订阅
纠错
加入自媒体

GPT5来了!奥特曼真听劝,但我担心的还是发生了......

两年多的时间,无数次的预告,无数次的营销。现在,GPT-5 终于来了!

这次,奥特曼是真听劝了。以前的 OpenAI 模型命名,像什么 o1、o3、o4、mini、nano、pro...... 看着比奶茶菜单还乱。而现在,它们统一都是 GPT-5。看上去清爽了不少。

但是大家最期待的那种ChatGPT、Sora式的惊艳技术大突破,说实话,没有......

这也是我所担心的点。

1 介绍一下GPT-5

GPT-5 并不是一个单一模型,而是一个融合了多个模型的 “混血系统”。它背后有三种不同层次的模型:

日常应答模型:快、准、便宜,回答大多数问题

深度推理模型:专门解决难题

实时路由器:自动判断该用哪个模型,根据你的问题类型、复杂度、是否需要工具来选择

比如你说一句 “这个题请认真推理”,它就会切换到推理模型。用完配额之后,还有 mini 版本顶上。

这是 GPT-5 真正的杀手锏,代表它已经具备非常成熟的工具和模型调用能力。

API 端也很简单,直接分成三个型号:

gpt-5(主力)

gpt-5-mini(轻量)

gpt-5-nano(极轻量)

每个型号还能设置 4 个推理等级。最特别的是增加了一个 “minimal模式”,不绕弯子、不浪费推理 token,直接提高响应速度。

此外,GPT-5 支持超长上下文,以及双模输入:

输入上限:272,000 tokens

输出上限(含推理 token):128,000 tokens

支持“文本+图片”输入,输出只支持文本

这意味着它能一口气消化上百页文档,相当于一本巨著,还能边看图边理解,再用相当长的篇幅给你答复。 

2 GPT-5确实更聪明了

OpenAI说,GPT-5的推理能力提升了,还更诚实、更少幻觉,在写作、编程、医疗等领域都比前代强。奥特曼自信地说:

“GPT-3有点像和高中生交谈。GPT-4,也许就像和大学生交谈一样。但有了GPT-5,现在就像和一位专家交谈,一位博士级别的专家,在任何你需要的领域,按需交流。”

听起来很燃,但一些早期体验者给出的评价是:它很稳,很能干,但不是质变。

特别是在写作上,甚至有人觉得GPT-4.5的文字风格更贴近人类,而GPT-5偶尔还是会冒出“套话式”的流水文。

不过在编程方面,GPT-5的口碑倒是相当炸裂。

从一口气生成整个网站,到精准解决复杂依赖冲突,它比任何前代模型都干脆利落,能用并行调用多个工具,像个人类程序员一样干活。

OpenAI官网甚至展示了GPT-5生成的小游戏,直接可以玩的那种,以及对应Prompt。

下面我们看一下 GPT-5 的成绩单:

数学:AIME 2025(无工具辅助)得分 94.6%  。

编程:SWEbench Verified 得分 74.9%,Aider Polyglot 得分 88%  。

多模态理解:在 MMMU 上取得 84.2%  。

健康领域:HealthBench Hard 得分 46.2% 。

经济重要任务:在涵盖法律、物流、销售和工程等 40 多个职业的任务中,其表现优于 o3 和 ChatGPT Agent。

推理能力:在 GPQA(面向研究生水平的科学问题)上也创下新记录,无工具情况下取得 88.4% 的高分。

3 价格打骨折

这次的定价直接开卷:

GPT-5:输入 $1.25/百万token;输出 $10/百万token

GPT-5 Mini:输入 $0.25/百万token;输出 $2/百万token

GPT-5 Nano:输入 $0.05/百万token;输出 $0.4/百万token

GPT-5 的价格比 GPT-4o 便宜一半,再加上90%的缓存折扣(短时间重复用相同输入时),做AI产品的成本能省一大截。

和同类Claude、Gemini、Grok比起来,价格优势明显。OpenAI这是要赤裸裸地抢市场。 

4 更安全可靠,从“拒绝”到“安全回答”

以前 AI 要么直接回答你,要么一句“抱歉不能回答”。

GPT-5 用了新的 safe-completions 策略:在安全政策范围内尽量给出高层次、有用的答案,而不是简单拒绝。

其他改进包括:

降低幻觉率:尤其是无联网时的事实错误

减少谄媚倾向:通过奖励机制减少它盲目迎合用户

承认做不到:遇到无法完成的任务,会明确告诉你,而不是装作完成了

在外部红队的 Prompt Injection 测试中,GPT-5-thinking 在攻击成功率上只有 56.8%(k=10),明显好于其他主流模型,但也说明这问题还没解决,超过一半的多次尝试仍然能突破防线。

5 GPT-5的发布时机

这次发布的时机非常 “奥特曼”:

谷歌刚发 Gemini Pro 1.5,他立刻甩出 GPT-5 抢头条

一口气覆盖免费到 $200/月全价位用户

同步进驻微软全家桶(Copilot、Azure AI)

这不仅是技术迭代和价格战,更是生态战:让所有用户和开发者在 GPT-5 体系里闭环,不给竞品留空间。

6 没有突破性技术,AI进入瓶颈期?

别看这次 GPT-5 发布得声势浩大,价格表甩得啪啪响,性能数据摆得整整齐齐,但如果你把兴奋劲压下来,就会发现一个残酷事实:

这次的内核,并没有任何真正的 “质变”技术突破。

它的推理能力更强、上下文更大、工具用得更灵活,这些进步本质上都是在现有LLM架构下的堆料与优化。

而这恰恰暴露了一个可能让整个行业都不安的信号:

我们是不是已经接近了这一代 AI 技术的 “天花板” ?

想想看,过去两年里,AI 大模型的惊艳时刻几乎都发生在 2022-2023:ChatGPT 横空出世、GPT-4 让人惊掉下巴、Stable Diffusion 把图像生成送到民用级别、Midjourney 的画风一度封神。

可到了 2024-2025,这些新品的“惊喜值”明显下降,发布会更多是在讲降价、整合、生态,而不是在炫耀什么 “完全新的智能范式”。

而且,目前大模型的训练成本依然高得难以落地,性能提升却越来越依赖于数据清洗、推理策略优化这种 “精装修” 工作,而不是地基上的革命。

这可能意味着:

下一代质变可能需要全新的架构突破,而不是继续把 Transformer 喂到天荒地老。

当前的 LLM,很可能已经到了一个短期内难以跨越的瓶颈期,我们不知道这个瓶颈会持续一年,还是五年。

换句话说,GPT-5 是一次优秀的迭代,但它的意义更像是 “苹果把 iPhone 15 做到了极致”,而不是 “乔布斯第一次拿出 iPhone ”。

对于GPT-5,你是惊喜呢?还是失望呢?

欢迎在评论区讨论!

       原文标题 : GPT5来了!奥特曼真听劝,但我担心的还是发生了......

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    人工智能 猎头职位 更多
    扫码关注公众号
    OFweek人工智能网
    获取更多精彩内容
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号