GPT5来了!奥特曼真听劝,但我担心的还是发生了......
两年多的时间,无数次的预告,无数次的营销。现在,GPT-5 终于来了!
这次,奥特曼是真听劝了。以前的 OpenAI 模型命名,像什么 o1、o3、o4、mini、nano、pro...... 看着比奶茶菜单还乱。而现在,它们统一都是 GPT-5。看上去清爽了不少。
但是大家最期待的那种ChatGPT、Sora式的惊艳技术大突破,说实话,没有......
这也是我所担心的点。
1 介绍一下GPT-5
GPT-5 并不是一个单一模型,而是一个融合了多个模型的 “混血系统”。它背后有三种不同层次的模型:
日常应答模型:快、准、便宜,回答大多数问题
深度推理模型:专门解决难题
实时路由器:自动判断该用哪个模型,根据你的问题类型、复杂度、是否需要工具来选择
比如你说一句 “这个题请认真推理”,它就会切换到推理模型。用完配额之后,还有 mini 版本顶上。
这是 GPT-5 真正的杀手锏,代表它已经具备非常成熟的工具和模型调用能力。
API 端也很简单,直接分成三个型号:
gpt-5(主力)
gpt-5-mini(轻量)
gpt-5-nano(极轻量)
每个型号还能设置 4 个推理等级。最特别的是增加了一个 “minimal模式”,不绕弯子、不浪费推理 token,直接提高响应速度。

此外,GPT-5 支持超长上下文,以及双模输入:
输入上限:272,000 tokens
输出上限(含推理 token):128,000 tokens
支持“文本+图片”输入,输出只支持文本
这意味着它能一口气消化上百页文档,相当于一本巨著,还能边看图边理解,再用相当长的篇幅给你答复。
2 GPT-5确实更聪明了
OpenAI说,GPT-5的推理能力提升了,还更诚实、更少幻觉,在写作、编程、医疗等领域都比前代强。奥特曼自信地说:
“GPT-3有点像和高中生交谈。GPT-4,也许就像和大学生交谈一样。但有了GPT-5,现在就像和一位专家交谈,一位博士级别的专家,在任何你需要的领域,按需交流。”
听起来很燃,但一些早期体验者给出的评价是:它很稳,很能干,但不是质变。
特别是在写作上,甚至有人觉得GPT-4.5的文字风格更贴近人类,而GPT-5偶尔还是会冒出“套话式”的流水文。
不过在编程方面,GPT-5的口碑倒是相当炸裂。

从一口气生成整个网站,到精准解决复杂依赖冲突,它比任何前代模型都干脆利落,能用并行调用多个工具,像个人类程序员一样干活。
OpenAI官网甚至展示了GPT-5生成的小游戏,直接可以玩的那种,以及对应Prompt。





下面我们看一下 GPT-5 的成绩单:
数学:AIME 2025(无工具辅助)得分 94.6% 。

编程:SWEbench Verified 得分 74.9%,Aider Polyglot 得分 88% 。

多模态理解:在 MMMU 上取得 84.2% 。

健康领域:HealthBench Hard 得分 46.2% 。

经济重要任务:在涵盖法律、物流、销售和工程等 40 多个职业的任务中,其表现优于 o3 和 ChatGPT Agent。

推理能力:在 GPQA(面向研究生水平的科学问题)上也创下新记录,无工具情况下取得 88.4% 的高分。

3 价格打骨折
这次的定价直接开卷:
GPT-5:输入 $1.25/百万token;输出 $10/百万token
GPT-5 Mini:输入 $0.25/百万token;输出 $2/百万token
GPT-5 Nano:输入 $0.05/百万token;输出 $0.4/百万token

GPT-5 的价格比 GPT-4o 便宜一半,再加上90%的缓存折扣(短时间重复用相同输入时),做AI产品的成本能省一大截。
和同类Claude、Gemini、Grok比起来,价格优势明显。OpenAI这是要赤裸裸地抢市场。
4 更安全可靠,从“拒绝”到“安全回答”
以前 AI 要么直接回答你,要么一句“抱歉不能回答”。
GPT-5 用了新的 safe-completions 策略:在安全政策范围内尽量给出高层次、有用的答案,而不是简单拒绝。
其他改进包括:
降低幻觉率:尤其是无联网时的事实错误
减少谄媚倾向:通过奖励机制减少它盲目迎合用户
承认做不到:遇到无法完成的任务,会明确告诉你,而不是装作完成了

在外部红队的 Prompt Injection 测试中,GPT-5-thinking 在攻击成功率上只有 56.8%(k=10),明显好于其他主流模型,但也说明这问题还没解决,超过一半的多次尝试仍然能突破防线。
5 GPT-5的发布时机
这次发布的时机非常 “奥特曼”:
谷歌刚发 Gemini Pro 1.5,他立刻甩出 GPT-5 抢头条
一口气覆盖免费到 $200/月全价位用户
同步进驻微软全家桶(Copilot、Azure AI)

这不仅是技术迭代和价格战,更是生态战:让所有用户和开发者在 GPT-5 体系里闭环,不给竞品留空间。
6 没有突破性技术,AI进入瓶颈期?
别看这次 GPT-5 发布得声势浩大,价格表甩得啪啪响,性能数据摆得整整齐齐,但如果你把兴奋劲压下来,就会发现一个残酷事实:
这次的内核,并没有任何真正的 “质变”技术突破。
它的推理能力更强、上下文更大、工具用得更灵活,这些进步本质上都是在现有LLM架构下的堆料与优化。
而这恰恰暴露了一个可能让整个行业都不安的信号:
我们是不是已经接近了这一代 AI 技术的 “天花板” ?
想想看,过去两年里,AI 大模型的惊艳时刻几乎都发生在 2022-2023:ChatGPT 横空出世、GPT-4 让人惊掉下巴、Stable Diffusion 把图像生成送到民用级别、Midjourney 的画风一度封神。
可到了 2024-2025,这些新品的“惊喜值”明显下降,发布会更多是在讲降价、整合、生态,而不是在炫耀什么 “完全新的智能范式”。
而且,目前大模型的训练成本依然高得难以落地,性能提升却越来越依赖于数据清洗、推理策略优化这种 “精装修” 工作,而不是地基上的革命。
这可能意味着:
下一代质变可能需要全新的架构突破,而不是继续把 Transformer 喂到天荒地老。
当前的 LLM,很可能已经到了一个短期内难以跨越的瓶颈期,我们不知道这个瓶颈会持续一年,还是五年。
换句话说,GPT-5 是一次优秀的迭代,但它的意义更像是 “苹果把 iPhone 15 做到了极致”,而不是 “乔布斯第一次拿出 iPhone ”。
对于GPT-5,你是惊喜呢?还是失望呢?
欢迎在评论区讨论!
原文标题 : GPT5来了!奥特曼真听劝,但我担心的还是发生了......


分享














发表评论
登录
手机
验证码
手机/邮箱/用户名
密码
立即登录即可访问所有OFweek服务
还不是会员?免费注册
忘记密码其他方式
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论