GPT5来了！奥特曼真听劝，但我担心的还是发生了...... - OFweek 人工智能网

当前位置： OFweek 人工智能网 > 机器学习 > 正文

GPT5来了！奥特曼真听劝，但我担心的还是发生了......

2025-08-14 16:47

AI机器人茶馆

两年多的时间，无数次的预告，无数次的营销。现在，GPT-5 终于来了！

这次，奥特曼是真听劝了。以前的 OpenAI 模型命名，像什么 o1、o3、o4、mini、nano、pro...... 看着比奶茶菜单还乱。而现在，它们统一都是 GPT-5。看上去清爽了不少。

但是大家最期待的那种ChatGPT、Sora式的惊艳技术大突破，说实话，没有......

这也是我所担心的点。

1 介绍一下GPT-5

GPT-5 并不是一个单一模型，而是一个融合了多个模型的 “混血系统”。它背后有三种不同层次的模型：

日常应答模型：快、准、便宜，回答大多数问题

深度推理模型：专门解决难题

实时路由器：自动判断该用哪个模型，根据你的问题类型、复杂度、是否需要工具来选择

比如你说一句 “这个题请认真推理”，它就会切换到推理模型。用完配额之后，还有 mini 版本顶上。

这是 GPT-5 真正的杀手锏，代表它已经具备非常成熟的工具和模型调用能力。

API 端也很简单，直接分成三个型号：

gpt-5（主力）

gpt-5-mini（轻量）

gpt-5-nano（极轻量）

每个型号还能设置 4 个推理等级。最特别的是增加了一个 “minimal模式”，不绕弯子、不浪费推理 token，直接提高响应速度。

此外，GPT-5 支持超长上下文，以及双模输入：

输入上限：272,000 tokens

输出上限（含推理 token）：128,000 tokens

支持“文本+图片”输入，输出只支持文本

这意味着它能一口气消化上百页文档，相当于一本巨著，还能边看图边理解，再用相当长的篇幅给你答复。

2 GPT-5确实更聪明了

OpenAI说，GPT-5的推理能力提升了，还更诚实、更少幻觉，在写作、编程、医疗等领域都比前代强。奥特曼自信地说：

“GPT-3有点像和高中生交谈。GPT-4，也许就像和大学生交谈一样。但有了GPT-5，现在就像和一位专家交谈，一位博士级别的专家，在任何你需要的领域，按需交流。”

听起来很燃，但一些早期体验者给出的评价是：它很稳，很能干，但不是质变。

特别是在写作上，甚至有人觉得GPT-4.5的文字风格更贴近人类，而GPT-5偶尔还是会冒出“套话式”的流水文。

不过在编程方面，GPT-5的口碑倒是相当炸裂。

从一口气生成整个网站，到精准解决复杂依赖冲突，它比任何前代模型都干脆利落，能用并行调用多个工具，像个人类程序员一样干活。

OpenAI官网甚至展示了GPT-5生成的小游戏，直接可以玩的那种，以及对应Prompt。

下面我们看一下 GPT-5 的成绩单：

数学：AIME 2025（无工具辅助）得分 94.6% 。

编程：SWEbench Verified 得分 74.9%，Aider Polyglot 得分 88% 。

多模态理解：在 MMMU 上取得 84.2% 。

健康领域：HealthBench Hard 得分 46.2% 。

经济重要任务：在涵盖法律、物流、销售和工程等 40 多个职业的任务中，其表现优于 o3 和 ChatGPT Agent。

推理能力：在 GPQA（面向研究生水平的科学问题）上也创下新记录，无工具情况下取得 88.4% 的高分。

3 价格打骨折

这次的定价直接开卷：

GPT-5：输入 $1.25/百万token；输出 $10/百万token

GPT-5 Mini：输入 $0.25/百万token；输出 $2/百万token

GPT-5 Nano：输入 $0.05/百万token；输出 $0.4/百万token

GPT-5 的价格比 GPT-4o 便宜一半，再加上90%的缓存折扣（短时间重复用相同输入时），做AI产品的成本能省一大截。

和同类Claude、Gemini、Grok比起来，价格优势明显。OpenAI这是要赤裸裸地抢市场。

4 更安全可靠，从“拒绝”到“安全回答”

以前 AI 要么直接回答你，要么一句“抱歉不能回答”。

GPT-5 用了新的 safe-completions 策略：在安全政策范围内尽量给出高层次、有用的答案，而不是简单拒绝。

其他改进包括：

降低幻觉率：尤其是无联网时的事实错误

减少谄媚倾向：通过奖励机制减少它盲目迎合用户

承认做不到：遇到无法完成的任务，会明确告诉你，而不是装作完成了

在外部红队的 Prompt Injection 测试中，GPT-5-thinking 在攻击成功率上只有 56.8%（k=10），明显好于其他主流模型，但也说明这问题还没解决，超过一半的多次尝试仍然能突破防线。

5 GPT-5的发布时机

这次发布的时机非常 “奥特曼”：

谷歌刚发 Gemini Pro 1.5，他立刻甩出 GPT-5 抢头条

一口气覆盖免费到 $200/月全价位用户

同步进驻微软全家桶（Copilot、Azure AI）

这不仅是技术迭代和价格战，更是生态战：让所有用户和开发者在 GPT-5 体系里闭环，不给竞品留空间。

6 没有突破性技术，AI进入瓶颈期？

别看这次 GPT-5 发布得声势浩大，价格表甩得啪啪响，性能数据摆得整整齐齐，但如果你把兴奋劲压下来，就会发现一个残酷事实：

这次的内核，并没有任何真正的 “质变”技术突破。

它的推理能力更强、上下文更大、工具用得更灵活，这些进步本质上都是在现有LLM架构下的堆料与优化。

而这恰恰暴露了一个可能让整个行业都不安的信号：

我们是不是已经接近了这一代 AI 技术的 “天花板” ？

想想看，过去两年里，AI 大模型的惊艳时刻几乎都发生在 2022-2023：ChatGPT 横空出世、GPT-4 让人惊掉下巴、Stable Diffusion 把图像生成送到民用级别、Midjourney 的画风一度封神。

可到了 2024-2025，这些新品的“惊喜值”明显下降，发布会更多是在讲降价、整合、生态，而不是在炫耀什么 “完全新的智能范式”。

而且，目前大模型的训练成本依然高得难以落地，性能提升却越来越依赖于数据清洗、推理策略优化这种 “精装修” 工作，而不是地基上的革命。

这可能意味着：

下一代质变可能需要全新的架构突破，而不是继续把 Transformer 喂到天荒地老。

当前的 LLM，很可能已经到了一个短期内难以跨越的瓶颈期，我们不知道这个瓶颈会持续一年，还是五年。

换句话说，GPT-5 是一次优秀的迭代，但它的意义更像是 “苹果把 iPhone 15 做到了极致”，而不是 “乔布斯第一次拿出 iPhone ”。

对于GPT-5，你是惊喜呢？还是失望呢？

欢迎在评论区讨论！

原文标题 : GPT5来了！奥特曼真听劝，但我担心的还是发生了......

本地收藏打印推荐给朋友

声明： 本文由入驻维科号的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。

发表评论

共0条评论，0人参与

立即登录即可访问所有OFweek服务

忘记密码

其他方式

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

暂无评论

图片新闻

最新活动更多

即日-5.20
立即下载>> 【限时免费】物理场仿真助力生物医学领域技术创新
精彩回顾
立即查看>> 【线下论坛】新唐科技×芯唐南京 2026 年度研讨会
精彩回顾
立即查看>> OFweek 2026（第十五届）中国机器人产业大会
精彩回顾
立即查看>> 维科杯· OFweek 2025中国机器人行业年度评选
精彩回顾
立即查看>> 【在线会议】液冷服务器信号完整性及冷却液关键电参数测试
精彩回顾
立即查看>> 【发布会】Flexiverse 2026 非夕科技新品发布会

一周热点月点击榜

企业服务广告服务猎头服务薪酬报告

人工智能猎头职位更多

高级软件工程师广东省/深圳市
自动化高级工程师广东省/深圳市
光器件研发工程师福建省/福州市
销售总监（光器件）北京市/海淀区
激光器高级销售经理上海市/虹口区
光器件物理工程师北京市/海淀区
激光研发工程师北京市/昌平区
技术专家广东省/江门市
封装工程师北京市/海淀区
结构工程师广东省/深圳市

扫码关注公众号
OFweek人工智能网
获取更多精彩内容

文章纠错

x

_*文字标题：

_*纠错内容：

联系邮箱：

_*验证码：

看不清，点击换一张

粤公网安备 44030502002758号