今日,Anthropic 最新小型模型 Claude Haiku 4.5 上线。价格仅为 Claude Sonnet 4 的三分之一,速度却提升了一倍多。
Claude Haiku 4.5 还提升了编码体验的响应速度,在某些电脑任务上甚至超越了 Claude Sonnet 4。这些改进使得 Claude for Chrome 等应用程序比以往更实用。
总体性能虽比不上 Sonnet 4.5, 但 Claude Haiku 4.5 为那些希望获得接近前沿性能且经济高效的用户提供了一个新的选择。目前价格为每百万输入和输出代币 1/5 美元。
它还开辟了模型组合使用的新方式。例如,Sonnet 4.5 可以将一个复杂的问题分解成多个步骤的计划,然后协调一个由多个 Haiku 4.5 组成的团队并行完成子任务。
基准测试
在代理编码领域,Haiku 4.5 的性能已经超过了 Sonnet 4 和 ChatGPT 5(high),达到 73.3% 的准确率。
在数学能力的测试中,Haiku 4.5 虽然成功率不及 ChatGPT 5 和 Sonnet 4,但其在使用工具的情况下也能达到 96.3% 的准确率。
视觉推理方面,Haiku 4.5 的能力就相对弱了些,是几个模型中分数最低的。
但总体而言,用户对 Haiku 4.5 的能力很满意,纷纷给出好评。
最安全的模型
安全方面,Claude Haiku 4.5 表现出较低的令人担忧的行为发生率,并且比 Claude Haiku 3.5 的一致性显著提高。
在自动一致性评估中,Claude Haiku 4.5 的总体偏差行为发生率也显著低于 Claude Sonnet 4.5 和 Claude Opus 4.1,因此,根据这一指标,Claude Haiku 4.5 是 Anthropic 迄今为止最安全的模型。
安全测试还表明,Claude Haiku 4.5 在生产化学、生物、放射性和核武器 (CBRN) 方面的风险有限。
Claude Haiku 4.5 现已在 Claude Code 和 Anthropic 的应用程序上线。开发人员可以在 Anthropic 的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上使用 Claude Haiku 4.5。
参考资料: https://www.anthropic.com/news/claude-haiku-4-5
发表评论
登录
手机
验证码
手机/邮箱/用户名
密码
立即登录即可访问所有OFweek服务
还不是会员?免费注册
忘记密码其他方式
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论