订阅
纠错
加入自媒体

大模型日报| Gemini首席工程师震惊了

2026-01-05 09:42
硅基星芒
关注

01

重大发布(新模型/产品/开源)

 ① 英伟达平台引入国产先进模型,GLM-4.7 与 Minimax-M2.1 开放免费调用

近日,随着国内AI公司智谱与Minimax相继公布港股上市进程,英伟达迅速跟进,在其NVIDIA NIM API平台上正式接入两家公司的最新大语言模型——GLM-4.7与Minimax M2.1。该平台致力于将大模型封装为即插即用的微服务,大幅降低开发者的部署与调试门槛。

目前,用户注册英伟达账号并生成API Key后,即可通过编程方式免费调用这两款模型。尽管在官方模型广场中尚未直接列出,但实际接口已开放使用。

初期测试显示,在通用对话场景中,GLM-4.7的响应速度约为每秒25个token,而Minimax-M2.1则可达每秒150个token,推测可能与模型新上线、资源仍在调配有关。

短评:

此举形成多方共赢:开发者得以规避繁琐的部署流程,快速集成先进模型能力;国内AI企业则通过英伟达的全球生态,有效提升其技术在国际舞台的能见度;而对英伟达而言,提供最新模型的免费尝试,也有助于巩固其开发者社区与平台黏性。技术无国界,生态共生长,或为AI全球化协作的一页新注脚。

② Grok 新版疑似曝光,xAI 神秘模型现身评测榜单

近期,有AI研究者在知名大模型评测平台LMS Arena及DesignArena中发现数款名称奇特的新模型记录,分别为“Vortexshade”“Quantumcrow”与“Obsidian”。

其命名风格与以往xAI产品的代号高度相似,经简单测试后,多数推测指向它们或为Grok系列即将发布的新版本。

短评:

尽管Grok在智能表现上已接近第一梯队,但其实际用户规模与生态影响力仍与GPT、Gemini等头部产品存在显著差距。在AI竞争日趋聚焦于实际应用的当下,Grok在多模态与合规安全等方面仍面临挑战。

③ OpenAI 布局无屏语音交互,计划推出对话式AI硬件

据TechCrunch报道,OpenAI正组建专项团队,研发新一代具备连续、自然对话能力的AI语音设备,目标在2026年推出首款无屏幕个人助理产品。该设备旨在突破当前语音助手“一问一答”的机械交互,支持打断、重叠对话等更贴近真人交流的沟通方式,如同一位置身耳畔的智能搭档。

实际上,OpenAI并非唯一聚焦语音赛道的玩家:Meta已在Ray-Ban智能眼镜中集成多麦克风系统,以提升嘈杂环境下的语音识别;Google正测试“语音摘要搜索”,将文字信息转化为语音播报;Tesla则于车机系统接入Grok,支持自然语言操控车辆功能。

短评:

从图形界面到触控操作,每一次交互方式的变革都重塑着技术入口。OpenAI此次转向,正是对“后屏幕时代”交互形态的一次前瞻押注。

然而,语音交互硬件之路不乏前车之鉴:Humane AI Pin因体验不佳折戟,Google的XR探索亦屡遇预期落差。可见,如何将技术能力转化为流畅、可靠的用户体验,仍是所有入局者必须回答的关键命题。

02

技术进展(论文/SOTA/算法)

① Claude Code 编程能力震惊业界,被指“一小时完成一年工作量”|

过去24小时内,谷歌Gemini团队首席工程师Jaana Dogan在社交平台连续发文,透露其团队耗时一年研发的“分布式代理编排器”项目,在向Claude Code提出需求后,仅用一小时即获得一套结构完整、可直接运行的程序代码。

她对此表示“不是焦虑,而是敬佩”,并指出尽管出于安全考虑,该代码无法直接用于谷歌核心项目,但其完成度与团队一年探索的成果已达同一水准。

Dogan同时强调,AI生成的代码仍须人工审查与迭代优化,但这标志着AI编程能力已从“片段补全”跃升至“系统级意图理解”阶段。

短评:

尽管目前仅为个案分享、未公开完整代码,但其揭示的趋势已足够清晰:AI编程正以指数速度进入“系统级辅助”新阶段。程序员或许不会因此失业,但驾驭AI工具以提升效率,必将成为未来开发者的必备素养。

从“不重复造轮子”到“不重复造整车”,高质量代码的自动化生成,很可能成为AI技术商业化落地最为顺畅的领域之一。

03

算力与基础设施(芯片/云/数据中心)

① Anthropic 豪掷210亿美元,向博通采购百万颗TPU芯片

据半导体分析机构SemiAnalysis披露,Anthropic已与博通达成协议,采购约100万个TPU v7p芯片,用于自建数据中心集群。这批芯片由谷歌与博通联合设计,但此次交易中博通将直接向Anthropic提供整机架系统,谷歌则以IP授权方身份获取相应费用。

博通CEO在12月投资者会议上证实,Anthropic的AI相关订单总额已达210亿美元,且因整机架出货模式,该批订单毛利率有所降低。

短评:

这一采购动向,折射出AI算力供应链的深层演变:博通从芯片设计商转向系统集成供应商,谷歌则从硬件销售转为知识产权授权。

随着谷歌、OpenAI、Anthropic等头部公司纷纷与博通签署大额订单,并大规模采用自研或定制芯片(如TPU),长期以来英伟达在高端AI算力市场的“单一主导”局面,正悄然呈现出多元化解构的趋势。

       原文标题 : 大模型日报| Gemini首席工程师震惊了

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    人工智能 猎头职位 更多
    扫码关注公众号
    OFweek人工智能网
    获取更多精彩内容
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号