继续预训练

小米开源首个7B推理AI大模型！聊聊小米如何通过架构创新和奖励模型等训练策略创新，媲美o1-mini

作者：羰汤羰及 InternLM、Qwen 等 LLM 全文约 4200 字，预计阅读 12 分钟昨天，阿里通义发布了两款 MoE 模型和六款 Dense 模型，即便是其小尺寸模型 Qwen3-4B，在数学推理和编程上的性能依旧令人惊艳

小米 AI大模型开源 2025-05-06

优必选：营收大增主靠小件，亏损继续又逢关税，能否乘机器人东风翻身？

出品｜派财经原创（ID：paicj314）文：林岚近日，优必选发布2024年度业绩公告。营收同比增加23.7%，创下近五年最大增幅，同时净利润为-11.60亿元，继续着连续五年的亏损。而刚发完

机器人关税 2025-04-14

朱啸虎，再一次预判了一切

很多人知道朱啸虎，或许依然还是因为他在共享单车风靡时期对于ofo的投资。然而，如果我们深入分析朱啸虎对于共享单车投资的成功之处的话，他对于共享单车未来发展的预判，或许是再合适不过了。当时间

朱啸虎 2025-04-06

R2模型呼之欲出！「卷王」DeepSeek继续给巨头上压力

属于OpenAI的时代结束了？ DeepSeek-R1的热度尚未消散，DeepSeek-R2就要来了？日前路透社报道称，三位知情人士透露，原计划今年5月发布的DeepSeek-R2模型，正在加速开发，或将提前发布，新模型有望可以生成更好的代码，并且使用英语之外的语言进行推理

DeepSeek OpenAI ChatGPT AI大模型 R2 2025-02-28

英伟达上架DeepSeek，股票继续跌

DeepSeek把英伟达股票单日干掉17%之后，英伟达选择了拥抱未来。英伟达网站显示，DeepSeek-R1模型已作为NVIDIA NIM微服务预览版在英伟达面向开发者的网站上发布。英伟达网站介绍称，DeepSeek-R1模型是最先进、高效的大型语言模型，在推理、数学和编码方面表现出色

英伟达 DeepSeek 2025-02-05

英伟达天塌了？中国低成本训练的AI，比美国万卡训练的更强

最近几天，估计大家被中国的一个AI大模型Deepseek（深度求索）惊呆了。原因是这个DeepSeek发布的DeepSeek-R1，其在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版

AI 英伟达 AMD 芯片华为 2025-01-27

诉讼频发！AI训练“盗用”版权内容，建立共享数据库迫在眉睫？

版权成为AI的又一块绊脚石。AI很强，但并不能无中生有。AI具备的能力，本质上来自算法和训练大模型所用的数据，数据的数量和质量会对大模型起到决定性作用。此前OpenAI工作人员表示，因没有足够多的高质量数据，Orion项目（即GPT-5）进展缓慢

OpenAI ChatGPT 大模型 AI 版权 2025-01-21

训练18个月GPT-5跳票！AI大模型的泡沫要破裂了？

OpenAI遭遇史上最大危机？ 12月上旬到中旬，OpenAI召开了为期12天的马拉松式发布会，每天都会公布一些新产品或新技术，带来了包括增强版o1大模型、文生视频大模型Sora Turbo、精简版推理模型o3-mini，以及高级语音模式增强等成果

OpenAI ChatGPT AI大模型 Sora GPT-5 2024-12-24

IBM研发共封装光学技术，加速AI模型训练

前言：新的光电共封装技术或取代数据中心中的电互连装置，大幅提高AI和其他计算应用的速度与能效。作者 | 方文三图片来源 | 网络

IBM 封装 AI模型训练 2024-12-23

达明机器人登录兴柜！未来继续携AI Cobot为工业自动化谱新曲

智能化的巨浪激荡全球，机器人行业不断刷新科技的边界，带来连连创新与惊喜。2024年 9 月 26 日，中国台湾资本市场迎来一颗新星 —— 达明机器人股份有限公司（股票代码 4585）正式挂牌台湾兴柜股票市场，为产业市场注入了新的活力和期待

达明机器人登录兴柜工业自动化达明机器人 2024-10-31

证实！字节大模型训练遭北大实习生投毒

本周有消息称，北大某田姓研究生在字节实习期间，利用 huggingface 的漏洞给字节大模型注入了破坏代码，导致其训练成果不可靠，而重新训练带来的损失或超千万美元（8000 多张 GPU 显卡）。GitHub 上公开了田某某的录音，成为实锤证据

字节 2024-10-21

2024慕尼黑华南电子展预登记开启，邀您共探电子“芯”未来

进入2024年以来，“新质生产力”持续刷屏。作为更强调科技创新发展的关键词，“新质生产力”离不开科技创新的成果，尤其是在全球半导体行业经历几年的低谷，终于迎来新一轮上升周期的特殊时刻。巨浪迎面而来，风口悄然而至

慕尼黑 2024-09-02

亏损超营收，优必选继续“亏钱赚吆喝”

近四年优必选已经亏掉了39亿元，2024年上半年还在亏。放眼未来，优必选的“梦想”很伟大，但照进现实的优必选何时才能盈利，这才是所有人都关注的问题。在亏钱中赚吆喝，似乎没什么必要

优必选人工智能 AI 大模型具身智能 2024-09-02

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

开源还是闭源，这是个问题。继旗下xAI公司宣布正式开源大模型Grok-1后，特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚，马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布

马斯克 xAI Grok 大模型 OpenAI 2024-08-13

被番茄小说当做AI训练“花肥” 网文作者联合说不

网文作者拒成番茄小说AI训练“花肥” 。近段时间，不少网文作者在社交媒体发文控诉，番茄小说在签约协议中，增加了“AI训练补充协议”，要求作者同意把作品“授权”给平台的AI，用于内容开发

番茄小说 AI训练 2024-07-29

上半年预亏8亿，用友遭遇转型阵痛？

文/杨剑勇用友网络，作为国内代表性的企业管理软件企业之一，深耕企服领域36年，高光时刻的市值曾一度超1700亿，如今的市值只有310亿元。相比过去的辉煌瞬间，如今显得黯然失色，令人惋惜。当然，市值减少千亿，这当中受资本市场环境等诸多因素影响，但企业自身经营能力也是投资者关注点之一

用友 AI大模型 2024-07-10

最强多模态模型GTP-4o问世，OpenAI继续开启人工智能创新之路

在全球科技领域迎来又一次颠覆性创新的今天，OpenAI公司隆重宣布，其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能，更在实时对话、图文分析等方面实现了质的飞跃，被誉为钢铁侠中全能AI管家贾维斯的现实版

人工智能 GTP-4o 2024-05-14

工业人形机器人已进工厂实景训练，天奇股份收获2个涨停

文/杨剑勇伴随全球电动化的浪潮不断推进，国内外汽车智能装备需求快速增长，对汽车制造的自动化、智能化、信息化提出更高要求。天奇股份作为国内智能装备代表性企业之一，早在2020年9月，天奇股份与优必选共同投资设立优奇智能，专注于为高端制造业提供无人化智能制造解决方案及数字化平台系统

工业人形机器人天奇股份 2024-02-28

美国计划禁止云计算厂商为中国训练AI大模型，我的一点看法

美国商务部长吉娜·雷蒙多(Gina Raimondo)在2024年1月26日接受路透采访时宣布了限制外国客户、尤其是中国客户使用美国云计算厂商的服务训练AI大模型的计划。雷蒙多的原话是：“我们不能允许中国或者其他我们不希望的玩家使用我们的云服务训练他们的模型

AI大模型芯片云计算 2024-01-29

谷歌Gemini“抄袭”百度文心一言？AI训练数据陷入大难题

作者：一号编辑：小迪谷歌过于心急，Gemini推出不到半月，就遭遇两次“危机”。美东时间12月6日，谷歌推出了迄今为止规模最大，能力最强的大模型Gemini

新火种 AI 大模型 Gemini 2023-12-20

黄仁勋不认怂：继续开发中国特供GPU，否则被华为替代

众所周知，为了避免中国在人工智能上超过美国，去年的时候，美国将包括A100、H100以内的几款高端GPU卡禁了。后来英伟达推出阉割版的H800、A800，使其符合禁令的要求，特供中国市场，这两种卡推出后，在国内照样是一卡难求，因为就算阉割，依然打遍国内没对手

华为英伟达 GPU AI 2023-12-08

营收下降，继续亏损，大模型能否成为金山云增长突破口？

文/杨剑勇 2023年第三季度，金山云营收16.25亿元，同比下降17.5%。其中，公有云服务营收为10.17亿元，同比下降24.5%，行业云服务收入为6.09亿元，同比下降2.2%。截至2023年

金山云大模型 2023-11-27

AI上市公司的艰难选择：继续拼大模型，还是赶紧拼盈利

来源 | 零壹智库作者 | 姚丽近日，AI企业第四范式（06682.HK）登陆港交所，上市AI创业企业再填一员。此前，2021年底年商汤科技（00020.HK）、202

大模型 AI 2023-10-25

DeepMind联合创始人：GPT-5正在训练中比当前模型大100倍

DeepMind联合创始人Suleyman近日在采访中表示，GPT－5仍在秘密训练中，未来将会比现在的GPT－4大100倍。其实，Open AI CEO Sam Altman此前曾否认训练GPT－5的这一说法

DeepMind GPT-5 AI OpenAI 2023-09-06

模型训练：优化人工智能和机器学习，完善DevOps工具的使用

据说法餐的秘诀在于黄油、黄油、更多的黄油。同样，对于DevOps而言，成功的三大秘诀是自动化、自动化、更高程度的自动化，而这一切归根结底都在于构建能够更快速地不断发布新版软件的流程。尽管人们认为在人工智能（AI）和机器学习（ML）方面，包括特征工程和参数调整，仍然涉及大量的手动工作

AI 机器学习 2023-09-01

海康威视“预”见浏阳河，助力水文工作更快、更准

近期在主汛期的影响下，长沙频繁迎来雷阵雨。游客小常记得，7月中旬的一天晚上9点，一场暴雨来得很急，1分钟前还在解放西街道悠闲逛街的市民游客，瞬间四散到沿街店铺屋檐下，动作稍慢一点就会全身湿透。他不知道

助力水文工作浏阳河水文站海康威视 2023-08-18

阿里云还会继续降价吗？

虽然在大多数时候，降价和利润通常站在对立面。但对云业务而言，降价往往会起到“以价换量”的效果——当云用户逐渐增加，分摊云成本的分母变多，成本降至足够低的时候，原本的亏损就会因为规模而转为盈利

热点阿里云 2023-08-16

上半年净利预降七成，AI服务器龙头业绩承压，算力市场被高估？

文/杨剑勇日前，浪潮信息发布业绩预告，2023年上半年营收预计同比下降30%左右。主要上半年受全球GPU及相关专用芯片供应紧张等因素的影响。同时，上半年净利润预计为2.86亿元-3.8亿元，同比下

AI服务器 2023-07-14

上半年净利预降七成，科大讯飞下半年继续all in 大模型

文/杨剑勇今年以来，受ChatGPT推动，人工智能概念股高度活跃。其中，科大讯飞作为市场中的AI龙头之一，不断创历史新高，市值曾一度逼近2000亿，当前市值为1600亿元。值得注意的是，与在资本市场节节攀高不同的是，今年业绩并不理想

科大讯飞大模型 2023-07-12

数亿网民数据将被用来训练AI？谷歌新隐私政策引发争议！

彼之砒霜，我之蜜糖。从ChatGPT出现到目前为止，大大小小的大模型一只手已经数不过来了。不管这些模型参数规模大小，上察天文，下晓地理，总能找出来一个符合应用场景的。这样的“外挂”说成是解放生产力，也不算为过

AI Google OpenAI 数据 2023-07-11

字节继续变“硬”！

来源｜伯虎财经（bohuFN）作者｜陈平安字节跳动再度涉足硬件领域。日前，根据《晚点 LatePost》报道，字节目前机器人团队已有约 50 人，并计划年底扩充到上百人。机器人是典型的投入大、周期长的赛道

字节人形机器人工业制造华为头戴显示 2023-07-06

AIGC想要替代“创作者”，需解决训练成本、内容“侵权”、道德伦理三大问题

近来，AIGC（人工智能生成内容）技术的快速发展吸引了全球各行各业的关注，成为热议话题。ChatGPT的加入更是让人工智能这一领域成为人们关注的焦点。在这个领域，越来越多的初创公司在AIGC的助力下，获得新一轮的融资

人工智能 AIGC 2023-05-12

预训练大模型最新统一范式

本文重点要讲的这篇论文是： ·Unifying Language Learning Paradigms ·Goog

预训练大模型 2023-05-06

想“白嫖”？没门！问答网站向AI训练要钱

近日，全球最大的程序员问答网站StackOverflow宣布：计划在今年年中向 AI 算法开发人员收费。

StackOverflow；Reddit；ChatGPT 2023-04-25

马斯克呼吁暂停人工智能训练6个月

在OpenAI火爆之后，尤其是ChatGPT和GPT-4发布之后，人们终于看到了人工智能本来应该具有的样子。在生成式人工智能火爆之后，人们真正意识到这才是应该在强大算力之下的人工智能应该具有的智慧和能力

马斯克生成式人工智能 2023-04-03

使用数据增强从头开始训练卷积神经网络（CNN）

介绍该文致力于处理神经网络中的过度拟合。过度拟合将是你主要担心的问题，因为你仅使用 2000 个数据样本训练模型。存在一些有助于克服过度拟合的方法，即 dropout 和权重衰减（L2 正则化）。我们将讨论数据增强，这是计算机视觉独有的，在使用深度学习模型解释图像时，数据增强在任何地方都会用到

数据增强卷积神经网络 2022-11-24

ECCV 2022商汤斩获70篇论文，继续领跑行业

10月23－27日，全球计算机视觉三大顶会之一，两年一届的欧洲计算机视觉国际会议ECCV（European Conference on Computer Vision）在以色列特拉维夫（Tel－Aviv）火热召开

商汤科技 ECCV 2022-10-26

使用 Google Colab 训练的图像分类模型

介绍图像分类是按照预先确定的原则对图像内的像素组进行分类和识别的过程。在创建分类规则时使用一种或多种光谱或文本质量是可行的。两种流行的分类技术是“有监督的”和“无监督的”。图像分类如何工作？使用标记的样本照片，训练模型以检测目标类别（要在图像中识别的对象）

Google 图像分类 2022-09-28

昇思MindSpore 1.8：丰富的算法集与套件，实现高性能训练，降低部署门槛

经过社区开发者们两个月来的不断努力，昇思MindSpore1．8版本现已发布。在此版本中，发布的MindSpore Golden Stick，提供了丰富的模型压缩算法；开源大模型训练套件MindSpo

昇思MindSpore 1.8 华为诺亚实验室昇思 2022-08-16

腾讯阿里继续为“AI”痴狂，谁将登上新王座？