一文读懂什么是AIGC、ChatGPT、大模型

2023-05-15 14:02

张栋伟

关注

昨天有读者私信我，能否解释一下AIGC和ChatGPT是什么样的关系？

确实，在短短的6个月时间里，AIGC、ChatGPT、大模型等新词汇一下成为媒体热词，加上所谓“人工智能将取代你的工作”之类的焦虑，张栋伟觉得有必要写这样一篇科普。

本文将力求简单化的说明这次人工智能浪潮带来的新词汇和它的意义，带你一文读懂什么是AIGC、ChatGPT、大模型。

1、什么是AI

AI，人工智能（Artificial Intelligence）的英文缩写。

AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

工厂里的自动生产线，小米公司的“铁蛋”机器狗，火车站的人脸识别通道，科大讯飞的语音输入法，都是属于AI系统的应用。

2、什么是AIGC

AIGC，全名“AI Generated Content”，中文直译就是“人工智能生成内容”，也可以称为“生成式AI” （Generative AI）。例如AI文本续写，文字转图像的AI图、AI数字化主持人等，都属于AIGC的范畴。

3、什么是大模型

首先解释，什么是GPT。

GPT的全称，是Generative Pre-Trained Transformer（生成式预训练转换器）是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型。

GPT是AIGC的一个种类。

在ChatGPT之前，被公众关注的AI模型是用于单一任务的，比如全球所知的“阿尔法狗”（AlphaGo）可以基于全球围棋棋谱的计算，打赢所有的人类围棋大师。谷歌进一步开发的“AlphaZero”在围棋、国际象棋和日本象棋等项目上，都是所向无敌。

这种专注于某个具体任务建立的AI数据模型，叫“小模型”。

ChatGPT与这种“小模型”不同，GPT大模型更像人类的大脑。它兼具“大规模”和“预训练”两种属性，可以在海量通用数据上进行预先训练，能大幅提升AI的泛化性、通用性、实用性。

基于GPT机制建立的AI数据模型，就叫“大模型”。

4、什么是ChatGPT

ChatGPT是由美国OpenAI公司发布的大模型。

由于ChatGPT 3.5展现了超出现实预期的智能数据能力，引发了一场新的全球人工智能竞赛。2023年3月，ChatGPT -4进一步提高了AI的能力。

5、中国有ChatGPT吗？

首先再次强调，ChatGPT是特指美国OpenAI公司的大模型。这是一个产品名称。

但是，领先的产品，往往会成为行业代名词，比如我们说搜索的时候，会简单的说“百度一下”。但实际上，搜索引擎还有360、Bing、谷歌等其他方式。

目前，我们把与ChatGPT类似的产品，暂时叫“类ChatGPT”产品或者直接叫“大模型”产品。

在ChatGPT火爆以后，中国的科技企业纷纷“赶上潮流”，推出了自己的大模型产品。以下是《中国企业家》杂志统计出的一些知名公司的产品列表。

但是，这种复杂的技术模型，显然不是一朝一夕就能实现。多个国内的大模型被国外技术人员质疑，是用ChatGPT进行“套壳”，用以提升品牌形象和股价。

中国的GPT大模型要成熟，还需要比较多的时间和机会，本文后面部分会继续说明。

6、ChatGPT有什么用途

ChatGPT是一种能生成文本、图像等内容的复杂系统。

OpenAI的战略伙伴微软（Microsoft）已将该技术添加到其Office MS 365办公套件及搜索引擎必应（Bing）等产品中。

微软的竞争对手谷歌（Google）也推出了类似的搜索工具Bard。

ChatGPT可以进行从历史到哲学等话题的对话，生成不同风格的文案、文章、歌词、诗歌，甚至直接生成计算机代码，或者对已有的计算机程序代码提供修改建议。ChatGPT也能处理视觉信息，诸如回答关于照片内容的问题。

ChatGPT是基于从互联网上搜罗的大量文章、图像、网站和社交媒体内容，以及与OpenAI人类雇工的实时对话（主要是英语）进行训练的。实际上，早在2014年微软公司面向中国推出了AI聊天机器人小冰，目前不知道小冰的对话内容是否也是ChatGPT学习的数据来源之一。

ChatGPT学着模仿写作的语法和结构，输出常用表达。它还学习识别图像中的形状和图案，如一只猫、一个孩子或一件衬衫的轮廓。它还可以将单词和短语与这些形状和图案相匹配，允许用户询问图像的内容，如猫在做什么或衬衫的颜色是什么。

因为ChatGPT的原始数据来自于公开的互联网，而互联网上的信息并不总是准确的。因此，ChatGPT给出的答案结果，并没有经过事实核查，不能100%保证准确，甚至有些完全是“一本正经的胡说八道”。

ChatGPT需要依靠人类员工的反馈来提高准确性。

其他类似的大模型，同样如此，都需要非常海量的人工能力，来帮助大模型提升准确性。这就是类似于在中国，虽然大家觉得高德地图、百度地图、腾讯地图很智能，但是实际上，它们不仅仅是在调用卫星数据、交通部门数据，还有数以万计的人工“标记员”在帮助和辅助数据修正工作。

7、ChatGPT之类的大模型是如何工作的？

前面已经说过，GPT的意思是“生成式预训练转换器（Generative Pre-trained Transformer），这是大模型的核心技术。

转换器是在数据序列中寻找长程模式的专门算法。转换器不仅能学会预测一个句子中的下一个词，还能学会预测一个段落中的下一个句子以及一篇文章中的下一个段落。这就是为什么它能够在长文本中紧扣主题。

由于转换器需要大量的数据，它的训练分为两个阶段：首先，它用通用数据进行预训练，这种数据更容易大量收集；然后，根据它要执行的具体任务，再利用定制的数据进行微调。

张栋伟在最近的两篇文章中多次强调，大模型的核心取决于三个因素：数据、算力和场景。

所有的大模型都要受制于该公司所能合法获得的数据量，还要具备能支撑这些数据的算力。最后，还需要有可以商业化的场景，形成投资-产出的正循环。

8、ChatGPT这样的大模型收费吗？

目前，包括美国的ChatGPT，以及国内的各种大模型，都是免费的。需要个人去官网注册申请。

大模型产品都会提供一个API（应用程序编程接口），允许各公司将该技术整合到自家产品或后端解决方案中。这种企业定制版本，以及面向个人的高级版本，会收费。

需要再次提示的是，上文已经说过，目前大模型都还需要人工进行优化，因此你在大模型输入的内容，以及大模型给你输出的答案结果，这些信息都会被开发者公司阅读到。

所以，请不要输入隐私数据或敏感的公司信息。

9、政府对AIGC的态度

世界各国政府正在探索规范生成式AI工具的方式，担心它们可能被滥用于犯罪、传播虚假信息或威胁国家安全等情况。

4月11日，国家互联网信息办公室（简称“网信办”）发布通知，就《生成式人工智能服务管理办法（征求意见稿）》向社会公开征求意见，意见反馈截止时间为5月10日。

网信办表示， “国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作，鼓励优先采用安全可信的软件、工具、计算和数据资源”。

网信办定义，所谓“生成式人工智能”，是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。网信办明确研发、利用生成式人工智能产品，面向中华人民共和国境内公众提供服务的，适用本办法。

在服务提供者的准入资格方面，《意见征求稿》要求利用生成式人工智能产品向公众提供服务前，应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》（2018年11月发布）向国家网信部门申报安全评估，并按照《互联网信息服务算法推荐管理规定》（2021年12月发布）履行算法备案和变更、注销备案手续。

《意见征求稿》详细地分别对提供生成式人工智能产品或服务，对用于生成式人工智能产品的预训练、优化训练数据提出明确要求。

10、AI会抢人类饭碗吗？

任何最新发明的技术，都会对当下的岗位和未来的工作产生重大影响。

在此前的计算机、互联网、移动互联网的技术浪潮中，都会蓝领阶层产生了重大影响。

当前业内普遍认为，AIGC将对白领职业产生较大影响。

但是，回首往事，会发现计算机、互联网、移动互联网三大革命性的新技术，使得社会经济变得更加生机勃勃。

这是因为，经济学家已经发现，新技术的相关影响往往包含三个方面：

（1）一些劳动者提高了生产力；

（2）部分岗位实现自动化或被合并；

（3）产生出以前不存在的新岗位。

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：