郑南宁：直觉AI与无人驾驶

2018-08-27 11:30

小郑院士从人工智能的五大学术流派讲起，分析了符号化人工智能与深度神经网络的局限性，并详细剖析了“使机器像人一样对物理世界直观理解”的直觉AI，以其团队实践的无人驾驶为例，分析人工智能中的认知与推理是如何解决实际问题的。

“首届中国认知计算与混合智能学术大会”于2018年8月25－26日在西安举行。本次大会的主题是研讨与交流认知科学、神经科学与人工智能学科等领域交叉融合的最新进展和前沿技术，西安交通大学人工智能与机器人研究所教授，中国工程院院士郑南宁作为大会报告的最后一位嘉宾分享了题为《直觉性AI与无人驾驶》报告。郑院士从人工智能的五大学术流派讲起，分析了符号化人工智能与深度神经网络的局限性，并详细剖析了“使机器像人一样对物理世界直观理解”的直觉AI，以其团队实践的无人驾驶为例，分析人工智能中的认知与推理是如何解决实际问题的。以下为报告的主要内容：

传统人工智能及其局限性

人工智能追求的长期目标是使机器能像人类一样感知世界和解决问题。对当前人工智能而言，解决某些对人类来说属于智力挑战的问题可能是相对简单的，但对看似简单的与真实物理世界交互的能力依然非常差（无人驾驶就属于这类问题）。

目前，人工智能主要有以下五大学术流派：

①符号主义：使用符号、规则和逻辑来表征知识和进行逻辑推理，最喜欢的算法是：规则和决策树

②联结主义：使用概率矩阵和加权神经元来动态地识别和归纳模式，最喜欢的算法是：神经网络
③贝叶斯派：获取发生的可能性来进行概率推理，最喜欢的算法是：朴素贝叶斯或马尔可夫

④进化主义：生成变化，然后为特定目标获取其中最优的，最喜欢的算法是：遗传算法
⑤Analogizer：根据约束条件来优化函数（尽可能走到更高，但同时不要离开道路），常用的算法：支持向量机（SVM）。

人类面临的许多问题具有不确定性、脆弱性和开放性。今天人工智能的理论框架，建立在演绎逻辑和语义描述的基础方法之上，但我们不可能对人类社会的所有问题建模，因为这中间存在着条件问题，我们不可能把一个行为的所有条件都模拟出，这是传统人工智能的局限性。

符号化人工智能的局限性

需要对问题本身抽象出一个精确数学意义上的解析式的数学模型（抽象不出，即归纳为不可解问题）

需要对已建立的数学模型设计出确定的算法

确定的算法无法表示现实世界问题所固有的测不准性和不完备性

图灵意义下的可计算问题都是可递归的（“可递归的”都是有序的，而实际中存在大量的开放性、动态性和脆弱性问题）

深度神经网络的局限性

过度依靠训练数据

缺乏推理和对因果关系的表达能力（而大量的人工智能问题需要给出处理对象间的关联、因果以及控制关系）

依靠于指令驱动或数据驱动，其存储架构无法进行高效的图数据索引和存储（而在一些应用中需要基于事件驱动的计算）

无法在计算过程中实现有效的注意机制（计算负载与资源分配），而选择性注意机制是构成高级AI的基本核心

郑南宁：直觉AI与无人驾驶

直觉AI

人脑对于非认知因素的理解更多地来自于直觉，并受到经验和长期知识积累的影响，这些因素在人对物理环境理解与行为交互、非完整信息处理等问题中有着极其重要的作用。而且人类的学习是一种与事物互动的过程，人类认知过程中的特征概念形成往往是建立在语义解释的基础上；人类依赖对事物的观察（或显著性特征的注意）在大脑中建立不同的内部分析模型，并利用这些模型来推测事物的变化，或是从过去的事件预测未来。

而机器学习中的特征提取及预测模型与人类认知过程中的特征概念形成及其内部分析模型是完全不同的，为使机器学习模型产生人类的认知结果，需要其所学特征在一定程度上符合神经生理学实验结果，同时要使特征具有数学和语义的解释性。此外，大脑神经网络结构的可塑性，以及人脑在非认知因素和认知功能之间的相互作用，它们是形式化方法难以、甚至不能描述的。因此，我们需要从脑认知机理和神经科学获得灵感和启发，发展新的AI计算模型与架构，让机器具备对物理世界最基本的感知与反应，即使机器具有“常识”推理的能力，从而实现更加健壮的人工智能系统。

我们要建造一种更加健壮的人工智能，需要脑认知和神经科学的启发。计算机和人类大脑是对问题求解的物质基础。在智力和计算能力方面，计算机远远超过了人类，但是人类面对的大部分问题都是开放的、动态的、复杂的，大脑在处理这种问题时表现出的想象和创造，还有对复杂问题的分析和描述，是传统人工智能的方法所不能企及的，我们只能够从人类大脑的神经网络结构中去获得构造新的人工智能的因素。

直觉推理

直觉和敏感都属于创造性思维，警察在破案中，靠的是多年积累和实践，形成的直觉判断。灵感、顿悟与直觉的区别是，直觉是对当前环境的反应，它在现在人工智能的发展中扮演着十分重要的角色。我们需要一种基于直觉的人工智能，也可以将它看成一种基于直觉的推理。

人的直觉反应实际上是寻找全局最优解。要构造直觉推理，需要连个关键因素：1．需要构造一个成本函数；2．需要给出一个决策结构，而这个决策结构就建立在记忆基础上。

人在观察事物时，一定会形成一种与时间相关的影像。如果把直觉推理和数学归纳演绎推理两类机制组合，就可以实现基于认知计算或受神经科学启发的人工智能。

认知推理

我们把认知推理称为直观、朴素的物理推理。物理层面的认知推理可以化解时间与空间，追踪事物的发展轨迹。认知推理的另一个要素在心理层面，简而言之就是学习方向受心理状态的引导。我们需要把物理层面和心理层面的推理嵌入到推理的人工智能系统中。

使机器像人一样对物理世界直观理解

实现物理层面认知推理的基本要素：

（1）物理（或对象）特征的识别，并形成长短期记忆

（2）物理（或对象）之间相互关系与作用的直观理解

（3）基于想象力的行为模型产生

关于物体（或对象）的关系和物理层面的直观推理是人类智力的核心，使机器像人一样对物理世界直观理解是人工智能追求的科学目标之一。

构造一个具体的人工智能系统

直觉推理、认知推理和因果模型是构建健壮的人工智能必须考虑的基本因素。那么如何来构造一个具体的系统？构造机器人需要三个基本要素：1．对环境中的所有对象进行特征识别，并且进行长期记忆；2．理出对象间的关系，并对它们相互间的作用进行描述；3．基于想象力的行为模型，人在进行具体行动之前，会想象其带来的后果，但机器就需要分析物体之间的各种关系。

这三种要素是让机器像人一样理解物理世界的基础。具有想象力的人工智能，就需要：

构造一个内部预测的模型，在行动之前预想到的结果；

给出环境模型，提取有用信息；

规划想象行为，最大化任务效率（具有想象力的AI）

用认知解决无人驾驶

我们在 2000 年初就开始做无人驾驶，有人说要把无人驾驶汽车和城市真实场景的车融合，我们还面临非常艰难的挑战，有相当长的路要走。车联网，V2X，V2V，都一样。在这种局部、动态的场景中，我们怎样让自动驾驶跟环境融合，确实是一个很大的问题。

无人驾驶技术的五大难题：

1．场景的“可靠感知”

无论何种路况或天气必须可靠地感知周围的场景

2．“预行为”理解

判断或理解交通场景中不同运动对象细微的预行为

3．“意外遭遇”的应对