中科院自动化所王飞跃教授团队研究成果入选第五届中国科协优秀科技论文

2020-10-19 09:00

本文来源：智车科技

／导读／

2020年9月30日，中国科协公布了第五届优秀科技论文评选结果，中科院自动化所王飞跃教授团队的李力教授牵头发表于《自动化学报》的“平行学习－机器学习的一个新型理论框架”一文榜上有名。本届遴选计划共收录96篇论文，均为发表在我国科技期刊上的优秀论文代表。

第五届科协优秀论文遴选计划公示表

论文概述

随着计算能力的提高和计算理论的创新，机器学习在过去 30 年中取得了长足的发展，正受到越来越多人的关注，与此同时，机器学习也面临越来越多的问题，传统机器学习理论框架的不足被逐渐发现和确认，新的机器学习理论框架不断被提出。

中科院自动化所王飞跃研究员于2004年提出了平行系统的思想，试图用一种适合复杂系统的计算理论与方法解决社会经济系统中的重要问题．其主要观点是利用大型计算模拟、预测并诱发引导复杂系统现象，通过整合人工社会，计算实验和平行系统等方法，形成新的计算研究体系。

近年来，我们尝试将平行系统的思想扩展并引入到机器学习领域建立一种新型理论框架以更好地解决数据取舍、行动选择等传统机器学习理论不能很好解决的问题。在本文中，我们将对这一理论框架的结构和方法进行阐述。框架示意图如下：

图1 平行学习的理论框架图

平行学习大致可以分为预测学习（Predictive Learning）、描述学习（Descriptive learning）、指示学习（Prescriptive Learning）三个互相耦合关联的阶段。

在数据处理阶段，平行学习首先从原始数据中选取特定的“小数据”，结合先验知识，使用预测学习产生大量新的数据。这些人工数据和特定的原始小数据一起构成解决问题所需要学习的“大数据”集合，通过描述学习的方式产生一个人工系统。

在行动学习阶段，平行学习沿用强化学习的思路，使用状态迁移来刻画系统的动态变化，通过指示学习的方式在人工系统中对行动空间进行探索。通过学习提取，我们可以得到“小知识”——应用于某些具体场景或任务的精准知识，并将其应用于平行控制和平行决策。而平行控制和平行决策将引导系统进行特定的数据采集，获得新的原始数据，并再次进行新的平行学习，使系统在数据和行动之间构成一个闭环。

以平行学习在自动泊车中的应用为例。首先通过获取真实系统中的泊车数据，结合计算实验与预测学习生成人工数据，形成泊车的“大数据”。使用这些数据，通过描述学习的方式构造人工系统，该系统是真实车辆的平行系统，接受控制序列作为输入，输出车辆的移动轨迹。在这一人工系统中，我们可以使用指示学习的方式探索可能的泊车方案，学习到的策略会控制真实车辆进行泊车，进而获得更多的数据。完整流程如下图所示

图2 平行学习在自动泊车中的应用

平行的核心思想是从小数据产生大数据，再从大数据提炼小规则即精准知识。平行学习是这一思想在机器学习领域中的具体实现。平行学习已在虚拟场景生成、无人驾驶车辆的智能控制与测试、社会计算和情报处理等领域得到了较好的应用。期待本文抛砖引玉，引起业内专家学者兴趣，共同对机器学习理论做出更加深入的革新。

关于“优秀科技论文遴选计划”

“优秀科技论文遴选计划”是中国科协基于鼓励科技工作者多出科研精品和原创性研究成果、促进更多优秀成果在我国科技期刊首发、进而助推世界一流科技期刊建设而设的大型年度评选活动。遴选工作由中国科协统一部署，面向10个学科集群评选推介发表在我国正式出版的科技期刊上、且在国际学术界有影响、在科技前沿有突破和建树、对原始创新有引领作用、对国家经济社会建设有重大贡献的优秀论文，对从源头上推动我国期刊质量的提升，维护我国科技期刊的成果首发权，掌握学术评价主导权、进而提升我国在国际科技界的话语权，更好地提升科技创新能力有重要的推动作用。

－ End －