订阅
纠错
加入自媒体

解读AlphaZero:一种人类从未见过的智慧

2018-12-29 15:04
来源: 物联中国

除了棋类,AlphaZero还能做什么?

现在的问题是,机器学习能否帮助人类发现所关心问题的真相?比如像癌症和意识、免疫系统之谜、基因组之谜等科学和医学尚未解决的重大问题。

早期迹象令人鼓舞。去年8月份,《自然医学》上的两篇文章探讨了机器学习如何应用于医学诊断。在一项研究中,DeepMind研究人员与伦敦莫尔菲尔德眼科医院(Moorfields Eye Hospital)的临床医生合作,开发出一种深度学习算法,可以准确地对各种视网膜病变进行分类。

解读AlphaZero:一种人类从未见过的智慧

另一篇文章也涉及一种机器学习算法,其能够确定急诊室病人的CT扫描是否显现出中风、颅内出血或其他重要神经疾病的迹象。对于中风患者来说,每一分钟都很重要;治疗耽误的时间越长,结果就越糟。新算法的准确性堪比人类专家,而且比人类专家快150倍。一个更快的诊断有助于医生对最紧急病例进行快速分类,并由人类放射科医生进行复查。

然而令人沮丧的是,机器学习算法还无法清晰表达它们的想法。我们不知道它们如何得出结论,所以也就无从确定能否信任机器。AlphaZero似乎已经发现了一些有关国际象棋的重要原则,但它无法与我们分享这种洞察力。作为人类,我们想要的不仅仅是答案,我们想要的是洞察力。从现在起,这将成为我们与电脑互动交流的开始。

事实上,这一情况在数学领域中早有耳闻。四色映射定理就是这样一个长期存在的数学问题。该定理指出在一定的合理约束条件下,有关相邻国家的任何地图都可以只使用四种颜色进行着色,这样相邻两个国家的颜色就不会相同。

虽然人们最终在计算机帮助下于1977年证明了四色映射定理,但是没有人能够检验论证中的所有步骤。从那以后,这个定理的证明得到了验证和简化,但仍有一些部分需要进行蛮力计算。这种发展使许多数学家感到恼火。他们不需要确认四色定理是正确的,但他们想知道为什么这是真的,但是证明没有帮助。

畅想未来:通用算法何时到来?

解读AlphaZero:一种人类从未见过的智慧

但是设想有一天,也许就在不久的将来,AlphaZero已经发展成为一种更通用的解决问题算法,其将拥有至高无上的洞察力,它能够拿出漂亮的证据,就像AlphaZero与Stockfish对弈时一样优雅,而且每一个证明都会揭示为什么定理是正确的。

对于人类数学家和科学家来说,这一天将标志着一个新时代的到来。机器的速度越来越快,相比之下人类神经元却以毫秒级的速度缓慢运转,我们再也跟不上机器的理解速度,人类洞察力的黎明可能很快就会变成黄昏。

无论是基因调控或癌症,还是免疫系统的编排,抑或是亚原子粒子的运动,其中或许还存在有待于发现的更深层模式。假设这些模式需要超越人类的更高智能来预测,而AlphaZero的继任者又能够识别并理解它们,那么在我们人类看来算法就像是一个神谕。

或许未来,我们不再明白为什么计算机的结论总是正确的,但我们可以通过实验和观察来检验它的计算和预测。科学将把我们的角色降低到旁观者的角色,在惊奇和困惑中目瞪口呆。

也许最终我们不再纠结于人类自身关于洞察力的匮乏。毕竟机器算法将能够治愈我们所有的疾病,解决我们所有的科学问题,并让我们所有的一切顺利前行。在我们作为智人存在的最初30万年时间里,我们在没有多少洞察力的情况下一样生存得相当好。我们将自豪地回忆起人类洞察力的黄金时代,这段几千年的辉煌插曲就发生在我们不理解的过去和我们不可思议的未来之间。

Alpha家族高手炼成记

Alpha家族系列出自DeepMind公司,这家公司是2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼创立的。在2014年,DeepMind荣获了剑桥大学计算机实验室的“年度公司”奖项。2014年1月26日,Google宣布收购DeepMind科技,收购的价格大概为4亿美元。

显然,DeepMind真正被全球熟知是在第一次人机大战之后,从2016年的那场对弈之后,DeepMind旗下的围棋AI就开始了超神之路。

解读AlphaZero:一种人类从未见过的智慧

2016年1月27日,AlphaGo在没有任何让子的情况下,以5:0完胜欧洲围棋冠军、职业二段选手樊麾。在围棋人工智能领域,实现了一次史无前例的突破。计算机程序能在不让子的情况下,在完整的围棋竞技中击败专业选手,这是第一次。

2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜,举世哗然,人工智能概念开始被大众熟知。

2016年末2017年初,该程序在中国棋类网站上以“大师”(Master)为注册账号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩;

2017年5月,在中国乌镇围棋峰会上,阿尔法围棋以3比0的总比分战胜排名世界第一的世界围棋冠军柯洁。在这次围棋峰会期间的2017年5月26日,阿尔法围棋还战胜了由陈耀烨、唐韦星、周睿羊、时越、芈昱廷五位世界冠军组成的围棋团队。在柯洁与阿尔法围棋的人机大战之后,阿尔法围棋团队宣布阿尔法围棋将不再参加围棋比赛。

2017年10月18日,DeepMind团队公布了最强版AlphaGo ,代号AlphaGo Zero。它的独门秘籍是“自学成才”。而且,是从一张白纸开始,零基础学习,在短短3天内,成为顶级高手。经过短短3天的自我训练,AlphaGo Zero就强势打败了此前战胜李世石的旧版AlphaGo,战绩是100:0的。

2017年12月5日,AlphaGo Zero迎来升级,这个被称为AlphaZero的程序在三天内自学了三种不同的棋类游戏,包括国际象棋、围棋和日本的将军棋,无需人工干预,一篇描述这一成就的论文今年12月初在《科学》杂志发表。在AlphaZero之外,DeepMind在医疗领域还打造了一个名为AlphaFold的AI系统,它能够应对当今生物学中最大的挑战之一:模拟蛋白质的形状。

2018年12月,AlphaGo Zero登上《自然》杂志封面,完整论文首次公开。

<上一页  1  2  
声明: 本文系OFweek根据授权转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号