AlphaGo Zero

✍ dations ◷ 2025-10-24 19:02:17 #AlphaGo Zero

AlphaGo Zero是DeepMind围棋软件AlphaGo的最新版。2017年10月19日,AlphaGo团队在《自然》上发表文章介绍了AlphaGo Zero,文中指出此版本不采用人类玩家的棋谱,且比之前的所有版本都要强大。通过自我对弈,AlphaGo Zero在三天内以100比0的战绩战胜了AlphaGo Lee,花了21天达到AlphaGo Master的水平,用40天超越了所有旧版本。DeepMind联合创始人兼CEO杰米斯·哈萨比斯说,AlphaGo Zero“不再受限于人类认知”,很强大。由于专家数据“经常很贵、不可靠或是无法取得”,不借助人类专家的数据集训练人工智能,对于人工智能开发超人技能具有重大意义,因为这样的AI不是学习人,是通过对自我的反思和独有的创造力直接超越人类。文章作者之一大卫·席尔瓦表示,摒弃向人类学习的需求,这有可能是对现有人工智能算法的拓展。

AlphaGo Zero神经网络使用TensorFlow在64个GPU和19个CPU参数服务器训练,推理的TPU只有四个。神经网络最初除了规则,对围棋一无所知。AI进行“非监督式学习”,自己和自己对弈,直到能预测自己的每一手棋及其对棋局结果的影响。前三天,AlphaGo Zero连续自我对弈490万局。几天之内它就发展出击败人类顶尖棋手的技能,而早期的AlphaGo要达到同等水平需要数月的训练。为了比较,研究人员还用人类对局数据训练了另一版AlphaGo Zero,发现该版本学习更加迅速,但从长远来看,表现反而较差。

哈萨比斯表示,AlphaGo的算法对需要智能搜索巨大概率空间的领域建树最大,如蛋白质折叠或精准模拟化学反应。对于很难模拟的领域,如学习如何开车,用处可能相对较低。

普遍认为,AlphaGo Zero是一次巨大的进步,即便是和它的开山鼻祖AlphaGo作比较时。艾伦人工智能研究院(英语:Allen Institute for Artificial Intelligence)的奥伦·伊奇奥尼(英语:Oren Etzioni)表示,AlphaGo Zero是“非常令人印象深刻的技术成果”,“不管是在他们实现目标的能力上,还是他们花40天时间用四个TPU训练这套系统的能力”。《卫报》称AlphaGo Zero是“人工智能的大突破”,援引谢菲尔德大学的伊莱尼·瓦希莱基(Eleni Vasilaki)和卡内基梅隆大学的汤姆·米切尔(Tom Mitchell),两人分别说它是令人印象深刻的成就和“突出的工程成就”。悉尼大学的马克·佩斯(英语:Mark Pesce)说AlphaGo Zero是“巨大的技术进展”,带领我们进入“未至之地”。

然而,纽约大学心理学家盖瑞·马库斯(英语:Gary Marcus)对我们目前所知的则表示谨慎,AlphaGo或许包括“程序员如何建造一台解决围棋等问题的机器的隐晦知识”,在确保它的基础结构比玩围棋时更有效率之前,它需要在其他的领域受检测。相反,DeepMind“自信这种方法可以归纳至更多的领域中”。

韩国职业围棋选手李世石回应称:“之前的AlphaGo并不完美,我认为这就是为什么要把AlphaGo Zero造出来”。至于AlphaGo的发展潜力,李世石表示他必须要静观其变,但同时表示它会影响年轻的棋手。韩国国家围棋队教练睦镇硕表示,围棋界已经模仿到之前AlphaGo各个版本的下棋风格,从中创造新的思路,他希望AlphaGo Zero能带来新的思路。睦镇硕补充道,棋界的大趋势如今被AlphaGo的下棋风格影响。“最初,我们很难理解,我差不多认为我在跟外星人打比赛。然而,有过这么次的体会,我已经适应它了。”他说。“我们现在错过了辩论AlphaGo与人类之间的能力差距的点。现在讲的是计算机间的差距。”据称,他已经开始和国家队棋手分析AlphaGo Zero的比赛风格:“虽然只看了几场比赛,但我们的印象是,AlphaGo Zero和他的前者相比,下棋更像人类。”中国职业棋手柯洁在他的微博上表示:“一个纯净、纯粹自我学习的AlphaGo是最强的……对于AlphaGo的自我进步来讲……人类太多余了。”

中国乌镇围棋峰会 3:0 对阵 柯洁;1:0 对阵 五位顶尖棋手联队

89:11 对阵AlphaGo Master

相关

  • Baird规则Baird规则是有机化学的经验规则。它是指当闭合环状三重态平面型的共轭多烯(轮烯)π电子数为4n时,具有芳香性。
  • 小葡萄菌纲Heterogastridiales 白冬孢酵母目(Leucosporidiales) 微球黑粉菌目(Microbotryales) 锁掷酵母目(Sporidiobolales)微球黑粉菌纲(学名:Microbotryomycetes)是担子菌门柄锈菌亚门下的一
  • 兴化市兴化市是位于中国江苏省泰州市北部的一个县级市,位于长江、淮河、黄海和京杭大运河之间的里下河地域内,是中国百强县。兴化是商品粮、水产品生产与集散基地,又是一座古老的文化
  • 米卡·哈基宁米卡·哈基宁(芬兰语:Mika Häkkinen,1968年9月28日-),是芬兰一级方程式赛车手,出生于芬兰万塔。人称“芬兰飞人”,是F1历史上七位成功卫冕世界冠军的车手之一。哈基宁从五岁起就开
  • 基于内核的虚拟机基于内核的虚拟机(英语:Kernel-based Virtual Machine,缩写为KVM)是一种用于Linux内核中的虚拟化基础设施,可将Linux内核转化为一个虚拟机监视器。KVM于2007年2月5日被导入Linux
  • 布德拉达布德拉达(Budhlada),是印度旁遮普邦Mansa县的一个城镇。总人口23499(2001年)。该地2001年总人口23499人,其中男性12423人,女性11076人;0—6岁人口3099人,其中男1702人,女1397人;识字率6
  • 岑彭岑彭(?-36年),字君然,南阳郡西棘阳县(今河南省新野县)人。云台二十八将之一。汉兵起,攻拔棘阳,岑彭带家属投奔前队大夫甄阜。甄阜被杀,岑彭跑到宛城,与前队式严说共守南阳城。汉兵攻之数
  • 不成问题的问题 (电影)《不成问题的问题》(英语:)是2016年中国黑白电影,是梅峰首次执导的电影,由范伟、殷桃、张超、蒋中炜演出,电影改编自老舍1943年的短篇小说,描述抗战时期大后方一个农场的故事。范伟
  • R-15《R-15》是由伏見ひろゆき所著的日本轻小说系列,插图由藤真拓哉负责。由角川Sneaker文库(角川书店)从2009年7月开始发售。系列第1作的《R-15 ようこそ天才学園へ!》是伏見ひろ
  • 1924年夏季奥林匹克运动会足球比赛1924年夏季奥林匹克运动会足球比赛于1924年5月25日至6月9日在法国巴黎举行。比赛共有来自4个大洲的22个国家参加,绝大多数球队都来自欧洲,仅有的三支非欧洲球队包括埃及队、美国队和乌拉圭队。首次参赛的乌拉圭队在本届比赛中五战全胜,获得冠军。巴黎的地点意大利 v 西班牙捷克斯洛伐克 v 土耳其瑞士 v 立陶宛美国 v 爱沙尼亚乌拉圭 v 南斯拉夫王国匈牙利 v 波兰法国 v 拉脱维亚荷兰 v 罗马尼亚瑞士 v 捷克斯洛伐克瑞士 v 捷克斯洛伐克爱尔兰 v 保