AlphaGo Zero

✍ dations ◷ 2025-09-11 16:01:25 #AlphaGo Zero

AlphaGo Zero是DeepMind围棋软件AlphaGo的最新版。2017年10月19日,AlphaGo团队在《自然》上发表文章介绍了AlphaGo Zero,文中指出此版本不采用人类玩家的棋谱,且比之前的所有版本都要强大。通过自我对弈,AlphaGo Zero在三天内以100比0的战绩战胜了AlphaGo Lee,花了21天达到AlphaGo Master的水平,用40天超越了所有旧版本。DeepMind联合创始人兼CEO杰米斯·哈萨比斯说,AlphaGo Zero“不再受限于人类认知”,很强大。由于专家数据“经常很贵、不可靠或是无法取得”,不借助人类专家的数据集训练人工智能,对于人工智能开发超人技能具有重大意义,因为这样的AI不是学习人,是通过对自我的反思和独有的创造力直接超越人类。文章作者之一大卫·席尔瓦表示,摒弃向人类学习的需求,这有可能是对现有人工智能算法的拓展。

AlphaGo Zero神经网络使用TensorFlow在64个GPU和19个CPU参数服务器训练,推理的TPU只有四个。神经网络最初除了规则,对围棋一无所知。AI进行“非监督式学习”,自己和自己对弈,直到能预测自己的每一手棋及其对棋局结果的影响。前三天,AlphaGo Zero连续自我对弈490万局。几天之内它就发展出击败人类顶尖棋手的技能,而早期的AlphaGo要达到同等水平需要数月的训练。为了比较,研究人员还用人类对局数据训练了另一版AlphaGo Zero,发现该版本学习更加迅速,但从长远来看,表现反而较差。

哈萨比斯表示,AlphaGo的算法对需要智能搜索巨大概率空间的领域建树最大,如蛋白质折叠或精准模拟化学反应。对于很难模拟的领域,如学习如何开车,用处可能相对较低。

普遍认为,AlphaGo Zero是一次巨大的进步,即便是和它的开山鼻祖AlphaGo作比较时。艾伦人工智能研究院(英语:Allen Institute for Artificial Intelligence)的奥伦·伊奇奥尼(英语:Oren Etzioni)表示,AlphaGo Zero是“非常令人印象深刻的技术成果”,“不管是在他们实现目标的能力上,还是他们花40天时间用四个TPU训练这套系统的能力”。《卫报》称AlphaGo Zero是“人工智能的大突破”,援引谢菲尔德大学的伊莱尼·瓦希莱基(Eleni Vasilaki)和卡内基梅隆大学的汤姆·米切尔(Tom Mitchell),两人分别说它是令人印象深刻的成就和“突出的工程成就”。悉尼大学的马克·佩斯(英语:Mark Pesce)说AlphaGo Zero是“巨大的技术进展”,带领我们进入“未至之地”。

然而,纽约大学心理学家盖瑞·马库斯(英语:Gary Marcus)对我们目前所知的则表示谨慎,AlphaGo或许包括“程序员如何建造一台解决围棋等问题的机器的隐晦知识”,在确保它的基础结构比玩围棋时更有效率之前,它需要在其他的领域受检测。相反,DeepMind“自信这种方法可以归纳至更多的领域中”。

韩国职业围棋选手李世石回应称:“之前的AlphaGo并不完美,我认为这就是为什么要把AlphaGo Zero造出来”。至于AlphaGo的发展潜力,李世石表示他必须要静观其变,但同时表示它会影响年轻的棋手。韩国国家围棋队教练睦镇硕表示,围棋界已经模仿到之前AlphaGo各个版本的下棋风格,从中创造新的思路,他希望AlphaGo Zero能带来新的思路。睦镇硕补充道,棋界的大趋势如今被AlphaGo的下棋风格影响。“最初,我们很难理解,我差不多认为我在跟外星人打比赛。然而,有过这么次的体会,我已经适应它了。”他说。“我们现在错过了辩论AlphaGo与人类之间的能力差距的点。现在讲的是计算机间的差距。”据称,他已经开始和国家队棋手分析AlphaGo Zero的比赛风格:“虽然只看了几场比赛,但我们的印象是,AlphaGo Zero和他的前者相比,下棋更像人类。”中国职业棋手柯洁在他的微博上表示:“一个纯净、纯粹自我学习的AlphaGo是最强的……对于AlphaGo的自我进步来讲……人类太多余了。”

中国乌镇围棋峰会 3:0 对阵 柯洁;1:0 对阵 五位顶尖棋手联队

89:11 对阵AlphaGo Master

相关

  • 白喉白喉疫苗是一种用来对抗白喉杆菌(英语:Corynebacterium diphtheriae)的疫苗,而白喉杆菌正是白喉的致病原。在1980年到2000年间,白喉疫苗的出现让白喉患者的感染人数减少90%之多。
  • 专利地图专利地图(Patent Map)系指透过专利检索技巧,检索出与研究主题相关之专利资料,并以统计分析之方法,加以缜密及精细之剖析整理制成各种可分析、解读、以图表格式呈现之加值化专利资
  • MPP+MPP+(1-甲基-4-苯基吡啶�)是一个分子式为C12H12N+带正电的化合物。它能够影响线粒体中的氧化磷酸化,造成ATP耗尽及细胞死亡,因此具有毒性。 同时,它还能阻断儿茶酚胺的合成,减少多
  • 神秘岛《神秘岛》(英语:Xcalibur)是加拿大与法国联合创作的一部40集3D电脑动画片。2001年11月1日至2002年4月1日于加拿大YTV电视频道首播。每集30分钟左右。中国大陆于中国中央电视台
  • 台湾原住民文学台湾原住民文学或台湾原住民族文学的定义不一,最主要的界定方式,通常是将具有台湾原住民血统的作家的作品,归入这个分类中。但也有研究者就题材、语言、工具等方向提出不同的定
  • 斯维亚托斯拉夫斯维亚托斯拉夫,起源于斯拉夫语族的男性名字。(以下人物按逝世先后排列)
  • 侦探伽利略《侦探伽利略》是日本作家东野圭吾的短篇推理小说集,也是“伽利略系列”的第一本小说。1998年5月30日于文艺春秋出版,2002年发行文春文库版。拍摄成福山雅治与柴咲幸主演的电
  • 泥鲸之子们在沙地上歌唱中文版单行本第1册封面《泥鲸之子们在沙地上歌唱》(日语:クジラの子らは砂上に歌う)是日本漫画家梅田阿比具科幻性质的奇幻漫画。于秋田书店旗下杂志《Mystery Bonita(日语:ミス
  • 人民力量革命 (2001年)第二次人民力量革命(Second People Power Revolution)是2001年1月由菲律宾人民、时任天主教马尼拉总教区总主教辛海梅枢机、时任菲律宾副总统格洛丽亚·马卡帕加尔·阿罗约、菲律宾军方及内阁成员等拒绝继续支持被控贪腐的菲律宾总统艾斯特拉达而合力逼迫其于1月20日辞职下台的革命。由于这次革命与1986年的第一次人民力量革命同样发生于菲律宾国家首都区桑托斯大道(Epifanio de los Santos Avenue)而被称为“桑托斯大道革命2”(EDSA Revolution of
  • 岳晓勇岳晓勇(1959年-),湖北恩施人,毕业于武汉大学英语系,中华人民共和国政治人物、外交官。2010年,接替郁红阳担任中华人民共和国驻约旦大使。2016年,接替徐建国担任中华人民共和国驻爱尔兰共和国大使。2021年7月任中国外交部阿富汗事务特使。