AlphaGo Zero

✍ dations ◷ 2025-04-28 09:12:39 #AlphaGo Zero

AlphaGo Zero是DeepMind围棋软件AlphaGo的最新版。2017年10月19日,AlphaGo团队在《自然》上发表文章介绍了AlphaGo Zero,文中指出此版本不采用人类玩家的棋谱,且比之前的所有版本都要强大。通过自我对弈,AlphaGo Zero在三天内以100比0的战绩战胜了AlphaGo Lee,花了21天达到AlphaGo Master的水平,用40天超越了所有旧版本。DeepMind联合创始人兼CEO杰米斯·哈萨比斯说,AlphaGo Zero“不再受限于人类认知”,很强大。由于专家数据“经常很贵、不可靠或是无法取得”,不借助人类专家的数据集训练人工智能,对于人工智能开发超人技能具有重大意义,因为这样的AI不是学习人,是通过对自我的反思和独有的创造力直接超越人类。文章作者之一大卫·席尔瓦表示,摒弃向人类学习的需求,这有可能是对现有人工智能算法的拓展。

AlphaGo Zero神经网络使用TensorFlow在64个GPU和19个CPU参数服务器训练,推理的TPU只有四个。神经网络最初除了规则,对围棋一无所知。AI进行“非监督式学习”,自己和自己对弈,直到能预测自己的每一手棋及其对棋局结果的影响。前三天,AlphaGo Zero连续自我对弈490万局。几天之内它就发展出击败人类顶尖棋手的技能,而早期的AlphaGo要达到同等水平需要数月的训练。为了比较,研究人员还用人类对局数据训练了另一版AlphaGo Zero,发现该版本学习更加迅速,但从长远来看,表现反而较差。

哈萨比斯表示,AlphaGo的算法对需要智能搜索巨大概率空间的领域建树最大,如蛋白质折叠或精准模拟化学反应。对于很难模拟的领域,如学习如何开车,用处可能相对较低。

普遍认为,AlphaGo Zero是一次巨大的进步,即便是和它的开山鼻祖AlphaGo作比较时。艾伦人工智能研究院(英语:Allen Institute for Artificial Intelligence)的奥伦·伊奇奥尼(英语:Oren Etzioni)表示,AlphaGo Zero是“非常令人印象深刻的技术成果”,“不管是在他们实现目标的能力上,还是他们花40天时间用四个TPU训练这套系统的能力”。《卫报》称AlphaGo Zero是“人工智能的大突破”,援引谢菲尔德大学的伊莱尼·瓦希莱基(Eleni Vasilaki)和卡内基梅隆大学的汤姆·米切尔(Tom Mitchell),两人分别说它是令人印象深刻的成就和“突出的工程成就”。悉尼大学的马克·佩斯(英语:Mark Pesce)说AlphaGo Zero是“巨大的技术进展”,带领我们进入“未至之地”。

然而,纽约大学心理学家盖瑞·马库斯(英语:Gary Marcus)对我们目前所知的则表示谨慎,AlphaGo或许包括“程序员如何建造一台解决围棋等问题的机器的隐晦知识”,在确保它的基础结构比玩围棋时更有效率之前,它需要在其他的领域受检测。相反,DeepMind“自信这种方法可以归纳至更多的领域中”。

韩国职业围棋选手李世石回应称:“之前的AlphaGo并不完美,我认为这就是为什么要把AlphaGo Zero造出来”。至于AlphaGo的发展潜力,李世石表示他必须要静观其变,但同时表示它会影响年轻的棋手。韩国国家围棋队教练睦镇硕表示,围棋界已经模仿到之前AlphaGo各个版本的下棋风格,从中创造新的思路,他希望AlphaGo Zero能带来新的思路。睦镇硕补充道,棋界的大趋势如今被AlphaGo的下棋风格影响。“最初,我们很难理解,我差不多认为我在跟外星人打比赛。然而,有过这么次的体会,我已经适应它了。”他说。“我们现在错过了辩论AlphaGo与人类之间的能力差距的点。现在讲的是计算机间的差距。”据称,他已经开始和国家队棋手分析AlphaGo Zero的比赛风格:“虽然只看了几场比赛,但我们的印象是,AlphaGo Zero和他的前者相比,下棋更像人类。”中国职业棋手柯洁在他的微博上表示:“一个纯净、纯粹自我学习的AlphaGo是最强的……对于AlphaGo的自我进步来讲……人类太多余了。”

中国乌镇围棋峰会 3:0 对阵 柯洁;1:0 对阵 五位顶尖棋手联队

89:11 对阵AlphaGo Master

相关

  • 南赤道洋流南赤道洋流(South Equatorial Current),或称为南赤道暖流,为一个显著的大西洋、太平洋及印度洋的洋流,在赤度至南纬20度间由东向西流。南赤道洋流在大西洋及太平洋向北伸延至北纬
  • 芬多精芬多精(英语:Phytoncide)是植物所排放的抗菌(英语:Antimicrobial)挥发性有机化合物。大多种植物都具有防御霉菌或细菌的芬多精。Phytoncide一词最早是于1930年由俄罗斯国立列宁格
  • Dancing High《Dancing High》(朝鲜语:댄싱하이,英语:Dancing High)为韩国KBS电视台是由KBS2制作的新综艺节目,郑亨敦主持,以10-19虚岁青少年为对象,展开舞蹈竞赛,预计会展现具有舞蹈实力、才华及
  • 神鬼传承《谍影重重4(伯恩的遗产)》 ()是一本谍报小说,由艾瑞克·范·勒斯贝德写作,于2004年出版,主要是1990年劳勃·勒德伦的神鬼三部曲最后一部《神鬼通牒》的续集。台湾已于2007年12月
  • 复仇者联盟4:终局之战 (原声带)《复仇者联盟4:终局之战 (电影原声带)》(英语:)是亚伦·席维斯崔为漫威工作室电影《复仇者联盟4:终局之战》创作的电影原声带。好莱坞唱片(英语:Hollywood Records)于2019年4月26日
  • 穆塔兹·伊萨·巴尔希姆穆塔兹·伊萨·巴希姆(阿拉伯语:معتز عيسى برشم‎,1991年6月24日-),卡塔尔跳高运动员,他以2.43米成为跳高亚洲纪录保持者。获得2012年奥运会铜牌(2.29米)、2016年奥运会
  • 卡洛斯·阿历山大·苏沙·施华卡拿奥(Carlão),全名为卡洛斯·阿历山大·苏沙·施华(Carlos Alexandre de Souza Silva),1986年8月1日生于里约热内卢,巴西职业足球运动员,现效力于日本职业足球联赛球会鹿岛鹿角。
  • 天津海河桥梁列表天津海河桥梁列表介绍了位于天津市内跨越海河干流和市区内主要支流的各式桥梁。天津市由于处于海河流域下游的九河下梢,自古便建有大量各式各样的桥梁。自从2002年起,天津市开始对海河进行综合开发以后,除对原有桥梁进行修缮、提升和改造之外,还邀请英国、美国、日本等多个国家的桥梁建筑设计公司共同对天津海河的桥梁进行设计并新建了一批具有景观作用的桥梁,使得天津市区内的海河上游,平均不到0.8公里就有一座桥梁,在改善交通的同时也提升了海河的景观。现在天津海河上的“一桥一景”已经成为天津著名的旅游景观。历史上,天津早期的
  • BenchWeLeoBenchWeLeo(韩语:벤치위레오), 是韩国K-band推出的四人男子乐队团体,成员有Junhaeng、 Gi-jun、 Guillaume、 Seulwoong。在2018年成立,2020年加入法国成员基永,2020年5月31日发行单曲델리만쥬正式出道。BenchWeLeo是以“狮子座”命名的乐队,“Leo on the Bench”吉祥物因其可爱的外表和对听众的热情而出现。乐队的创建基于这样的想法,成员从大学毕业后去母校的校友想做音乐。 这是因为我在大学的时候一直在乐队里工作,但是我想尝试新的挑
  • 之乎者也《之乎者也》,是罗大佑在1982年所发行的首张创作专辑。罗大佑还没有发行这张专辑之前,早就发表这张专辑的一些歌曲。1974年(民国63年),罗大佑在读中国医药学院二年级时发表两首歌曲,而且歌词都是两位文学家所写的,分别是徐志摩的《歌》和余光中的《乡愁四韵》;三年后,《歌》被选为《闪亮的日子》的电影插曲之一。1976年,罗大佑发表《错误》、《蒲公英》这两首创作歌曲,其中《错误》的歌词是罗大佑改写于郑愁予的同名散文。1979年,罗大佑花费30分钟完成《恋曲1980》,这首歌是为中国医药学院护理系的学姐而创作的