ELF OpenGo

✍ dations ◷ 2025-09-14 14:29:24 #ELF OpenGo

ELF OpenGo是Facebook AI Research团队(FAIR)所开发的电脑围棋软件及所发布的资料。

ELF OpenGo是Facebook AI Research团队(FAIR)依照DeepMind在科学期刊《自然》上对于AlphaGo Zero所发表的论文《Mastering the game of Go without human knowledge》与AlphaZero的论文《Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm》所实做出的开源电脑围棋程序,也就是不使用人类棋谱与累积的围棋知识,仅实做围棋规则,使用单一人工神經网络从自我对弈中学习(不像AlphaGo以人类角度思考,设计了Policy Network与Value Network)。

训练网络使用20 blocks x 224 filters,在2000个GPU下训练两周,相较AlphaGo Zero使用的20 blocks x 256 filters版本略小一些(AlphaGo Zero另外还有40 blocks x 256 filters)。

由于Facebook所拥有的计算资源,产生出高质量的训练网络资料与对局棋谱,许多基于相同算法或是AlphaGo相关论文内容的围棋软件都积极测试ELF OpenGo所提供的训练资料。

Leela Zero是目前少数有公开代码并公开训练网络资料的围棋软件,且仍然有志愿者持续投入资源计算演化,故经常被当作其他围棋软件的基准。

由Facebook自行测试,ELF OpenGo与Leela Zero对战的成绩为198:2。在Leela Zero的进度网站上也经常会比较现有训练网络与ELF OpenGo的比较。

志愿者在CGOS上使用Leela Zero的程序引擎以及由ELF OpenGo公开的训练网络(v0)转换成Leela Zero格式的训练网络(即Hash值62b5417b的训练网络,账号LZ_62b541_ELF_1600)进行对弈测试,但由于目前在CGOS上测试的不是ELF Go的程序引擎,不清楚ELF OpenGo的训练资料在转换后的影响。截至2018年5月30日 (2018-05-30),对弈已经超过1000盘,BayesElo分数约3770分。

Facebook与韩国棋院合作,以中国规则与韩国的世界顶尖棋手对弈(贴目7.5目),在电脑每步限制50秒(使用单机单张NVIDIA Tesla V100),人类不限时间的前提下,每个人至少下两局,达到14:0的成绩,对弈对手包括金志锡、申真谞、朴永训以及崔哲瀚。

相关

  • 经济部国际贸易局经济部国际贸易局(简称国贸局、贸易局),是中华民国经济部所属机关,是掌理中华民国国际贸易政策之研拟及进出口管理事项的主管机关。根据《经济及能源部贸易商务局组织法》草案拟
  • 三鹰事件三鹰事件,是指1949年7月15日晚上,在日本东京都北多摩郡三鹰町,中央本线三鹰站的一辆无人驾驶的空列车(63系)从车站停车库突然窜出,以时速60公里冲向车站,连带冲击到线路旁的商店街,
  • 露皮塔·尼永奥露皮塔·尼永奥(英语:Lupita Nyong'o,1983年3月1日-),生于墨西哥首都墨西哥城,肯尼亚电影女演员。2013年,因电影《为奴十二年》而受到注目,并以此片获得第20届美国演员工会奖最佳女配
  • State of California加利福尼亚州(英语:State of California),简称加州,是美国西部太平洋沿岸的一个州。面积位列美国第三;人口为3,930万,位列美国各州第一。州首府是萨克拉门托。在地理、地貌、物产、
  • 商城县商城县,是中华人民共和国河南省信阳市下辖的一个县,位于河南省东南部,大别山北麓。面积2117平方公里,2006年人口74万。县人民政府驻城关镇。商城历史悠久,人文荟萃。夏商为诸侯封
  • 物理变化物理变化与化学变化(化学反应)相对,指的是不涉及物质原子重组的变化。物理变化的过程中,原有的分子并未分解,也没有新的分子产生。只是分子间的距离改变了。如冰融化成液态水时,水
  • 钮先锺钮先锺(1913年7月-2004年2月7日),台湾军事学者,生于江西九江。有笔名万仞、强安平、一厂等,其中“万仞”是效法并期望超越军事思想家蒋百里。1913年,钮先锺出生于江西。1930年进入
  • 桑特海峡战役桑特海峡战役(Battle of the Saintes)是美国独立战争中英国海军在西印度群岛的重要胜利,从而结束了该地区的法国威胁。桑特海峡战役发生在1782年4月9日至12日,是英、法国在加
  • 山本孕江山本孕江(1893年12月-1947年?)是日本高知县出身的俳人。日治时代台湾俳句界的中心人物,本名山本昇。明治26年(1893年)生于高知县高知市。师事高滨虚子,属于“ホトトギス派”的俳人
  • 拉德布鲁赫公式拉德布鲁赫公式(德语:)是由德国法学教授与政治人物古斯塔夫·拉德布鲁赫在1946年的论文中第一次提出的公式。根据这一理论,法官遭遇正义与法律有效性之间的冲突时只有在法规背后