Minigo是一套电脑围棋软件。
Minigo是一套依照DeepMind在《自然》上对于AlphaGo Zero所发表的论文《Mastering the game of Go without human knowledge》所实做出的开源电脑围棋程序,也就是不使用人类棋谱与累积的围棋知识,仅实做围棋规则,使用单一人工神經网络从自我对弈中学习(不像AlphaGo以人类角度思考,设计了Policy Network与Value Network)。
软件是基于Brain Lee的MuGo继续开发,使用Python与C++撰写,并且透过TensorFlow实做人工神經网络的部分。代码以Apache License 2.0发布,训练资料以公有领域(Public domain)发布。
项目的目标包括了:
除此之外,项目也希望借由独立另外实做,验证Leela Zero所产生的疑问。
这个项目虽然是挂在TensorFlow的GitHub下(且TensowFlow是由Google研发出的软件),而且主要的项目贡献者Andrew Jackson与Tom Madams都是Google员工,但官方一再强调这并非TensorFlow项目的一环,也不是DeepMind的AlphaGo官方版本,而是由独立的团队依照AlphaGo Zero的论文而实做出的版本。
虽然Google与DeepMind没有正式参与Minigo项目,但Andrew Jackson使用的是Google所提供的20%时间,并且得到Google赞助提供硬件资源进行运算,供Minigo团队确认程序正确性:
Leela Zero同样也是依照AlphaGo Zero论文所独立实做出来的软件,而Minigo项目获取Google赞助的计算资源,透过大量计算资源得到质量还不错的训练网络资料。因此Leela Zero的团队与Minigo的团队基于双方的经验,讨论参数的调整能带来的改善,以及双方训练资料共享的可能性。
Minigo的第二阶段在CGOS上以somebot
开头的名称参与19x19的对战,排名最高的账号为somebot-199b
,获取约2600分的BayesElo成绩。