AlphaZero

✍ dations ◷ 2025-10-25 09:56:01 #AlphaZero

AlphaZero是DeepMind所开发的人工智能软件。

AlphaZero使用与AlphaGo Zero类似但更一般性的算法，在不做太多改变的前提下，并将算法从围棋延伸到将棋与国际象棋上。AlphaZero与AlphaGo Zero不同之处在于：

AlphaZero基于蒙特卡洛树搜索，每秒只能搜索8万步（国际象棋）与4万步（将棋），相较于Stockfish每秒可以7000万步，以及elmo（日语：elmo (コンピュータ将棋ソフト)）每秒可以3500万步，AlphaZero则是利用了人工神經网络提升了搜索的质量。

AlphaZero使用了5,000颗第一代的TPU进行训练。

在4小时的训练后（约自我训练4400万局:Table S3），AlphaZero以28胜72和0败的成绩打败Stockfish:Table 1。

在12小时的训练后（约自我训练2400万局:Table S3），AlphaZero以90胜2和8败的成绩打败elmo（日语：elmo (コンピュータ将棋ソフト)）:Table 1。

在34小时的训练后（约自我训练2100万局:Table S3），AlphaZero以60胜40败的成绩打败AlphaGo Zero:Table 1。

相关

无性繁殖无性生殖是指生物体不以透过生殖细胞的结合方式，也就是不经由减数分裂来产生配子，直接由母体细胞分裂后产生出新个体的生殖方式。主要分为孢子繁殖（英语：Sporogenesis）、分裂生殖
面包列表以下是各种面包的列表。
大卫·苏特戴维·哈凯特·苏特（英语：David Hackett Souter，1939年9月17日－），前美国最高法院大法官，自1990年出任美国最高法院大法官直至于2009年6月29日退休。他是由共和党总统乔治·H·W·布
刘芳 (音乐家)刘芳（1974年－）是一位加拿大华人音乐家。1974年出生于昆明，擅琵琶、古筝，得到媒体、专家和听众给于极高的赞誉。刘芳的多场音乐会被加拿大、荷兰、英国、法国、德国、西班牙等国国
安硕MSCI新兴市场东欧指数基金安硕MSCI新兴市场东欧指数基金（英语：ishares MSCI Emerging Markets Eastern Europe Index Fund，NYSE：ESR）是于纽约证券交易所上市的交易所交易基金，这个是在东欧新兴市场的企业股
镜子之家《镜子之家》是三岛由纪夫于1959年创作的长篇小说。小说主要讲述女主人公镜子及其四名青年好友。五位主角构成了五条故事线，都叙述了他们厌恶世俗，守护自身价值并失败的故事。
阿诺德·哈柏格阿诺德·卡尔·哈柏格（英语：Arnold Carl Harberger，1924年7月27日－），美国经济学家，以他名字命名的哈伯格三角在福利经济学中广泛使用。哈伯格在约翰·霍普金斯大学完成了经济学学士
英雄奇幻英雄奇幻（Heroic fantasy）是奇幻小说的次文类，故事着重于叙述英雄传说。英雄奇幻在十九和二十世纪早期并不盛行，作家罗伯特·欧文·霍华德创作一部英雄短篇小说《蛮王柯南》（Cona
阿诺·迪帕斯夸莱阿诺·迪帕斯夸莱（法语：Arnaud Di Pasquale，1979年2月11日－），法国职业网球运动员。2000年悉尼奥运会第三轮，他直落二盘战胜法网亚军瑞典好手马格努斯·诺曼。在铜牌争夺战。他击败了未来世界第一瑞士球王罗杰·费德勒。
青岛市文物保护单位青岛市文物保护单位（又称青岛市重点文物保护单位），是中华人民共和国山东省青岛市的市级文物保护单位。截至2018年2月，青岛市共公布了十批、共189处文物保护单位，其中已改列入全国重点文物保护单位的有36处，山东省文物保护单位的有47处。在三里河遗址等大量远古时期遗址的考古研究表明，现今青岛地区早在新石器时代即有人类生活，并孕育出大汶口文化、龙山文化及岳石文化。在近代，经过德、日两国的殖民统治，青岛的建筑及文化风貌更显多元。青岛的文物普查始于1952年，目前该工作由青岛市文化和旅游局负责。青岛市文物保护单位