安德鲁·G·巴托(英语:Andrew G. Barto,约1948年-)是一名美国计算机科学家,目前是马萨诸塞大学阿默斯特分校的计算机科学荣誉教授。巴托最出名的是他对现代计算强化学习领域的基础性贡献。
巴托于1970年以优异的成绩获得密歇根大学的数学学士学位,最初他主修的是海军建筑和工程。在阅读了麦可·A·阿比布(英语:Michael A. Arbib)、沃伦·麦卡洛克和沃尔特·皮茨的作品后,他开始对使用计算机和数学来建立大脑模型感兴趣,五年后,他因一篇关于细胞自动机的论文获得计算机科学博士学位。
1977年,巴托加入马萨诸塞大学阿默斯特分校的资讯和计算机科学学院,担任博士后研究助理,1982年晋升为副教授,1991年晋升为正教授。2007年至2011年,他是系主任,也是神经科学和行为项目的核心教员 。
在马萨诸塞大学阿默斯特分校的这段时间里,巴托共同领导了自主学习实验室(最初是自适应网络实验室),该实验室产生强化学习的几个关键想法。理查德·S·萨顿(英语:Richard S. Sutton)与他合著了有影响力的《强化学习》()一书(麻省理工学院出版社1988年;2018年第二版)。巴托毕业了27名博士生,其中13人后来成为教授。
巴托是美国科学促进会会员、电机电子工程师学会会士与高级会士,以及人工智能促进协会和神经科学学会(英语:Society for Neuroscience)的成员。
巴托被授予2019年马萨诸塞大学阿默斯特分校神经科学终身成就奖、2004年IEEE神经网络协会先锋奖,以及2017年IJCAI卓越研究奖(英语:IJCAI Award for Research Excellence)。后者对他的褒奖是:
“巴托教授因其在强化学习的理论和应用方面的开创性和有影响的研究而受到认可。”