嘴型同步

✍ dations ◷ 2025-09-15 17:53:49 #嘴型同步

嘴型同步是语音转表情系列技术的一种,指的是将一段录制的语音转成某个人讲这段话的嘴型。一般来说,这个人会是讲过这段语音的人,但技术上的确可以做到,制造一段影像,让一个人讲出他未曾讲过的话。

2016年,华盛顿大学国际电脑视觉研讨会上发表了一篇论文《是什么让汤姆汉克看起来像汤姆汉克》,这篇论文中搜集了大量汤姆汉克的照片,用机器学习训练出他三维的模型,一旦模型建造完毕,就可以用不同人的影像驱动汤姆汉克的模型,让这个模型做出汤姆汉克未曾做过的表情跟动作,但看起来跟真人做的一样。

2017年,华盛顿大学又在图学研讨会上发表全球最新的嘴型同步技术,这一次是大量搜集美国前总统奥巴马的演讲,通过机器学习,得到不同的语音跟嘴型之间的配对.然后就从网络上随机撷取一段奥巴马的演讲视频,把语音的部分移除,填上另外一段语音在合成嘴型,让奥巴马看起来是真的在说后来填上去的那一段话。

一般说来,合成一段影像,让一个人的录影说出他不曾说过的话,是有道德跟法律上的争议.到目前为止也没有看到真正这样做的学术团队,但技术上来说,这是可行的。

相关

  • 莱昂县莱昂县(英语:Lyon County, Nevada)是美国内华达州北部的一个县,北邻俄勒冈州,东北邻爱达荷州。面积5,222平方公里。根据美国2000年人口普查局估计,共有人口34,501人。县治耶灵顿 (
  • 罗先特别市罗先特别市(朝鲜语:라선특별시/羅先特別市 Rasŏn thŭkpyŏlsi */?)是朝鲜位于中朝俄边境的特别市,为原来的罗津市及比邻的先锋郡合并而成。罗津及先锋原属于咸镜北道,该特别市
  • 琼桑峰坐标:27°52′53″N 88°08′09″E / 27.8814°N 88.1357°E / 27.8814; 88.1357琼桑峰(尼泊尔语:जोङ्सोङ् हिमाल,印地语:जोंगसोंग पर्वत),位于尼泊尔、
  • K2K2可以指:
  • 代码 (2001年电影)代码是2001年芬兰的一部关于GNU/Linux的英语纪录片,其中介绍了自由软件运动中卓有贡献的一些人物。电影中的开源倡导者或程序员
  • 关于武装冲突情况下保护文化财产的海牙公约《关于武装冲突情况下保护文化财产的海牙公约》,又称《1954年海牙公约》,是联合国教育、科学及文化组织于1954年5月14日在荷兰海牙通过的一项国际公约,旨在保护受到武装冲突威
  • 王振鹄王振鹄(1924年04月06日-2019年6月9日),中国濮阳人,排行第四,台湾图书馆学研究者、教育工作者、天主教徒。曾在国立台湾师范大学、国立台湾大学、辅仁大学、中国文化大学担任图书馆
  • 法兰西斯科·吉米尼亚尼法兰西斯科·吉米尼亚尼(意大利语:Francesco Saverio Geminiani,1687年12月5日-1762年9月17日)是意大利路加出身的巴洛克音乐作曲家、小提琴家、音乐理论家。代表作是‘大协奏曲
  • 李尚顺李尚顺(1974年8月5日-)是韩国男歌手及作曲家。在1999年以乐团Rollor Coaster的成员出道。在2010年与东律组成 Verandah Project。曾于荷兰阿姆斯特丹音乐院留学。在一次救助流
  • 谢尔施利赫特山坐标:47°30′35″N 10°55′0″E / 47.50972°N 10.91667°E / 47.50972; 10.91667谢尔施利赫特山(德语:Schellschlicht),是德国的山峰,位于该国东南部,由巴伐利亚负责管辖,属于阿