首页 >
语音合成
✍ dations ◷ 2025-11-24 05:38:14 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- 萜烯萜烯(英语:terpene,简称萜,旧称䓝,词由松节油“turpentine”而来)是一系列萜类化合物的总称,属脂类,不溶于水,是分子式为异戊二烯(C5H8)的整数倍的烯烃类化合物。萜烯是一个庞大而多样
- 妥瑞症图雷特氏综合征(英语:Tourette Syndrome、TS),又称抽动症、托雷氏症、杜雷氏症,是一种抽动综合症(Tics)。这是一种遗传性的神经内科疾病,通常发生于学龄前至青春期前。有一部分的患
- 死刑美国目前有31个州和联邦政府及军队有死刑法律,其余的州、海外领地和首都华盛顿特区没有死刑。在这些没有死刑的地区,绝大多数的最高刑罚是“终身监禁、不得假释”。另外,美国对
- Nd4f4 6s22, 8, 18, 22, 8, 2蒸气压第一:533.1 kJ·mol−1 第二:1040 kJ·mol−1 第三:2130 kJ·mol主条目:钕的同位素钕(旧译作釢、鋖)是化学元素,化学符号是Nd,原子序数是60,属于
- 字母间距字符间距(英语:Letterspacing,也称英语:Tracking)简称字距,在字体排版学中指的是字符之间的空隙,该属性影响文本行或文本块的密度。字符间距容易与字距调整混淆。CSS(层叠样式表)中,wo
- 行为心理学行为主义(英语:Behaviorism)又称作行为论,是20世纪初起源于美国的心理学流派,主张心理学应该研究可以被观察和直接测量的行为,反对研究没有科学根据的意识。其主要特色为以系统方
- 弗雷德里克·约里奥-居里让·弗雷德里克·约里奥-居里(法语:Jean Frédéric Joliot-Curie,原姓氏为约里奥(Joliot),1900年3月19日-1958年8月14日),法国物理学家,1935年诺贝尔化学奖获得者。1900年出生于法
- 树枝状聚合物树枝状聚合物,又称树枝化聚合物,是每个重复单元上带有树枝化基元(dendron)的线状聚合物。一个树枝状聚合物大分子往往包含数千树枝化基元。在这方面,他们与球状的树枝状化合物(den
- 人民阵线人民阵线(法语:Front populaire)是20世纪上半叶战间期法国出现的一个左翼政治联盟。1935年7月14日,共产党、工人国际法国支部、激进党和各大工会组织全国规模的反法西斯示威活动
- 机械加工机械加工是一种用加工机械对工件的外形尺寸或性能进行改变的过程。按被加工的工件处于的温度状态,分为冷加工和热加工。一般在常温下加工,并且不引起工件的化学或物相变化,称冷
