语音合成

✍ dations ◷ 2025-12-07 08:48:51 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 负链RNA病毒核糖核酸病毒(英语:RNA virus),又称RNA病毒,其遗传物质为RNA,这些核糖核酸通常是单链RNA(ssRNA),但是也可能是双链RNA(dsRNA)。由RNA病毒感染造成的著名人类疾病包括艾滋病(AIDS)、埃博
  • 世界卫生组织基本药物标准清单世界卫生组织基本药物标准清单(法语:Listes modèles OMS des médicaments essentiels;英语:WHO Model List of Essential Medicines;简称EML)是世界卫生组织(WHO或称世卫组织)的出
  • 植物生理学植物生理学是植物学的一个分支科学,它研究植物的功能或生理学。密切相关的领域包括植物形态学(植物结构),植物生态学(与环境的相互作用),植物化学(植物的生物化学),细胞生物学,遗传学,生
  • 视交叉视交叉为一呈长方形的神经纤维块,位于蝶骨视神经沟之后上方,第三脑室前壁和底部的交界处,构成第三脑室隐窝的向前延伸部。在脚间池前部,略呈倾斜,后缘比前缘高。在垂体上部,除其后
  • 记忆异常心理学 行为遗传学 生物心理学 心理药物学 认知心理学 比较心理学 跨文化心理学 文化心理学 差异心理学(英语:Differential psychology) 发展心理学 演化心理学 实验心理学
  • 生命进化历程生命演化历程纪录地球上生命发展过程中的主要事件。本条目中的时间表,是以科学证据为基础所做的估算。生物演化指生物的族群从一个世代到另一个世代之间,获得并传递新性状的过
  • 英国皇家学会伦敦王家自然知识促进学会(英语:Royal Society of London for Improving Natural Knowledge),简称“王家学会”(Royal Society),但多译作“皇家学会”,是英国资助科学发展的组织,成立
  • 北方邦北方邦(印地语:उत्तर प्रदेश;拉丁字母转写:Uttar Pradesh)处于印度北部,和尼泊尔接壤,毗邻国内的北阿坎德邦、喜马偕尔邦、哈里亚纳邦、拉贾斯坦邦、中央邦以及比哈尔邦
  • 抬头显示器平视显示器(英语:Head Up Display,缩写HUD)是一种目前普遍运用在航空器上的飞行辅助仪器。平视的意思是飞行员不需要低头就能够看到他需要的重要资讯。平视显示器最早出现在军用
  • 建筑材料建筑材料是指用于土木工程的各种材料的总称,简称“建材”。狭义上的建材是指用于土建工程的材料,如钢、沙石、玻璃、水泥、涂料等,通常将水泥、钢材和沙石称为一般建筑工程的三