1.语音合成的目的是什么?它主要可分为哪几类?什么叫波形合成法和参数合成法?其区别在哪里?试比较它们的优缺点。

答:语音合成的目的是解决如何让机器像人那样说话的问题。

语音合成从技术方式讲可分为波形合成法、参数合成法和规则合成法;从合成策略上讲可分为频谱逼近和波形逼近。

波形合成法是对波形进行编码或编辑。波形合成法是相对简单,通常只能合成有限词汇的语音段。
参数合成法先提取出声学参数,并整合成一个完整的音库。在发音过程中,首先根据需要发的音,从音库中选择合适的声学参数,然后根据韵律模型中得到的韵律参数,通过合成算法产生语音。参数合成法优点是其音库一般较小,并且整个系统能适应的韵律特征的范围较宽,这类合成器比特率低,音质适中;缺点是算法复杂、参数多,并且在压缩比较大时,信息丢失亦大,合成的语音不够自然、清晰。

2.什么是TTS?它可以应用到哪些领域?一般一个TTS系统是由哪几个部分组成的?

答:TTS是文语转换系统,把文本文件通过一定的软硬件转换后由计算机或电话语音系统等输出语音。

文语转换系统能够提供一个良人机交互界面,它可以应用到以下领域:
(1) 用于各种智能系统,如信息查询系统、自动售票系统;
(2) 可作为残疾人的辅助交流工具,如作为盲人的阅读或作为聋哑人的代言工具;
(3) 用于通信设备或一些数字产品中,如手机和PDA等。
一般一个TTS系统由文本分析、韵律控制和语音合成这三个模块构成。

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐