本模块支持 微软TTS魔音TTS 两大API接口,提供高效、精准的文本转语音功能。用户可自由选择 语言、角色、风格、语速、语调 等参数,定制个性化的语音合成效果,适用于多种应用场景,如视频配音、有声阅读和内容创作等。

工具支持 批量处理模式,可快速转换目录下的多个文本文件,大幅提升工作效率。通过简洁直观的界面和强大的语音合成功能,帮助用户轻松完成文本转录音频任务,确保语音输出的自然度和质量,为多媒体创作提供便捷支持。

操作使用

进入软件后可以直接搜索 通用文本转语音 进入该模块。

在这里插入图片描述

文件配置

功能按钮 功能类别 功能描述
选择TXT文本目录 目录选择 选择需转换的文本文件目录,仅支持txt类型文件,执行任务前自动校验路径有效性。
输出路径 目录选择 设置音频文件的保存位置,默认使用系统设定的统一输出路径,并自动校验路径有效性。
文本转语音方式 模式选择 选择TTS接口(微软TTS或魔音TTS)进行文本转语音处理。

在这里插入图片描述

参数配置

微软TTS文本转语音参数设置

选项 参数选择模式 说明
语言 下拉选择 选择语音合成的语言(如中文 普通话)
性别 下拉选择 选择语音的性别(如男性、女性)
姓名 下拉选择 选择具体的语音模型(如云希)
语言风格 下拉选择 设定语音风格(如默认选项)
角色 下拉选择 选择语音角色(如年轻成年男性👦)
强度 下拉选择 设定语音的表达强度(如普通)
语速 滑动条 调整语音的播放速度(默认 1.1)
语调 滑动条 调整语音的音调(默认 0)

在这里插入图片描述

魔音TTS文本转语音参数设置

选项 参数选择模式 说明
语言 下拉选择 选择语音合成的语言(如普通话)
性别 下拉选择 选择语音的性别(如男性、女性)
姓名 下拉选择 选择具体的语音模型(如魔云熙新)
语言风格 下拉选择 设定语音风格(如默认24K)
音频格式 下拉选择 选择输出音频格式(如wav)
停顿方式 下拉选择 选择语音停顿方式
语速 滑动条 调整语音的播放速度(默认 1.2)
语调 滑动条 调整语音的音调(默认 0)

在这里插入图片描述

应用示例

操作演示以生成《西游记》100回举例,选择存放100回《西游记》 的文本目录,选择好生成音频的API接口以及对应接口的参数即可,点击执行之后会在下方的任务列表显示任务状态,右侧的任务进度会显示当前执行任务的进度情况。

在这里插入图片描述

执行完成之后会在输入目录下看到生成的音频文件。

在这里插入图片描述

开发与应用

软件使用以及综合参考资料内容可以查阅

文章链接 内容描述
AIGC工具平台Tauri+Django环境开发,支持局域网使用 图形桌面工具使用教程,详细介绍 Tauri+Django 环境的开发方法,支持局域网部署与使用。
AIGC工具平台Tauri+Django常见错误与解决办法 常见错误与解决办法,针对 Tauri+Django 环境下可能遇到的问题提供实用的解决方案。
AIGC工具平台Tauri+Django内容生产介绍和使用 包含当前主流新媒体领域常用的音频、视频剪辑,以及内容一键生产功能。
AIGC工具平台Tauri+Django开源ComfyUI项目介绍和使用 工作流相关内容讲解,涵盖文件管理、文件汇总、软件使用教程及开发指导,附带模型下载资源。
AIGC工具平台Tauri+Django开源git项目介绍和使用 开源git项目内容讲解,涵盖项目整合包、算法模型、测试指导、项目应用,附带项目整合包下载。
Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐