发现一个好用的语音克隆工作流,大家在做数字人视频的时候可以克隆自己的声音,或者别的好听的声音。

话不多说,咱们搭建下。

1、首先贴上git地址。

https://github.com/billwuhao/ComfyUI_StepAudioTTS

2、接着可以去comfyui的manger中安装此插件。

节点管理--》搜索

我这边是已经下载过的。如果能直接安装最好了。

若服务器受网络限制可以先在本地下载好源码,再移到服务器上面安装。步骤如下:

cd ComfyUI/custom_nodesgit clone https://github.com/billwuhao/ComfyUI_StepAudioTTS.gitcd ComfyUI_StepAudioTTSpip install -r requirements.txt

3、重启comfyui

4、重启后就可以去体验下了。

上面是要克隆的内容,想说什么话就写到这里就行了。

下面是原上传音频的内容。支持语气(高兴、悲伤等),多语言,加速慢速,还可将克隆的音频设置成哼唱的。效果不错,快来体验下吧。

大家在搭建的过程中有遇到什么问题,或者有什么想实现的功能欢迎留言,大家一起讨论学习。

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐