这次是从一个微信公众号发现的,尝试了一下其中的方法1,果然强大好用。

方法1

使用 OpenAI 开源的语音转文字模型 Whisper,通过这个模型可以实现语音转文字,即使是离线也能使用。

因为开源的 Whisper 需要通过 python 和命令行来执行,所以我们找到了已经封装好的软件,可以直接使用。

打开软件下载:https://github.com/Const-me/Whisper/releases/

下载 WhisperDesktop.zip 文件,解压出来即可。

下面则是用到的离线库的下载地址:

https://huggingface.co/ggerganov/whisper.cpp/tree/main

我挑了最大个儿的多语言库,尝试11分钟的语音文件,电脑显卡是集成的,速度很慢,但转换出来的效果非常好,而且可以导出为特定格式的文本形式:
在这里插入图片描述

我使用的是这个版本whisperDesktop和训练好的模型

提取码: 1114

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐