语音转文字，功能更强大的工具

因为开源的 Whisper 需要通过 python 和命令行来执行，所以我们找到了已经封装好的软件，可以直接使用。使用 OpenAI 开源的语音转文字模型 Whisper，通过这个模型可以实现语音转文字，即使是离线也能使用。下载 WhisperDesktop.zip 文件，解压出来即可。发现的，尝试了一下其中的方法1，果然强大好用。

stereohomology

1115人浏览 · 2023-10-09 17:33:24

stereohomology · 2023-10-09 17:33:24 发布

这次是从一个微信公众号发现的，尝试了一下其中的方法1，果然强大好用。

方法1

使用 OpenAI 开源的语音转文字模型 Whisper，通过这个模型可以实现语音转文字，即使是离线也能使用。

因为开源的 Whisper 需要通过 python 和命令行来执行，所以我们找到了已经封装好的软件，可以直接使用。

打开软件下载：https://github.com/Const-me/Whisper/releases/

下载 WhisperDesktop.zip 文件，解压出来即可。

下面则是用到的离线库的下载地址：

https://huggingface.co/ggerganov/whisper.cpp/tree/main

我挑了最大个儿的多语言库，尝试11分钟的语音文件，电脑显卡是集成的，速度很慢，但转换出来的效果非常好，而且可以导出为特定格式的文本形式：
在这里插入图片描述

我使用的是这个版本whisperDesktop和训练好的模型

提取码: 1114

技术共进，成长同行——讯飞AI开发者社区

更多推荐

从数据标注到AI基础设施：Scale AI如何重新定义人工智能生态

讯飞AI开发者社区

从Prompt工程到模型微调：全方位解决AI幻觉问题

在人工智能飞速发展的今天，AI已经深入到我们生活的方方面面。然而，AI存在一个让人头疼的问题，那就是“幻觉”。简单来说，AI有时候会给出一些和事实不符或者不合理的回答。我们这篇文章的目的就是要全方位地探讨如何解决这个AI幻觉问题，从Prompt工程到模型微调，把各种解决办法都讲清楚。范围呢，主要集中在自然语言处理领域的AI模型，像大家熟悉的聊天机器人等。接下来我给大家说说这篇文章的结构。首先会介绍