回到目录

【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务

0. dify本地化部署

可以参考《2.2. win10的wsl环境下调试dify的api后端服务(20250511发布)》

1. 配置tencent cloud

1.1. 腾讯云官网申请免费api key

腾讯云官网可以申请到免费的体验key
在这里插入图片描述

[图1]

1.2. dify配置Model Provider

dify管理页面的配置项目,可以设置tencent的语音转文字服务,其中 api key包括APPID、SecretID、SecretKey三部分
在这里插入图片描述

[图2]

2. 创建工作流workflow

2.1. 创建工作流

在工作室 创建一个工作流,名称 testAudio
在这里插入图片描述
[图3]

2.2. 配置组件

添加一个SPEECH TO TEXT组件,MODEL选择 tencent(tencent)
在这里插入图片描述
[图4]

2.3. 配置文件参数

开始图标,可以配置输入的mp3文件参数
在这里插入图片描述
[图5]

3. 运行流程

3.1. 右上角run图标

运行workflow流程,首先插入一个mp3文件,点击”start Run"按钮
在这里插入图片描述

[图6]

3.2. 查看结果

在TRACING页面的output可以查看到文本信息
在这里插入图片描述
[图7]

4. 测试情况

中文普通话的歌曲准确率高,外语基本无法识别,粤语和闽南语待找到MP3素材再作测试。

回到目录

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐