fe6b5636125d5e7b9ed6063a4551084d.png

语音识别 API 升级到 3.0 版本。全新的 API 接口文档更加规范和全面,统一的参数风格和公共错误码,统一的 SDK/CLI 版本与 API 文档严格一致,给您带来简单快捷的使用体验。支持全地域就近接入让您更快连接腾讯云产品。

相关接口

接口名称:SentenceRecognition

接口功能:一句话识别, 对60秒之内的短音频文件进行识别,达到快速准确识别较短语音的效果,可应用于语音消息转写等场景。

接口描述

接口请求域名: asr.tencentcloudapi.com 。

本接口用于对60秒之内的短音频文件进行识别,支持本地语音文件上传和语音URL上传两种请求方式。

当音频文件通过请求中body内容上传时,请求大小不能超过600KB;当音频以url方式传输时,音频时长不可超过60s。

所有请求参数放在POST请求的body中,编码类型采用x-www-form-urlencoded,参数进行urlencode编码后传输。

现暂只支持中文普通话和带有一定方言口音的中文普通话识别,支持识别8k16bit和16k16bit的mp3或者wav格式的单声道音频。

默认接口请求频率限制:25次/秒。

输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见:cloud.tencent.com/document/api/1093/35640

11df5e7718656c17968f19f3f1aa9d82.png

输出参数

6d78038a7e539fbbf97676b5266013c6.png

示例

通过语音URL形式调用接口:

用户通过语音url(http%3A%2F%2Ftest-1256085166.cos.ap-guangzhou.myqcloud.com%2Fcase13.wav)的方式(SourceType为0)请求一句话识别服务,服务的引擎模型为:电话 8k (EngSerViceType = 8k),一句话语音的采样率为8k,声道数为单声道,长度为159768字节。

输入:

https://asr.tencentcloudapi.com/?Action=SentenceRecognition

&ProjectId=0

&SubServiceType=2

&EngSerViceType=8k

&SourceType=0

&Url=http%3A%2F%2Ftest-1256085166.cos.ap-guangzhou.myqcloud.com%2Fcase13.wav

&SecretId=111

&Timestamp=111

&VoiceFormat=wav

&UsrAudioKey=www

&DataLen=159768

&

输出:

{

"Response": {

"Result": "张先生,您好。那个为了规范保险从业人员的销售行为,也为了更好的保护您的合法权益。",

"RequestId": "8984d9a9-343f-4c67-8fd9-5c79510a12da"

}

}

开发者资源

API Explorer:该工具提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力,能显著降低使用云 API 的难度,推荐使用:console.cloud.tencent.com/api/explorer?Product=asr&Version=2019-06-14&Action=SentenceRecognition&SignVersion=

命令行工具:cloud.tencent.com/document/product/440/6176

错误码

业务逻辑相关

d7f39e6fc74aa7dc3f3fb24294f1ac3f.png

18628b16286809aeb3ab8df48d1ce80d.png

公共错误码:返回结果中如果存在 Error 字段,则表示调用 API 接口失败。 Error 中的 Code 字段表示错误码,所有业务都可能出现的错误码为公共错误码,下表列出了公共错误码。

5459f741aece65c4f13f6a363d44905f.png

c45ec6cc42997d8d8a9f24ccc9fbd1a9.png

文章来源腾讯云 ,查看更多相关文档请访问https://cloud.tencent.com/document/product

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐