语音一句话识别
一、接口描述
1. 功能描述
对一分钟内的短语音进行识别,适用于对话聊天,控制口令等较短的语音识别场景。 支持音频编码格式:pcm(无压缩的pcm文件或wav文件)、ogg\wav 8000\16000; mp3\flv 16000\22050\44100; amr 8000的单声道(mono)。 支持音频采样率:8000Hz、16000Hz。 支持对返回结果进行设置:处理唤醒词,是否识别结果需要加标点符号,是否将中文数字转为阿拉伯数字输出(逆文本)。支持多种语言的识别,资源模型选择
2. 接口数据要求:
传入的语音数据不能超过500kb(大概25-30s)
3. 接口使用:
平台为每个API提供试用体验服务,您在AI市场选择“免费试用”规格下单后,即可开始体验业内领先的人工智能API服务。 免费试用服务具有调用量、QPS限制,如需更高性能的API服务,可以提交咨询工单,联系京东AI扩容购买。
在获得使用权限后,您可使用已经封装好的SDK/参照接口鉴权规则进行相应开发,整体流程详见 接入流程
用户需要使用营业执照图片base64编码去做请求,使用其他图片的base64编码请求成功时也会加入计费。
二、请求说明
1. 接口地址 :
https://aiapi.jd.com/aispeech/asr
2. 请求方式:
post
3. 请求参数
(1)query请求参数
公共请求参数
名称 | 类型 | 必填 | 示例值 | 描述 |
---|---|---|---|---|
appkey | String | 是 | 80d2b762ecb86593f9668526920f46c | 您的appkey,可在买家中心控制台中获取 |
timestamp | long | 是 | 1541491668060 | 请求的时间戳,精确到毫秒,timestamp有效期5分钟 |
sign | String | 是 | 2e148773a0337a8f2200ba90d445f083 | 签名,根据规则MD5(sectetkey+timestamp) |
(2)header请求参数
业务请求参数
名称 | 类型 | 必填 | 示例值 | 描述 |
---|---|---|---|---|
audioType | String | 是 | wav | 音频类型 |
sampleRate | Number | 是 | 16000 | 采样率[8000,16000] |
enableNumberConvert | Boolean | 否 | true | 数字转换,逆文本,数字转换为阿拉伯数字,默认false |
enablePunctuation | Boolean | 都 | true | 返回识别结果文本是否带标点,默认false |
wakeupWord | String | 否 | "你好京东" | 唤醒词,识别结果中会过滤掉唤醒词的结果 |
recordId | String | 否 | 80d2b762ecb86593f9668526920f46c | 请求id,用于区别每一个请求 |
(3)body请求参数
业务请求参数
待识别的音频数据(二进制BINARY)。(4)请求代码示例
建议您使用我们提供的SDK进行调用,SDK获取及调用方式详见本页一接口描述中的2接口使用
三、返回说明
1.返回参数
(1)公共返回参数
名称 | 类型 | 示例值 | 描述 |
---|---|---|---|
code | string | 1000 | 参见下方错误码-系统级错误码 |
charge | boolean | false 或 true | false:不扣费, true:扣费 |
remainTimes | long | 1305 | 剩余调用次数;免费api:每天剩余调用次数;收费api:剩余次数;无限制时为-1 |
remainSeconds | long | 1223456 | 剩余调用时间(s);免费api:-1;收费api:剩余调用时间;无限制时为-1 |
msg | string | 查询成功 | 参见下方错误码-系统级错误码 |
result | object | {...} | 查询结果 |
(2)业务返回参数
result参数信息
名称 | 类型 | 示例值 | 描述 | ||
---|---|---|---|---|---|
status | number | 200 | 状态code,200代表请求正常,其他为错误状态 | ||
result | Object | 返回结果具体内容 | |||
context | Object | 上下文 | |||
recordId | String | 请求id | |||
asr | Object | 识别结果 | |||
text | String | 识别结果文本 | |||
message | string | 返回信息 |
2.返回示例
{
"status": 200,
"result": {
"context": {
"session":"6a065b55-59c9-4ff6-9f5c-9227faf757a0",
"recordId": "4518a8cf-1408-40ae-b76c-5a3dd194abfb"
},
"asr": {
"text": "你好"
}
}
}
四、错误码信息
1.系统级错误码
2.业务错误码
业务错误码(code) | message | 说明 |
---|---|---|
200 | 正常返回 | |
400 | 缺少请求参数 | 缺少必填的请求参数 |
500 | "Internal server error" | 服务器请求错误 |