语音识别ASR
一、 接口描述
1.功能描述
本API将输入的语音音频(时长一分钟以内)识别成文字,支持输出汉字、拼音和置信度
2.能力说明
对输入的音频进行语音识别,输出汉字、拼音识别结果
3.接口数据要求
音频格式:base64编码
音频时长:不超过1分钟
音频类型:wav格式
二、请求说明
1. 接口地址 :
https://aiapi.jd.com/jdai/asr_t3
2.请求方式:
POST
3. 请求参数
(1)query请求参数
公共请求参数
名称 | 类型 | 必填 | 示例值 | 描述 |
---|---|---|---|---|
appkey | string | 是 | 80d2b762ecb86593f9668526920f46c | 您的appkey,可在买家中心控制台中获 |
timestamp | long | 是 | 1541491668060 | 请求的时间戳,精确到毫秒,timestamp有效期5分钟 |
sign | string | 是 | 2e148773a0337a8f2200ba90d445f083 | 签名,根据规则MD5(sectetkey+timestamp) |
(2)header请求参数
业务请求参数
名称 | 类型 | 必填 | 示例值 | 描述 |
---|---|---|---|---|
Content-Type | string | 是 | application/json; charset=utf-8 | 内容类型 |
(3)body请求参数
业务请求参数
参数名 | 含义 | 类型 | 是否必传 | 备注 |
---|---|---|---|---|
wav_str | 音频文件路径base64格式编码 | string | Y | base64_data |
output_mode_str | 输出类型 | string | Y | ‘hanzi’: 只输出汉字结果 ‘pinyin’:只输出拼音结果 ‘hanzi_pinyin’:同时输出汉字和拼音结果 |
4.请求代码示例
import requests
import sys
import urllib
import json
import base64
url = 'https://aiapi.jd.com/jdai/asr_t3?appkey=<调用者appkey>×tamp=时间戳&sign=签名'
bytesStr = base64.b64encode(open(sys.argv[1]).read())
d = {"wav_str": bytesStr,"output_mode_str":sys.argv[2]}
n = requests.post(url, data=e, headers={"Content-Type": "application/json; charset=utf-8"})
yy = json.loads(n.text)
print(yy)
三、返回说明
1、返回参数
(1)公共返回参数
名称 | 类型 | 示例值 | 描述 |
---|---|---|---|
code | string | 1000 | 参见下方错误码-系统级错误码 |
charge | boolean | false 或 true | false:不扣费, true:扣费 |
remainTimes | long | 1305 | 剩余调用次数;免费api:每天剩余调用次数;收费api:剩余次数;无限制时为-1 |
remainSeconds | long | 1223456 | 剩余调用时间(s);免费api:-1;收费api:剩余调用时间;无限制时为-1 |
msg | string | 查询成功 | 参见下方错误码-系统级错误码 |
result | object | {...} | 查询结果 |
(2)业务返回参数
参数名 | 含义 | 类型 | 备注 |
---|---|---|---|
status | 状态 | String | "ok" |
response_pinyin | 拼音结果 | String | "ha3o de" |
score_pinyin | 拼音结果置信度 | Double | 0.9994078874588013 |
score | 汉字结果置信度 | Double | 0.9416798310314151 |
time | 计算时间 | String | "1639.905ms" |
response | 汉字识别结果 | String | "好的" |
2、返回示例
{
"code": "10000",
"charge": false,
"remainTimes": 4998,
"remainSeconds": -1,
"msg": "查询成功",
"result": {
"status": "ok",
"response_pinyin": "ha3o de",
"score_pinyin": 0.9994078874588013,
"score": 0.9416798310314151,
"time": "1639.905ms",
"response": "好的"
}
}