语音合成流式接口
一、接口描述
1. 功能描述
- 文字转换成语音的流式调用接口。和普通接口的区别在于,本接口响应速度较快,并且可以直接返回音频的二进制流,方便给各种直接播放音频的场景使用。
2. 能力说明
- 文字转语音,可选音色、音量、音速
3. 文本要求
- 文本长度不能超过1000个字符(包含标点)
4. 接口使用
平台为每个API提供试用体验服务,您可体验业内领先的人工智能API服务。 免费试用服务具有调用量、QPS限制,如需更高性能的API服务,可以提交咨询工单,联系京东AI扩容购买。
二、请求说明
1. 接口地址
- 一次请求多次推送合成结果: https://stream-tts.jd.com/tts/stream
- 一次请求合成完毕一次推送: https://stream-tts.jd.com/tts/range
2. 请求方式
- https
get
3. 请求参数
(1)query请求参数
名称 | 类型 | 必填 | 示例值 | 描述 |
---|---|---|---|---|
id | String | 否(/tts/stream)/是(/tts/range) | 1569bafc-aaed-4b7e-9b90-464c88d93707 | 客户端生成的请求ID, 须保证唯一。 |
appkey | String | 是 | 80d2b762ecb86593f9668526920f46c | 您的appkey,可在买家中心控制台中获取 |
timestamp | long | 是 | 1541491668060 | 请求的时间戳,精确到毫秒,timestamp有效期5分钟 |
sign | String | 是 | 2e148773a0337a8f2200ba90d445f083 | 签名,根据规则MD5(sectetkey+timestamp) |
vol | string | 否 | 1.0 | 音量(默认值:1.0)取值范围:【0.1,10.0】 |
sp | string | 否 | 1.0 | 语速(默认值:1.0)取值范围:【0.5,2.0】 |
sr | int | 否 | 24000 | 采样率(默认值:24000) |
tim | int | 否 | 0 | 音色(默认值0) - 0:桃桃(女声) - 1:斌斌(男声) - 3:婷婷(女声) |
version | int | 否 | 0 | 版本选择(默认值0) - 0:普通版 - 1:精品版 - 其它:精品版 |
text | string | 是 | 你好 | 需要进行语音转换的文本,包含标点不超过1000个字符,需进行urlencode(utf-8) |
4. 请求代码示例
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8" />
<meta name="viewport" content="width=device-width, initial-scale=1.0" />
<title>tts</title>
</head>
<body>
<audio id="aud" hidden></audio>
<button onclick="play()">播放</button>
</body>
<script>
function generateUUID() {
let d = Date.now();
return "xxxxxxxx-xxxx-4xxx-yxxx-xxxxxxxxxxxx".replace(/[xy]/g, c => {
let r = (d + Math.random() * 16) % 16 | 0;
d = Math.floor(d / 16);
return (c === "x" ? r : (r & 0x3) | 0x8).toString(16);
});
}
var audio = document.getElementById("aud");
var text = "一段文本一段文本一段文本一段文本一段文本";
var role = 1; // 0:桃桃(女声) 1:斌斌(男声) 3:婷婷(女声)
var speed = 1; // 播放速度
audio.src = `https://stream-tts-dev.jd.com/tts/stream?appkey=d91e83fd329f44da969db00ad8990fc4&sign=2e148773a0337a8f2200ba90d445f0841541491668060×tamp=1541491668060&sp=1.0&sr=24000&text=你好,人工智能!&vol=1.0&tim=0`;
function play() {
audio.play();
}
</script>
</html>
三、返回说明
1. 返回参数
服务器返回的结果为MP3音频二进制文件
名称 | 类型 | 必填 | 示例值 | 描述 |
---|---|---|---|---|
返回体 | 二进制 | 是 | http返回体body为二进制音频流 |
四、HTTP返回状态码
状态码 | 说明 |
---|---|
200 | 请求成功 |
500 | 请求失败 |
500错误码错误状态说明
返回500错误码时,会在header中设置errMsg字段,具体内容如下: