概述
京东AI TTS支持的SSML标签有 speak, audio, background, voice, sub, break, phoneme, emphasis, say-as,w
使用方法
Http请求头中添加了新的字段 tt, 为1表示请求为SSML文本 ,为0或不指定表示普通文本。如:
parameters = {
"tt": "1",
"tim": "0",
"vol": "2.0",
"sp": "1.0",
"sr": "24000",
"aue": "3"
}
标签
Speak
说明
根标签,SSML请求为xml格式的文本,其中根节点名字必须为speak
例子
<speak>你好,京东!</speak>
audio
说明
插入一段外部音频,音频文件以url形式指定,url必须可访问,音频文件目前支持标准wav和mp3格式,采样率8k到48k,文件大小小于10M
属性
- src:音频文件的url
例子
<speak>今天天气不错<audio src="http://storage.jd.com/background-voice/background.wav"/></speak>
background
说明
指定合成语音的背景音,背景音的音频文件以url形式指定,文件格式同audio标签的外部音频
属性
- repeat: 其取值为yes或no,表示背景音是否循环添加
- times:背景音音量,小数形式,取值为0到1
- src:音频文件的url
例子
<speak><background src="http://storage.jd.com/background-voice/background.wav" repeat="yes" times="1.0" >春风桃李花开</background></speak>
voice
说明
设置发音人
属性
- name:发音人,取值为taotao或者binbin
例子
<speak><voice name="binbin">今天几号了</voice></speak>
sub
说明
替换词语的发音
属性
- alias:替换后的词语
例子
<speak><sub alias="胃溃疡">Gu</sub></speak>
break
说明
插入静音
属性
- time:静音时间,单位为秒,小数形式 最大为10
例子
<speak>我等你5秒<break time="0.5"/>你算出来了吗?</speak>
phoneme
说明
指定标签中文本的中文发音
属性
- py:中文拼音,多个字拼音用空格分开,拼音数量必须与中文数量一致(音调范围0~4表示轻声~四声)
例子
<speak><phoneme py="chao2 yang2 qu1">朝阳区</phoneme></speak>
emphasis
说明
强调标签中的文本发音
属性
无
例子
<speak>请问您是<emphasis>王先生</emphasis>的家属吗?</speak>
W
说明
分词(分词会修改发音的韵律)
属性
无
例子
<speak>我是<w>中国</w><w>人</w></speak>
<speak>我是<w>中国人</w></speak>
say-as
说明
按指定规则发音
属性
- code:按数字串读 如123 读一二三
- value:按数字值来读 如123 读一百二十三
- letter:按字母串读
- tel:按电话读
例子
<speak>您的编码是<say-as type="code">123</say-as></speak>
<speak>我等你<say-as type="value">123</say-as>秒</speak>
<speak>星期一的英文是这么拼的<say-as type="letter">today</say-as></speak>
<speak>电话是<say-as type="tel">13717771777</say-as></speak>