概述

京东AI TTS支持的SSML标签有 speak, audio, background, voice, sub, break, phoneme, emphasis, say-as,w

使用方法

Http请求头中添加了新的字段 tt, 为1表示请求为SSML文本，为0或不指定表示普通文本。如：

parameters = {
            "tt": "1",
            "tim": "0",
            "vol": "2.0",
            "sp": "1.0",
            "sr": "24000",
            "aue": "3"
}

标签

Speak

说明

根标签，SSML请求为xml格式的文本，其中根节点名字必须为speak

例子

<speak>你好，京东！</speak>

audio

说明

插入一段外部音频，音频文件以url形式指定，url必须可访问，音频文件目前支持标准wav和mp3格式，采样率8k到48k，文件大小小于10M

属性

src：音频文件的url

例子

<speak>今天天气不错<audio src="http://storage.jd.com/background-voice/background.wav"/></speak>

background

说明

指定合成语音的背景音，背景音的音频文件以url形式指定，文件格式同audio标签的外部音频

属性

repeat：其取值为yes或no，表示背景音是否循环添加
times：背景音音量，小数形式，取值为0到1
src：音频文件的url

例子

<speak><background src="http://storage.jd.com/background-voice/background.wav"  repeat="yes"  times="1.0" >春风桃李花开</background></speak>

voice

说明

设置发音人

属性

name：发音人，取值为taotao或者binbin

例子

<speak><voice name="binbin">今天几号了</voice></speak>

sub

说明

替换词语的发音

属性

alias：替换后的词语

例子

<speak><sub alias="胃溃疡">Gu</sub></speak>

break

说明

插入静音

属性

time：静音时间，单位为秒，小数形式最大为10

例子

<speak>我等你5秒<break time="0.5"/>你算出来了吗？</speak>

phoneme

说明

指定标签中文本的中文发音

属性

py：中文拼音，多个字拼音用空格分开，拼音数量必须与中文数量一致（音调范围0~4表示轻声~四声）

例子

<speak><phoneme py="chao2 yang2 qu1">朝阳区</phoneme></speak>

emphasis

说明

强调标签中的文本发音

属性

无

例子

<speak>请问您是<emphasis>王先生</emphasis>的家属吗？</speak>

W

说明

分词（分词会修改发音的韵律）

属性

无

例子

<speak>我是<w>中国</w><w>人</w></speak>
<speak>我是<w>中国人</w></speak>

say-as

说明

按指定规则发音

属性

code：按数字串读如123 读一二三
value：按数字值来读如123 读一百二十三
letter：按字母串读
tel：按电话读

例子

<speak>您的编码是<say-as type="code">123</say-as></speak>

<speak>我等你<say-as type="value">123</say-as>秒</speak>

<speak>星期一的英文是这么拼的<say-as type="letter">today</say-as></speak>

<speak>电话是<say-as type="tel">13717771777</say-as></speak>

results matching ""

No results matching ""