概述

京东AI TTS支持的SSML标签有 speak, audio, background, voice, sub, break, phoneme, emphasis, say-as,w

使用方法

Http请求头中添加了新的字段 tt, 为1表示请求为SSML文本 ,为0或不指定表示普通文本。如:

parameters = {
            "tt": "1",
            "tim": "0",
            "vol": "2.0",
            "sp": "1.0",
            "sr": "24000",
            "aue": "3"
}

标签

Speak

说明

根标签,SSML请求为xml格式的文本,其中根节点名字必须为speak

例子

<speak>你好,京东!</speak>

audio

说明

插入一段外部音频,音频文件以url形式指定,url必须可访问,音频文件目前支持标准wav和mp3格式,采样率8k到48k,文件大小小于10M

属性

  • src:音频文件的url

例子

<speak>今天天气不错<audio src="http://storage.jd.com/background-voice/background.wav"/></speak>

background

说明

指定合成语音的背景音,背景音的音频文件以url形式指定,文件格式同audio标签的外部音频

属性

  • repeat: 其取值为yes或no,表示背景音是否循环添加
  • times:背景音音量,小数形式,取值为0到1
  • src:音频文件的url

例子

<speak><background src="http://storage.jd.com/background-voice/background.wav"  repeat="yes"  times="1.0" >春风桃李花开</background></speak>

voice

说明

设置发音人

属性

  • name:发音人,取值为taotao或者binbin

例子

<speak><voice name="binbin">今天几号了</voice></speak>

sub

说明

替换词语的发音

属性

  • alias:替换后的词语

例子

<speak><sub alias="胃溃疡">Gu</sub></speak>

break

说明

插入静音

属性

  • time:静音时间,单位为秒,小数形式 最大为10

例子

<speak>我等你5秒<break time="0.5"/>你算出来了吗?</speak>

phoneme

说明

指定标签中文本的中文发音

属性

  • py:中文拼音,多个字拼音用空格分开,拼音数量必须与中文数量一致(音调范围0~4表示轻声~四声)

例子

<speak><phoneme py="chao2 yang2 qu1">朝阳区</phoneme></speak>

emphasis

说明

强调标签中的文本发音

属性

例子

<speak>请问您是<emphasis>王先生</emphasis>的家属吗?</speak>

W

说明

分词(分词会修改发音的韵律)

属性

例子

<speak>我是<w>中国</w><w>人</w></speak>
<speak>我是<w>中国人</w></speak>

say-as

说明

按指定规则发音

属性

  • code:按数字串读 如123 读一二三
  • value:按数字值来读 如123 读一百二十三
  • letter:按字母串读
  • tel:按电话读

例子

<speak>您的编码是<say-as type="code">123</say-as></speak>

<speak>我等你<say-as type="value">123</say-as>秒</speak>

<speak>星期一的英文是这么拼的<say-as type="letter">today</say-as></speak>

<speak>电话是<say-as type="tel">13717771777</say-as></speak>
Copyright © JD AI Platform all right reserved,powered by GitbookFile Modify: 2021-05-21 22:10:38

results matching ""

    No results matching ""