词法分析
一、接口描述
1. 功能描述
提供中文分词、词性标注、命名实体识别三个功能,解析自然语言中的基本语言元素,并赋予词性,进一步将文本中的特定类型的事物名称或符号识别出来,使机器能更准确的理解内容,支撑自然语言的准确理解。
2. 接口使用
平台为每个API提供试用体验服务,您在AI市场选择“免费试用”规格下单后,即可开始体验业内领先的人工智能API服务。 免费试用服务具有调用量、QPS限制,如需更高性能的API服务,可以提交咨询工单,联系京东AI扩容购买。
在获得使用权限后,您可使用已经封装好的SDK/参照接口鉴权规则进行相应开发,整体流程详见 接入流程
二、请求说明
1. 接口地址 :
https://aiapi.jd.com/jdai/lexer
2. 请求方式:
post
3. 请求参数
(1)query请求参数
公共请求参数
名称 | 类型 | 必填 | 示例值 | 描述 |
---|---|---|---|---|
appkey | string | 是 | 80d2b762ecb86593f9668526920f46c | 您的appkey,可在买家中心控制台中获 |
timestamp | long | 是 | 1541491668060 | 请求的时间戳,精确到毫秒,timestamp有效期5分钟 |
sign | string | 是 | 2e148773a0337a8f2200ba90d445f083 | 签名,根据规则MD5(sectetkey+timestamp) |
(2)header请求参数
业务请求参数
名称 | 类型 | 必填 | 示例值 | 描述 |
---|---|---|---|---|
Content-Type | string | 是 | application/json | 表示请求JSON格式的文本信息 |
(3)body请求参数
业务请求参数
名称 | 类型 | 必填 | 示例值 | 描述 |
---|---|---|---|---|
appId | string | 否 | 0 | 应用id,同一调用方可以创建多个应用。appId不填或者为0时表示使用通用的分词模型。 |
text | string | 是 | 克林顿访问中国 | 输入文本 |
type | int | 是 | 0 | 选择所需的词法分析的结果,包括"分词"、"词性标注"和"命名实体识别”一个或多个的组合。 0: 提供分词,词性标注以及命名实体识别的结果 1: 提供分词的结果 2: 提供分词和词性标注的结果 3: 提供分词和命名实体的结果 如输入其它数值,默认按0情况处理 |
4、请求代码示例
建议您使用我们提供的SDK进行调用,SDK获取及调用方式详见本页一接口描述中的2接口使用
三、返回说明
1、返回参数
(1)公共返回参数
名称 | 类型 | 示例值 | 描述 |
---|---|---|---|
code | string | 1000 | 参见下方错误码-系统级错误码 |
charge | boolean | false 或 true | false:不扣费, true:扣费 |
remainTimes | long | 1305 | 剩余调用次数;免费api:每天剩余调用次数;收费api:剩余次数;无限制时为-1 |
remainSeconds | long | 1223456 | 剩余调用时间(s);免费api:-1;收费api:剩余调用时间;无限制时为-1 |
msg | string | 查询成功 | 参见下方错误码-系统级错误码数 |
result | object | {...} | 查询结果 |
(2)业务返回参数
名称 | 类型 | 示例值 | 描述 |
---|---|---|---|
status | int | 0 | 参照四、错误码-业务错误码 |
message | string | ok | 参照四、错误码-业务错误码 |
request_id | string | 5893465d31284468a8014de6ee430f8e | 便于双方定位问题 |
text | string | 克林顿访问中国 | 输入文本 |
tokenizedText | list | [{"offset": 0,"pos": "NR","length": 3,"ner": "PERSON","word": "克林顿"},...] | 词法分析结果,详情下面tokenizedText字段说明 |
tokenizedText字段说明
名称 | 类型 | 示例值 | 描述 |
---|---|---|---|
word | string | 克林顿 | 分词 |
pos | string | NR | 词性 |
ner | string | PERSON | 命名实体识别 |
offset | int | 0 | 距离起始位置偏移 |
length | int | 3 | 分词长度 |
词性字段说明
词性标签 | 中文含义 | 词性标签 | 中文含义 |
---|---|---|---|
VV | 其他动词 | P | 介词 |
LB | 长“被”结构 | VE | 动词 |
AD | 副词 | DEG | 助词 |
VC | 系动词 | M | 度量词 |
DEV | 助词 | VA | 谓词性形容词 |
OD | 序列词 | MSP | 其他助词 |
PN | 代词 | AS | 动态助词 |
PU | 标点 | NT | 时间名词 |
CS | 从属连词 | BA | "把"字结构 |
NR | 专有名词 | CC | 并列连接词 |
SB | 短“被”结构 | NN | 其他名词 |
DEC | 助词 | JJ | 名词修饰语 |
LC | 方位词 | DER | 助词 |
FW | 外来词 | DT | 限定词 |
SP | 句末助词 | IJ | 感叹词 |
CD | 基数词 | ETC | 助词 |
ON | 拟声词 |
命名实体字段说明
命名实体标签 | 中文含义 | 命名实体标签 | 中文含义 |
---|---|---|---|
O | 非命名实体 | LOC(LOCATION) | 位置 |
ORG(ORGANIZATION) | 组织机构 | PERSON | 人物 |
BRAND | 商标 | PRODUCT | 产品 |
CATEGORY | 类别 | MISC | 杂项 |
GPE | 地理政治实体,例如,中国 | DATE | 日期 |
NUMBER | 数字 | TIME | 时间 |
ORDINAL | 序数,例如第一 | DEMONYM | 民族 |
PERCENT | 百分比 | MONEY | 钱 |
FACILITY | 设施, 例如, 图书馆, 医院 |
2、返回示例
{
"code": "10000",
"charge": false,
"remainTimes": 4998,
"remainSeconds": -1,
"msg": "查询成功",
"result": {
"status": 0,
"request_id": "ac7be2c2-c5c6-4bd4-b52d-e03b03fc5b58",
"message": "ok",
"text": "克林顿访问中国",
"tokenizedText": [
{
"offset": 0,
"pos": "NR",
"length": 3,
"ner": "PERSON",
"word": "克林顿"
},
{
"offset": 3,
"pos": "VV",
"length": 2,
"ner": "O",
"word": "访问"
},
{
"offset": 5,
"pos": "NR",
"length": 2,
"ner": "GPE",
"word": "中国"
}
]
}
}
四、错误码
1.系统级错误码
2.业务错误码
业务错误码(status) | message | 说明 |
---|---|---|
12001 | "Invalid parameter" | 无效参数 |
12002 | "Missing parameter" | 缺少参数 |
12003 | "Error parsing parameter information" | 参数解析错误 |