有奖捉虫:办公协同&微信生态&物联网文档专题 HOT

简介

本文档提供关于数据万象语音识别模板SDK使用方式。
API
操作名
操作描述
创建模板
用于创建一个新的模板
删除模板
删除一个模板
查询模板
查询模板列表
修改模板
修改一个模板

基本操作

创建模板

功能说明

用于创建一个新的模板。

方法原型

def ci_create_asr_template(self, Bucket, Name, EngineModelType, ChannelNum,
ResTextFormat, FilterDirty=0, FilterModal=0, ConvertNumMode=0, SpeakerDiarization=0,
SpeakerNumber=0, FilterPunc=0, OutputFileType='txt', **kwargs)

参数说明

Request 的具体参数描述如下:
节点名称(关键字)
描述
类型
必选
Bucket
存储桶名称
String
Name
模板名称仅支持中文、英文、数字、_、-和*
String
EngineModelType
引擎模型类型,分为电话场景和非电话场景。 电话场景:
8k_zh:电话 8k 中文普通话通用(可用于双声道音频);
8k_zh_s:电话 8k 中文普通话话者分离(仅适用于单声道音频);
8k_en:电话 8k 英语;
非电话场景:
16k_zh:16k 中文普通话通用;
16k_zh_video:16k 音视频领域;
16k_en:16k 英语;
16k_ca:16k 粤语;
16k_ja:16k 日语;
16k_zh_edu:中文教育;
6k_en_edu:英文教育;
6k_zh_medical:医疗;
16k_th:泰语;
16k_zh_dialect:多方言,支持23种方言。
String
ChannelNum
语音声道数:
1 表示单声道.EngineModelType为非电话场景仅支持单声道;
2 表示双声道(仅支持 8k_zh 引擎模型 双声道应分别对应通话双方)。
int
ResTextFormat
识别结果返回形式:
0 表示识别结果文本(含分段时间戳);
1 词级别粒度的详细识别结果,不含标点,含语速值.(词时间戳列表,一般用于生成字幕场景)
2 词级别粒度的详细识别结果(包含标点、语速值)。
int
FilterDirty
是否过滤脏词(目前支持中文普通话引擎):
0 表示不过滤脏词;
1 表示过滤脏词;
2 表示将脏词替换为 *
默认值为 0。
int
FilterModal
是否过滤语气词(目前支持中文普通话引擎):
0 表示不过滤语气词;
1 表示部分过滤;
2 表示严格过滤 。
默认值为 0。
int
ConvertNumMode
是否进行阿拉伯数字智能转换(目前支持中文普通话引擎):
0 表示不转换,直接输出中文数字;
1 表示根据场景智能转换为阿拉伯数字。
3 表示打开数学相关数字转换。
默认值为 0。
int
SpeakerDiarization
是否开启说话人分离:
0 表示不开启;
1 表示开启(仅支持8k_zh,16k_zh,16k_zh_video,单声道音频)。
默认值为 0。
注意:8k电话场景建议使用双声道来区分通话双方,设置ChannelNum=2即可,不用开启说话人分离。
int
SpeakerNumber
说话人分离人数(需配合开启说话人分离使用),取值范围:0-10。
0代表自动分离(目前仅支持≤6个人)。
1-10代表指定说话人数分离。
默认值为 0。
int
FilterPunc
是否过滤标点符号(目前支持中文普通话引擎):
0 表示不过滤。
1 表示过滤句末标点。
2 表示过滤所有标点。
默认值为 0。
int
OutputFileType
输出文件类型,可选 txt、srt。默认为txt
String

请求示例

def ci_create_asr_template():
# 创建语音识别模板
response = client.ci_create_asr_template(
Bucket=bucket_name,
Name='templateName',
EngineModelType='16k_zh',
ChannelNum=1,
ResTextFormat=2,
)
print(response)
return response

返回结果说明

{
'RequestId': 'NjMyMjliMWZfZWM0YTYyNjRfNWNmNF8xMDBh',
'Template': {
'TemplateId': 't1c1287c04c147443da0b2cc7b8fbabf32',
'Name': 'templateName',
'State': 'Normal',
'Tag': 'SpeechRecognition',
'CreateTime': '2022-09-15T11:25:19+0800',
'UpdateTime': '2022-09-15T11:25:19+0800',
'BucketId': 'testpic-1253960454',
'Category': 'Custom',
'SpeechRecognition': {
'EngineModelType': '16k_zh',
'ChannelNum': '1',
'ResTextFormat': '2',
'FilterDirty': '0',
'FilterModal': '0',
'ConvertNumMode': '0',
'SpeakerDiarization': '0',
'SpeakerNumber': '0',
'FilterPunc': '0',
'OutputFileType': 'txt'
}
}
}
响应字段详情详见创建语音识别模板响应信息

删除模板

功能说明

删除一个模板

方法原型

def ci_delete_asr_template(self, Bucket, TemplateId, **kwargs)

参数说明

参数名称
描述
类型
必选
Bucket
Bucket 的命名规则为 BucketName-APPID,详情请参见 存储桶概述
String
TemplateId
要取消的模板 ID
String

请求示例

def ci_delete_asr_template():
# 删除指定语音识别模板
response = client.ci_delete_asr_template(
Bucket=bucket_name,
TemplateId='t1bdxxxxxxxxxxxxxxxxx94a9',
)
print(response)
return response

返回结果说明

{
'RequestId': 'NjMyMjlkZmRfZWM0YTYyNjRfNWNmNF8xMDBi',
'TemplateId': 't1c1287c04c147443da0b2cc7b8fbabf32'
}
响应字段详情详见DeleteTemplate响应信息

查询模板列表

功能说明

查询模板列表

方法原型

def ci_get_asr_template(self, Bucket, Category='Custom', Ids='', Name='', PageNumber=1, PageSize=10, **kwargs)

参数说明

参数名称
描述
类型
必选
Bucket
Bucket 的命名规则为 BucketName-APPID,详情请参见 存储桶概述
String
Category
Official,Custom,默认值:Custom
String
Ids
模板 ID,以,符号分割字符串
String
Name
模板名称前缀
String
PageNumber
第几页
Integer
PageSize
每页个数
Integer

请求示例

def ci_get_asr_template():
# 获取语音识别模板
response = client.ci_get_asr_template(
Bucket=bucket_name,
)
print(response)
return response

返回结果说明

{
'TotalCount': '1',
'RequestId': 'NjMyMjljNTlfMTIwNjUzMDlfMmUzYV8xMWNh',
'PageNumber': '1',
'PageSize': '10',
'TemplateList': [
{
'TemplateId': 't1c1287c04c147443da0b2cc7b8fbabf32',
'Name': 'templateName',
'State': 'Normal',
'Tag': 'SpeechRecognition',
'CreateTime': '2022-09-15T11:25:19+0800',
'UpdateTime': '2022-09-15T11:25:19+0800',
'BucketId': 'testpic-1253960454',
'Category': 'Custom',
'SpeechRecognition': {
'EngineModelType': '16k_zh',
'ChannelNum': '1',
'ResTextFormat': '2',
'FilterDirty': '0',
'FilterModal': '0',
'ConvertNumMode': '0',
'SpeakerDiarization': '0',
'SpeakerNumber': '0',
'FilterPunc': '0',
'OutputFileType': 'txt'
}
}
]
}
响应字段详情请参见 获取语音识别模板响应信息

修改模板

功能说明

修改模板

方法原型

def ci_update_asr_template(self, Bucket, TemplateId, Name, EngineModelType, ChannelNum,
ResTextFormat, FilterDirty=0, FilterModal=0, ConvertNumMode=0, SpeakerDiarization=0,
SpeakerNumber=0, FilterPunc=0, OutputFileType='txt', **kwargs)

参数说明

节点名称(关键字
描述
类型
必选
bucketName
Bucket 的命名规则为 BucketName-APPID,详情请参见 存储桶概述
String
templateId
修改的模板 ID
String
说明
其余参数请参见 创建模板接口,与其参数一致。

请求示例

def ci_update_asr_template():
# 修改语音识别模板
response = client.ci_update_asr_template(
Bucket=bucket_name,
TemplateId='t1bdxxxxxxxxxxxxxxxxx94a9',
Name='QueueId1',
EngineModelType='16k_zh',
ChannelNum=1,
ResTextFormat=1,
)
print(response)
return response

返回结果说明

{
'RequestId': 'NjMyMjlkNzhfMTIwNjUzMDlfMmUxZF8xMGM4',
'Template': {
'TemplateId': 't1c1287c04c147443da0b2cc7b8fbabf32',
'Name': 'QueueId1',
'State': 'Normal',
'Tag': 'SpeechRecognition',
'CreateTime': '2022-09-15T11:25:19+0800',
'UpdateTime': '2022-09-15T11:35:20+0800',
'BucketId': 'testpic-1253960454',
'Category': 'Custom',
'SpeechRecognition': {
'EngineModelType': '16k_zh',
'ChannelNum': '1',
'ResTextFormat': '1',
'FilterDirty': '0',
'FilterModal': '0',
'ConvertNumMode': '0',
'SpeakerDiarization': '0',
'SpeakerNumber': '0',
'FilterPunc': '0',
'OutputFileType': 'txt'
}
}
}
响应字段详情请参见 更新语音识别模板响应信息