2021年12月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
语音识别产品支持四川话、武汉话等23种方言 | 在原有中文普通话、英语、粤语、日语、上海话基础上,新增了四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话。 | 2021-12-03 | 一句话识别 API、录音文件识别API |
2021年02月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
语音识别发布多款行业模型 | 实时语音识别支持教育、医疗、游戏、法庭行业模型 录音文件识别支持教育、医疗行业模型 |
2021-02-01 | 录音文件识别、实时语音识别 |
2021年01月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
语音识别支持音频格式全面升级 | 对录音文件识别、实时语音识别支持的格式进行了全面的升级丰富 | 2021-01-21 | 腾讯云语音识别产品详细信息 |
实时语音识别 SDK 全面支持 websocket 协议 | 实时语音识别服务端、客户端、前端 SDK 都已支持 websocket 协议 | 2021-01-21 | 实时语音识别(websocket) |
语音流异步识别子产品发布 | 对直播协议语音流进行识别,准实时返回识别结果,支持音视频场景专用模型,可用于直播流质检等场景 | 2021-01-15 | 语音流异步识别任务创建 |
录音文件识别极速版子产品发布 | 对较大的录音文件进行极速识别,半实时返回识别结果;可应用于音视频字幕、准实时质检分析场景等场景 | 2021-01-15 | 录音文件识别极速版 |
2020年11月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
录音文件识别支持自动说话人分离 | 16k_zh_video 引擎模型支持说话人分离功能上线,电话场景和非电话场景均支持自动分离和指定说话人数分离 | 2020-11-27 | 录音文件识别请求 |
2020年10月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
ASR 接入层支持 websocket 协议 | 本接口服务采用 websocket 协议,对实时音频流进行识别,同步返回识别结果,达到“边说边出文字”的效果。 | 2020-10-10 | 实时语音识别(websocket) |
2020年09月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
ASR 访问控制 | 通过腾讯云的 CAM(访问控制)产品实现对 ASR 操作维度和资源维度的权限管理。 | 2020-09-16 | |
语音识别电话场景支持英语模型 | 语音识别新增电话 8k 英语模型,适用于英语电话场景的语音转文字 | 2020-09-09 | |
客户端 TRTC 接入实时语音识别技术指引上线 | 针对有实时音视频与语音识别需求的用户,可通过 TRTC 接入的实时语音识别的方式使用 | 2020-09-07 | TRTC 接入实时语音识别 |
2020年08月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
语音识别产品支持上海话方言 | 语音识别产品提升语言和方言能力,新增支持上海话方言的能力 | 2020-08-21 | |
语音识别产品支持日语 | 语音识别产品提升语言和方言能力,新增支持日语的能力 | 2020-08-04 | |
语音识别产品返回结果中标点符号能力提升 | 语音识别产品返回结果中标点符号能力升级后增加顿号、问号和叹号的支持 | 2020-08-01 |
2020年07月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
录音文件识别支持3人及以上多说话人分离 | 电话场景支持单声道2人话者分离,非电话场景支持单声道2-10人话者分离 | 2020-07-28 | 录音文件识别请求 |
实时语音识别支持 OPUS 格式 | OPUS 是一个低延时、高保真的适合在网络中传输的开源的语音编码格式,也是目前比较主流的音频流格式,可更好的支持使用该格式的客户接入实时语音识别 | 2020-07-02 |
2020年06月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
录音文件识别支持时长能力提升 | 当采用上传音频 url 方式使用录音文件识别时,url 的时长限制由1小时放宽到5小时 | 2020-06-18 | |
实时语音识别支持词时间戳功能 | 实时语音识别支持词时间戳功能,该功能适用于通过语音识别加载字幕,并且对时延要求较高场景 | 2020-06-05 |
2020年04月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
支持用户自主对识别结果进行数字转换 | 支持用户自主选择转换为中文数字还是智能转换为阿拉伯数字 | 2020-04-24 | |
录音文件识别产品上线音视频领域模型 | 对于音视频领域(半远场、带背景音乐)的音频转写,有业界领先的识别精度 | 2020-04-07 |
2020年03月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
发布语音识别后脏词过滤、语气词过滤和句末标点过滤用户自主选择功能 | 支持用户根据使用场景自主选择是否过滤脏词、语气词和句末标点 | 2020-03-16 |
2020年02月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
语音识别产品支持通过控制台创建热词 | 添加热词可以显著提升专有词汇识别准确率 | 2020-02-25 | 热词 |
2020年01月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
实时语音识别与一句话识别产品价格策略变更 | 变更后的计费策略是根据用量梯度决定产品价格,用量越多单价越低 | 2020-01-01 | 计费策略文档 |
2019年12月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
录音文件识别支持云函数接入方式 | 对于将音频文件存储在腾讯云 COS 上的用户,使用云函数方式接入的方法可明显减少前期的接入开发工作 | 2019-12-18 | 使用云函数方式的录音文件识别 |
语音识别产品上线 Beta 版本自学习模型 | 支持通过语言模型自学习工具进行定制优化,可有效提高专有领域或行业下的语音识别准确率 | 2019-12-10 | 自学习模型 |
语音识别产品支持预付费的购买方式 | 腾讯云语音识别 ASR 提供预付费和后付费两种计费模式 | 2019-12-06 | 计费概述 |
2019年11月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
---|---|---|---|
实时语音识别、一句话识别支持英语和粤语 | 实时语音识别、一句话识别提升语言和方言能力,新增支持英语和粤语的能力 | 2019-11-13 |