语音识别_实时语音识别_录音文件识别_语音转文本服务

优惠套餐

新客0元体验

新用户专享资源包

一句话识别5,000次调用
实时语音识别5小时时长
录音文件识别10小时时长
语音流异步识别5小时时长

录音文件识别极速版5小时时长
自购买之日起当月有效

高性价比

一句话识别资源包

30,000次调用
自购买之日起一年有效

应用于语音消息转写等场景。
对60秒之内的短音频文件进行识别，达到快速准确识别较短语音的效果。

高性价比

实时语音识别资源包

30小时时长
自购买之日起一年有效

应用于语音输入、电话机器人等实时音频流场景。
对实时音频流进行识别，达到“边说边出文字”的效果。

高性价比

录音文件识别资源包

60小时时长
自购买之日起一年有效

应用于字幕生成、录音资料转写等场景。
对录音文件进行识别，达到识别较长非实时语音的效果。

产品子功能

语音识别（ASR）
语音识别+（ASR+）

录音文件识别

对用户上传的5小时内的录音文件进行识别。可应用于呼叫中心音频转写与质检、视频字幕转写、会议语音资料转写等场景。

实时语音识别

对不限时长的实时音频流进行识别，识别结果自动断句，标记每句话的开始和结束时间。可应用于智能语音助手、语音输入法等实时音频流场景。

录音文件识别极速版

对用户上传的录音文件进行极速识别，准实时返回识别结果。返回速度快于录音文件识别。可应用于短视频配音转写、字幕转写等时效要求高的场景。

一句话识别

对60秒内的短音频文件进行识别。可应用于即时通信应用（IM）、语音消息转文字、语音搜索等短文件识别场景。

产品优势

技术先进

语音识别引擎基于Transformer技术，具备较好的鲁棒性。支持声音和文本层面的自适应能力和语言混合识别能力。中文普通话、英文、粤语、以及其他方言引擎的识别字准率均能满足广泛的商用场景。

性价比高

腾讯云提供按量预付费、后付费、按并发计费等多种灵活计费模式，在预付费包提供了较大优惠，每月赠送免费额度，降低客户成本。

多语种、多方言

支持除普通话外的粤语、上海话、四川话等27种方言，并将持续开放其他语种和方言的识别能力。支持通过单一引擎识别普通话、粤语、英语和多方言。支持15个小语种识别。

适用多领域、多场景

可广泛适用于客服质检、外呼中心、智能家居、游戏直播、会议转写、语音输入法、教育等多个行业，基于海量数据实现分场景优化，积累了多行业的最佳实践。

支持热词和自助训练

针对垂直领域，客户可自助上传热词词表或自训练语料，有效提升专有领域的识别准确率。

高性能

产品全面实现华南、华北、华东、西南等多地域就近接入，实时识别时延达到毫秒级，非实时识别实现高性能转写速率。

应用场景

语音识别（ASR）
语音识别+（ASR+）

客服质检
会议实时转写
实时字幕
法庭转写
面对面销售
语音输入法

解决方案

在智能客服场景中，使用腾讯云语音识别可以将客服通话录音转化为文本，对可能出现的违规用语、危险用语等进行及时的干预处理，避免造成公司损失。支持实时监控和离线录音异步质检等多种质检方式。

产品动态

2026-01-15 新能力发布

实时语音翻译V1.0发布。支持实时中英文互译、中英混场景。

2025-12-15 模型优化

实时语音识别，优化普通话、英语、粤语、上海话、四川话、河南话、陕西话、安徽话、湖南话、湖北话，新增闽南话和潮汕话

2024-01-15 新版本发布

语音识别大模型V1.0版本发布

2023-05-26 新功能发布

提升识别引擎在医疗、地名、智能营销场景的识别准确率，提升了热词和自学习的性能。

2022-12-26 QPS/并发叠加包发布

实时语音识别、录音文件识别极速版、一句话识别支持QPS/并发叠加包购买。

2022-11-30 新功能发布

实时语音识别、录音文件识别、一句话识别支持热词增强版。

2022-11-28 新模型发布

实时语音识别、录音文件识别、一句话识别支持中英粤混合模型。

2022-10-29 新功能发布

录音文件识别支持情绪能量值检测和静音时长检测。

2022-9-27 模型优化

8k引擎下的中文普通话模型进行了优化。

2022-9-26 模型优化

16k引擎下的多方言模型进行了优化。

2021-12-02 新模型发布

语音识别产品支持上海话、西安话等23种方言。

2021-02-01 新模型发布

实时语音识别、录音文件识别支持教育、医疗、游戏、法庭行业模型。

2021-01-21 功能优化

实时语音识别SDK全面支持websocket 协议。

2021-01-15 新功能发布

语音流异步识别上线。

客户案例

微信

即时通讯

在语音消息转写和语音输入产品功能中使用语音识别服务，帮助用户更便捷的进行消息阅览和传递，提升了 App 的易用性。

喜马拉雅

音频服务

喜马拉雅使用腾讯云语音识别，实现 UGC 上传音频节目转写，通过转写为文字的内容提供内容标签，实现更精准的内容推荐。

珍爱网

婚恋网站

使用腾讯云语音识别完成电话录音质检，效率提升31倍，成本降低90%，过去50个人的工作量，现在只需1个人工+1台机器。

58同城

分类信息网站

58同城智能电话联络系统集成腾讯云语音识别服务，使得电话联络机器人可以听懂客户的声音，显著提高电话联络效率，降低电话联络人力成本。

中信银行

银行

中信银行手机银行 App 集成腾讯云语音识别服务，用户使用语音交互，即可完成转账、查询、理财等日常金融交易，大幅提升业务办理效率。

尚德机构

教育

尚德机构使用腾讯云语音识别进行电话录音质检，从只能抽检变成全检，大幅提高质检效率，完成客服工作质量评价，并推动改进客服与用户沟通的体验。

帮助与文档

常见问题

语音识别服务如何开通？

需要用户在语音识别控制台开通服务，默认开通的是后付费购买方式。

语音识别服务每月有免费额度吗？

语音识别服务如何计费？

更多问题请查看常见问题，也可在问答社区中进行提问。

按照我们的入门指南，只需点几次鼠标，即可创建您的首个语音识别实例。

开始使用

新用户专享资源包

一句话识别5,000次调用

实时语音识别5小时时长

录音文件识别10小时时长

语音流异步识别5小时时长

一句话识别资源包

30,000次调用

自购买之日起一年有效

实时语音识别资源包

30小时时长

自购买之日起一年有效

录音文件识别资源包

60小时时长

自购买之日起一年有效

技术先进

性价比高

多语种、多方言

适用多领域、多场景

支持热词和自助训练

高性能

解决方案

推荐产品

产品简介

购买指南

词汇表

语音识别服务如何开通？

语音识别服务每月有免费额度吗？

语音识别服务如何计费？