语音识别

文章/答案/技术大牛

发布

首页标签语音识别

#语音识别

专业智能高效的语音处理服务

基于PYNQ的智能垃圾分类系统

FPGA技术江湖 22天前2025-06-11 13:48:54

大侠好，欢迎来到FPGA技术江湖，江湖偌大，相见即是缘分。大侠可以关注FPGA技术江湖，在“闯荡江湖”、"行侠仗义"栏里获取其他感兴趣的资源，或者一起煮酒言欢。...

18310

ESP32语音识别灯：从设计到实现的全过程解析

芯动大师 2025-05-192025-05-19 17:25:40

使用ESP32-S3N8R8模块作为主控芯片，S3内核增加了用于加速神经网络计算和信号处理等的指令，这使得我们可以使用它来快速解析训练好的语音模型进行语音识别的...

33500

新手必看！云蝠智能大模型呼叫系统快速入门指南

云小蝠聊大模型 2025-05-142025-05-14 16:39:02

16210

腾讯云一句话识别接口调用

向东平 2025-05-092025-05-09 00:21:22

使用主账号登录语音识别控制台（https://console.cloud.tencent.com/asr），开通语音识别服务。

21010

Parakeet V2：NVIDIA 打造的“超级听写机”，让语音识别快准稳！

GPUS Lady 2025-05-052025-05-05 13:51:40

在我们日常生活中，语音识别已经成为手机助手、字幕生成、会议记录等场景中的重要技术。5月1日，NVIDIA 推出了一个全新语音识别模型——Parakeet-tdt...

98010

如何提升语音转写准确率？

用户7942235 2025-04-192025-04-19 06:30:37

无论是使用开源的ASR还是商业收费的ASR都面临着一个问题，就是识别某些领域内容的语音的时候不准确，比如在识别一些关于AI和云计算相关的一些名词的时候，市面上的...

18110

OpenAI深夜发布3个全新的语音模型，一手实测都在这了。

数字生命卡兹克 2025-04-142025-04-14 21:54:22

词错率的意思就是用于衡量语音识别系统的准确性，它通过计算模型转录文本与人工参考文本之间的错误比例来得出，错得越少，WER越低，模型的表现也就越好。

8200

从数据看 2025，中国大模型呼叫推荐市场的百亿蓝图

云小蝠聊大模型 2025-04-072025-04-07 17:35:35

根据行业趋势与技术渗透速度，结合头部企业动态及第三方机构预测，2025 年中国大模型呼叫推荐市场规模预计将达到 80 亿 - 120 亿元，年复合增长率约为45...

28410

语音识别技术在多语言环境中的挑战与突破

Echo_Wish 2025-03-292025-03-29 23:26:28

今天，我们就来聊聊语音识别在多语言环境下的挑战，以及业界如何通过技术突破这些难题，最后还会带大家用 Python 搭建一个简单的多语言语音识别模型。

29800

刚刚，OpenAI又发新货！3个新模型+1个新网站，语音识别比Whisper更强！

AI进修生 2025-03-212025-03-21 16:45:08

三个音频模型：gpt-4o-mini-tts（文字转语音），gpt-4o-transcribe 和 gpt-4o-mini-transcribe（语音转文字）。

18210

电销外呼系统核心功能

更新中 2025-02-282025-02-28 15:43:53

在数字化转型的浪潮中，电销外呼系统正经历着从传统呼叫工具向智能业务中枢的蜕变。作为企业获客转化的核心引擎，新一代外呼系统通过技术创新正在重塑销售效率的天花板。本...

33610

为什么应该关注AI外呼技术？

更新中 2025-02-252025-02-25 17:03:00

语音识别（ASR）与合成（TTS）优化：通过预训练模型（如Whisper、Tacotron）提升语音交互实时性。

25010

语音识别技术的进步与挑战

Echo_Wish 2025-02-242025-02-24 08:22:01

语音识别技术从诞生至今，经历了巨大的进步。最初的语音识别系统只能识别有限的词汇，且准确率较低。随着计算能力的提升和机器学习算法的发展，语音识别技术取得了长足的进...

26210

万字长文 | 让大模型“开口”说话：从ASR到端到端语音大模型的进化之旅

AI研思录 2025-02-202025-02-20 19:42:30

实际上，当前的Siri和小爱同学的每一句话背后都依赖于三项核心技术（未来可能就是端到端语音了）：自动语音识别（ASR）、自然语言处理（NLP）、文本到语音转换（...

1.3K20

浅析AI呼叫的业务逻辑

更新中 2025-02-212025-02-21 15:04:04

在人工智能（AI）技术日新月异的今天，AI外呼系统作为客户服务与营销的重要工具，正逐步改变着企业的运营模式和客户体验。本文将探讨AI外呼的技术路径，从技术架构、...

20500

活跃用户

gavin1024
14 文章60.2K 回答0 关注

#语音识别

基于PYNQ的智能垃圾分类系统

ESP32语音识别灯：从设计到实现的全过程解析

新手必看！云蝠智能大模型呼叫系统快速入门指南

腾讯云一句话识别接口调用

Parakeet V2：NVIDIA 打造的“超级听写机”，让语音识别快准稳！

如何提升语音转写准确率？

OpenAI深夜发布3个全新的语音模型，一手实测都在这了。

从数据看 2025，中国大模型呼叫推荐市场的百亿蓝图

语音识别技术在多语言环境中的挑战与突破

刚刚，OpenAI又发新货！3个新模型+1个新网站，语音识别比Whisper更强！

电销外呼系统核心功能

为什么应该关注AI外呼技术？

语音识别技术的进步与挑战

万字长文 | 让大模型“开口”说话：从ASR到端到端语音大模型的进化之旅

浅析AI呼叫的业务逻辑

相关产品

活跃用户

gavin1024

热门专栏

腾讯云开发者社区头条

Tencent Serverless 官方专栏

张善友的专栏

腾讯技术工程官方号的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐