首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签语音识别

#语音识别

专业智能高效的语音处理服务

AI:安装Nemo并进行自动语音识别

Freedom123

注意: base 与 studyNemo 的环境相互独立,并不互通,在不同环境中install的包不能相互使用

6310

Python 语音录制与识别

dandelion1990

本文介绍一些 Python 中常用的语音能力的包,以及如何通过调用云服务商的 API 进行语音识别

9610

盘点一个语音识别库报错的问题

Python进阶者

甚至你可以给客户说,离线版的本身就有语音识别率的问题,会有一些识别错误。在线版的会识别率更高,看看客户是否愿意更改为联网版。先给客户一个心理暗示,让他有个准备。...

7210

AI+低代码+语音识别,让用户闭着眼睛开发

否子戈

腾讯 · 前端开发工程师 (已认证)

上篇文章中提到利用 AI 配合低代码平台,可以让用户快速搭建页面和应用。本文将会对这个问题展开聊聊,不讲概念,直接上干货。

10910

openai whisper 语音识别,语音翻译

崔哥

Whisper 是openai开源的一个通用的语音识别模型,同时支持把各种语言的音频翻译为成英文(音频->文本)。

20210

【RV1126】移植sherpa实时语音识别和TTS文字转语音功能

呱牛笔记

参考:【RV1126】移植kaldi实时语音识别 https://blog.csdn.net/qq_28877125/article/details/13037...

18310

胡歌给大家拜年了!家人们快来跟《繁花》明星学拜年

腾讯云AI

在腾讯云语音识别(ASR)技术的加持下,这只H5融合互动营销和语音识别等前沿科技元素,为用户创造了一场别开生面的新春年味。

11210

语音识别语料归一化处理的方法

阿志小管家

在进行语音识别模型的训练和测试语料收集的过程中,我们需要对收集到的语料进行归一化处理。

9710

深度学习的进展

红目香薰

深度学习在各个领域都有广泛的应用,如自然语言处理中的文本分类和情感分析,计算机视觉中的图像识别和目标检测,语音识别中的语音翻译和语音助手等。近年来,深度学习在上...

10510

小米新一代Kaldi团队论文解读:新型自动语音识别 (ASR) 模型Zipformer诞生之路|ICLR 2024 Oral

机器之心

近日,小米集团新一代 Kaldi 团队关于语音识别声学模型的论文《Zipformer: A faster and better encoder for auto...

39410

使用 LinkAi 打造自己的知识库和数字人

绿毛龟

随着人工智能技术的不断发展,我们越来越需要一个高效、智能的方式来管理和利用我们的知识。LinkAi 提供的智能语音识别和文本分析技术,可以帮助我们轻松地打造自己...

46310

华为ICT——第八章:语音处理理论与实践02

用户10920956

⚫ 加窗:分帧后,每一帧的开始和结束都会出现间断。因此分割的帧越多,与原始信号的误差就越大, 加窗就是为了解决这个问题,使成帧后的信号变得连续,并且每一帧都会表...

10010

华为ICT——第五章语音处理理论与实践

用户10920956

10410

英伟达AI游戏引擎炸场CES!NPC与玩家实时交互,对话动作流畅似真人

量子位

Convai是一个主要面向游戏开发者的数字人平台,提供了语音识别/合成、语言理解与生成等AI对话服务。

13310

AudioGPT 语音技术全覆盖:语音识别、增强、分离、风格迁移等 | 开源日报 No.114

小柒

oil.nvim 是一个类似于 vim-vinegar 的文件浏览器,允许您像普通 Neovim 缓冲区一样编辑文件系统。其主要功能包括支持常见插件管理器、通过...

21110

用活人脑细胞造AI系统!语音识别已成功,可无监督学习|Nature子刊

量子位

但这种思想下设计的“传统”类脑芯片大多数都是直接基于数字电子原理,完全模仿大脑功能的能力着实有限。

18910

FaceBook推出新的翻译模型Seamless!可实现跨语言交流的无缝衔接!

Python兴趣圈

FaceBook (中文名:脸书)近期发布了一个新的翻译模型 Seamless Communication,可实现跨语言实时"无缝"交流。

25610

电话质检语音识别技术:提升企业效率与质量的新选择

用户10792926

随着通讯技术的发展和人们对质量的不断追求,电话质检语音识别技术应运而生。这项技术通过对电话录音的自动分析和识别,能够快速准确地得出通话双方的交流情况、语音质量和...

16510
领券