腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
实时音频可视化Java
、
、
我已经使用Java Sound API构建了一个应用程序,该应用程序能够录制和播放
语音
,程序在录制完成后显示录制的
语音
的
波形
。我想在录制完成的同时显示
波形
。
浏览 0
提问于2011-03-14
得票数 4
4
回答
如何在Python中进行实时
语音
活动检测?
、
、
、
、
我正在对记录的音频文件执行
语音
活动检测,以检测
波形
中的
语音
和非
语音
部分。分类器的输出类似于(突出显示的绿色区域表示
语音
):我在这里面临的唯一问题是让它工作的音频输入流(例如:从麦克风),并做一个规定的时间框架的实时分析。我知道PyAudio可以用来动态地记录麦克风上的
语音
,还有一些
波形
、频谱、谱图等实时可视化的例子,但是没有找到任何与以近乎实时的方式进行特征提取相关的东西。
浏览 11
提问于2020-03-24
得票数 17
回答已采纳
2
回答
来自苹果商业广告的
波形
API?
、
、
、
在新的iPhone 3GS商业广告中,苹果用一个很酷的蓝色
波形
动画展示了
语音
控制。这种渲染
波形
(或者可能只是体积)的视觉效果是否可以作为API调用或源代码在某个地方使用?(不是
语音
控制部分,只是音频可视化部分)谢谢!
浏览 1
提问于2009-07-10
得票数 1
回答已采纳
1
回答
非英文窗口系统上
语音
识别
、
、
、
我无法在我的荷兰语windows系统上使用
语音
识别应用程序,因为它只在英文版本上可用。这个是可能的吗?有这样的库吗?
浏览 1
提问于2013-11-05
得票数 2
1
回答
如何在
语音
识别中获取音素?
、
、
、
、
我正在从事
语音
识别工作,以显示音素和它的
波形
,如果可能的话,使用vista和Windows7的内置
语音
识别使用Delphi2009。欢迎使用其他编程语言。
浏览 7
提问于2010-06-01
得票数 1
1
回答
绘制
语音
频谱图的TSNE散点图
、
、
、
、
我有属于4类的
语音
波形
的频谱图。我想绘制TSNE散点图,以可视化
语音
文件在四个类中的分布。我怎样才能用tsne做到这一点?
浏览 16
提问于2019-05-10
得票数 0
回答已采纳
1
回答
iOS像
语音
备忘录一样记录音频和绘制
波形
、
、
、
、
在我的应用程序中,我想记录音频,在记录的时候显示一个
波形
,然后滚动这个
波形
来记录和播放指定的时间。例如,如果我有3分钟的音频,我应该能够滚动回2:00,并开始录制从那里修复一个错误。在
语音
备忘录中,这是即时完成的,没有任何延迟或加载时间。我想弄清楚这是怎么回事,如果有人有线索的话。EZAudio --这个图书馆很棒,但没有做我想做的。你不能滚动
波形
。它在开始时删除
波形
数据,并在达到一定长度时开始将其追加到末尾。 SCWaveformView -这个
波形
很好,但它使用图像。
浏览 3
提问于2015-05-11
得票数 10
回答已采纳
1
回答
用时间值改变
波形
图的颜色
、
我目前正在做一个
语音
处理项目,并且有一个关于西班牙语单词的时间
波形
的快速问题。我想突出显示
波形
中包含音素ai的部分。使用Audacity,我已经能够在音素出现的时间标记位置,并想知道我如何能够改变
波形
的那个部分的颜色。
浏览 3
提问于2017-02-15
得票数 2
回答已采纳
1
回答
为什么是情节特征?
、
在PyTorch的教程基于
波形
2Vec2的
语音
识别中,声学特征是从音频
波形
中提取出来的(尽管它是不必要的,因为该模型可以一步完成特征提取和分类),然后绘制。我们从这些阴谋中得到了什么?
浏览 0
提问于2022-11-03
得票数 0
2
回答
如何找到选定的SpeechSynthesizer
语音
的音频格式
、
、
、
在C#的文本到
语音
应用程序中,我使用了SpeechSynthesizer类,它有一个名为SpeakProgress的事件,该事件是为每个口语触发的。但是对于某些声音,参数e.AudioPosition与输出音频流不同步,并且输出
波形
文件的播放速度比这个位置显示的要快(参见)。 无论如何,我正试图找到有关比特率的确切信息和与所选
语音
相关的其他信息。正如我所经历的,如果我能够用这个信息初始化这个
波形
文件,同步问题就会得到解决。但是,如果我在SupportedAudioFormat中找不到这样的信息,我就没有其他方法可以找到它们
浏览 5
提问于2015-12-08
得票数 10
回答已采纳
1
回答
必应
语音
API从麦克风发送实时音频
、
、
我尝试了必应
语音
API application.It将工作良好的
波形
文件检测模式,但如何读取麦克风。是否有可用的示例程序?
浏览 0
提问于2018-02-07
得票数 0
回答已采纳
1
回答
如何解码
语音
输入
、
、
、
我想要做的是创建一个API,将人类
语音
翻译成IPA (国际音标)格式。我的问题是,关于如何在原始音频
波形
级别解码
语音
的资源在哪里?我寻找一个API,但我找到的大多数东西都直接翻译成罗马字母。我希望创造一些更准确的东西来区分发声的
语音
。
浏览 5
提问于2012-07-20
得票数 5
回答已采纳
1
回答
我应该使用什么Wav格式来记录音频和识别其中的
语音
?
这就是流动: 使用VOSK
语音
识别的第一级
语音
检测,并将录制的音频添加到内存流中。如果识别了
语音
,则将内存流保存到wav文件中。第二级
语音
识别使用Microsoft认知
语音
服务从wav文件中读取。我的问题是,在保存wav文件时,我应该使用什么样的
波形
格式来临时提高认知
语音
服务的
语音
识别精度。
浏览 15
提问于2022-02-16
得票数 0
1
回答
提取音频文件的二进制表示
、
、
、
我想要这个提取这些表示,以识别
语音
和声音,即一个基本的
语音
识别软件。编辑-我想获得音频的
波形
,而不是图形,而是二进制表示,这样我就可以将
语音
转换为文本。
浏览 2
提问于2012-03-05
得票数 0
2
回答
Flash:为上传的声音生成/显示声音
波形
、
、
我有一个项目,需要我显示一个上传的声音
波形
。声音始终是MP3,大多数时间是22.05 kHz单声道,只有
语音
。我找到并观察过的所有生成
波形
的例子,要么是在声音播放时实时进行可视化,要么是最有希望的,它保持已经生成的
波形
,但它做得非常慢,似乎使用了和播放音频一样长的时间。 有没有办法产生比实时更快的电波?
浏览 1
提问于2011-03-14
得票数 2
回答已采纳
2
回答
波形
比较
、
、
、
我的目标是通过将声音的
波形
与我的数据库中的
波形
进行比较,来识别声音是否属于IPA。我精通数学,SciPy和PyBrain。我想把一个声音文件分成与不同音节相对应的
波形
--这将需要一个学习算法。所以,“我喜欢苹果”会被切成组成句子的音节
波形
。然后将每个
波形
与英国PA的
波形
进行比较。我不知道该怎么演这部分。我正在考虑使用Praat来检测
波形
,捕
浏览 8
提问于2016-10-29
得票数 1
回答已采纳
2
回答
GDK如何在没有网络连接的情况下处理
语音
触发
、
我希望能够在我的眼镜应用程序中使用具有已知定义(0-9)的
语音
意图。关于玻璃
语音
触发器,当用户使用"OK,Glass“菜单时,他们会得到一个可用应用程序列表的提示,这些应用程序具有可识别的
语音
触发器。
浏览 2
提问于2014-03-10
得票数 2
1
回答
我用算法来比较样本的错误是什么?
我想要比较和识别两个声音流。我创建了自己的算法,但它的工作并不完全像我想要的那样。我试着拿几个字母"A,B,C“和"D,E,F”或者"facebook“和”音乐“进行比较,算法给出了这个比较的真实价值,但这些都不是相同的词。我的算法是如此不精确,还是它是由笔记本电脑的麦克风记录的声音质量的原因造成的? 我的比较算法的概念:我从一个流取100个样本(可以是在轨道中间),并以指定的方式检查每一条第二流的每一段:前0-99样本,1- 100,2-101等等。我的程序与一条输入轨迹相比只有几条轨迹,所以我的算法可以从每条路径中得到最好的解决方案(最相似的样本),但不幸的是,它得
浏览 1
提问于2014-06-02
得票数 0
回答已采纳
1
回答
Android上的谷歌
语音
识别器需要互联网吗?
、
我使用以下代码调用google的
语音
识别器: package com.example.voiceinputbuiltintest然而,当我在搭载安卓版本gingerbread.el21的三星Galaxy S2上试用它时,
语音
识别器活动显示出来,但显示它需要网络连接,并且拒绝工作。
浏览 2
提问于2013-10-24
得票数 5
回答已采纳
1
回答
XAudio2.7停止源
语音
后崩溃
源
语音
以8 8KHz、单声道和16位/采样
波形
格式创建。然后,我运行一个后台线程,等待
语音
回调并提交新的缓冲区。一切都很好,直到我停止
语音
和它崩溃的访问冲突异常的应用程序。
浏览 2
提问于2017-02-08
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
通过PHP,JS两种方式获取语音的长度
安捷伦示波器抓波形
语音合成领域的首个完全端到端模型,百度提出并行音频波形生成模型ClariNet
普源示波器测波形
普源示波器存波形
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券