时频掩模处理语音 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

带内DTMF音调

这实际上并不是发送任何类型的电话信号，而只是通过语音路径发送相应的DTMF声音。当IVR提示我输入双音多频音时-而不是按下电话上的按钮，如果我播放预先录制的包含双音多频声音的.WAV文件时声音真的很大怎么办？假设这些文件中有极好的音频质量。这在技术上是一样的吗？

浏览 0提问于2014-06-01得票数 1

1回答

利用MFCC和Mel谱图与CNN

、

我想得到一些反馈，为什么在许多研究论文中，研究人员通过卷积神经网络(CNN)传递MFCC？从本质上讲，CNN本身就是一个特征提取过程。谢谢!

浏览 5提问于2021-08-27得票数 0

回答已采纳

1回答

我们有要求，我们要求用户对问题的描述，它可以很长一段时间。因此，为了收集它，我们将speechTimout扩展到"6“，但在某些情况下，它可能很短，所以我们希望有一个选项，用户可以在完成后按"1”键，以避免不必要的等待时间。我们已向用户提供消息“请简要描述您的问题。完成后请按"1”“。” 下面是代码 this.twilioService.gather(message, { finishOnKey: '1', input: ['speech'

浏览 35提问于2021-08-05得票数 0

4回答

转置wav文件密钥的傅立叶变换

、、

例如每秒1/10 )3)根据我想要的键值，将频率空间上移或下移5)把所有的积木粘在一起但现在我在想，当我试图将转换后的块重新粘合在一起时，

浏览 0提问于2010-04-13得票数 1

回答已采纳

1回答

如何修复"Invalid Autopilot Actions JSON: Invalid Autopilot Action“

、、、、

我正在尝试使用Twilio自动驾驶，它触发twilio功能后，收集一些单词，我需要程序来播放数字或'DTMF音调‘const response = new VoiceResponse(); digits: '3' }

浏览 17提问于2019-10-23得票数 0

回答已采纳

1回答

婴儿哭声检测

、

我想问的是，鉴于婴儿的时频图，我应该遵循哪些步骤来检测婴儿的哭声。在语音识别中，我看到了一些方法，如中值滤波和隐马尔可夫模型。但是对于简单的声音检测，我是否需要采用这样一种诡辩的方法？

浏览 13提问于2015-07-12得票数 0

2回答

WebRTC操作系统编解码器:良好音频的最小带宽

、、、

在我的WebRTC应用程序中，OPUS编解码器已经被用来压缩音频流，我想知道应该为没有抖动的音频流分配的最小可行带宽是什么？

浏览 8提问于2016-06-23得票数 1

回答已采纳

1回答

有没有可能把Twilio的通话记录成“你说话的时候”？

、、、、

这样，您就可以在调用期间在每个语音部分的末尾触发一个回调，以生成文本。谢谢。

浏览 1提问于2013-09-17得票数 2

1回答

在使用MFCC的ASR系统中，提取哪些特征或使用哪些参数来区分用户？

、

在测试阶段，MFCC从扬声器中提取哪些特征？ - Compute a triangular bank filter to transform hz scale into mel scale - Apply discrete cos transform 通过这样做，我得到了系数。但是我想知

浏览 2提问于2015-03-10得票数 0

1回答

什么是梅尔谱作为一个音频序列，我如何应用它？

、、、、

我当时的印象是，梅尔光谱图只是以梅尔标度为y轴的光谱仪。然而，最近，我在一篇研究论文中读到了这句话：“可以从两个不同的角度看数据表示，比如梅尔-光谱图:图像或音频序列。”这是什么意思？这意味着Mel-光谱图不仅是光谱图，而且可以用另一种方式解释.如果是的话，究竟是什么，又如何应用呢？

浏览 6提问于2022-09-14得票数 -2

4回答

在基于sip的软电话中使用DTMF的目的是什么？

、

在一些基于sip的软电话中使用DTMF来处理有效载荷类型。但是我并不清楚使用DTMF的过程和重要性。像和这样的开源软电话使用DTMF。

浏览 11提问于2012-02-16得票数 3

回答已采纳

2回答

建立波浪分类系统的最佳方法

、

我想为波浪做一个分类器，例如：上图来自：http://www.invisiblesbook.com/equal-temperament-tuning/ 我相信，我将不得不从原始输入中提取特征，使用FFT或其他方法，并将其作为CNN的主题。建立这样的波浪分类器的最好方法是什么？我并不是特别询问神经网络，任何其他准确和快速的方法也会有帮助。

浏览 0提问于2018-10-09得票数 0

3回答

如何在Android中通过呼叫传输调制语音？

、

我想知道，在安卓系统中，可以像应用程序在通话中那样传输调制语音。我已经搜索了很多，但我只得到了如何在录音后改变声音的结果。所以，请回答我，在Android系统中可以在呼叫时传送更改的声音。

浏览 5提问于2013-08-08得票数 1

回答已采纳

1回答

用于特征提取的Python FFT

、、、

我期待着对人类加速度计数据进行特征提取，以用于活动识别。我的数据采样率为100 is。import numpy as np fft_freq = [] fft_window = np.

浏览 9提问于2017-08-24得票数 8

回答已采纳

1回答

第二个电话，而在第一个(语音信箱)没有登录到CallLog数据或监听- Android，TelephonyManager onCallStateChanged

、、

第二个电话直接打到语音信箱。安卓应用程序似乎从来没有收到过通知(通过onCallStateChanged)。当我挂断第一个调用时，会访问回调日志，并对最近的调用做一些事情(这很好)。

浏览 5提问于2014-09-15得票数 0

回答已采纳

1回答

构建一个Twilio Autopilot机器人IVR，它可以接听电话并遵循说明

我正在尝试构建一个可以接听电话的机器人。呼叫者会说“按1”这样的短语，机器人就会播放数字1。任何洞察力都会有所帮助。谢谢

浏览 0提问于2019-10-13得票数 1

1回答

我如何将谷歌语音转发到我的iPhone，但仍然使用iPhone的可视语音邮件？

、

我有一个谷歌语音号码，可以转发到我的iPhone号码。我想知道是否有任何方法使AT&T处理语音邮件，而不是谷歌语音。这样，我就可以使用手机应用程序查看语音邮件，而不必打开带有谷歌语音的浏览器。我明白，如果我这样使用它，我就不会被抄写语音信箱。没关系，这不是我使用谷歌语音的原因。理想情况下，我希望谷歌语音处理语音邮件时，我的手机关闭或在飞机模式，当我的手机打开，我有一个信号，

浏览 0提问于2010-08-29得票数 2

回答已采纳

1回答

Google语音API现场识别

、、、

我会使用Google语音库，但是我们的应用程序是基于osgi的，所以我宁愿使用Google语音Rest。我想知道是否有可能用这个rest进行某种livespeech识别。我可以提出一个单一的要求，但我想要流我的音频数据和处理结果随着时间的推移。

浏览 1提问于2018-09-12得票数 0

回答已采纳

5回答

无法使twilio聚集正常工作

、

最初的调用运行良好，但当我按下1或3时，似乎没有发生任何事情，在3秒的暂停之后，它继续进行。

浏览 0提问于2011-04-23得票数 4

回答已采纳

1回答

Pytorch:如何为平均池掩盖灵活的输入大小？

、、、、

背景：我想将卷积和平均池应用到序列分类任务中。# Two sequences.s2 = torch.range(start=1, end=3).view(-1, 1) # one-by-one kernels = torch.ones(1, 1, 2) h1 = F.conv1d(s1.view(1, 1, -1),

浏览 3提问于2019-07-01得票数 2

点击加载更多