腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(1806)
视频
沙龙
1
回答
保存
音频文件
的
mel
谱
图
而
不
显示
其
分解
图
python
、
librosa
、
spectrogram
、
mfcc
我想
保存
mfcc光谱
图
而
不
显示
在Jupyter notebook输出中。我已经尝试使用以下代码
保存
mfcc光谱
图
,尽管输出中
的
曲线图发生了偏转。
浏览 8
提问于2021-10-07
得票数 0
2
回答
用卷积神经网络处理熔体
谱
图
python
、
audio-recognition
使用librosa,我已经为一秒长
的
.wav
音频文件
创建了混合
谱
图
。它返回640x480 .jpg文件。我现在
的
问题是如何继续输入,因为我认为输入对于网络来说太大了。如果是这样的话,什么才是适当
的
解决办法呢?大约60x60?它必须是二次型
的
吗?在我看来,各种选择:在将cv2.resize()传递给输入层之前,只需使用cv2。
浏览 0
提问于2019-03-08
得票数 2
回答已采纳
1
回答
如何将CNN应用于短时傅立叶变换?
python
、
python-3.x
、
conv-neural-network
、
fft
所以我有一个返回.wav文件
的
短时傅里叶变换
谱
的
代码。我希望能够利用,比方说一毫秒
的
光谱,并用它来训练CNN。ax.set_ylabel('Frequency [kHz]')plt.show() (请随意更正我在评论中提出
浏览 1
提问于2019-05-24
得票数 1
2
回答
使用librosa函数将语
谱
图
转换为音频
python
、
audio
、
spectrogram
、
librosa
我正在从事语音合成工作,我已经使用librosa构建了频谱
图
。当我想要将频谱
图
转换为音频以
保存
为wav文件时,它会产生问题。我寻求帮助,发现liborsa有一个函数
mel
_to_audio,但这不起作用。 我使用这个函数来获取
音频文件
的
频谱
图
。librosa.feature.melspectrogram 这是我用来将语
谱
图
转换成音频
的
函数。 librosa.feature.inverse.
mel
_t
浏览 284
提问于2019-09-17
得票数 1
回答已采纳
1
回答
在
音频文件
中,Librosa混合
谱
图
的
时间与实际时间
不
匹配
python
、
librosa
我试图使用librosa.feature计算MFCC系数,但当我使用specshow绘制它时,
显示
图上
的
时间与
音频文件
中
的
实际时间
不
匹配。我尝试了librosa docs
的
代码,在这里我们创建了具有预先计算
的
日志功率
Mel
谱
图
的
MFCC。sr=None) # fs is 22000 # according to WINDOW_SIZE and fs, win_length is 550, and
浏览 4
提问于2019-10-12
得票数 0
回答已采纳
1
回答
频谱图中窗口移位
的
影响?
python
、
matplotlib
、
signal-processing
、
librosa
、
spectrogram
我在DSP和生成
音频文件
的
频谱
图
方面是相当新手。我
的
频谱
图
不平滑,它
显示
的
是带有像素值
的
相当原始
的
图像,如下所示 ? 当我在寻找像这样一个平滑
的
谱
图
时 ? 我在哪里做错了?是因为窗口大小
的
原因吗?我生成
Mel
谱
图
的
代码是 def readData(file): orig
浏览 65
提问于2020-09-26
得票数 0
1
回答
将OGG (和其他格式)转换为MIDI?
convert
、
midi
、
ogg-vorbis
从midi文件中我应该期望什么样
的
质量?
浏览 0
提问于2014-08-10
得票数 3
回答已采纳
1
回答
利用matlab进行
谱
图
处理后提取FFT帧
的
局部极大值
matlab
、
audio
、
signal-processing
、
spectrogram
用
谱
图
处理信号后,从FFT帧中提取局部极大值。手机
的
麦克风记录呼出并将数据存储在wav文件中。首先,我将音频缓冲为30 50帧(帧间重叠50% )。然后用hamming窗口对每个帧进行加窗,并取|FFT|db生成信号
的
幅度
谱
图
。在用
谱
图
处理信号后,我想利用每个帧中
的
局部最大值来提取共振,在滑动窗口上计算。然后,
保存
大于全局最大值20%
浏览 2
提问于2016-11-21
得票数 1
回答已采纳
1
回答
控制光谱
图
大小
的
参数
python
、
signal-processing
、
spectrogram
、
librosa
我正试图得到如下说明所描述
的
谱
图
。 据我所知,这个指令意味着n_mels=128和n_fft=1024在melspectrogram函数中。128
mel
-scale大小是正确
的
,但是我得到
的
帧数是4
浏览 0
提问于2018-07-09
得票数 2
2
回答
如何以一种可用于预处理和建模
的
格式表示音频数据?
python
、
deep-learning
、
classification
、
supervised-learning
、
audio-recognition
在train文件夹中,有多个文件夹,如cat、dog、elephant等,这些文件夹包含多个
音频文件
。例如,文件夹dog、cat等中有多个
音频文件
,文件夹也是表示音频所属
的
class
的
class名称。如何以一种可以使用机器学习模型
的
格式表示这些数据? 为了稍微解释一下我
的
问题:让我们拿一个.csv文件。我们有行和列。行是数据点,列是特性,对此数据
的
培训机器培训模型是有意义
的
。
浏览 0
提问于2019-09-07
得票数 3
1
回答
在tensorflow中创建自己
的
数据集
python
、
tensorflow
、
pytorch
、
conv-neural-network
我面临着用
谱
图
对声音进行分类
的
任务。我有一个解决这个问题
的
方法(我将把所有的音频记录转换成光谱仪->,将它们
保存
为图片并为此训练一个神经网络),但我想走更简单
的
方法,即不
保存
图片,而是立即将
音频文件
转换为张量,但是有一个问题,我找不到关于如何从TensorFlow中
的
张量中创建数据集
的
任何有用信息。trch = torch.from_numpy(log_
mel
_spectrogram)
浏览 4
提问于2021-12-24
得票数 2
2
回答
声音
的
频率分析
frequency-analysis
、
audio-analysis
我用两个麦克风记录鸟儿
的
叫声。记录可以长达3个小时,每天听整个文件在audacity上是很耗时
的
。我想要
的
是一个脚本,它获取我
的
原始文件,并为我提供一组简短
的
音频文件
,每个文件都包含一只鸟
的
叫声。通过我
的
麦克风,我可以用mp3或wav录音。但是脚本应该只接受频率高于nHz
的
呼叫。此频率表示固定
的
、不应
保存
的
背景声音。我不知道哪种语言是最好
的
,我完全不知道如何做到这
浏览 33
提问于2019-01-29
得票数 0
1
回答
电报Bot :语音信息音频谱
图
丢失。窃听器?
api
、
bots
、
telegram
、
waveform
、
ogg
我正在开发一个电报机器人,我有一个关于发送语音(音频)信息
的
问题。vbr on -application voip \顺便说一句,MIME类型看起来是正确
的
:$ file --mime-type -b \ audio/ogg
音频文件
按预期正确播放,但我遇到
浏览 0
提问于2019-06-04
得票数 7
1
回答
dfd级别0,1和2之间有什么不同?
difference
、
dfd
我正在做我
的
最后一年项目的文档(使用机器学习模型进行cardioVascular风险评估)。COuld任何人请告诉我dfd 0级,1级和2级
的
区别。提前谢谢
浏览 5
提问于2019-06-11
得票数 2
1
回答
如何在TFS中查看当前迭代中完成工作
的
百分比?
tfs-2015
我们需要
显示
一个图表,
显示
某些项目集合中几个项目的已完成工作
的
谱
图
,比如说,众所周知
的
DefualtCollection.。因此,例如,如果集合中有3个项目,projects 1,2和3,
而
项目1已完成
其
任务
的
30%,2<code>E 211</code>已完成57%,
而
<code>E 112</code>3<code>E213<&
浏览 2
提问于2017-05-09
得票数 3
回答已采纳
7
回答
如何利用神经网络在音频片段中提取羽毛球射击声音
的
全部时间戳?
python
、
machine-learning
、
audio
、
deep-learning
、
librosa
我试图在一场羽毛球比赛
的
原始
音频文件
中找到这些例子,其中一次被任何一名球员击中。为了同样
的
目的,我在时间戳上标上了正面(敲击声)和负面(无撞击声:评论/人群声音等)标签,如下所示: 并将其转换为模型
的
谱
图</e
浏览 28
提问于2022-11-17
得票数 3
2
回答
声学指纹
的
原理是什么?
android
、
ios
、
pattern-matching
、
acoustics
什么样
的
API或框架被用来分配一个音符
的
一个值?比如,像Shazzam这样
的
应用程序如何从麦克风中获取信息,并知道该如何处理它?对我来说,这是惊人
的
电话,麦克风和一些巧妙
的
逻辑可以竞争调谐器从一个音乐商店!关于这个主题
的
有趣
的
论文。音乐识别应用软件Shazzam基于和
的
原理 下面是中
的
一些类似代码
的
示例
浏览 8
提问于2016-07-21
得票数 1
回答已采纳
2
回答
如何找到与示例声音文件最佳匹配
的
声音文件?
matlab
、
speech-recognition
、
spectrogram
例如,一组具有“一”、“二”和“三”
的
单词,
而
另一组具有通过单独记录获得
的
相同
的
准确单词。许多单词押韵和使用
的
声音有点不同。到目前为止,我已经尝试过几种方法,但是到目前为止,我得到
的
最实际
的
事情是对每个声音文件进行
谱
图
(都是用相同
的
脚本构建
的
)。 这一切都是通过MATLAB完成
的
,我只能使用MATLAB。我将把一组录音/光谱
图
称为“样本集”,而这套录音&
浏览 0
提问于2014-01-20
得票数 0
回答已采纳
7
回答
Ubuntu有免费
的
实时摄谱仪吗?
sound
在我家里
的
立体声里,我有一个有二维矩阵
的
光谱仪,X轴是频率(左是低音,中间是声音,右边是高音),Y轴是那个频率上声音
的
体积或功率。我见过这样
的
Ubuntu,但他们工作
的
MP3文件或其他预先录制
的
歌曲。是否有任何东西可以做到这一实时麦克风连接或简单
的
系统混频器?
浏览 0
提问于2013-01-13
得票数 21
回答已采纳
1
回答
使用FFT匹配两个
音频文件
(Android )
java
、
android
、
android-studio
、
audio
、
audio-fingerprinting
在过去
的
几天里,我一直在开发我
的
应用程序,我需要同时播放和录制一个
音频文件
。我需要完成
的
任务只是将录音与播放
的
音频文件
进行比较,并返回一个匹配
的
百分比。以下是我到目前为止所做
的
工作,以及我
的
问题
的
一些背景: 我决定使用.wav
音频文件
格式来简化对文件
的
解码。有没有办法做到这一点,
而
不
保存
在用户
的</em
浏览 4
提问于2017-01-04
得票数 2
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
即时通信 IM
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券