腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
CNN
和
PyTorch
处理
音频
分类
的
输入
数据
?
python
、
machine-learning
、
classification
、
pytorch
、
signal-processing
当一名工程系学生研究DSP
和
ML领域时,我正在做一个
音频
分类
项目,
输入
是短剪辑(4秒)如贝斯,键盘,吉他等乐器(NSynth Dataset by the Magenta team at Google这个想法是将所有的短片(.wav文件)转换成光谱图或光谱图,然后应用
CNN
来训练模型。然而,我
的
问题是,由于整个
数据
集都很大(大约23 my ),我想知道是否应该先将所有的
音频
文件转换为PNG格式
的
图像,然后再应用
CNN
浏览 16
提问于2020-01-22
得票数 1
回答已采纳
3
回答
如何
将
音频
数据
输入
深度学习算法?
deep-learning
、
classification
、
speech
、
audio-processing
、
generative-adversarial-network
我是深度学习
的
新手,我
的
目标是
使用
GAN (生成对抗网络)来识别情感语音。我只知道图像是大多数深度学习算法
的
输入
,比如GAN。但我很好奇,除了
使用
光谱图
的
图像作为
输入
之外,
音频
数据
如何
成为它
的
输入
。
浏览 98
提问于2019-10-10
得票数 2
1
回答
使用
Pytorch
从.ckpt文件加载预训练(
CNN
)模型
pytorch
我正在
使用
Pytorch
进行图像
分类
。我正在寻找在ImageNet以外
的
数据
集上预先训练
的
CNN
模型,我找到了一个指向".ckpt“文件
的
链接。我还找到了
使用
Tenserflow加载此文件
的
教程,但没有
使用
pytorch
。
如何
从".ckpt“文件中
使用
Pytorch
加载预先训练好
的
模型?
浏览 295
提问于2019-11-25
得票数 1
回答已采纳
1
回答
为什么
CNN
不能在简单
的
MLP网络上提供更高
的
精确度?[来自Keras
的
例子]
machine-learning
、
deep-learning
、
nlp
、
keras
我仍然是机器学习
的
新手,刚遇到强大
的
深度学习库,Keras。 我已经阅读过Keras文档,并且在Github 这里上尝试了很少
的
Keras示例。我还从几个来源学习了一些深入学习
的
基本知识
和
概念,但在
CNN
和
RNN中还没有得到真正
的
理解,这两个网络看起来非常强大。因此,为了证明我
的
假设,我从Keras下载了reuters_mlp.py示例,该示例最初
使用
简单
的
MLP网络作为模型。我结合了从imdb_<
浏览 0
提问于2017-05-17
得票数 3
回答已采纳
1
回答
是否有可能将火把
和
火炬
的
几何模型结合起来?
pytorch
、
pytorch-geometric
我正在
处理
一个
使用
图形
数据
的
节点
分类
问题。通过简单地将网络应用于单个节点(例如,忽略图形结构),我
使用
了
PyTorch
对节点进行
分类
,并
使用
PyTorch
几何方法应用GNN (例如GCN)对节点进行
分类
。是否可以将
PyTorch
中
的
模型作为
PyTorch
几何中
的
最后一层?我对这将
如何
工作感到有点困惑,因为对to
浏览 0
提问于2022-12-16
得票数 1
回答已采纳
2
回答
VGG或盗梦空间是否有语音或
音频
?
deep-learning
、
feature-engineering
、
transfer-learning
、
inception
、
vgg16
我想
使用
VGG16 (或VGG19)来完成语音集群任务。我用VGG19 (
和
weights='imagenet')试了一下。我得到了糟糕
的
结果,我假设这是因为我
使用
的
VGG有错误
的
权重(图像权重(ima
浏览 0
提问于2021-05-25
得票数 0
2
回答
如何
利用声音进行说话人识别?
python
、
voice-recognition
我想知道你能不能用他们
的
声音探测到他们。例如,我们在程序中给feed一些
数据
,比如这是猫
的
声音,当它检测到它时,它会向猫打招呼。
浏览 15
提问于2022-08-20
得票数 -1
2
回答
如何
利用FFT
和
神经网络对声音进行
分类
?我该用
CNN
还是RNN?
tensorflow
、
keras
、
neural-network
为了教育目的,我正在做一个个人项目,学习Keras
和
机器学习。首先,我想
分类
一下,如果一个声音是拍手还是踢踏舞。 我
使用
的
是一个微控制器,是声音触发
和
采样声音@20 using。微控制器将这些原始
的
ADC
数据
发送到PC机进行Python
处理
。我目前采取1000点,并得到FFT
使用
numpy (
使用
rfft和它
的
绝对值)。现在,我想把拍到
的
FFT信号作为训练
数据
,用
浏览 1
提问于2019-05-03
得票数 2
回答已采纳
2
回答
卷积神经网络中
的
随机裁剪
和
翻转
image-processing
、
neural-network
、
conv-neural-network
在我读到
的
许多关于卷积神经网络(
CNN
)
的
研究论文中,我看到人们从图像中随机裁剪一个正方形区域(例如224x224),然后随机水平翻转它。为什么要进行随机裁剪
和
翻转?另外,为什么人们总是裁剪一个正方形
的
区域。Can不能在矩形区域上工作吗?
浏览 0
提问于2015-09-29
得票数 17
回答已采纳
1
回答
什么是建立
CNN
模型
的
理想方法?
deep-learning
、
conv-neural-network
、
regression
、
classification
我试图执行检测某种类型
的
声音在
音频
文件。这些录音有可变
的
长度,我想要检测
的
声音类型通常在1~5秒长,而且我有
数据
集
的
标签(事件发生时
的
开始
和
偏移)。非常感谢。
浏览 1
提问于2022-03-01
得票数 1
回答已采纳
1
回答
从理论上讲,
使用
CNN
来
处理
分类
数据
和数字
数据
是否合理?
deep-learning
、
classification
、
theory
、
conv-neural-network
我试着用
CNN
来做二进制
分类
。由于
CNN
在特征提取方面的优势,它在图像
和
语音等模式
数据
中得到了广泛
的
应用。但是,我拥有的
数据
集不是图像或声音
数据
,而是
分类
数据
和数字
数据
,它们与这种情况不同。我
的
问题如下。如果是合理
的
浏览 1
提问于2020-06-26
得票数 1
1
回答
如何
防止模型识别错误类
neural-network
、
deep-learning
、
classification
、
keras
、
image-classification
假设我有一个能识别猫
和
狗
的
模型。然而,当我
使用
一个杯子或人类
的
图片时,它会产生一个在0.70置信度
的
随机预测。我应该用西格莫德而不是软卡吗? 或者,是否有任何解决方法来防止对新类对象
的
大量信任?
浏览 0
提问于2019-06-06
得票数 3
回答已采纳
1
回答
根据姓名对用户性别进行
分类
的
最佳方法是什么?
python
、
python-3.x
、
nlp
、
deep-learning
、
kaggle
如果您检查我
的
,我已经成功地实现了
CNN
,KNN对信号故障进行
分类
。为此,我对信号进行了很少预
处理
的
降维
处理
,并将其提供给网络,利用其类信息对网络进行训练,然后用测试样本对训练后
的
网络进行测试,确定
分类
并计算精度。我在这里
的
问题是
如何
将文本信息
输入
CNN
或任何其他网络。作为
输入
,我从kaggle
的
Twitter
数据
库中选择了两个
浏览 0
提问于2018-03-19
得票数 0
回答已采纳
1
回答
如何
将numpy阵列(麦克风/回送
输入
)转换为
PyTorch
分类
器
的
torchaudio波形
python
、
pytorch
、
wav
、
waveform
、
audio-processing
我目前正在用
PyTorch
和
torchaudio训练
分类
器。为此,我遵循了以下教程:为此,我希望不必将记录保存到.wav文件中再次加载,而是直接向
分类
器提供内存中
的
记录。本教程
使用
torchaudio
的<
浏览 27
提问于2022-09-20
得票数 1
1
回答
图像
分类
Pytorch
deep-learning
、
computer-vision
、
conv-neural-network
、
pytorch
如何
确定
CNN
的
层数
和
最终模型,以提高预测
的
准确性。我正在对图像进行
分类
,目前用简单
的
模型获得了65%
的
准确率,我应该
如何
增强它才能达到最大
的
准确率。(
Pytorch
)
浏览 3
提问于2018-12-02
得票数 0
1
回答
MLP有可能比
CNN
有更好
的
准确性吗?
neural-network
、
keras
、
cnn
、
mlp
我正在研究癫痫
分类
系统,它消耗脑电图信号,结果说如果
使用
某一时期,是否是癫痫发作。为了进行网络培训,我利用Keras。我正在尝试几种不同
的
神经网络配置,现在我想知道,在某些情况下,MLP在一维
分类
方面是否比
CNN
更好?我
的
问题不仅与脑电图或癫痫
的
检测有关,而且更多
的
是当MLP在准确性上比
CNN
表现得更好
的
时候。或者,在数学上证明了,对于给定
的
分类
问题,总会有一些
CNN</e
浏览 0
提问于2021-05-15
得票数 0
1
回答
如何
共享权重以“重用”现有网络
tensorflow
、
reinforcement-learning
、
tf.keras
Introduction这是“状态值函数”应该“
使用
两次”,因为它是同一个函数,V,是用两个不同
的
参数X
和
Y。网络本身是一个卷积神经网络,我已经实现了。我相信我已经为奖励网络正确地实现了所有必要
的
层,r(X)。值网络V(X)
使用
相同
的
卷积层,所以我认为原则上它是正确
的
,除了从V(X)到V(Y)之间
的
权重分担。目
浏览 2
提问于2021-02-09
得票数 0
1
回答
使用
CNN
检测
数据
集中
的
不正确标签图像
python
、
cnn
、
image-classification
、
multiclass-classification
、
labels
我想要做
的
是训练一个模型来识别在我
的
数据
集中被错误标记
的
图像,例如,在一种狗类中,我可以找到猫
的
图像,我想要一个模型来检测所有在错误类中
的
图像。有没有人试过这样做有更多
的
细节,或有人有任何想法?
浏览 0
提问于2022-05-03
得票数 0
3
回答
为什么RNN通常比
CNN
有更少
的
隐藏层?
deep-learning
、
cnn
、
lstm
、
rnn
、
feature-extraction
can可以有数百个隐藏层,而且由于它们经常与图像
数据
一起
使用
,因此有许多层捕获更多
的
复杂性。 然而,据我所见,RNN通常只有几个层,例如2-4层。例如,对于心电图(ECG)
分类
,我见过文献
使用
LSTM 4层,
CNN
10-15层,结果相似。这是因为RNNs/LSTM如果更深(由于梯度消失问题)更难训练,还是因为RNNs/LSTM往往会快速适应顺序
数据
?
浏览 0
提问于2019-06-09
得票数 9
2
回答
为什么在某些计算机视觉问题中
使用
RNN?
deep-learning
、
cnn
、
rnn
、
computer-vision
当我进行各种计算机视觉项目的实现时,一些OCR问题
使用
GRU或LSTM,而有些则没有。据我所知,RNN只用于
输入
数据
是序列
的
问题,如
音频
或文本。因此,在kaggle上
的
MNIST核中,几乎没有内核
使用
RNN,几乎所有的基于GitHub
的
IAM
数据
集
的
OCR存储库都
使用
了GRU或LSTM。直观地说,图像中
的
书面文本是一个序列,因此
使用
RNN。但是,MNIST
浏览 0
提问于2020-07-06
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Uber如何处理和使用乘客数据改善App的体验?
PyTorch可视化理解卷积神经网络
Github 2.2K星的超全PyTorch资源列表
一份超全的PyTorch资源列表
库、教程、论文实现,这是一份超全的PyTorch资源列表
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券