腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Python
从声卡读取音频
、
、
我想要做的是从声卡读取音
频数
据而不保存它,但最重要的是
python
正在读取的音
频数
据我想检查是否播放了某些特定的音频。
浏览 87
提问于2018-07-01
得票数 -1
1
回答
使用
python
的流mp3冰淇淋数据
、
、
我正在尝试编写自己的套接字流,使用
python
的套接字连接到一个已知的mp3源,流数据并尝试将其作为pcm数据传递到alsa音频中。/usr/bin/env
python
import sysimport timeimport Queue
浏览 0
提问于2015-01-10
得票数 0
回答已采纳
2
回答
语音识别中‘InvalidParameterValue.ErrorInvalidVoicedata?
、
、
实现‘一句话识别’功能时,发送请求回应‘InvalidParameterValue.ErrorInvalidVoicedata’音
频数
据无效,传参时data参数提示——(语音数据,当SourceType要base64编码(采用
python
语言时注意读取文件应该为string而不是byte,以byte格式读取后要decode()。编码后的数据不可带有回车换行符)。音
频数
据要小于600kB),确认是传入base64编码的音
频数
据(没带前缀),试了好几遍都显示音频无效,哪位大佬能指条明路
浏览 1484
提问于2019-03-18
1
回答
如何利用语音句子数据集训练HMM进行语音识别?
、
、
、
、
我读过一些关于HMM和MFCC的期刊和论文,但是我仍然对它如何与我的数据集(句子音
频数
据集)一步一步地工作感到困惑。我的数据集示例(音频表单): 我的句子数据集被用来获得转换概率。注意:我和
python
一起工作,我使用hmmlearn和
python
_speech_features作为我的库。
浏览 2
提问于2018-07-04
得票数 3
回答已采纳
1
回答
如何使用tensorflow从音频中捕获mfcc和spectral_contrast
、
我有一组.wav格式的音
频数
据集,如何从音频中提取特征并使用
python
和tensorflow将它们分类。我也向其他
python
库开放。
浏览 5
提问于2017-08-29
得票数 0
回答已采纳
1
回答
Python
中的Google语音API
、
、
、
、
我正试图在
python
中构建一个系统,其中音频通过套接字连接从客户端的浏览器中传输,然后将音频流到google云进行语音识别。<!现在,在我的
python
代码中,我不知道如何将其流到Google进行语音识别。下面是我的
python
代码:import jsonimport websocketsimport queue
浏览 1
提问于2019-02-28
得票数 0
2
回答
如何在
Python
中将ByteArray[]转换为int16?
我正在做一个
python
项目,我很难在
python
中将包含音
频数
据的ByteArray转换为int16。 有人能给我提个醒吗? 我使用过jep (
python
)等库。 谁能解释一下这件事?
浏览 38
提问于2019-03-11
得票数 0
回答已采纳
1
回答
Python
与PHP之间的数据交换
、
可以在PHP页面和
Python
应用程序之间交换数据吗?如何实现响应
Python
应用程序的PHP页面?我的应用程序分为两个部分: web后端和
Python
守护进程。通过web后端,我将MP3s上传到服务器;这些MP3s由我的
Python
守护进程处理,该守护进程从Musicbrainz获取元数据。我需要询问用户"
Python
“的结果,以选择正确的元数据。
浏览 5
提问于2014-03-20
得票数 4
1
回答
是否有可能在不编写新文件的情况下将文本合成为语音?
、
、
、
我想使用GCP Text- to -Speech API来合成文本到语音,几乎我能找到的每个例子都会写一个新文件,我想在函数输入文本并通过计算机扬声器读取它的时候这样做。我一直在尝试转换GCP上传的代码,它表示hello world。我还没能找到一种方法来阅读它后,它被转换。似乎Watson和Azure有这项服务,但GCP没有? client = texttospeech.TextToSpeechClient(credentials=credentials)
浏览 18
提问于2019-10-10
得票数 1
回答已采纳
2
回答
如何减少Twisted服务器的内存使用量?
、
、
我用
Python
/Twisted编写了一个音频广播服务器。它工作得很好,但是内存使用增长太快了!我认为这是因为一些用户的网络可能不够好,无法及时下载音频。我的音频服务器将音
频数
据广播到不同听众的客户端,如果他们中的一些人不能及时下载音
频数
据,也就是说,我的服务器一直保存着音
频数
据,直到听众收到。更重要的是,我的音频服务器是一个广播服务器,它接收音
频数
据,并将它们发送到不同的客户端,我认为Twisted将这些数据复制到不同的缓冲区中,即使它们是相同的音频片段。
浏览 2
提问于2009-11-09
得票数 2
回答已采纳
1
回答
Python
创建原始音频
、
、
如果不使用标准安装附带的依赖项,如何才能在
Python
中实现这一目标? 我从这里和网上查阅了大量的文件、描述和相关问题。我读过PCM和ADPCM,以及A/D转换器。真的,我所想要的只是希望有人能为我指出正确的方向,准确地学习音频格式,以及如何在
Python
中使用它们(但首先我想从原始音频开始)。
浏览 0
提问于2012-12-06
得票数 2
回答已采纳
1
回答
是否可以将numpy数组和采样率发送到microsoft speech- to -text,而不是将其保存到wav文件?
、
、
我使用Microsoft Cognitive Services speech-to-text
python
API进行转录。
浏览 36
提问于2020-10-12
得票数 0
回答已采纳
1
回答
从.wav文件中提取数据段
、
、
我有以下代码来加载.wav文件并播放它:import winsound data = base64.b64encode(f.read()) 它播放文件没有问题,但现在我想提取一个‘块’,比方说从233到300,并只播放这部分。winsound.PlaySound(base64.b64dec
浏览 47
提问于2018-06-05
得票数 1
2
回答
基于网络的聊天/视频会议应用HTML5 websocket服务器中的媒体流切分
、
、
、
为了使我们的应用程序更容易访问,我们希望使用以下顺序实现Adaptive: 我们知道微软已经建立了支持自适应流的,但是它只支持Silverlight,这不是我们想要的。编辑: 还有一个名为FFmpeg的解决方案(对于
Python
是一个PyFFmpeg包装器),但它只支持。
浏览 8
提问于2010-11-22
得票数 29
回答已采纳
2
回答
如何从外语线程调用
python
函数(C++)
、
、
、
、
我正在开发一个程序,使用DirectShow从媒体文件中抓取音
频数
据。DirectShow使用线程将音
频数
据传递给我程序中的回调函数,我让该回调函数调用
Python
中的另一个函数。我使用Boost.
Python
来包装我的库,即回调函数:private:public: } 问题来了,DirectShow的一个线程调用我的Python
浏览 4
提问于2009-02-04
得票数 5
回答已采纳
1
回答
无需派生
python
中的子进程即可访问视
频数
据
、
我正在尝试从
python
中访问视
频数
据(例如,帧、视频长度)。因为mod_wsgi和
python
之间显然存在一个奇怪的bug,所以不能选择生成像mplayer这样的东西。
浏览 0
提问于2012-02-07
得票数 0
回答已采纳
1
回答
将H264视频流转换为RTSP url
、
、
我有一个h264视
频数
据流。我想在RTSP上播放这个h264视频。谢谢
浏览 1
提问于2014-09-02
得票数 0
5
回答
利用HTML5 websockets实现基于real的实时视频聊天
、
、
、
、
如果我能用PHP或
Python
来实现这一点,那就太好了,因为我(不幸地)目前还不懂任何其他的编程语言。 一个好的教程将做,以及一个已经建立的解决方案,我不得不支付。
浏览 10
提问于2010-11-18
得票数 41
回答已采纳
1
回答
一个不使用PortAudio的音频记录器工作程序
、
、
、
显然,PortAudio是不能添加到需求中的东西,因为它不是
python
包。从那以后我就被困住了。
浏览 10
提问于2021-06-23
得票数 0
1
回答
需要一些音频处理应用程序的建议
、
、
、
我想问一些关于实时音
频数
据处理的建议。目前,我使用
python
套接字创建了一个简单的服务器和客户机,这些套接字可以从麦克风发送和接收音
频数
据,直到我停止使用为止(每个数据包有4096字节,但可能更多)。也许我应该一收到它就把每个块放在redis中,而不是把它保存在
python
对象中。另一种方法是将音
频数
据序列化为b64。我只是害怕失去速度,因为我目前正在使用tcp发送数据。 谢谢你的帮助!
浏览 2
提问于2020-08-22
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
视频数据湖?
短视频数据分析
JoVE科教视频数据库
抓取得到App音频数据
短视频数据分析的脚本
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券