python 频数 - 腾讯云开发者社区

、、

我想要做的是从声卡读取音频数据而不保存它，但最重要的是python正在读取的音频数据我想检查是否播放了某些特定的音频。

浏览 87提问于2018-07-01得票数 -1

1回答

使用python的流mp3冰淇淋数据

、、

我正在尝试编写自己的套接字流，使用python的套接字连接到一个已知的mp3源，流数据并尝试将其作为pcm数据传递到alsa音频中。/usr/bin/env pythonimport sysimport timeimport Queue

浏览 0提问于2015-01-10得票数 0

回答已采纳

2回答

语音识别中‘InvalidParameterValue.ErrorInvalidVoicedata？

、、

实现‘一句话识别’功能时，发送请求回应‘InvalidParameterValue.ErrorInvalidVoicedata’音频数据无效，传参时data参数提示——（语音数据，当SourceType要base64编码(采用python语言时注意读取文件应该为string而不是byte，以byte格式读取后要decode()。编码后的数据不可带有回车换行符)。音频数据要小于600kB），确认是传入base64编码的音频数据（没带前缀），试了好几遍都显示音频无效，哪位大佬能指条明路

浏览 1484提问于2019-03-18

1回答

如何利用语音句子数据集训练HMM进行语音识别？

、、、、

我读过一些关于HMM和MFCC的期刊和论文，但是我仍然对它如何与我的数据集(句子音频数据集)一步一步地工作感到困惑。我的数据集示例(音频表单)：我的句子数据集被用来获得转换概率。注意:我和python一起工作，我使用hmmlearn和python_speech_features作为我的库。

浏览 2提问于2018-07-04得票数 3

回答已采纳

1回答

如何使用tensorflow从音频中捕获mfcc和spectral_contrast

、

我有一组.wav格式的音频数据集，如何从音频中提取特征并使用python和tensorflow将它们分类。我也向其他python库开放。

浏览 5提问于2017-08-29得票数 0

回答已采纳

1回答

Python中的Google语音API

、、、、

我正试图在python中构建一个系统，其中音频通过套接字连接从客户端的浏览器中传输，然后将音频流到google云进行语音识别。<!现在，在我的python代码中，我不知道如何将其流到Google进行语音识别。下面是我的python代码：import jsonimport websocketsimport queue

浏览 1提问于2019-02-28得票数 0

2回答

如何在Python中将ByteArray[]转换为int16？

我正在做一个python项目，我很难在python中将包含音频数据的ByteArray转换为int16。有人能给我提个醒吗？我使用过jep (python)等库。谁能解释一下这件事？

浏览 38提问于2019-03-11得票数 0

回答已采纳

1回答

Python与PHP之间的数据交换

、

可以在PHP页面和Python应用程序之间交换数据吗？如何实现响应Python应用程序的PHP页面？我的应用程序分为两个部分: web后端和Python守护进程。通过web后端，我将MP3s上传到服务器；这些MP3s由我的Python守护进程处理，该守护进程从Musicbrainz获取元数据。我需要询问用户"Python“的结果，以选择正确的元数据。

浏览 5提问于2014-03-20得票数 4

1回答

是否有可能在不编写新文件的情况下将文本合成为语音？

、、、

我想使用GCP Text- to -Speech API来合成文本到语音，几乎我能找到的每个例子都会写一个新文件，我想在函数输入文本并通过计算机扬声器读取它的时候这样做。我一直在尝试转换GCP上传的代码，它表示hello world。我还没能找到一种方法来阅读它后，它被转换。似乎Watson和Azure有这项服务，但GCP没有？ client = texttospeech.TextToSpeechClient(credentials=credentials)

浏览 18提问于2019-10-10得票数 1

回答已采纳

2回答

如何减少Twisted服务器的内存使用量？

、、

我用Python/Twisted编写了一个音频广播服务器。它工作得很好，但是内存使用增长太快了！我认为这是因为一些用户的网络可能不够好，无法及时下载音频。我的音频服务器将音频数据广播到不同听众的客户端，如果他们中的一些人不能及时下载音频数据，也就是说，我的服务器一直保存着音频数据，直到听众收到。更重要的是，我的音频服务器是一个广播服务器，它接收音频数据，并将它们发送到不同的客户端，我认为Twisted将这些数据复制到不同的缓冲区中，即使它们是相同的音频片段。

浏览 2提问于2009-11-09得票数 2

回答已采纳

1回答

Python创建原始音频

、、

如果不使用标准安装附带的依赖项，如何才能在Python 中实现这一目标？我从这里和网上查阅了大量的文件、描述和相关问题。我读过PCM和ADPCM，以及A/D转换器。真的，我所想要的只是希望有人能为我指出正确的方向，准确地学习音频格式，以及如何在Python中使用它们(但首先我想从原始音频开始)。

浏览 0提问于2012-12-06得票数 2

回答已采纳

1回答

是否可以将numpy数组和采样率发送到microsoft speech- to -text，而不是将其保存到wav文件？

、、

我使用Microsoft Cognitive Services speech-to-text python API进行转录。

浏览 36提问于2020-10-12得票数 0

回答已采纳

1回答

从.wav文件中提取数据段

、、

我有以下代码来加载.wav文件并播放它：import winsound data = base64.b64encode(f.read()) 它播放文件没有问题，但现在我想提取一个‘块’，比方说从233到300，并只播放这部分。winsound.PlaySound(base64.b64dec

浏览 47提问于2018-06-05得票数 1

2回答

基于网络的聊天/视频会议应用HTML5 websocket服务器中的媒体流切分

、、、

为了使我们的应用程序更容易访问，我们希望使用以下顺序实现Adaptive：我们知道微软已经建立了支持自适应流的，但是它只支持Silverlight，这不是我们想要的。编辑：还有一个名为FFmpeg的解决方案(对于Python是一个PyFFmpeg包装器)，但它只支持。

浏览 8提问于2010-11-22得票数 29

回答已采纳

2回答

如何从外语线程调用python函数(C++)

、、、、

我正在开发一个程序，使用DirectShow从媒体文件中抓取音频数据。DirectShow使用线程将音频数据传递给我程序中的回调函数，我让该回调函数调用Python中的另一个函数。我使用Boost.Python来包装我的库，即回调函数：private:public: } 问题来了，DirectShow的一个线程调用我的Python

浏览 4提问于2009-02-04得票数 5

回答已采纳

1回答

无需派生python中的子进程即可访问视频数据

、

我正在尝试从python中访问视频数据(例如，帧、视频长度)。因为mod_wsgi和python之间显然存在一个奇怪的bug，所以不能选择生成像mplayer这样的东西。

浏览 0提问于2012-02-07得票数 0

回答已采纳

1回答

将H264视频流转换为RTSP url

、、

我有一个h264视频数据流。我想在RTSP上播放这个h264视频。谢谢

浏览 1提问于2014-09-02得票数 0

5回答

利用HTML5 websockets实现基于real的实时视频聊天

、、、、

如果我能用PHP或Python来实现这一点，那就太好了，因为我(不幸地)目前还不懂任何其他的编程语言。一个好的教程将做，以及一个已经建立的解决方案，我不得不支付。

浏览 10提问于2010-11-18得票数 41

回答已采纳

1回答

一个不使用PortAudio的音频记录器工作程序

、、、

显然，PortAudio是不能添加到需求中的东西，因为它不是python包。从那以后我就被困住了。

浏览 10提问于2021-06-23得票数 0

1回答

需要一些音频处理应用程序的建议

、、、

我想问一些关于实时音频数据处理的建议。目前，我使用python套接字创建了一个简单的服务器和客户机，这些套接字可以从麦克风发送和接收音频数据，直到我停止使用为止(每个数据包有4096字节，但可能更多)。也许我应该一收到它就把每个块放在redis中，而不是把它保存在python对象中。另一种方法是将音频数据序列化为b64。我只是害怕失去速度，因为我目前正在使用tcp发送数据。谢谢你的帮助！

浏览 2提问于2020-08-22得票数 0

点击加载更多