文章/答案/技术大牛

发布

手把手教你使用Python第三方库PyAudio打造一款录音工具

文章来源：企鹅号 - Python进阶者

回复“书籍”即可获赠Python从入门到进阶共10本电子书

今

日

鸡

汤

故园东望路漫漫，双袖龙钟泪不干。

大家好，我是【（这是月亮的背面）】。今天给大家分享Python使用PyAudio制作录音工具，文章目录如下：

应用平台

音频录制部分

音频播放部分

GUI窗口所需属性值代码部分

pynput监听键盘

总结

最近有在使用屏幕录制软件录制桌面，在用的过程中突发奇想，使用python能不能做屏幕录制工具，也锻炼下自己的动手能力。接下准备写使用python如何做屏幕录制工具的系列文章：

录制屏幕制作视频

录制音频

合成视频，音频

基于Pyqt5制作可视化窗口

大概上述四个部分，希望自己能够尽快完善，上一篇文章利用opencv制作了屏幕录制部分，接下继续更新系列，使用python录制音频。

应用平台

windows 10

python 3.7

音频录制部分

音频录制与视频录制相似，也是以数据帧的方式录制保存，这次使用强大的第三方包PyAudio和内置的wave模块编写主要部分代码：pip install PyAudio

from pyaudio import PyAudio, paInt16, paContinue, paComplete

# 设置固定参数

chunk = 1024 # 每个缓冲区的帧数

format_sample = paInt16 # 采样位数

channels = 2 # 声道：1，单声道；2，双声道

fps = 44100 # 采样频率

# 这里采用回调的方式录制音频

def callback(in_data, frame_count, time_info, status):

"""录制回调函数"""

wf.writeframes(in_data)

if xx: # 当某某条件满足时

return in_data, paContinue

else:

return in_data, paComplete

# 实例化PyAudio

p = PyAudio()

stream = p.open(format=format_sample,

channels=channels,

rate=fps,

frames_per_buffer=chunk,

input=True,

input_device_index=None, # 输入设备索引, None为默认设备

stream_callback=callback # 回调函数

)

# 开始流录制

stream.start_stream()

# 判断流是否活跃

while stream.is_active():

time.sleep(0.1) # 0.1为灵敏度

# 录制完成，关闭流及实例

stream.stop_stream()

stream.close()

p.terminate()

采取流式并用回调函数录制，需要先定义保存音频文件，用wave新建音频二进制文件：

import wave

wf = wave.open('test.wav', 'wb')

wf.setnchannels(channels)

wf.setsampwidth(p.get_sample_size(format_sample))

wf.setframerate(fps)

为了后续代码可以很好的与之结合复用，将上面的代码包装成类

from pyaudio import PyAudio

class AudioRecord(PyAudio):

def __init__(self,):

源码于文末补充。

音频播放部分

播放部分代码与录制部分代码相差不大，核心部分：

目前暂时测试了.wav和.mp3格式可以正常录制及播放，其它类型格式音频可以自行调用代码进行测试。

GUI窗口所需属性值代码部分

考虑到GUI窗口能较为人性化的输出及输入值，编写该部分代码，内容含音频时长及获取输入设备及输出设备。

# 音频时长

duration = wf.getnframes() / wf.getframerate()

# 获取系统目前已安装的输入输出设备

dev_info = self.get_device_info_by_index(i)

default_rate = int(dev_info['defaultSampleRate'])

if not dev_info['hostApi'] and default_rate == fps and '映射器' not in dev_info['name']:

if dev_info['maxInputChannels']:

print('输入设备：', dev_info['name'])

elif dev_info['maxOutputChannels']:

print('输出设备：', dev_info['name'])

pynput监听键盘

在这部分代码也暂时使用pynput监听键盘来对录音做中断处理。可以调用上一篇文章中的键盘监听代码。

def hotkey(self):

"""热键监听"""

with keyboard.Listener(on_press=self.on_press) as listener:

listener.join()

def on_press(self, key):

try:

if key.char == 't': # t键，录制结束，保存音频

self.flag = True

elif key.char == 'k': # k键，录制中止，删除文件

self.flag = True

self.kill = True

except Exception as e:

print(e)

功能与上一篇类似，不再赘述。

总结

大家好，我是【（这是月亮的背面）】。以上就是使用PyAudio调用windows的音频设备进行录制及播放的内容了，这篇文章带大家整体学习了使用类及其继承相关知识，用法在这只是展示了冰山一角，还有更多的知识等待着我们一起去探索！

于二零二一年十二月二十日作

源码:

import wave

import time

from pathlib import Path

from threading import Thread

from pyaudio import PyAudio, paInt16, paContinue, paComplete

from pynput import keyboard # pip install pynput

class AudioRecord(PyAudio):

def __init__(self, channels=2):

super().__init__()

self.chunk = 1024 # 每个缓冲区的帧数

self.format_sample = paInt16 # 采样位数

self.channels = channels # 声道：1，单声道；2，双声道

self.fps = 44100 # 采样频率

self.input_dict = None

self.output_dict = None

self.stream = None

self.filename = '~test.wav'

self.duration = 0 # 音频时长

self.flag = False

self.kill = False

def __call__(self, filename):

"""重载文件名"""

self.filename = filename

def callback_input(self, in_data, frame_count, time_info, status):

"""录制回调函数"""

self.wf.writeframes(in_data)

if not self.flag:

return in_data, paContinue

else:

return in_data, paComplete

def callback_output(self, in_data, frame_count, time_info, status):

"""播放回调函数"""

data = self.wf.readframes(frame_count)

return data, paContinue

def open_stream(self, name):

"""打开录制流"""

input_device_index = self.get_device_index(name, True) if name else None

return self.open(format=self.format_sample,

channels=self.channels,

rate=self.fps,

frames_per_buffer=self.chunk,

input=True,

input_device_index=input_device_index, # 输入设备索引

stream_callback=self.callback_input

)

def audio_record_run(self, name=None):

"""音频录制"""

self.wf = self.save_audio_file(self.filename)

self.stream = self.open_stream(name)

self.stream.start_stream()

while self.stream.is_active():

time.sleep(0.1)

self.wf.close()

if self.kill:

Path(self.filename).unlink()

self.duration = self.get_duration(self.wf)

print(self.duration)

self.terminate_run()

def run(self, filename=None, name=None, record=True):

"""音频录制线程"""

thread_1 = Thread(target=self.hotkey, daemon=True)

if record:

# 录制

if filename:

self.filename = filename

thread_2 = Thread(target=self.audio_record_run, args=(name,))

else:

# 播放

if not filename:

raise Exception('未输入音频文件名，不能播放，请输入后再试！')

thread_2 = Thread(target=self.read_audio, args=(filename, name,))

thread_1.start()

thread_2.start()

def read_audio(self, filename, name=None):

"""音频播放"""

output_device_index = self.get_device_index(name, False) if name else None

with wave.open(filename, 'rb') as self.wf:

self.duration = self.get_duration(self.wf)

self.stream = self.open(format=self.get_format_from_width(self.wf.getsampwidth()),

channels=self.wf.getnchannels(),

rate=self.wf.getframerate(),

output=True,

output_device_index=output_device_index, # 输出设备索引

stream_callback=self.callback_output

)

self.stream.start_stream()

while self.stream.is_active():

time.sleep(0.1)

print(self.duration)

self.terminate_run()

@staticmethod

def get_duration(wf):

"""获取音频时长"""

return round(wf.getnframes() / wf.getframerate(), 2)

def get_in_out_devices(self):

"""获取系统输入输出设备"""

self.input_dict = {}

self.output_dict = {}

for i in range(self.get_device_count()):

dev_info = self.get_device_info_by_index(i)

default_rate = int(dev_info['defaultSampleRate'])

if not dev_info['hostApi'] and default_rate == self.fps and '映射器' not in dev_info['name']:

if dev_info['maxInputChannels']:

self.input_dict[dev_info['name']] = i

elif dev_info['maxOutputChannels']:

self.output_dict[dev_info['name']] = i

def get_device_index(self, name, input_in=True):

"""获取选定设备索引"""

if input_in and self.input_dict:

return self.input_dict.get(name, -1)

elif not input_in and self.output_dict:

return self.output_dict.get(name, -1)

def save_audio_file(self, filename):

"""音频文件保存"""

wf = wave.open(filename, 'wb')

wf.setnchannels(self.channels)

wf.setsampwidth(self.get_sample_size(self.format_sample))

wf.setframerate(self.fps)

return wf

def terminate_run(self):

"""结束流录制或流播放"""

if self.stream:

self.stream.stop_stream()

self.stream.close()

self.terminate()

def hotkey(self):

"""热键监听"""

with keyboard.Listener(on_press=self.on_press) as listener:

listener.join()

def on_press(self, key):

try:

if key.char == 't': # t键，录制结束，保存音频

self.flag = True

elif key.char == 'k': # k键，录制中止，删除文件

self.flag = True

self.kill = True

except Exception as e:

print(e)

if __name__ == '__main__':

audio_record = AudioRecord()

audio_record.get_in_out_devices()

# 录制

print(audio_record.input_dict)

audio_record.run('test.mp3')

# 播放

print(audio_record.output_dict)

audio_record.run('test.mp3', record=False)

-------------------End-------------------

欢迎大家点赞，留言，转发，转载，感谢大家的相伴与支持

万水千山总是情，点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

发表于: 2024-08-022024-08-02 12:41:48
原文链接：https://page.om.qq.com/page/OCrsGEI6OGJHIOEta0OCE7dw0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

手把手教你使用Python第三方库PyAudio打造一款录音工具

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐