专栏首页恩蓝脚本Android音频开发之音频采集的实现示例

Android音频开发之音频采集的实现示例

在 Android 系统中,一般使用 AudioRecord 或者 MediaRecord 来采集音频。

AudioRecord 是一个比较偏底层的API,它可以获取到一帧帧 PCM 数据,之后可以对这些数据进行处理。

而 MediaRecorder 是基于 AudioRecorder 的 API(最终还是会创建AudioRecord用来与AudioFlinger进行交互) ,它可以直接将采集到的音频数据转化为执行的编码格式,并保存。

直播技术采用的就是 AudioRecorder 采集音频数据。

本文主要介绍例如 AudioRecord 进行音频的采集。

基本API

获取最小的缓冲区大小,用于存放 AudioRecord 采集到的音频数据。

复制代码 代码如下:

static public int getMinBufferSize(int sampleRateInHz, int channelConfig, int audioFormat)

AudioRecord构造方法

根据具体的参数配置,请求硬件资源创建一个可以用于采集音频的 AudioRecord 对象。

参数描述:

音频采集基本概念

音频采集一般使用 AudioRecod或者 MediaRecord

音频采集的来源是什么? MediaRecorder.AudioSource.MIC 一般是麦克风

采样率(单位:赫兹) 每秒钟音频采样点个数(8000/44100Hz)

声道

  1. AudioFormat.CHANNEL_IN_MONO 单声道,一个声道进行采样
  2. AudioFormat.CHANNEL_IN_STEREO 双声道,两个声道进行采样

音频采样精度

指定采样的数据的格式和每次采样的大小。

数据返回格式为 PCM 格式

每次采样的位宽为 16bit

一般都采用这个 AudioFormat.ENCODING_PCM_16BIT(官方文档表示,该采样精度保证所有设备都支持)

比特率

每秒传送的比特(bit)数。单位为 bps(Bit Per Second),比特率越高,传送数据速度越快。

采样率x采样大小x声道数 每秒钟采样的大小=16bit(位宽) 2(双通道) 44100(每次采样的次数hz) = 1411200b=1411.2kbps

比特率越大表示单位时间内采样的数据越多,传输的数据量越大。

audioResource

音频采集的来源

audioSampleRate

音频采样率

channelConfig

声道

audioFormat

音频采样精度,指定采样的数据的格式和每次采样的大小。

bufferSizeInBytes

AudioRecord 采集到的音频数据所存放的缓冲区大小。

//设置采集来源为麦克风
private static final int AUDIO_RESOURCE = MediaRecorder.AudioSource.MIC;
//设置采样率为44100,目前为常用的采样率,官方文档表示这个值可以兼容所有的设置
private final static int AUDIO_SAMPLE_RATE = 44100;
//设置声道声道数量为双声道
private final static int CHANNEL_CONFIG = AudioFormat.CHANNEL_IN_STEREO;
//设置采样精度,将采样的数据以PCM进行编码,每次采集的数据位宽为16bit。
private final static int AUDIO_FORMAT = AudioFormat.ENCODING_PCM_16BIT;

public AudioRecord(int audioSource, int sampleRateInHz, int channelConfig, int audioFormat, int bufferSizeInBytes)

开始采集

开始采集之后,状态变为RECORDSTATE_RECORDING 。

public void startRecording ()

读取录制内容,将采集到的数据读取到缓冲区

方法调用的返回值的状态码:

情况异常:

1.ERROR_INVALID_OPERATION if the object wasn’t properly initialized

2.ERROR_BAD_VALUE if the parameters don’t resolve to valid data and indexes.

情况正常:the number of bytes that were read

public int read (ByteBuffer audioBuffer, int sizeInBytes)
public int read (byte[] audioData, int offsetInBytes, int sizeInBytes)
public int read (short[] audioData, int offsetInShorts, int sizeInShorts)

停止采集

停止采集之后,状态变为 RECORDSTATE_STOPPED 。

public void stop ()

获取AudioRecord的状态

用于检测AudioRecord是否确保了获得适当的硬件资源。在AudioRecord对象实例化之后调用。

STATE_INITIALIZED 初始完毕

STATE_UNINITIALIZED 未初始化

public int getState ()

返回当前AudioRecord的采集状态

public static final int RECORDSTATE_STOPPED = 1; 停止状态

调用 void stop() 之后的状态

public static final int RECORDSTATE_RECORDING = 3;正在采集

调用 startRecording () 之后的状态

public int getRecordingState()

AudioRecord 采集音频的基本流程

权限

<uses-permission android:name="android.permission.RECORD_AUDIO" / 
<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" / 

构造一个 AudioRecord 对象。

开始采集。

读取采集的数据。

停止采集。

构造一个 AudioRecord 对象

复制代码 代码如下:

AudioRecord audioRecord = new AudioRecord(audioResource, audioSampleRate, channelConfig, audioFormat, bufferSizeInBytes);

获取 bufferSizeInBytes 值

bufferSizeInBytes 是 AudioRecord 采集到的音频数据所存放的缓冲区大小。

注意:这个大小不能随便设置,AudioRecord 提供对应的 API 来获取这个值。

复制代码 代码如下:

this.bufferSizeInBytes = AudioRecord.getMinBufferSize(audioSampleRate, channelConfig, audioFormat);

通过 bufferSizeInBytes 返回就可以知道传入给 AudioRecord.getMinBufferSize 的参数是否支持当前的硬件设备。

if (AudioRecord.ERROR_BAD_VALUE == bufferSizeInBytes || AudioRecord.ERROR == bufferSizeInBytes) {
  throw new RuntimeException("Unable to getMinBufferSize");
}

//bufferSizeInBytes is available...

开始采集

在开始录音之前,首先要判断一下 AudioRecord 的状态是否已经初始化完毕了。

//判断AudioRecord的状态是否初始化完毕
//在AudioRecord对象构造完毕之后,就处于AudioRecord.STATE_INITIALIZED状态了。
int state = audioRecord.getState();
if (state == AudioRecord.STATE_UNINITIALIZED) {
  throw new RuntimeException("AudioRecord STATE_UNINITIALIZED");
}

开始采集

audioRecord.startRecording();
//开启线程读取数据
new Thread(recordTask).start();

读取采集的数据

上面提到, AudioRecord 在采集数据时会将数据存放到缓冲区中,因此我们只需要创建一个数据流去从缓冲区中将采集的数据读取出来即可。

创建一个 数据流 ,一边从 AudioRecord 中读取音频数据到 缓冲区 ,一边将 缓冲区 中数据写入到 数据流 。

因为需要使用IO操作,因此读取数据的过程应该在子线程中执行

//创建一个流,存放从AudioRecord读取的数据
File saveFile = new File(Environment.getExternalStorageDirectory(), "audio-record.pcm");
DataOutputStream dataOutputStream = new DataOutputStream(
        new BufferedOutputStream(new FileOutputStream(saveFile)));

private Runnable recordTask = new Runnable() {
  @Override
  public void run() {
    //设置线程的优先级
    android.os.Process.setThreadPriority(android.os.Process.THREAD_PRIOR
    Log.i(TAG, "设置采集音频线程优先级");
    final byte[] data = new byte[bufferSizeInBytes];
    //标记为开始采集状态
    isRecording = true;
    Log.i(TAG, "设置当前当前状态为采集状态");
    //getRecordingState获取当前AudioReroding是否正在采集数据的状态
    while (isRecording && audioRecord.getRecordingState() == AudioRecord
      //读取采集数据到缓冲区中,read就是读取到的数据量
      final int read = audioRecord.read(data, 0, bufferSizeInBytes);
      if (AudioRecord.ERROR_INVALID_OPERATION != read && AudioRecord.E
        //将数据写入到文件中
        dataOutputStream.write(buffer,0,read);
      }
    }
  }
};

停止采集

/**
 * 停止录音
 */
public void stopRecord() throws IOException {
  Log.i(TAG, "停止录音,回收AudioRecord对象,释放内存");
  isRecording = false;
  if (audioRecord != null) {
    if (audioRecord.getRecordingState() == AudioRecord.RECORDSTATE_RECORDING) {
      audioRecord.stop();
      Log.i(TAG, "audioRecord.stop()");
    }
    if (audioRecord.getState() == AudioRecord.STATE_INITIALIZED) {
      audioRecord.release();
      Log.i(TAG, "audioRecord.release()");
    }
  }
}

几个小问题

采集数据之后,保存的文件为 audio-record.pcm ,这个文件并不能使用普通的播放器播放。它是一个原始的文件,没有任何播放格式,因此就无法被播放器识别并播放。

上面的问题可以有两种解决方法

  1. 使用 AudioTrack 播放 pcm 格式的音频数据。
  2. 将 pcm 数据转化为 wav 格式的数据,这样就可以被播放器识别。

以上就是本文的全部内容,希望对大家的学习有所帮助。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • android实现滑动解锁

    本文实例为大家分享了android实现滑动解锁的具体代码,供大家参考,具体内容如下

    砸漏
  • Android实现电影院选座效果

    本文实例为大家分享了Android实现电影院选座效果展示的具体代码,供大家参考,具体内容如下

    砸漏
  • Android页面中引导蒙层的使用方法详解

    蒙层是什么,蒙层是一层透明的呈灰色的视图,是在用户使用App时让用户快速学会使用的一些指导。类似于一些引导页面,只不过比引导页面更加生动形象而已。在GitHub...

    砸漏
  • [Coursera][From Nand to Tetris / Part I] 第六周 汇编器项目 python 实现

    今天折腾一上午,终于 完成了 Coursera 上 From Nand to Tetris / Part I 这个课程的最后一个汇编器项目。这套课程真是没白跟,...

    Alan Zhang
  • SpringBoot 整合 Dubbo 控制台报 [DUBBO] Duplicate class org/apache/dubbo/common/Version.class in 2 jar

    ERROR 10316 --- [ main] org.apache.dubbo.common.Version : [...

    北漂的我
  • python接口自动化学习笔记(封装方法用于读取excel)

    本篇是使用xlrd实现的对excel的数据进行读取,xlrd网上demo很多,不做过多叙述,下面主要讲解封装的思路: 首先贴出测试用的excel表格

    Criss@陈磊
  • MOne︱基于词包的无监督多主题得分

    又开源了一个某机构整理的今日头条数据,可见:今日头条中文新闻文本(多层)分类数据集

    素质
  • python接口自动化学习笔记(封装方法用于读取excel)

    本篇是使用xlrd实现的对excel的数据进行读取,xlrd网上demo很多,不做过多叙述,下面主要讲解封装的思路: 首先贴出测试用的excel表格

    软件测试君
  • BZOJ 2748: [HAOI2012]音量调节【二维dp,枚举】

    2748: [HAOI2012]音量调节 Time Limit: 3 Sec  Memory Limit: 128 MB Submit: 2010  Solve...

    Angel_Kitty
  • 区块链开发公司如何应用?聊区块链+积分联盟

    区块链技术开发至今已有十年,从概念的现世到如今初步应用,区块链开发公司在各个领域开始发光发热,很多人都想参与其中,通过区块链开发实现企业转型来适应未来市场,也有...

    区块链开发先驱者

扫码关注云+社区

领取腾讯云代金券