iOS实现麦克风捕获和AAC编码

2023-10-31

转载地址：http://blog.csdn.net/shenyi0106/article/details/47004039

在Ios中，实现打开和捕获麦克风大多是用的AVCaptureSession这个组件来实现的，它可以不仅可以实现音频捕获，还可以实现视频的捕获。本文将主要实现麦克风音频的捕获和编码。

针对打开麦克风和捕获音频的代码，网上也有一些，我就简单的整理了一下：

首先，我们需要定义一个AVCaptureSession类型的变量，它是架起在麦克风设备和数据输出上的一座桥，通过它可以方便的得到麦克风的实时原始数据。

[objc] view plain copy

AVCaptureSession *m_capture

同时，定义一组函数，用来打开和关闭麦克风；为了能使数据顺利的导出，你还需要实现AVCaptureAudioDataOutputSampleBufferDelegate这个协议

[objc] view plain copy

-(void)open;
-(void)close;
-(BOOL)isOpen;

下面我们将分别实现上述参数函数，来完成数据的捕获。

[objc] view plain copy

-(void)open {
NSError *error;
m_capture = [[AVCaptureSession alloc]init];
AVCaptureDevice *audioDev = [AVCaptureDevice defaultDeviceWithMediaType:AVMediaTypeAudio];
if (audioDev == nil)
{
CKPrint("Couldn't create audio capture device");
return ;
}
// create mic device
AVCaptureDeviceInput *audioIn = [AVCaptureDeviceInput deviceInputWithDevice:audioDev error:&error];
if (error != nil)
{
CKPrint("Couldn't create audio input");
return ;
}
// add mic device in capture object
if ([m_capture canAddInput:audioIn] == NO)
{
CKPrint("Couldn't add audio input")
return ;
}
[m_capture addInput:audioIn];
// export audio data
AVCaptureAudioDataOutput *audioOutput = [[AVCaptureAudioDataOutput alloc] init];
[audioOutput setSampleBufferDelegate:self queue:dispatch_get_main_queue()];
if ([m_capture canAddOutput:audioOutput] == NO)
{
CKPrint("Couldn't add audio output");
return ;
}
[m_capture addOutput:audioOutput];
[audioOutput connectionWithMediaType:AVMediaTypeAudio];
[m_capture startRunning];
return ;
}

[objc] view plain copy

-(void)close {
if (m_capture != nil && [m_capture isRunning])
{
[m_capture stopRunning];
}
return;
}
-(BOOL)isOpen {
if (m_capture == nil)
{
return NO;
}
return [m_capture isRunning];
}

通过上面三个函数，即可完成所有麦克风捕获的准备工作，现在我们就等着数据主动送上门了。要想数据主动送上门，我们还需要实现一个协议接口：

[objc] view plain copy

- (void)captureOutput:(AVCaptureOutput *)captureOutput didOutputSampleBuffer:(CMSampleBufferRef)sampleBuffer fromConnection:(AVCaptureConnection *)connection {
char szBuf[4096];
int nSize = sizeof(szBuf);
#if SUPPORT_AAC_ENCODER
if ([self encoderAAC:sampleBuffer aacData:szBuf aacLen:&nSize] == YES)
{
[g_pViewController sendAudioData:szBuf len:nSize channel:0];
}
#else //#if SUPPORT_AAC_ENCODER
AudioStreamBasicDescription outputFormat = *(CMAudioFormatDescriptionGetStreamBasicDescription(CMSampleBufferGetFormatDescription(sampleBuffer)));
nSize = CMSampleBufferGetTotalSampleSize(sampleBuffer);
CMBlockBufferRef databuf = CMSampleBufferGetDataBuffer(sampleBuffer);
if (CMBlockBufferCopyDataBytes(databuf, 0, nSize, szBuf) == kCMBlockBufferNoErr)
{
[g_pViewController sendAudioData:szBuf len:nSize channel:outputFormat.mChannelsPerFrame];
}
#endif
}

到这里，我们的工作也就差不多做完了，所捕获出来的数据是原始的PCM数据。

当然，由于PCM数据本身比较大，不利于网络传输，所以如果需要进行网络传输时，就需要对数据进行编码；Ios系统本身支持多种音频编码格式，这里我们就以AAC为例来实现一个PCM编码AAC的函数。

在Ios系统中，PCM编码AAC的例子，在网上也是一找一大片，但是大多都是不太完整的，而且相当一部分都是E文的，对于某些童鞋而言，这些都是深恶痛绝的。我这里就做做好人，把它们整理了一下，写成了一个函数，方便使用。

在编码前，需要先创建一个编码转换对象

[objc] view plain copy

AVAudioConverterRef m_converter;

[objc] view plain copy

#if SUPPORT_AAC_ENCODER
-(BOOL)createAudioConvert:(CMSampleBufferRef)sampleBuffer { //根据输入样本初始化一个编码转换器
if (m_converter != nil)
{
return TRUE;
}
AudioStreamBasicDescription inputFormat = *(CMAudioFormatDescriptionGetStreamBasicDescription(CMSampleBufferGetFormatDescription(sampleBuffer))); // 输入音频格式
AudioStreamBasicDescription outputFormat; // 这里开始是输出音频格式
memset(&outputFormat, 0, sizeof(outputFormat));
outputFormat.mSampleRate = inputFormat.mSampleRate; // 采样率保持一致
outputFormat.mFormatID = kAudioFormatMPEG4AAC; // AAC编码
outputFormat.mChannelsPerFrame = 2;
outputFormat.mFramesPerPacket = 1024; // AAC一帧是1024个字节
AudioClassDescription *desc = [self getAudioClassDescriptionWithType:kAudioFormatMPEG4AAC fromManufacturer:kAppleSoftwareAudioCodecManufacturer];
if (AudioConverterNewSpecific(&inputFormat, &outputFormat, 1, desc, &m_converter) != noErr)
{
CKPrint(@"AudioConverterNewSpecific failed");
return NO;
}
return YES;
}
-(BOOL)encoderAAC:(CMSampleBufferRef)sampleBuffer aacData:(char*)aacData aacLen:(int*)aacLen { // 编码PCM成AAC
if ([self createAudioConvert:sampleBuffer] != YES)
{
return NO;
}
CMBlockBufferRef blockBuffer = nil;
AudioBufferList inBufferList;
if (CMSampleBufferGetAudioBufferListWithRetainedBlockBuffer(sampleBuffer, NULL, &inBufferList, sizeof(inBufferList), NULL, NULL, 0, &blockBuffer) != noErr)
{
CKPrint(@"CMSampleBufferGetAudioBufferListWithRetainedBlockBuffer failed");
return NO;
}
// 初始化一个输出缓冲列表
AudioBufferList outBufferList;
outBufferList.mNumberBuffers = 1;
outBufferList.mBuffers[0].mNumberChannels = 2;
outBufferList.mBuffers[0].mDataByteSize = *aacLen; // 设置缓冲区大小
outBufferList.mBuffers[0].mData = aacData; // 设置AAC缓冲区
UInt32 outputDataPacketSize = 1;
if (AudioConverterFillComplexBuffer(m_converter, inputDataProc, &inBufferList, &outputDataPacketSize, &outBufferList, NULL) != noErr)
{
CKPrint(@"AudioConverterFillComplexBuffer failed");
return NO;
}
*aacLen = outBufferList.mBuffers[0].mDataByteSize; //设置编码后的AAC大小
CFRelease(blockBuffer);
return YES;
}
-(AudioClassDescription*)getAudioClassDescriptionWithType:(UInt32)type fromManufacturer:(UInt32)manufacturer { // 获得相应的编码器
static AudioClassDescription audioDesc;
UInt32 encoderSpecifier = type, size = 0;
OSStatus status;
memset(&audioDesc, 0, sizeof(audioDesc));
status = AudioFormatGetPropertyInfo(kAudioFormatProperty_Encoders, sizeof(encoderSpecifier), &encoderSpecifier, &size);
if (status)
{
return nil;
}
uint32_t count = size / sizeof(AudioClassDescription);
AudioClassDescription descs[count];
status = AudioFormatGetProperty(kAudioFormatProperty_Encoders, sizeof(encoderSpecifier), &encoderSpecifier, &size, descs);
for (uint32_t i = 0; i < count; i++)
{
if ((type == descs[i].mSubType) && (manufacturer == descs[i].mManufacturer))
{
memcpy(&audioDesc, &descs[i], sizeof(audioDesc));
break;
}
}
return &audioDesc;
}
OSStatus inputDataProc(AudioConverterRef inConverter, UInt32 *ioNumberDataPackets, AudioBufferList *ioData,AudioStreamPacketDescription **outDataPacketDescription, voidvoid *inUserData) { //<span style="font-family: Arial, Helvetica, sans-serif;">AudioConverterFillComplexBuffer 编码过程中，会要求这个函数来填充输入数据，也就是原始PCM数据</span>
AudioBufferList bufferList = *(AudioBufferList*)inUserData;
ioData->mBuffers[0].mNumberChannels = 1;
ioData->mBuffers[0].mData = bufferList.mBuffers[0].mData;
ioData->mBuffers[0].mDataByteSize = bufferList.mBuffers[0].mDataByteSize;
return noErr;
}
#endif

好了，世界是那么美好，一个函数即可所有的事情搞定了。当你需要进行AAC编码时，调用encoderAAC这个函数就可以了（在上面有完整的代码）

[objc] view plain copy

char szBuf[4096];
int nSize = sizeof(szBuf);
if ([self encoderAAC:sampleBuffer aacData:szBuf aacLen:&nSize] == YES)
{
// do something
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

其他知识

iOS实现麦克风捕获和AAC编码的相关文章

数据结构知识整理

标题2020 1024 996 你品你细品堆栈队列大根堆小根堆大根堆堆顶的元素是最大的越往下越小小根堆堆顶的元素是最小的越往下越大大根堆小根堆的声明 priority queue
通过超链接解析zip压缩包中的 xml 内容

import com alibaba fastjson JSON import com api zp documentexchange OkHttp import okhttp3 OkHttpClient import okhttp3 Re
Eigen与cuda兼容问题解决

1 报错 usr include eigen3 Eigen src Core arch CUDA Half h 596 error no suitable constructor exists to convert from float t
源码解析(一)：Spring JDBC如何实现多数据源

Spring JDBC如何实现多数据源背景类介绍 bean初始化设置属性 1 AbstractRoutingDataSource 属性 2 初始化设置设置当前lookupKey 1 获取 lookupKey 2 找到目标数据源获取连
kali自动化渗透神器websploit模块介绍

websploit 安装websploit root kali2 apt get install websploit root kali2 websploit db d8b db d88888b d8888b d8888 d8888b db
Linux操作系统下如何查看磁盘的queue_depth(队列深度)，安排！

Linux中的queue depth 队列深度可以用lsscsi查看 lsscsi l 0 0 1 0 disk FUJITSU MAM3184MP 0105 dev sda state running queue depth 16 sc
Eureka服务注册与发现

Eureka服务注册与发现 1 什么是Eureka 2 Eureka原理 3 对比Zookeeper 1 什么是Eureka Eureka是Netflix的子模块 Eureka是一个基于Rest的服务用于定位服务以实现云端中间层服务发现
【无公网IP内网穿透】异地远程访问本地SQL Server数据库

目录 1 前言 2 本地安装和设置SQL Server 2 1 SQL Server下载 2 2 SQL Server本地连接测试 2 3 Cpolar内网穿透的下载和安装 2 3 Cpolar内网穿透的注册 3 本地网页发布 3 1 Cp

随机推荐

MNIST数据集下载与保存为图片格式

文章目录 MNIST 数据集下载与保存为图片格式 1 MNIST数据集 2 保存为图片格式 MNIST 数据集下载与保存为图片格式 1 MNIST数据集下载地址 http yann lecun com exdb mnist 获得文
【Java基础】Java中数组详解（含数组内存的解析）

一数组概述 1 数组的理解数组 Array 是多个相同类型数据按照一定顺序排列的集合并能使用一个名字命名并通过编号的方式对这些数据进行统一的管理 2 数组的相关概念数组名元素角标下标索引三个词是一个意思数组的长度元素
idea实用插件Free MyBatis plugin、Maven Helper、GsonFormat和快速生成maven依赖技巧

1 Free MyBatis plugin 这个插件主要实现了mapper和xml的快速跳转不用每次查找sql的时候全局搜索了安装过程不多说这个插件介绍如下常用的就是第二个功能快速从xml代码跳转到mapper文件和从mapper
ElementUI浅尝辄止18：Avatar 头像

用图标图片或者字符的形式展示用户或事物信息常用于管理系统或web网站的用户头像在用户账户模块更换头像操作也能看到关于Avatar组件的应用 1 如何使用通过 shape 和 size 设置头像的形状和大小
pyPdf和pyPdf2在合并pdf时的那个异常

当一个pdf文件有多page的时候它将出来见你方法是取直接修改那个文件generic py 1 pyPdf 路径大约在这里 usr lib python2 7 site packages pyPdf generic py if data
Jupyter notebook的cell运行结果输出显示配置

参考 JupyterNotebook 输出窗口的显示效果调整 1 问题描述使用Jupyter notebook时有时候会遇到某个cell的输出行数过长输出显示时Jupyter notebook 会把这些输出给放进了一个带有滚动条的小窗
php指定某个pid运,php 按pid排序并给出深度

arr id gt 1 pid gt 0 name gt name1 id gt 2 pid gt 0 name gt name2 id gt 3 pid gt 0 name gt name3 id gt 4 pid gt 1 name g
五、elasticsearch、kibana环境搭建

一软件准备 jdk 8u251 linux x64 tar gz elasticsearch 6 8 18 tar gz 下载 kibana 6 8 18 linux x86 64 tar gz elasticsearch analysi
SSAS教程（一）——SSAS简介

SSAS全称SQL Server Analysis Services Analysis Services 是在决策支持和商业分析中使用的分析数据引擎它为商业报表和客户端应用程序提供了企业级语义数据模型比如Power BI Excel R
自定义Flink消费和生产Kafka消息（消费时Schema、生产时Key&Value&分区）

当我们在消费Kafka数据时比较常用的是SimpleStringSchema 我个人比较喜欢用的是JSONKeyValueDeserializationSchema 上述两个API可以完成绝大多数的开发场景但是但遇到个别的特殊场景时我
Qt——加载qss文件简单用法

1 新建后缀名为 qss的通用文件添加需要实现的样式代码 2 在资源文件中添加刚刚新建的 qss文件 3 main函数添加以下代码 int main int argc char argv QApplication a argc argv
用服务器怎么修改奥的斯的速度,奥的斯服务器使用指南-20210412074643.pdf-原创力文档...

OTIS电梯电脑软件画面 1 2 com com com com 3 4 Disp Ent M 7 8 9 state D E F call Test F 4 5 6 Disp A sel B 开始 In out S 1 2 3 ON U
texture和sprite使用上的区别

1 什么情况下使用Texture 当图片过大不适合合成图集的时候可以使用Texture 此时要尽量的保证图片的宽高是2的N次方使用的地方少当图片为2的N次方且出现的频率不高时可以使用Texture 例如游戏的背景和Logo 需要
gzip: stdin: unexpected end of file Linux解压文件出错

root localhost jdk1 8 tar zxvf jdk 8u161 linux x64 tar gz jdk1 8 0 161 jdk1 8 0 161 javafx src zip gzip stdin unexpected
【计算机网络】HTTP首部详解

HTTP首部详解 HTTP 协议的请求和响应报文中必定包含 HTTP 首部首部内容为客户端和服务端分别处理请求和响应提供所需要的信息对于客户端用户来说这些信息中的大部分内容都无需亲自查看 1 HTTP请求报文 2 HTTP响应报文 3
Java 动态代理简单使用

Java简单的动态代理项目结构 dao包 public interface UserInfodao public boolean LoginCheck String username String password void listAl
mongodb 查询效率_2020年9个好用的MongoDB 图形化界面工具

市场上有许多MongoDB管理工具这些工具可以提高MongoDB开发和管理的效率下面我们就列举一些2020年好用的mongo管理工具 1 NoSQLBooster 用于MongoDB的NoSQLBooster 以前称为MongoBoos
如何将Spotify音乐下载并保存为MP3

Spotify歌曲采用原始的OGG Vorbis格式具有DRM保护可防止您下载并将其分发到其他地方以供欣赏得益于精心设计的DRmare Spotify Music Converter for Mac 您现在可以批量下载Spotify曲
【操作系统】浅谈 Linux 中的中断机制

操作系统浅谈 Linux 中的中断机制参考资料 2015 SP 北京大学 Principles of Operating System 操作系统原理 by 陈向群 p7 p10 认认真真的聊聊中断什么是软中断认认真真的聊聊软中断
iOS实现麦克风捕获和AAC编码

转载地址 http blog csdn net shenyi0106 article details 47004039 在Ios中实现打开和捕获麦克风大多是用的AVCaptureSession这个组件来实现的它可以不仅可以实现音频捕获

iOS实现麦克风捕获和AAC编码

iOS实现麦克风捕获和AAC编码 的相关文章

随机推荐

热门标签

iOS实现麦克风捕获和AAC编码的相关文章