Chinaunix首页 | 论坛 | 博客
  • 博客访问: 819349
  • 博文数量: 756
  • 博客积分: 40000
  • 博客等级: 大将
  • 技术积分: 4980
  • 用 户 组: 普通用户
  • 注册时间: 2008-10-13 14:40
文章分类

全部博文(756)

文章存档

2011年(1)

2008年(755)

我的朋友

分类:

2008-10-13 16:08:40

简单录、放音并保存为wav文件程序

作者:任雪景、文娟



引言
我是C++的初学者,入门都要靠VCKBASE,好在里面有很多适合于初学者的例子,让我少走了很多弯路,为了回馈大家,我也把我最近刚完成的一个简单的小程序提供给大家,让那些曾经和我一样徘徊在C++大门之外的人能快些掌握要领,大家不妨看一看。
本文以VC知识库第26期 栾义明 先生的为基础的,在此深表感谢!相同之处不再重复,我在此基础上增加了将录音保存为wav文件的格式,便于大家参考。
基本步骤及思想:设定音频采集参数(采样率、声道等),打开音频设备、准备wave数据头和开辟缓存,操作采集的数据并保存为wav文件。设定音频回放参数,打开回放设备、准备wave数据头和写wave数据。另外样本程序需包含#include 和#pragma comment(lib,"WINMM.LIB")多媒体支持。
在介绍程序前,需要你对wave文件的格式和相关一些基础概念有所了解,这些均可以在msdn中查找,为方便理解,我们将其整理,如果对这些基础知识已有所了解,可以跳过。

概念1、定义波形数据格式

typedef struct{WORD  wFormatTag; 
	  WORD nChannels; 
	  DWORD nSamplesPerSec; 
	  DWORD nAvgBytesPerSec;
	  WORD  nBlockAlign; 
	  WORD wBitsPerSample; 
	  WORD  cbSize; } WAVEFORMATEX;
具体参数解释如下:
wFormatTag:波形数据的格式,定义在MMREG.H文件中
nChannels:波形数据的通道数:单声道或立体声
nSamplesPerSec:采样率,对于PCM格式的波形数据,采样率有8.0 kHz,11.025kHz,22.05 kHz,44.1 kHz等
nAvgBytesPerSec:数据率,对于PCM格式的波形数据,数据率等于采样率乘以每样点字节数
nBlockAlign:每个样点字节数
wBitsPerSample:采样精度,对于PCM格式的波形数据,采样精度为8或16
cbSize:附加格式信息的数据块大小
概念2、定义设备头结构
WAVEHDR定义了指向波形数据缓冲区的设备头。
typedef struct { LPSTR lpData; 
	DWORD dwBufferLength; 
	DWORD dwBytesRecorded; 
	DWORD dwUser; 
	DWORD dwFlags; 
	DWORD dwLoops; 
	struct wavehdr_tag * lpNext; 
	DWORD reserved; } WAVEHDR; 
lpData:波形数据的缓冲区地址
dwBufferLength:波形数据的缓冲区地址的长度
dwBytesRecorded:当设备用于录音时,标志已经录入的数据长度
dwUser:用户数据
dwFlags:波形数据的缓冲区的属性
dwLoops:播放循环的次数,仅用于播放控制中
lpNext和reserved均为保留值
注意:上述结构体以及我们在程序中所使用到的“HWAVEIN””HWAVEOUT”结构体均是系统已经存在的,我们只需要对其进行赋值即可。
概念3、消息处理函数
MM_WIM_OPEN //设备的打开
MM_WIM_DATA //设备数据的采集及操作
MM_WIM_CLOSE //设备的关闭
相应回放设备的消息分别为MM_WOM_OPEN,MM_WOM_DATA,MM_WOM_CLOSE.
注意:消息处理函数是消息自我驱动的,不需要我们的人为干预。比如:当我们打开设备时,系统会自动调用MM_WIM_OPEN,当我们将数据添加到缓冲区,而缓冲区满时,系统会自动调用MM_WIM_DATA,我们所需要做的,就是对该函数编好相应的源代码。
现在,我们进入正题:如何实现一个录音机。

⑴先对WAVEFORMATEX结构体进行赋值,然后为缓冲区分配内存
pBuffer1=(PBYTE)malloc(INP_BUFFER_SIZE);
pBuffer2=(PBYTE)malloc(INP_BUFFER_SIZE);
对设备头结构体分配内存
pWaveHdr1=reinterpret_cast(malloc(sizeof(WAVEHDR)));
pWaveHdr2=reinterpret_cast(malloc(sizeof(WAVEHDR)));
然后使用wave音频相关函数对输入数据进行操作:

①为波形输入设备准备缓冲区
waveInPrepareHeader(hWaveIn,pWaveHdr1,sizeof(WAVEHDR));
waveInPrepareHeader(hWaveIn,pWaveHdr2,sizeof(WAVEHDR));
②为波形输入设备添加缓冲区
waveInAddBuffer (hWaveIn, pWaveHdr1, sizeof (WAVEHDR)) ;
waveInAddBuffer (hWaveIn, pWaveHdr2, sizeof (WAVEHDR)) ;
③启动声音输入设备,将输入数据写入内存
waveInStart (hWaveIn) ;
⑵编写消息处理函数,其中,MM_WIM_DATA 函数是本程序的核心。其主要作用是将输入数据另行保存在一缓冲区内(pSaveBuffer),该缓冲区的长度将随着已录入数据的大小而增加,从而实现保存输入话音数据的功能。同时,可将缓冲区内数据保存为wav文件。其具体实现如下:
CFile m_file;
CFileException fileException;
CString m_csFileName= "F:\\audio.wav";//保存路径
m_file.Open(m_csFileName,CFile::modeCreate|CFile::modeReadWrite, &fileException);
DWORD m_WaveHeaderSize = 38;
DWORD m_WaveFormatSize = 18;
m_file.SeekToBegin();
m_file.Write("RIFF",4);
unsigned int Sec=(sizeof pSaveBuffer + m_WaveHeaderSize);
m_file.Write(&Sec,sizeof(Sec));
m_file.Write("WAVE",4);
m_file.Write("fmt ",4);
m_file.Write(&m_WaveFormatSize,sizeof(m_WaveFormatSize));
m_file.Write(&waveform.wFormatTag,sizeof(waveform.wFormatTag));
m_file.Write(&waveform.nChannels,sizeof(waveform.nChannels));
m_file.Write(&waveform.nSamplesPerSec,sizeof(waveform.nSamplesPerSec));
m_file.Write(&waveform.nAvgBytesPerSec,sizeof(waveform.nAvgBytesPerSec));
m_file.Write(&waveform.nBlockAlign,sizeof(waveform.nBlockAlign));
m_file.Write(&waveform.wBitsPerSample,sizeof(waveform.wBitsPerSample));
m_file.Write(&waveform.cbSize,sizeof(waveform.cbSize));
m_file.Write("data",4);
m_file.Write(&dwDataLength,sizeof(dwDataLength));
m_file.Write(pSaveBuffer,dwDataLength);
m_file.Seek(dwDataLength,CFile::begin);
m_file.Close();
存在的问题:
我们也才开始vc学习,只是将自己了解的知识与和我们水平相当的新手们分享,希望一起提高。本程序有时不稳定,但音质很好,可能还有尚未暴露的错误,恳请广大高手们不吝赐教。E-mail: xuejing0103@126.com,smilewenjuan@yahoo.com.cn
--------------------next---------------------

还有:
m_file.Open(m_csFileName,CFile::modeCreate|CFile::modeReadWrite, &fileException);

这一句使用了文件异常对象,为什么不检查Open的返回值?
应该有诸如:
BOOL bRet = m_file.Open(...);
if(!bRet) {
  fileException.ReportError();
  ...;
  return;
}
的调用。

unsigned int Sec=(sizeof pSaveBuffer + m_WaveHeaderSize);
这一句可能会有点问题(我说不准),因为pSaveBuffer是指针,sizeof 运算符会返回指针的大小(一般4字节)而不是它指向的内存块的字节数。如果是数组名就没问题。

还有你说程序不稳定,不知你有没有注意到waveInReset()函数的调用也会产生MM_WIM_DATA消息。 ( ariesbi 发表于 2008-1-7 22:31:00)
 
用低层波形音频函数录、放音的程序我做过一些,对MM的程序提两个小建议:

1、建议定义一个WAV文件头的结构,以避免大量调用赋值或Write()语句。

2、响应录音缓冲区满的消息有很多种方法,除了窗口外还有事件、回调函数、线程等,从你附的代码看不出你用的哪一种。我觉得比较好的是用线程响应。应该把录放音功能封装成类,线程可以用工作者线程(也叫劳工线程),自己写线程的消息循环;也可以用图形界面线程,把CWinthread做为基类。用线程便于多声卡录音的实现。
( ariesbi 发表于 2008-1-7 22:12:00)
 
女娃娃写的文章很少见,一定要赞一个!

本着严谨的态度,指出一些不合理的地方:

写文件这段代码,MM_WIM_DATA 消息来时每次都会执行一次;看代码,分配的录音缓冲区为 16KB,每秒录音 11025B,大约1.5秒就会收到 MM_WIM_DATA 消息,也就是写一次文件。虽然可以执行,但感觉不是很合理。如果把写文件的代码放入结束那个{...}里,就会在用户点击停止录音时执行一次,比较合理。


另外:部分代码的原始出处其实都在一本书上,它就是《Windows程序设计》的第二十二章【声音与音乐】,大家有时间应该看看这本书。它的下载地址为:

http://blog.csdn.net/zaodt/archive/2007/11/25/1901332.aspx ( zaodt 发表于 2007-12-12 12:11:00)
 
顶呀!不过MM编码风格有待再接再厉哦 o(∩_∩)o. ( birdsinging 发表于 2007-12-3 23:20:00)
 
.......................................................

--------------------next---------------------

阅读(408) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~