C#实现WAV音频单声道提取-shark888-ChinaUnix博客

大白鲨

首页　| 　博文目录　| 　关于我

shark888

博客访问： 1715110
博文数量： 585
博客积分： 14610
博客等级：上将
技术积分： 7402
用户组：普通用户
注册时间： 2008-05-15 10:52

文章分类

全部博文（585）

报表编程（2）
软件架构与设计（16）
网络应用/路由/安（27）
嵌入开发/CCD/Lin（21）
系统应用（12）

虚拟机应用（10）

window（2）
OpenSource（9）
VC编程技巧（37）
多线程编程（9）
图像处理与识别(（24）
网络编程（41）
C/C++ /VC（19）
OpenGL/OpenGv（2）
Web开发（3）
VC编程（95）

自定义组件（5）

基本组件（0）
算法&加密与解密（39）
Java（4）

JSP/Server（0）

数据库应用（2）
数据库管理/开发（13）
游戏开发&多媒体（4）
项目管理（5）
软件工程（50）
软件测试（2）
招聘（3）
未分配的博文（148）

文章存档

2013年（5）

2012年（214）

2011年（56）

2010年（66）

2009年（44）

2008年（200）

我的朋友

相关博文

C#实现WAV音频单声道提取

分类：嵌入式

2011-03-24 00:19:05

作者：Joseph Pan （转载请注明出处http://www.cnblogs.com/weizhoupan/archive/2011/03/20/1989718.html ）

　　喜欢买碟或者卡拉ok的朋友一定不会对声道这个术语陌生。通常我们在音像店买回来的VCD或者DVD都是双声道的形式，唱片商在录制唱片时往往提供了两个或多个声道，以保存不同的音频内容，以形成立体声效。左声道保存的大多为一些背景声效，如卡拉OK的消音伴唱。而右声道保存的往往是较为主要的声音，比如主唱的歌声。利用多声道技术，听众可以清晰地分辨出各种乐器来自的方向，从而使音乐更富想象力，更加接近于临场感受。

　　有时候我们只需要音频里的单声道内容，比如喜欢用电脑录制卡拉ok的朋友就经常为了找歌曲的伴唱而流连于各大伴奏网站。现在的网络翻唱非常流行，很多网络歌手就是先搜索喜欢的歌曲的伴奏，然后利用Adobe Audition（前身就是大名鼎鼎的CoolEdit）录制自己的演唱，然后加一些简单的降噪和压限处理，最后mix到伴奏的音轨里面。尽管利用Audition也可以完成单声道的提取工作，但是操作起来比较复杂。

　　其实对WAV的单声道提取并不困难。关键在于对WAV文件格式的理解。

一、WAV的文件头

　　WAV为微软公司(Microsoft)开发的一种声音文件格式，它符合RIFF(Resource Interchange File Format)文件规范。所有的WAV都有一个文件头，这个文件头包含了音频流的编码参数。

偏移地址	字节数	类型	内容
00H~03H	4	字符	资源交换文件标志（RIFF）
04H~07H	4	长整数	从下个地址开始到文件尾的总字节数
08H~0BH	4	字符	WAV文件标志（WAVE）
0CH~0FH	4	字符	波形格式标志（FMT）
10H~13H	4	整数	过滤字节（一般为00000010H）
14H~15H	2	整数	格式种类（值为1，表示数据PCMμ律编码的数据）
16H~17H	2	整数	通道数，单声道为1，双声道为2
18H~1BH	4	长整数	采样频率
1CH~1FH	4	长整数	波形数据传输速率（每秒平均字节数）
20H~21H	2	整数	数据的调整数（按字节计算）
22H~23H	2	整数	样本数据位数

　　表1　　WAV的文件头

　　由表1我们可以得到以下几个重要的信息：

16H~17H处记录通道数，当值为1时，表示文件为单声道；当值为2时，表示文件为双声道。
18H~1BH处记录采样频率。它的取值与声卡的支持情况有关。常见的有8000、11025、22050、44100、48000、96000等。其中，44100是大多数歌曲文件采用的标准采样频率。
22H~23H处记录样本数据位数。即每一个采样的长度。常见的有8位和16位。这里还包含了另外一个信息：若样本的数据位数为n，对于双声道文件，则低n/2位用于存放左声道；高n/2位用于存放右声道。

　　根据这三点信息，我们可以自己编程实现单声道的提取。下面我们就来一步步动手实现。由于程序涉及的只是简单的二进制文件读写操作，因此这里只举C#作简单示例，其他语言的处理与之大同小异。

二、文件读取类的编写

　　为了方便以后对WAV文件的研究，我们可以先单独写一个WAV文件读取类，专门获取文件头的每一块信息：

WaveAccess

三、单声道提取

　　前面提到，若样本的数据位数为n，则对单声道的提取，其实就是提取出n/2的数据。对于任意一位数据，其在新的数据队列中的索引k’与其在源数据队列中的索引k满足如下的映射关系：

k = 2*k’ – k’mod(n/2) + n/2

　　但这里有个问题，加入只是将高或者低n/2的数据提取出来合为一个新的文件，则样本的数据位数和文件长度都需要修改为原先的一半，如果没有进行修改，播放速度将变为原来的两倍。

　　另外一种解决思路是将我们需要的那n/2的数据提取出来，然后覆盖另外n/2的数据。这样，头文件就不需要进行修改，因为没有任何属性发生了改变，只是文件的内容发生了变化。

　　根据上面的思想，对整个WAV文件作一次遍历，每次读入n位数据，如果是要提取左声道，则取出低n/2位数，覆盖高n/2位数；如果是要提取右声道，则取出高n/2位数，覆盖低n/2位数。据此编写singleChannelExtract函数如下：

singleChannelExtract

四、实验结果

　　根据上面的分析，完成单声道提取器如图1所示。

　　　　　　　　　图1　单声道提取器

　　运行该程序后，点击“open...”按钮，打开文件打开对话框，选中要进行单声道提取的文件。完成后，Format Info栏将显示该wav文件的信息。之后，单击“Extract!”按钮，弹出一个文件保存对话框，选择要保存的路径点确定，开始提取单声道，完成后将提示“Done!”。

　　图2和图3分别给出了对一段音频进行右声道提取前和提取后的结果。

　　　　　　　　　　　　　　　　　　　　　　　　图2　提取右声道前

　　　　　　　　　　　　　　　　　　　　　　　　图3　提取右声道后

　　注意图3中原来的左声道内容已经被右声道的内容覆盖，因此此时虽然还是双声道，但两个声道的内容是一样的，因此在使用上与单声道并没有区别。但如果只想保留一个声道，则可以根据前面的阐述，将每个采样值n/2位内容提取出来并合并成一个文件，再修改头文件相关数据，从而达到需要的结果。

『附相关程序下载』

阅读(2702) | 评论(0) | 转发(0) |

上一篇：WAV音频定长分段切取

下一篇：VC菜单编程

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6