使用speex对pcm,wav进行降噪处理-andersonyan-ChinaUnix博客

北雨南萍hkyan.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

andersonyan

博客访问： 7996695
博文数量： 701
博客积分： 2150
博客等级：上尉
技术积分： 13233
用户组：普通用户
注册时间： 2011-06-29 16:28

个人简介

天行健，君子以自强不息！

文章分类

全部博文（701）

产品（29）

产品需求分析（1）

市场需求分析（4）

商业需求分析（4）

学习与思考（5）

产品运营（5）

项目管理（1）

原型设计（1）

UI&UE设计（8）
Android技术（23）
我的开源项目（5）
格物致知（1）
Windows技术（7）

技术点滴（3）

DirectShow（4）
三言两语（132）

moduo（0）

poco（1）

boost（0）

Java（16）

python（37）

Javascript（2）

HTML（2）

C++（35）

C语言（12）

Perl（27）
人在江湖（92）

项目见闻录（9）

IT业界（29）

管理手记（44）
linux技术（175）

muduo专项（1）

linux程序开发（21）

集群相关（35）

POE技术专项（5）

多线程编程（6）

多进程编程（13）

(socket)网络编程（21）

微知小技（71）
流媒体技术（237）

RTP-RTCP-RTSP（1）

GStreamer（18）

HLS专项（2）

WebRTC（85）

Nginx与流媒体（13）

H.26X（11）

DASH专项（2）

技术点滴（5）

SDL开发专项（1）

mpeg2-TS专项（0）

RTMP专项（19）

crtmpserver（15）

FFmpeg专项（64）
未分配的博文（0）

文章存档

2019年（2）

2018年（12）

2017年（76）

2016年（120）

2015年（178）

2014年（129）

2013年（123）

2012年（61）

我的朋友

相关博文

使用speex对pcm,wav进行降噪处理

分类：云计算

2018-10-24 17:43:27

	1. speex的降噪模块的简介

	speex的语音处理模块要使用独立于 speex codec库的libspeexdsp 库。

	这个分离的库是在1.2版本后实现；

	它这库包括了： 预处理，回声消除，jitter buffer 和重采样模块；

	在Unix/Linux环境下，使用 -lspeexdsp -lm 来编译和链接。

	和libspeex一样，库libspeexdsp的库函数都是可重入函数。

	但它不是线程安全的，所以在多个线程中使用同一个实例时，必须加个线程安全锁。

	NOTE:

	所谓就是允许被的函数。

	函数的递归调用是 指当一个函数正被调用尚未返回时，又直接或间接调用函数本身。

	一般的函数不能做到这样，只有重入函数才允许递归调用.

	2. 下载与编译

	$ tar -zxvf 

	$ cd speexdsp-1.2rc3

	$./configure --prefix=/data/speexdsp-1.2rc3-install/ --enable-static --disable-shared --with-pic

	$ make && make install

	3. API简介

	预处理模块需要添加头文件：

	#include 

	创建实例:

	SpeexPreprocessState *preprocess_state = speex_preprocess_state_init(frame_size,sampling_rate);

	参数： frame_size ， 建议设置成编码器相同的值。

	对于每一个输入帧，调用处理的函数：

	speex_preprocess_run(preprocess_state, audio_frame);

	参数： audio_frame ， 即是输入，也是输出。

	在某些场景下，有些降噪的数据并不想输出，可以下面的API: 

	它会更新处理器内部的状态，但不会将降噪后的数据输出，这样可以节省一些计算量：

	speex_preprocess_estimate_update(preprocess_state, audio_frame);

	使用下面API来改变进行预处理器的状态设置，更多的参数见下面的一节：

	speex_preprocess_ctl(preprocess_state, request, ptr);

	实例销毁 :

	speex_preprocess_state_destroy(preprocess_state);

	3.1 Preprocessor options

	As with the codec, the preprocessor also has options that can be controlled using an ioctl()-like call. The available options are:

	SPEEX_PREPROCESS_SET_DENOISE Turns denoising on(1) or off(2) (spx_int32_t)

	SPEEX_PREPROCESS_GET_DENOISE Get denoising status (spx_int32_t)

	SPEEX_PREPROCESS_SET_AGC Turns automatic gain control (AGC) on(1) or off(2) (spx_int32_t)

	SPEEX_PREPROCESS_GET_AGC Get AGC status (spx_int32_t)

	SPEEX_PREPROCESS_SET_VAD Turns voice activity detector (VAD) on(1) or off(2) (spx_int32_t)

	SPEEX_PREPROCESS_GET_VAD Get VAD status (spx_int32_t)

	SPEEX_PREPROCESS_SET_AGC_LEVEL

	SPEEX_PREPROCESS_GET_AGC_LEVEL

	SPEEX_PREPROCESS_SET_DEREVERB Turns reverberation removal on(1) or off(2) (spx_int32_t)

	SPEEX_PREPROCESS_GET_DEREVERB Get reverberation removal status (spx_int32_t)

	SPEEX_PREPROCESS_SET_DEREVERB_LEVEL Not working yet, do not use

	SPEEX_PREPROCESS_GET_DEREVERB_LEVEL Not working yet, do not use

	SPEEX_PREPROCESS_SET_DEREVERB_DECAY Not working yet, do not use

	SPEEX_PREPROCESS_GET_DEREVERB_DECAY Not working yet, do not use

	SPEEX_PREPROCESS_SET_PROB_START

	SPEEX_PREPROCESS_GET_PROB_START

	SPEEX_PREPROCESS_SET_PROB_CONTINUE

	SPEEX_PREPROCESS_GET_PROB_CONTINUE

	SPEEX_PREPROCESS_SET_NOISE_SUPPRESS Setmaximumattenuation of the noise in dB (negativespx_int32_t)

	SPEEX_PREPROCESS_GET_NOISE_SUPPRESS Getmaximumattenuation of the noise in dB (negativespx_int32_t)

	SPEEX_PREPROCESS_SET_ECHO_SUPPRESS Setmaximumattenuation of the residual echo in dB (negative spx_int32_t)

	SPEEX_PREPROCESS_GET_ECHO_SUPPRESS Setmaximumattenuation of the residual echo in dB (negativespx_int32_t)

	SPEEX_PREPROCESS_SET_ECHO_SUPPRESS_ACTIVE Set maximum attenuation of the echo in dB when near

	end is active (negative spx_int32_t)

	SPEEX_PREPROCESS_GET_ECHO_SUPPRESS_ACTIVE Set maximum attenuation of the echo in dB when near

	end is active (negative spx_int32_t)

	SPEEX_PREPROCESS_SET_ECHO_STATE Set the associated echo canceller for residual echo suppression (pointer

	or NULL for no residual echo suppression)

	SPEEX_PREPROCESS_GET_ECHO_STATE Get the associated echo canceller (pointer)

	4. 应用实例

	C语言实现的音频降噪代码如下。

	代码中采样率、音频帧大小需要根据实际情况设置，

	HEADLEN是WAV格式的文件头，占44个字节，这44个字节是不需要处理的，不然文件头会损坏，

	导致得到的结果无法播放。

	如果是PCM数据，则没有这个头，直接输入指定长度的数据就行；

	noiseSuppress的值可以控制减除的噪声强度，负值越小，噪声去除的强度越大，

	同时会造成原声的失真，需要作出权衡。

		
				#include <stdio.h> 

				#include <stdlib.h> 

				#include <stdint.h> 

				#include <assert.h> 

				#include <string.h>

				#include <speex/speex_preprocess.h>
			
				#define HEADLEN 44

				#define SAMPLE_RATE (48000) 

				#define SAMPLES_PER_FRAME (1024)

				#define FRAME_SIZE (SAMPLES_PER_FRAME * 1000/ SAMPLE_RATE)

				#define FRAME_BYTES (SAMPLES_PER_FRAME)

				int main()

				{

				    size_t n = 0;

				    FILE *inFile, *outFile;

				    fopen_s(&inFile, "./audio/input01L.wav", "rb");

				    fopen_s(&outFile, "./audio/output01L.wav", "wb");

				    char *headBuf = (char*)malloc(HEADLEN);

				    char *dataBuf = (char*)malloc(FRAME_BYTES * 2 );

				    memset(headBuf, 0, HEADLEN);

				    memset(dataBuf, 0, FRAME_BYTES);

				    assert(headBuf != NULL);

				    assert(dataBuf != NULL);

				    SpeexPreprocessState *state = speex_preprocess_state_init(1024, SAMPLE_RATE);

				    int denoise = 1;

				    int noiseSuppress = -25;

				    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_DENOISE, &denoise);

				    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_NOISE_SUPPRESS, &noiseSuppress);

				    int i;

				    i = 0;

				    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_AGC, &i);

				    i = 80000;

				    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_AGC_LEVEL, &i);

				    i = 0;

				    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_DEREVERB, &i);

				    float f = 0;

				    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_DEREVERB_DECAY, &f);

				    f = 0;

				    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_DEREVERB_LEVEL, &f);

				    //静音检测，效果一般

				    /*

				    int vad = 1;

				    int vadProbStart = 80;

				    int vadProbContinue = 65;

				    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_VAD, &vad); 

				    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_PROB_START, &vadProbStart); 

				    speex_preprocess_ctl(state, SPEEX_PREPROCESS_SET_PROB_CONTINUE, &vadProbContinue);

				    */

				    bool flag = true;

				    while (1)

				    {

				        if (flag == true)

				        {

				            flag = false;

				            n = fread(headBuf, 1, HEADLEN, inFile);

				            if (n == 0)

				                break;

				            fwrite(headBuf, 1, HEADLEN, outFile);

				        }

				        else

				        {

				            n = fread(dataBuf, 1, SAMPLES_PER_FRAME, inFile);

				            if (n == 0)

				                break;

				            speex_preprocess_run(state, (spx_int16_t*)(dataBuf));

				            fwrite(dataBuf, 1, SAMPLES_PER_FRAME, outFile);

				        }

				    }

				    free(headBuf);

				    free(dataBuf);

				    fclose(inFile);

				    fclose(outFile);

				    speex_preprocess_state_destroy(state);

				    return 0;

				}

阅读(6894) | 评论(0) | 转发(0) |

上一篇：FFmpeg命令行应用备忘录

下一篇：FFmpeg-4.0 的filter机制的架构与实现.之一 Filter原理

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6