Android Audio System线性音量和对数音量的转换-xgqsa-ChinaUnix博客

longlong

首页　| 　博文目录　| 　关于我

xgqsa

博客访问： 739169
博文数量： 182
博客积分： 2088
博客等级：大尉
技术积分： 1698
用户组：普通用户
注册时间： 2009-12-16 15:09

个人简介

文章分类

全部博文（182）

Acoustic（0）
Windows（2）
Android（24）

System（1）

HAL（1）

building（2）

Compile（2）

debug（2）

Audio（3）

misc（5）

repo（1）

boot（0）

img（2）
Study~（2）
随记~（9）
方式方法（0）
Tools（6）
C/C++（10）
Embedded（58）

Audio_ALSA（6）

GSM（1）

LCD（7）

USB（2）

Wifi（1）

RF（2）

Development Kit（0）

MMC/SD（1）

NandFlash（1）

misc（4）

MiniGUI（4）

UTOLog（10）

asm（2）

File System（9）

bootloader（4）

ARM（0）

Hardware（0）

WinCE（0）

Linux（3）
GNU（19）

vim（1）

git（10）

Command/Tools（5）

Shell（1）

Makefile（2）
Linux/Unix（49）

debug（3）

Ubuntu（4）

Network Protocol（0）

Doc（1）

System（6）

Learning style（1）

Application（3）

use（8）

Log（0）

Tools（2）

Kernel（15）

Driver（6）
未分配的博文（3）

文章存档

2016年（1）

2015年（18）

2014年（14）

2013年（20）

2012年（129）

我的朋友

相关博文

Android Audio System线性音量和对数音量的转换

分类： Android平台

2014-07-31 13:07:13

转载地址：http://blog.csdn.net/droidphone/article/details/7477350

Android的音频系统的代码中，应用程序对每个音频流的音量做出调整后，最终会转换为一个系数K，所有的音频数据在输出到硬件之前，都要乘以系数K，只要应用程序发出调整音量的调用，中间层的Audio System就会重新计算系数K的值。对应用程序来说，音量控制通常都是按照线性进行调整的，比如对于具有15级音量的音频流来说，我们预期每级的音量变化都是相当的，也就是说：从第5级调到第6级，和从第7级调到第8级，我们期望人耳可以感觉到同样大小的音量变化。但是，在Android的代码中，我们看到了计算系数K的公式，它相当奇怪，代码位于frameworks/base/media/libmedia/audiosystem.cpp中：

点击(此处)折叠或打开

01.// convert volume steps to natural log scale
02.
03.// change this value to change volume scaling
04.static const float dBPerStep = 0.50f;
05.// shouldn't need to touch these
06.static const float dBConvert = -dBPerStep * 2.302585093f / 20.0f;
07.static const float dBConvertInverse = 1.0f / dBConvert;
08.
09.float AudioSystem::linearToLog(int volume)
10.{
11. // float v = volume ? exp(float(100 - volume) * dBConvert) : 0;
12. // LOGD("linearToLog(%d)=%f", volume, v);
13. // return v;
14. return volume ? exp(float(100 - volume) * dBConvert) : 0;
15.}
16.
17.int AudioSystem::logToLinear(float volume)
18.{
19. // int v = volume ? 100 - int(dBConvertInverse * log(volume) + 0.5) : 0;
20. // LOGD("logTolinear(%d)=%f", v, volume);
21. // return v;
22. return volume ? 100 - int(dBConvertInverse * log(volume) + 0.5) : 0;
23.}

要理解上面代码中的公式，我们先要了解人耳的声心理学模型。根据人耳的声心理学的研究，人耳对声音大小的感知程度并不是线性的，而是呈对数关系。对数形式的单位是dB，在音频领域，通常我们会定义一个标准电平V0，那么电平X的转换公式是：

dB=20log(X/V0)；

例如：我们给喇叭输出满负荷最大音量时的电平是1V，如果有15级音量，如果按线性进行调整，1/15 = 66.6mV，我们就得到每级音量的调整量是：

66.6mV，133.2mV，200mV，......，866.8mV，933.4mV，1000mV；

如果按照这个步长进行调整，人耳感觉到的音量变化就不是连续的。

另一种方式是按对数进行调整，在数字音频领域，通常0dB代表最大音量，0dB意味着不对数据进行任何的变换处理，输出等于输入，所以20log(V0/V0)=20log(1)=0dB。这意味着最大音量以下的dB值为一个负数，现在我们把1V认为是0dB，最低音量是-28dB，那么对应15级音量的dB值就是：

-28dB，-26dB，-24dB，......，-4dB，-2dB，0dB；

对应的电平值是（使用公式Vx=10^(dB/20)*V0 ）：

39mV，50mV，63mV，......，630mV，794mV，1000mV；

线性音量和对数音量的调整曲线

回到Android的代码中，它也使用了对数的调节方式，它先是定义了每次调节音量的步长值为0.5dB：

static const float dBPerStep = 0.50f;

然后他定义了一个计算用的中间常数：

static const float dBConvert = -dBPerStep * 2.302585093f / 20.0f;

这个一开始有点难于理解，尤其是奇怪的系数：2.302585093。所有这些定义都是为了得到用于与音频数据相乘的系数K，Android中有多种音频流，每种音频流的默认音量调节步数都不一样，有的是7步，有的是5步，有的是15步，为了便于计算的统一，计算前都会先把相应的步数映射为0-100步之间，因为步长已经定义为0.5dB，所以各级音量对应的dB数如下：

音量级别	0	1	2	3	......	97	98	99	100
dB数	mute	-49.5dB	-49dB	-48.5dB	......	-1.5dB	1.0dB	0.5dB	0dB

很显然，知道了音量为哪个步数级别后，相应的dB值也会知道，那么我们要做的就是把dB值转换为系数K值，K值实际上就是公式dB=20log(X/V0)中的比值：X/V0，根据此公式反推，音量级别为volume对应的K值：

(1) dB = -dBPerStep * ( 100 - volume )；

又因为：

(2) dB/20 = log(Vx/V0) = log(K);

把（1）式代入（2）式：

(3) -dBPerStep * ( 100 - volume ) / 20 = log(K)；

为了得到K，两边取以10为底的指数：

(4) 10 ^ ( -dBPerStep * ( 100 - volume ) / 20 ) = 10 ^ ( log(K) )；

(5) K = 10 ^ ( log(K) ) = 10 ^ ( -dBPerStep * ( 100 - volume ) / 20 ) ;

(6) K = 10 ^ ( dBConvert * ( 100 - volume ) ) ; // 令：dBConvert = -dBPerStep / 20；

使用（6）式即可得到系数K，需要计算以10为底的幂，可是这与Android使用的计算公式有些差异，Andrioid使用的公式是：

(7) exp(float(100 - volume) * dBConvert)；

这是因为它没有使用以10为底的幂运算，而是使用以自然常数e为底的幂运算，因为：

(8) ln( 10) = 2.302585093；

我们把dBConvert 重新定义为-dBPerStep * 2.302585093/ 20后，式子(6)和式子(7)实际上是完全等价的。也就是说：

(9) e^2.302585093 = e^ln(10) = 10;

这下终于知道2.302585093这个奇怪数字的来历啦！！从代码的注释中，我们可以知道，只要改变dBPerStep的大小，就可以决定系统的最小音量了：

最小音量 = -99 * dBPerStep；默认情况下是-49.5dB，K值为：0.00334965439；

至于最大软件数字音量，就是0dB，不能改变，要改就修改底层的音频驱动的硬件音量吧！！

阅读(1796) | 评论(0) | 转发(0) |

上一篇：Alsa中PCM参数设置

下一篇：C语言字节对齐

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6