Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2097142
  • 博文数量: 361
  • 博客积分: 10828
  • 博客等级: 上将
  • 技术积分: 4161
  • 用 户 组: 普通用户
  • 注册时间: 2010-01-20 14:34
文章分类

全部博文(361)

文章存档

2011年(132)

2010年(229)

分类:

2010-01-21 17:30:55

VAD: Voice Activity Detection 行为检测
语音行为检测(VAD)是一种当被在语音端口或拨号对等体上被开启时,只有可以听见的语音能够被传输的功能。当 VAD 被开启时,语音的质量的级别会被稍微降低,但此种连接占用的宽带相对要少一些。(注释:假如10秒通话,其中只有5秒进行了讲话,这时只发送5秒的语音包,其它时间发送sid包,告诉对方静音)。

 

cng:产生一个静音包给对方播放。

 

RTP(Real-time Transport Protocol)是用于Internet上针对多媒体数据流的一种传输协议。RTP被定义为在一对一或一对多的传输情况下工作。其目的是提供时间信息和实现流同步。但RTP通常使用UDP来传送数据。但RTP也可以在TCP或ATM等其他协议之上工作。当应用程序开始一个RTP会话时将使用两个端口:一个给RTP一个给 RTCP。RTP本身并不能为接顺序传送数据包提供可靠的传送机制。也不提供流量控制或拥塞控制。它依靠RTCP提供这些服务。通常RTP算法并不作为一个独立的网络层来实现。而是作为应用程序代码的一部分。

实时传送控制协议RTCP.RTCP(Real-time Transport Control Protocol)和RTP提供流量控制和拥塞控制。在RTP会话期间,各参与者周期性地传送RTCP包.RTCP包中含有已发送的数据包的数量、丢失的数据包的数量等统计资料.因此,服务器可以利用这些信息动态地改变传输速率,甚至改变有效载荷类型。RTP和RTCP配合使用,它们能以有效的反馈和最小的开销使传输效率最佳化。因而特别适合传送网上的实时数据。

srtp:加密的rtp包

------------------------------------------------------------------------

dtmf:

双音多频 DTMF(Dual Tone Multi Frequency),双音多频,由高频群和低频群组成,高低频群各包含4个频率。一个高频信号和一个低频信号叠加组成一个组合信号,代表一个数字。DTMF信令有16个编码。利用DTMF信令可选择呼叫相应的对讲机

双音多频信号(DTMF),电话系统中电话机与交换机之间的一种用户信令,通常用于发送被叫号码。

在使用双音多频信号之前,电话系统中使用一连串的断续脉冲来传送被叫号码,称为脉冲拨号。脉冲拨号需要电信局中的操作员手工完成长途接续。

双音多频信号是贝尔实验室发明的,其目的是为了自动完成长途呼叫。

双音多频的拨号键盘是4×4的矩阵,每一行代表一个低频,每一列代表一个高频。每按一个键就发送一个高频和低频的正弦信号组合,比如'1'相当于697和1209赫兹(Hz)。交换机可以解码这些频率组合并确定所对应的按键。

下表描述了每个DTMF信号的频率。
               1209 Hz 1336 Hz 1477 Hz 1633 Hz
697 Hz          1       2            3            A

770 Hz          4       5            6            B

852 Hz          7       8            9            C

941 Hz          *       0            #            D
 
电话在拨号的时候发出的声音就是双音多频信号


 

------------------------------------------------------------------------

音频编码协议主要有G.711(64kbit/s)、G.722、G.728 (16kbit/s,采用低时延的代数编码激励-线性预测[LD-ACELP]数据压缩算法)、G.729、G.723(5.3kbit/s或6.4kbit/s)。G.729使用“可变结构-代数线性预测编码(CS-ACELP)”技术对语音进行编码和压缩,使语音的传输速率为8kbit/s。G.729B 是G.729增补版,它对分组大小、优先级、时延抖动缓冲区、实时协议的使用未作任何说明,主要部分描述了实现VAD、DTX、CNG的标准过程。它是对分组化语音技术进行全面标准化工作的开端。

G.7xx 是一组 ITU-T 标准,用于音频压缩和解压缩。它主要用于电话方面。在电话技术中,有两个主要的算法标准,分别定义在 mu-law 算法(美国使用)和 a-law 算法(欧洲及世界其他国家使用)中。两者都是基于对数关系的,但对于计算机的处理来说,后者更为简单。 G.7xx 协议组由以下协议组成: 

G.711 ― 64 kbps 信道上的语音频率脉冲编码调制(PCM) 
G.721 ― 32 kbit/s 自适应差分脉冲编码调制(ADPCM) 
G.722 ― 64 kbit/s 下的 7 kHz 音频编码 
G.722.1 ―带有低帧损耗的具有免提操作的系统在 24 kbit/s 和 32 kbit/s 上的编码 
G.722.2 ―利用自适应多频率宽带(AMR-WB)以 16 kbit/s 多频率语音编码 
G.726 ― 40、32、24、16 kbit/s 自适应差分脉冲编码调制 ADPCM 
G.727 ― 5-、4-、 3-和 2-bit/s 嵌入式自适应差分脉冲编码调制 ADPCM 
G.728 ―利用低延迟代码线性预测以 16 bit/s 进行语音编码 
G.729 ―利用共扼结构-代数激励编码线性预测(CS-ACELP)以 8 bit/s 进行语音编码 

阅读(994) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~