Chinaunix首页 | 论坛 | 博客
  • 博客访问: 21910
  • 博文数量: 7
  • 博客积分: 245
  • 博客等级: 二等列兵
  • 技术积分: 76
  • 用 户 组: 普通用户
  • 注册时间: 2009-12-02 16:30
文章分类
文章存档

2012年(4)

2010年(1)

2009年(2)

我的朋友

分类: C/C++

2012-07-29 23:29:55

     视频会议业界标杆当属polycom公司,会议电话-多通道语音合成polycom中有注册的专利文献,这里有一个很奇怪的事实是,学术界的算法和产品采用技术的差异,这个在我做的麦克语音合成中得到了体现。在会议室噪声情况下,想做个精确时间延迟都比较困难,也鲜见小信号处理分析技术的成功使用。polycom中的那个专利,采用投票方式在通道间切换,平滑过渡,提供360全向语音拾取。
     通道间切换有基于能量和信噪比两种切换方式,基于能量的常引入噪声方向强的那个通道,基于信噪比平滑的话,会破坏能量平滑性,因此结合两种策略可提供较好的语音。
     学术算法有时往往和工程实践相差千万里,做算法的一定要以产品为导向。
阅读(807) | 评论(0) | 转发(0) |
0

上一篇:毕业两年了

下一篇:多姿态人脸识别[转]

给主人留下些什么吧!~~