视频会议业界标杆当属polycom公司,会议电话-多通道语音合成polycom中有注册的专利文献,这里有一个很奇怪的事实是,学术界的算法和产品采用技术的差异,这个在我做的麦克语音合成中得到了体现。在会议室噪声情况下,想做个精确时间延迟都比较困难,也鲜见小信号处理分析技术的成功使用。polycom中的那个专利,采用投票方式在通道间切换,平滑过渡,提供360全向语音拾取。
通道间切换有基于能量和信噪比两种切换方式,基于能量的常引入噪声方向强的那个通道,基于信噪比平滑的话,会破坏能量平滑性,因此结合两种策略可提供较好的语音。
学术算法有时往往和工程实践相差千万里,做算法的一定要以产品为导向。
阅读(803) | 评论(0) | 转发(0) |