Linux学习小标兵,专注Linux资讯分享,技术文章分享
分类: LINUX
2019-12-29 21:51:14
导读 | Mozilla继续开发的辅助项目之一是DeepSpeech,这是一种由百度研究得出的语音转文本引擎,并在TensorFlow之上构建,具有CPU和NVIDIA CUDA加速功能。本周标志着Mozilla DeepSpeech 0.6的发布,该版本进行了性能优化,Windows构建,简化了语言模型以及其他更改。 |
DeepSpeech 0.6目前已为该开源语音转文本引擎实现了7.5%的单词错误率。新版本进行了各种API更改,通过TensorFlow 1.14 cuDNN RNN支持为其训练图提供了更好的训练性能,将语言模型缩减为使用前50万个单词,并添加了各种数据增强技术,一种用于大容量转录大型音频文件的工具,以及其他各种变化。
那些想尝试DeepSpeech 0.6从音频文件转录语音的人可以从GitHub获取二进制版本。 Mozilla Hacks博客上还有关于DeepSpeech 0.6改进的更多详细信息。
本文来自《Linux就该这么学》官方资讯站。