分类: LINUX
2012-09-04 22:38:52
Sphinx武林秘籍(中)
――训练自已的中文语言模型与声学模型
一、训练语言模型
(1) 安装语言模型训练工具CMUCLMTK
./configure(2) 准备训练的文档
sudo -i(3)训练文档成模板
cd/usr/local/bin
text2wfreq < my_db.txt | wfreq2vocab > my_db.vocab
最终生成了语言模型my_db.lm.DMP
二、训练声学模型
(1)准备一些文件
分别创建两个目录etc和wav,然后在两个目录下面制作一些数据文件,方便后面训练时使用。如下所示:(2)准备etc下的数据文件
cd /sphinx/Mytrain(3)准备wav下的音频文件
我们先在windows下面,录下前进、后退、左转、右转、停止五个命令词的wav音频文件,然后放在共享文件中。 mkdir speaker_1 speaker_2 speaker_3 speaker_4 speaker_5 把相应的音频1_11.wav 2_11.wav 3_11.wav 4_11.wav 5_11.wav 分别拷贝到相应的speaker_1 speaker_2 speaker_3 speaker_4 speaker_5 目录下面。