[麻烦介绍一下水俣病]【名称】 “俣”,日文原作“俣”字。《名义抄》音“疑辅反”、《汉语大字典》释为“‘俣’的新字形”,日语训读“また”。 “水俣症”一词。其解释若下:“病名。由于工厂排放废...+阅读
应用HTK建立连续语音识别系统 ------------王风娜 基本内容知识回顾 HTK工具包 基于HMM的连续语音识别 应用HTK建立连续语音识别系统实例 知识回顾 HTK工具包数据准备工具 HDMan、HCopy、HLEd、HSGen、HBuild、HLStats 、HParse 模型训练及优化工具 HERest、HInit、HRest、HHEd、HCompV 识别工具 HVite 性能评估工具 HResults、HRec 基于HMM的连续语音识别系统 HMM 三个基本问题:推理、学习、识别 模型初始状态 转移矩阵 λ ={π, A, B} 状态产生观测向 量的概率分布 连续语音识别模型结构:混合HMM(见附) 建模单元:可根据实际问题选择,对于大词汇量选择音素,进而扩展到三音素(词内或词间) 三音素捆绑:解决训练数据不足问题基于数据的状态聚类:自底向上,不能给不可见音素建模(欧氏距离) 基于决策树的聚类:自顶向下,能为不可见音素建模(见附) 嵌入式训练:训练语音必须有对应的抄本文件 嵌入式识别: p(w) p(O| w) w* = argmaxp(w| O) = argmax p(O) w w 识别网络及N-gram语言模型 识别结果评估: N ?D?S *100% Correct= N Accuracy = N ?D?S?I * 100 % N 应用HTK建立连续语音识别的实例数据准备 创建模型及学习单音素模型 三音素模型 状态捆绑 增加高斯混合模型的个数 识别及评估 数据准备训练及待识别语音文件(.wav) 训练语音包含的所有词(wlist) 训练语音的词级标注文件(.lab 或 word.mlf) wlist中词的发音词典dict(见附) HDMan -m -w wlist -n monophones1 -l dlog dict beep names 训练语音的音素级标注文件(.lab 或 phones.mlf) HLEd .led 生成音素序列文件phones0(不包含sp)、phones1(包含sp) 训练语音的特征文件(.mfc、.plp等) HCopy config 训练语音词级网络wdnet(见附) HPRase HBuild HParse 创建模型及学习(逐步细化)
1、单音素模型: Proto文件:定义模型拓扑结构 3-state left-right HCompV:统计训练数据全局均值、方差 HCompV -C config -f 0.01 -m -S train.scp -M hmm0 proto hmm0(marcos、hmmdef) HERest: X3 hmm3 HERest -C config -I phones0.mlf -t 250.0 150.0 1000.0 -S train.scp -H hmm0/macros –H hmm0/hmmdefs -M hmm1 phones0
2、固定静音的单音素模型加入sil、sp模型 捆绑sil和sp模型 hmm4 hmm5 HHEd -H hmm4/macros -H hmm4/hmmdefs -M hmm5 sil.hed phones1 HERest: X2 hmm7 (phones1)
3、训练数据的重组:解决多音现象 HVite:得到更好的音素级标注文件aligned.mlf HVite -l '*' -o SWT -b silence -C config -a -H hmm7/macros -H hmm7/hmmdefs -i aligned.mlf -m -t 250.0 -y lab -I words.mlf -S train.scp dict phones1 HERest: X2 hmm9(phones1) Error:can't find tee model at the start and end of the sentence.
4、三音素模型三音素标注文件wintri.mlf HLEd -n triphones1 -l '*' -i wintri.mlf mktri.led aligned.mlf sil th ih s sp m ae n sp ... 扩展为 sil th+ih th-ih+s ih-s sp m+ae m-ae+n ae-n sp ... 三音素模型 HHEd -B -H hmm9/macros -H hmm9/hmmdefs -M hmm10 mktri.hed phones1 HERest: X2 -s stats hmm12(triphones)
5、三音素捆绑 HHEd: HHEd -B -H hmm12/macros -H hmm12/hmmdefs -M hmm13 tree.hed triphones1 >log HERest: X2 hmm15(tiedlist)
6、增加混合高斯模型个数 Increase the mixture HHEd -H hmm15/macros -H hmm15/hmmdefs -M hmm16 increasemix.hed tailist increasemix.hed: HERest X2 MU +2 {*.state[2-4].mix} hmm18(tiedlist) 可根据实际问题需要适当增加高斯模型个数 识别及评估识别HVite HVite -H hmm15/macros -H hmm15/hmmdefs -S test.scp -l '*' -i recout.mlf -w wdnet -p 0.0 -s 5.0 dict tiedlist 词级、音素级、三音素级识别结果 评估 HResults -I testref.mlf tiedlist recout.mlf >result 附: 模型结构:混合HMM 决策树捆绑: 返回 词典dict 返回 识别网络 返回 The End!
延伸阅读:
有哪位老师可以帮忙用英文翻译一下公司简介必重谢Zibo Tiantai Tiling Ltd. which is in Zichuan District of Zibo City, "King of the World Short Stories" Pu Songling's hometown, is in Zibo Longquan Ceramic Industri...
明天要面试学院办公室助理有没有有经验的朋友可以指导一下提问面试办公室文员需要注意以下四点: 面试办公室文员需要注意一:整体形象: 1:应聘时需要穿戴整洁得体,化淡妆即可。 2:话语一定要轻缓并且要柔和,不要大声的讨论,不过声音也不要显得过...
各位好我想了解一下学通信工程以后的就业方向有哪些以及各个方1、 SP产品经理:SP可视电话能够让用户“耳闻其声”、“眼观其色”,可实现古人所谓的“天涯若比邻”的佳境,所以被看作是3G的杀手级应用!SP产品经理一般负责规划研发移动增值业务...
准备去韩国留学想问一下韩国大学毕业难吗可以,任何人在任何年纪任何学历的情况下都能出国。现在整个世界就是地球村,只要有一定的经济基础就可以出国, 申请韩国,最低要有高中或相当于高中的学历,并且具备韩国语4级或以上...
介绍一下爱尔兰习俗这个国家怎么样去哪上学好么爱尔兰民风淳朴,人民热情、友好,而且渴望了解其它的社会和文化。在家里、酒馆或其它地方相聚和交谈乃是国民惯常的消遣方式。中国现在非常风行《吉尼斯世界纪录大全》就是爱尔...
用英语简单介绍别人Now I will introduce my classmate briefly. He is 21 years old,born in Shanghai. He will graduate from Shanghai University.His major is Business English. He spen...
我想了解一下华北电力大学毕业生的就业方向以及就业待遇及薪水华北电力大学原属于电力部,是为电力系统培养人才的大学之类 基本属实吧 我给补充一些: 要考就考电气工程相关专业,或者热动专业也行,热动专业有不少进火电厂,很好。 别的什么经管...
哈佛大学重点学科可以介绍一下吗哈佛大学几个主要的研究生院的著名系、部有: 文理学院的生物化学与分子生物学系、生物科学部、应用科学部、计算机技术研究中心、地质学系、化学系等; 医学院的细胞与进化生物...
如何写一份简单明了的简历个人简历 基本信息 姓 名: 性 别: 出生日期: 民 族: 年 龄: 户 籍: 婚姻状况: 身高: 现所在地: 外语语种: 外语水平: 普通话水平: 毕业院校: 最高学历: 毕业时间: 专 业: 职 称: 计算机能力:...