孤立词的语音识别程序,基于能量,思路比较清晰,代码也不复杂,蛮适合想了解语音识别原理的你。
基于MATLAB的孤立词识别项目,录音用的是voc.m
,识别用reco.m
,两段脚本分工明确,跑起来还挺顺畅的。像录音部分,就用了audiorecorder
函数,操作简单,响应也快。
识别逻辑用的是MFCC特征+简单分类器的组合,比如支持向量机SVM、或者HMM。其实不用太担心算法细节,脚本里已经封装得蛮清楚了,基本是照着跑、改点参数就能上手。
像reco.m
那段,用了个3 秒识别窗口,这个设置挺合理的,一般一个单词说完差不多就这个长度,既不会太短丢信息,也不会拖太长加干扰。
压缩包里还带了训练集、预脚本、特征提取代码,等于一站式搞定,挺适合拿来做课程设计、项目 demo,甚至小型商业原型。
如果你在搞语音识别,是入门阶段,建议你动手试试。自己录个音识别下,体验比看原理书直观多了。