关键词:
语音识别
嵌入式
隐马尔可夫模型
音节分割
模式识别
摘要:
让机器听懂人类的语言一直是很多研究者的愿望。随着语音信号处理技术的不断进步和集成电路技术的发展,已经可以让机器听懂人的语言并做出动作。目前,语音识别技术正逐渐市场化,越来越多的人开始注意到语音在设备控制领域的独特优势。过去语音识别系统主要运行在PC和专用服务器上,由于这些设备不易携带以及成本等原因,将语音识别系统移植到更轻便的嵌入式系统中是很有必要的,本文基于这样的背景,开展了面向汽车控制的嵌入式语音识别系统研究。本项设计在详细了解和研究国内外关于语音识别的研究现状基础上,针对汽车电子控制领域的需求,提出嵌入式语音识别系统的目标与任务,包括硬件系统搭建、语音识别算法仿真和软件系统搭建。硬件系统以ARM微处理器为核心,处理器外围包含语音信号采集、数据存储、结果显示等模块。这些模块相互联系,组成了一个能够支撑整个语音识别流程的硬件系统。算法方面首先阐述了在PC上和在嵌入式设备中实现语音识别算法的联系与区别,说明了在PC上对语音识别算法进行仿真的必要性,并使用Matlab工具对语音信号预处理、端点检测及特征提取算法进行仿真。在特征提取方面,比较了线性预测系数(LPC)和美尔倒谱系数(MFCC)的优劣,选择识别成功率更高的MFCC作为语音识别特征参数。在识别算法方面,针对语音识别中语音信号的特征矢量不对齐问题,验证动态时间规划(DTW)算法的效果。对隐马尔可夫模型(HMM)训练和识别算法进行仿真,提出了一种解决孤立词语音识别中的拒绝识别问题的方案。最后通过比较上述两种识别算法的优劣,在PC上验证孤立词语音识别系统方案的可行性,确定选择基于HMM的孤立词语音识别作为最终方案。将语音识别算法移植到嵌入式系统中,实现对汽车灯光的语音控制,并测试了识别成功率和干扰词的拒绝识别率。测试结果表明,当人与麦克风的距离在1米以内时,系统对孤立词的识别成功率接近90%,拒绝识别率超过70%。