基于嵌入式Linux的语音识别系统硬软件设计
该设计运用三星公司的S3C2440,结合ICRoute公司的高性能语音识别芯片LD3320,进行了语音识别系统的硬件和软件设计。在嵌入式Linux操作系统下,运用多进程机制完成了对语音识别芯片、超声波测距和云台的控制,并将语音识别技术应用于多角度超声波测距系统中。通过测试,系统可以通过识别语音指令控制测量方向,无需手动干预,最后将测量结果通过语音播放出来。 1.引言 语言是人类传播信息的重要手段,语音识别则是实现语音控制的关键技术。采用嵌入式语音识别技术使得设备具有功耗低、使用简便、灵活等优点,摆脱了复杂按键和按钮的困扰,在服务机器人、智能家居及消费电子等领域发挥着重要作用。 2.系统构成与原理 语音识别主要包括两个阶段:训练阶段和识别阶段。在训练或识别过程中,都必须对输入语音进行预处理和特征提取。训练阶段通过用户输入的若干次训练语音,经过预处理和特征提取后得到特征参数,最后通过特征参数建模,进而建立训练语音的参考模型库。而识别阶段是将输入语音的特征矢量参数和参考模型库中的参考模型进行相似性度量,然后把相似度最高的输入特征矢量作为识别结果输出,从而达到语音识别目的,如图1 所示。 图1 语音识别原理框图 语音识别技术可分为:特定人识别和非特定人识别两种。特定人识别是指需要对待识别人的语音进行采集训练,识别对象为专门的人;非特定人识别是指识别对象为大多数用户,一般要采集多个人的语音进行录音、训练和学习,从而达到较高的识别率。 在实际应用中,现代技术开发嵌入式语音识别有两种实现方式:调入嵌入式语音开发包和外扩语音识别芯片。本文的语音识别系统方案是以嵌入式处理器S3C2440 为核心,外扩非特定人语音识别芯片LD3320,并将超声波测距模块和云台相结合作为系统的机械执行机构。系统测量过程如下:首先根据语音指令控制两自由度云台的位姿,使超声波探测器指向特定方向,然后开启超声波探测器,测量出前方障碍物距离,最后将测量结果转化为可以播放的二进制数据流,通过LD3320的播放功能完成数据的播放。 3.硬件电路设计方案 硬件电路主要包括语音识别部分、主控部分、超声波测距部分和舵机控制部分,如图2 所示。处理器为三星公司的S3C2440,系统主频最高可达533 MHz,支持SPI、I2C、UART等接口,能够满足控制系统的需求。主控芯片S3C2440 通过SPI 总线完成对语音识别模块的读写操作,超声波测距部分和舵机控制部分由处理器的GPIO进行统一控制。 图2 硬件电路设计方案 |