基于HMM的語(yǔ)音識(shí)別技術(shù)在嵌入式系統(tǒng)中的應(yīng)用

時(shí)間：2024-09-08 13:15:29 理工畢業(yè)論文

摘要：介紹語(yǔ)音識(shí)別技術(shù)在嵌入式系統(tǒng)中的應(yīng)用狀況與發(fā)展，以及在嵌入式系統(tǒng)中使用HMM語(yǔ)音識(shí)別算法的優(yōu)點(diǎn)，并對(duì)基于HMM語(yǔ)音識(shí)別技術(shù)的系統(tǒng)進(jìn)行介紹。

語(yǔ)音識(shí)別ASR（Automatic Speech Recognition）系統(tǒng)的實(shí)用化研究是近十年語(yǔ)音識(shí)別研究的一個(gè)主要方向。近年來(lái)，消費(fèi)類電子產(chǎn)品對(duì)低成本、高穩(wěn)健性的語(yǔ)音識(shí)別片上系統(tǒng)的需求快速增加，語(yǔ)音識(shí)別系統(tǒng)大量地從實(shí)驗(yàn)室的PC平臺(tái)轉(zhuǎn)移到嵌入式設(shè)備中。

語(yǔ)音識(shí)別技術(shù)目前在嵌入式系統(tǒng)中的應(yīng)用主要為語(yǔ)音命令控制，它使得原本需要手工操作的工作用語(yǔ)音就可以方便地完成。語(yǔ)音命令控制可廣泛用于家電語(yǔ)音遙控、玩具、智能儀器及移動(dòng)電話等便攜設(shè)備中。使用語(yǔ)音作為人機(jī)交互的途徑對(duì)于使用者來(lái)說(shuō)是最自然的一種方式，同時(shí)設(shè)備的小型化也要求省略鍵盤(pán)以節(jié)省體積。

嵌入式設(shè)備通常針對(duì)特定應(yīng)用而設(shè)計(jì)，只需要對(duì)幾十個(gè)詞的命令進(jìn)行識(shí)別，屬于小詞匯量語(yǔ)音識(shí)別系統(tǒng)。因此在語(yǔ)音識(shí)別技術(shù)的要求不在于大詞匯量和連續(xù)語(yǔ)音識(shí)別，而在于識(shí)別的準(zhǔn)確性與穩(wěn)健性。

對(duì)于嵌入式系統(tǒng)而言，還有許多其它因素需要考慮。首先是成本，由于成本的限制，一般使用定點(diǎn)DSP，有時(shí)甚至只能考慮使用MPU，這意味著算法的復(fù)雜度受到限制；其次，嵌入式系統(tǒng)對(duì)體積有嚴(yán)格的限制，這就需要一個(gè)高度集成的硬件平臺(tái)，因此，SoC（System on Chip）開(kāi)始在語(yǔ)音識(shí)別領(lǐng)域嶄露頭角。SoC結(jié)構(gòu)的嵌入式系統(tǒng)大大減少了芯片數(shù)量，能夠提供高集成度和相對(duì)低成本的解決方案，同時(shí)也使得系統(tǒng)的可靠性大為提高。

語(yǔ)音識(shí)別片上系統(tǒng)是系統(tǒng)級(jí)的集成芯片。它不只是把功能復(fù)雜的若干個(gè)數(shù)字邏輯電路放入同一個(gè)芯片，做成一個(gè)完整的單片數(shù)字系統(tǒng)，而且在芯片中還應(yīng)包括其它類型的電子功能器件，如模擬器件（如ADC/DAC）和存儲(chǔ)器。

筆者使用SoC芯片實(shí)現(xiàn)了一個(gè)穩(wěn)定、可靠、高性能的嵌入式語(yǔ)音識(shí)別系統(tǒng)。包括一套全定點(diǎn)的DHMM和CHMM嵌入式語(yǔ)音識(shí)別算法和硬件系統(tǒng)。

1 硬件平臺(tái)

本識(shí)別系統(tǒng)是在與Infineon公司合作開(kāi)發(fā)的芯片UniSpeech上實(shí)現(xiàn)的。UniSpeech芯片是為語(yǔ)音信號(hào)處理開(kāi)發(fā)的專用芯片，采用0.18μm工藝生產(chǎn)。它將雙核（DSP MCU）、存儲(chǔ)器、模擬處理單元（ADC與DAC）集成在一個(gè)芯片中，構(gòu)成了一種語(yǔ)音處理SoC芯片。這種芯片的設(shè)計(jì)思想主要是為語(yǔ)音識(shí)別和語(yǔ)音壓縮編碼領(lǐng)域提供一個(gè)低成本、高可靠性的硬件平臺(tái)。

該芯片為語(yǔ)音識(shí)別算法提供了相應(yīng)的存儲(chǔ)量和運(yùn)算能力。包括一個(gè)內(nèi)存控制單元MMU（Memory Management Unit）和104KB的片上RAM。其DSP核為16位定點(diǎn)DSP，運(yùn)算速度可達(dá)到約100MIPS.MCU核是8位增強(qiáng)型8051，每?jī)蓚€(gè)時(shí)鐘周期為一個(gè)指令周期，其時(shí)鐘頻率可達(dá)到50MHz。

UniSpeech芯片集成了2路8kHz采樣12bit精度的ADC和2路8kHz采樣11bit的DAC，采樣后的數(shù)據(jù)在芯片內(nèi)部均按16bit格式保存和處理。對(duì)于語(yǔ)音識(shí)別領(lǐng)域，這樣精度的ADC/DAC已經(jīng)可以滿足應(yīng)用。ADC/DAC既可以由MCU核控制，也可以由DSP核控制。

2 嵌入式語(yǔ)音識(shí)別系統(tǒng)比較

以下就目前基于整詞模型的語(yǔ)音識(shí)別的主要技術(shù)作一比較。

（1）基于DTW（Dynamic Time Warping）和模擬匹配技術(shù)的語(yǔ)音識(shí)別系統(tǒng)。目前，許多移動(dòng)電話可以提供簡(jiǎn)單的語(yǔ)音識(shí)別功能，幾乎都是甚至DTM和模板匹配技術(shù)。

DTW和模板匹配技術(shù)直接利用提取的語(yǔ)音特征作為模板，能較好地實(shí)現(xiàn)孤立詞識(shí)別。由于DTW模版匹配的運(yùn)算量不大，并且限于小詞表，一般的應(yīng)用領(lǐng)域孤立數(shù)碼、簡(jiǎn)單命令集、地名或人名集的語(yǔ)音識(shí)別。為減少運(yùn)算量大多數(shù)使用的特征是LPCC（Linear Predictive Cepstrum Coefficient）運(yùn)算。

DTW和模板匹配技術(shù)的缺點(diǎn)是只對(duì)特定人語(yǔ)音識(shí)別有較好的識(shí)別性能，并且在使用前需要對(duì)所有詞條進(jìn)行訓(xùn)練。這一應(yīng)用從20世紀(jì)90年代就進(jìn)入成熟期。目前的努力方向是進(jìn)一步降低成本、提高穩(wěn)健性（采用雙模板）和抗噪性能。

（2）基于隱含馬爾科夫模型HMM（Hidden Markov Model）的識(shí)別算法。這是Rabiner等人在20世紀(jì)80年代引入語(yǔ)音識(shí)別領(lǐng)域的一種語(yǔ)音識(shí)別算法。該算法通過(guò)對(duì)大量語(yǔ)音數(shù)據(jù)進(jìn)行數(shù)據(jù)統(tǒng)計(jì)，建立識(shí)別條的統(tǒng)計(jì)模型，然后從待識(shí)別語(yǔ)音中提取特征，與這些模型匹配，通過(guò)比較匹配分?jǐn)?shù)以獲得識(shí)別結(jié)果。通過(guò)大量的語(yǔ)音，就能夠獲得一個(gè)穩(wěn)健的統(tǒng)計(jì)模型，能夠適應(yīng)實(shí)際語(yǔ)音中的各種突發(fā)情況。因此，HMM算法具有良好的識(shí)別性能和抗噪性能。

基于HMM技術(shù)的識(shí)別系統(tǒng)可用于非特定人，不需要用戶事先訓(xùn)練。它的缺點(diǎn)在于統(tǒng)計(jì)模型的建立需要依賴一個(gè)較大的語(yǔ)音庫(kù)。這在實(shí)際工作中占有很大的工作量。且模型所需要的存儲(chǔ)量和匹配計(jì)算（包括特征矢量的輸出概率計(jì)算）的運(yùn)算量相對(duì)較大，通常需要具有一定容量SRAM的DSP才能完成。

在嵌入式語(yǔ)音識(shí)別系統(tǒng)中，由于成本和算法復(fù)雜度的限制，HMM算法特別CHMM（Continuous density HMM）算法尚未得到廣泛的應(yīng)用。

（3）人工神經(jīng)網(wǎng)絡(luò)ANN（Artificial Neural Network）。ANN在語(yǔ)音識(shí)別領(lǐng)域的應(yīng)用是在20世紀(jì)80年代中后期發(fā)展起來(lái)的。其思想是用大量簡(jiǎn)單的處理單元并行連接構(gòu)成一種信息處理系統(tǒng)。這種系統(tǒng)可以進(jìn)行自我更新，且有高度的并行處理及容錯(cuò)能力，因而在認(rèn)知任務(wù)中非常吸引人。但是ANN相對(duì)于模式匹配而言，在反映語(yǔ)音的動(dòng)態(tài)特性上存在重大缺陷。單獨(dú)使用ANN的系統(tǒng)識(shí)別性能不高，所以目前ANN通常在多階段識(shí)別中與HMM算法配合使用。

3 基于HMM的語(yǔ)音識(shí)別系統(tǒng)

下面詳細(xì)介紹

【基于HMM的語(yǔ)音識(shí)別技術(shù)在嵌入式系統(tǒng)中的應(yīng)用】相關(guān)文章：

基于LD3320的語(yǔ)音識(shí)別系統(tǒng)在家庭電路中的模擬應(yīng)用03-11

基于DSP的Bluetooth嵌入式系統(tǒng)應(yīng)用03-20

UML 在嵌入式系統(tǒng)設(shè)計(jì)中的應(yīng)用03-18

藍(lán)牙芯片ROK 101 007在語(yǔ)音系統(tǒng)中的應(yīng)用03-27

基于ISD語(yǔ)音芯片的報(bào)警系統(tǒng)03-07

液晶顯示在嵌入式系統(tǒng)中的應(yīng)用03-21

嵌入式系統(tǒng)中的內(nèi)存壓縮技術(shù)03-18

基于激光天線語(yǔ)音通信系統(tǒng)的研制03-18

基于DSP的語(yǔ)音處理系統(tǒng)的設(shè)計(jì)11-22

亚洲国产日韩欧美在线a乱码,国产精品路线1路线2路线,亚洲视频一区,精品国产自,www狠狠,国产情侣激情在线视频免费看,亚洲成年网站在线观看

基于HMM的語(yǔ)音識(shí)別技術(shù)在嵌入式系統(tǒng)中的應(yīng)用