- 相關(guān)推薦
基于LD3320的語(yǔ)音識(shí)別系統(tǒng)在家庭電路中的模擬應(yīng)用
摘 要:本研究旨在為行動(dòng)不便的殘障人士或者老年人的家居生活提供便利和幫助,使他們能夠通過(guò)語(yǔ)音識(shí)別系統(tǒng)對(duì)家用電器、照明系統(tǒng)、門窗開關(guān)等實(shí)現(xiàn)智能控制。通過(guò)查找資料,對(duì)比參數(shù)、價(jià)格、識(shí)別率等方面的信息,最終采用了基于LD3320的語(yǔ)音識(shí)別系統(tǒng)進(jìn)行家庭電路控制模擬應(yīng)用。系統(tǒng)由四部分構(gòu)成,即:YS-LD語(yǔ)音識(shí)別模塊、STM32單片機(jī)控制單元、LED顯示單元、繼電器輸出單元。LD3320語(yǔ)音識(shí)別芯片感應(yīng)語(yǔ)音――通過(guò)STM32單片機(jī)運(yùn)算分析――發(fā)出信號(hào)――控制繼電器――電器工作。經(jīng)過(guò)測(cè)試,本套系統(tǒng)的語(yǔ)音辨識(shí)率高達(dá)90%,造價(jià)僅155元,并且無(wú)需用戶自行建立語(yǔ)音模型及開發(fā)語(yǔ)音識(shí)別算法,降低了應(yīng)用開發(fā)的技術(shù)門檻,有利于推廣應(yīng)用。
關(guān)鍵詞:語(yǔ)音控制;單片機(jī);語(yǔ)音識(shí)別芯片;
一、課題背景
學(xué)校常會(huì)組織我們到貴陽(yáng)市盲聾啞學(xué)校送愛(ài)心,與殘障孩子親密互動(dòng),今年也不例外。那些殘章的孩子來(lái)到這個(gè)世界,只能用他們僅存的方式去感知世界萬(wàn)物,在他們的世界里只有一種顏色,那就是黑色。我不禁想,在學(xué)校還有老師的照拂,可他們總有一日要長(zhǎng)大,要開啟自己的人生旅程。要是我能為他們做哪怕一點(diǎn)點(diǎn)事,就算只是為他們的家庭生活提供一些幫助也是好的。我想,如果能利用我在機(jī)器人社中學(xué)到的傳感器、電子電路、單片機(jī)等專業(yè)知識(shí),對(duì)家庭電路進(jìn)行智能化改造,讓家庭的電路“聰明”起來(lái),使他們能夠聽得懂主人的指令而進(jìn)行相應(yīng)的操作,那就可以對(duì)有殘障的人和對(duì)一些不良于行的病人或老人的家庭生活都能提供很大的便利。于是,有了我的這個(gè)設(shè)計(jì)――基于LD3320的語(yǔ)音識(shí)別系統(tǒng)在家庭電路中的模擬應(yīng)用。
二、模型設(shè)計(jì)
(一)模塊功能
(二)模型組成
(三)主要電子元件工作原理與功能說(shuō)明
1、LD3320語(yǔ)音識(shí)別芯片
LD3320語(yǔ)音識(shí)別芯片采用的是ASR(Auto Speech Recognitio)技術(shù),是YS-LD語(yǔ)音識(shí)別模塊的核心。它是對(duì)大量的語(yǔ)音數(shù)據(jù)經(jīng)語(yǔ)言學(xué)家語(yǔ)音模型分析,建立數(shù)學(xué)模型,并經(jīng)過(guò)反復(fù)訓(xùn)練提取基元語(yǔ)音的細(xì)節(jié)特征,以及提取各基元間的特征差異,得到在統(tǒng)計(jì)概率最優(yōu)化意義上的各個(gè)基元語(yǔ)音特征,最后才由資深工程師將算法以及語(yǔ)音模型轉(zhuǎn)換成硬件芯片并應(yīng)用在嵌入式系統(tǒng)中。
LD3320有兩種使用模式,即“觸發(fā)識(shí)別模式”和“循環(huán)識(shí)別模式”?梢酝ㄟ^(guò)編程,設(shè)置兩種不同的使用模式。
觸發(fā)識(shí)別模式:系統(tǒng)的主控MCU在接收到外界一個(gè)觸發(fā)后,啟動(dòng)LD3320芯片的一個(gè)定時(shí)識(shí)別過(guò)程,在這個(gè)定時(shí)過(guò)程中說(shuō)出要識(shí)別的語(yǔ)音關(guān)鍵詞語(yǔ)。這個(gè)過(guò)程結(jié)束后,需要再次觸發(fā)才能再次啟動(dòng)一個(gè)識(shí)別過(guò)程。
循環(huán)識(shí)別模式:系統(tǒng)的主控MCU反復(fù)啟動(dòng)識(shí)別過(guò)程。如果沒(méi)有人說(shuō)話就沒(méi)有識(shí)別結(jié)果,則每次識(shí)別過(guò)程的定時(shí)到時(shí)后再啟動(dòng)一個(gè)識(shí)別過(guò)程;如果有識(shí)別結(jié)果,則根據(jù)識(shí)別作相應(yīng)處理后再啟動(dòng)一個(gè)識(shí)別過(guò)程。
根據(jù)本案模型的設(shè)計(jì)特點(diǎn),采用語(yǔ)音觸發(fā)識(shí)別模式。LD3320芯片最多支持50個(gè)識(shí)別條目,每個(gè)識(shí)別條目是標(biāo)準(zhǔn)普通話的漢語(yǔ)拼音(小寫),每2個(gè)字(漢語(yǔ)拼音)之間用1個(gè)空格間隔。例如表1,只需要把識(shí)別的關(guān)鍵詞語(yǔ)以漢語(yǔ)拼音字符串的形式傳送進(jìn)芯片,該芯片已封裝了基于標(biāo)準(zhǔn)普通話的語(yǔ)音模型數(shù)據(jù)和語(yǔ)音識(shí)別算法,無(wú)需進(jìn)行任何語(yǔ)音訓(xùn)練即可投入開發(fā)應(yīng)用。
2、STM32單片機(jī)控制單元
本案模擬系統(tǒng)主控單元采用意法半導(dǎo)體ARM-Cortex架構(gòu)的STM32F1系列超低功耗單片機(jī)作為控制核心。
該單元完成幾大功能:
向LD3320模塊提供時(shí)鐘振蕩信號(hào),以驅(qū)動(dòng)片上DSP(數(shù)字信號(hào)處理器 )工作;
通過(guò)SPI(串行外設(shè)接口)串行通信方式向LD3320模塊寫入預(yù)定義的控制命令拼音串,并讀取語(yǔ)音模塊返回的識(shí)別結(jié)果編碼;
根據(jù)識(shí)別結(jié)果驅(qū)動(dòng)負(fù)載電路(LED單元(發(fā)光二極管)、繼電器單元)的動(dòng)作。
當(dāng)LD3320模塊完成一次識(shí)別過(guò)程后,通過(guò)中斷請(qǐng)求方式通知主控單元處理,主控單元獲知中斷請(qǐng)求后會(huì)暫時(shí)中止當(dāng)前的任務(wù)執(zhí)行,轉(zhuǎn)而跳轉(zhuǎn)到中斷服務(wù)例程(ISR Route),在該例程中通過(guò)SPI總線從LD3320模塊讀取識(shí)別編碼,根據(jù)識(shí)別編碼的不同執(zhí)行對(duì)應(yīng)控制功能。通過(guò)點(diǎn)亮、熄滅指令對(duì)應(yīng)發(fā)光二極管或驅(qū)動(dòng)繼電器接通主回路得到運(yùn)行結(jié)果。
3、LED顯示單元
本案模擬系統(tǒng)用六個(gè)共陽(yáng)極發(fā)光二極管(LED)來(lái)模擬家庭中廚房、工作間、臥室、走廊、衛(wèi)生間、陽(yáng)臺(tái)的燈泡開關(guān)狀況,工作時(shí)主控單片機(jī)則根據(jù)語(yǔ)音命令,采用輸出低電平方式進(jìn)行驅(qū)動(dòng)點(diǎn)亮。
4、繼電器輸出單元
繼電器輸出單元可接收主控單片機(jī)的高低電平控制信號(hào)以接通或斷開主回路。主回路根據(jù)實(shí)際需求可以用于大電壓,交、直流供電的負(fù)載驅(qū)動(dòng)。本案模擬系統(tǒng)用繼電器單元實(shí)現(xiàn)家庭電扇的通斷控制。
(四)系統(tǒng)軟件開發(fā)環(huán)境
本案模擬系統(tǒng)的軟件開發(fā)只針對(duì)STM32F103主控單元進(jìn)行,軟件代碼完成以下功能:
LD3320底層驅(qū)動(dòng)(對(duì)其內(nèi)部寄存器的讀寫、時(shí)序的控制);
STM32F103硬件單元和用戶變量的初始化;
用戶語(yǔ)音命令拼音串的寫入;
中斷服務(wù)ISR(完成負(fù)載電路的驅(qū)動(dòng)控制)。
軟件開發(fā)基于ARM公司的Keil開發(fā)環(huán)境,完成從代碼編輯到編譯、調(diào)試、燒寫一系列過(guò)程。
(五)設(shè)備成本
三、設(shè)備實(shí)測(cè)
(一)控制命令
LD3320語(yǔ)音識(shí)別芯片中最多可以寫入50條語(yǔ)音控制指令,可以根據(jù)用戶需要定制個(gè)性化的語(yǔ)音控制功能。本案設(shè)備的設(shè)計(jì)初衷是為了探索LD3320語(yǔ)音識(shí)別芯片在家庭電路中的模擬應(yīng)用,故只寫入了比較基本的18條指令。
(二)設(shè)備測(cè)試
在寫入程序,完成硬件連線并加電復(fù)位后,系統(tǒng)即進(jìn)入運(yùn)行狀態(tài)。向系統(tǒng)說(shuō)出控制命令(盡可能用普通話, 不過(guò)實(shí)測(cè)時(shí)對(duì)貴陽(yáng)本地方言還是有較高識(shí)別率),比如說(shuō)“廚房打開”、“走廊關(guān)閉”、“電扇啟動(dòng)”、“運(yùn)行流水燈”等命令后,系統(tǒng)會(huì)根據(jù)識(shí)別結(jié)果執(zhí)行對(duì)應(yīng)動(dòng)作,點(diǎn)亮/熄滅LED或者通/斷電扇運(yùn)行。
為了更好的檢測(cè)語(yǔ)音識(shí)別效果,實(shí)驗(yàn)中選擇多個(gè)不同音色的人在家庭(比較安靜)環(huán)境下分別進(jìn)行測(cè)試,每個(gè)詞語(yǔ)測(cè)試50遍。部分非特定人的語(yǔ)音命令測(cè)試的正確識(shí)別數(shù)據(jù)比例見(jiàn)表4:由上表可知,在家庭(比較安靜)環(huán)境下,對(duì)于語(yǔ)音命令的平均識(shí)別率可達(dá)到90%以上。
四、設(shè)備優(yōu)勢(shì)與應(yīng)用展望
(一)設(shè)備優(yōu)勢(shì)
1、本案設(shè)備成本低、語(yǔ)音辨識(shí)率高、響應(yīng)快速,可以直接安裝于家庭電路中實(shí)現(xiàn)語(yǔ)音智能控制。
2、由于LD3320 可以動(dòng)態(tài)編輯的識(shí)別關(guān)鍵詞語(yǔ)列表,因此其可以應(yīng)用的范圍大大超過(guò)了那些不可以改變識(shí)別列表的芯片。
3、可以根據(jù)用戶的需求進(jìn)行控制命令寫入,實(shí)現(xiàn)可定制、個(gè)性化的智能控制。
(二)應(yīng)用展望
1、應(yīng)對(duì)家庭生活突發(fā)狀況
在本語(yǔ)音識(shí)別系統(tǒng)中只是初步嘗試了對(duì)用電器通、斷電控制,而在現(xiàn)在社會(huì)中有很多的空巢老人,他們獨(dú)自生活,如果在家中出現(xiàn)意外或突發(fā)疾病,隨時(shí)都有可能危及生命。如果在本案系統(tǒng)中可以添加“緊急呼叫”的語(yǔ)音控制,當(dāng)出現(xiàn)突發(fā)狀況時(shí)可以使用該功能觸發(fā)電話自動(dòng)撥打物管、救護(hù)車、親屬等重要聯(lián)系人。或者該控制與小區(qū)物管相連,每當(dāng)有人有緊急呼叫時(shí),物管的終端緊急呼叫燈亮起,并觸發(fā)揚(yáng)聲器發(fā)出警報(bào)聲,使物管人員迅速到場(chǎng)解決問(wèn)題。
2、實(shí)現(xiàn)家用電器的語(yǔ)音控制
(1)電磁爐/微波爐/智能家電操作
在現(xiàn)在的家電中,各種各樣的設(shè)置越來(lái)越繁復(fù)。用戶在使用過(guò)程中,還要不斷地對(duì)家電進(jìn)行功能切換。在引入LD3320 芯片后,可以用語(yǔ)音直接控制這些家電。比如用語(yǔ)音來(lái)控制電磁爐把火力調(diào)整到“煎炸”或者是“慢燉”。
(2)數(shù)碼像框
數(shù)碼像框中存放了許多的照片和視頻,同時(shí)又具有多種播放的方式。一般是通過(guò)按鍵或者遙控器的方式來(lái)對(duì)其進(jìn)行操作,但是這樣的操作并不方便。在引入了LD3320 提供的語(yǔ)音識(shí)別功能后,用戶可以最自然地用語(yǔ)音去點(diǎn)播想要顯示的照片,或者改變數(shù)碼像框的顯示方式。使得這樣的數(shù)碼產(chǎn)品更加具有人性化的操作界面。
3、機(jī)頂盒/彩電遙控器
隨著數(shù)字電視的普及,家庭中可以收看到的電視節(jié)目也越來(lái)越豐富。大家也就苦于在眾多的頻道中迅速選擇到自己想要看的頻道。在把LD3320 語(yǔ)音識(shí)別芯片集成進(jìn)機(jī)頂盒/彩電遙控器后,用戶只需要對(duì)著遙控器說(shuō)出想要看的電視頻道的名字,就可以快速地選擇。比如用戶可以說(shuō)出“奧運(yùn)體育”,就可以轉(zhuǎn)到體育頻道來(lái)觀看精彩的體育比賽了。
4、智能玩具/對(duì)話玩具
在電視購(gòu)物中曾經(jīng)出現(xiàn)過(guò)可以人機(jī)對(duì)話的玩具,比如金福豬,金福狗等。這些玩具采用的語(yǔ)音識(shí)別只能支持固定的10 條左右的語(yǔ)音命令,比如“你好”,“我想聽歌”等等。采用LD3320 芯片,可以利用其動(dòng)態(tài)編輯識(shí)別關(guān)鍵詞語(yǔ)列表的性能,讓玩具實(shí)現(xiàn)及其復(fù)雜的對(duì)話腳本。避免了玩具的嚴(yán)重同質(zhì)化。
(三)公共服務(wù)設(shè)施的語(yǔ)音控制
1、自動(dòng)售貨機(jī)、地鐵自動(dòng)售票機(jī)等銷售型服務(wù)設(shè)施
在自動(dòng)售貨機(jī)、地鐵自動(dòng)售票機(jī)等銷售型服務(wù)設(shè)施中安裝語(yǔ)音操作模塊。人們可以對(duì)著售貨機(jī)說(shuō)出要買的商品,比如“可口可樂(lè)”或者“面巾紙”投幣后商品就自動(dòng)售出。在北京、上海等大都市中,外地旅客較多,對(duì)地鐵線路不熟悉導(dǎo)致買票時(shí)不知道票價(jià)也不知道如何購(gòu)買。有了語(yǔ)音操作界面后,只需要對(duì)著售票機(jī)說(shuō)出要去的地方或者想要到達(dá)的站點(diǎn),根據(jù)屏幕提示放入紙幣,就可以方便地買到車票。
2、公共照明系統(tǒng)、輔助設(shè)施的語(yǔ)音控制
在公共場(chǎng)合幫助殘疾人士、行動(dòng)不便的老人或小孩非接觸地去控制公共照明系統(tǒng)或輔助設(shè)施(地下通道輪椅臺(tái)等)的運(yùn)行。
3、樓宇電視的廣告點(diǎn)播
目前分眾傳媒等公司的樓宇廣告設(shè)施,遍布幾乎所有的寫字樓,也在廣告投放上取得了良好的效果。但是目前用戶在接受廣告時(shí),都是被動(dòng)地去接受信息。對(duì)于其中感興趣的廣告,只能是等待下次再看到時(shí)進(jìn)行仔細(xì)地了解,沒(méi)有辦法進(jìn)行主動(dòng)式地廣告查詢。
引入LD3320 語(yǔ)音識(shí)別芯片后,用戶可以用語(yǔ)音去方便地查詢想要了解的廣告信息。比如操作樓宇廣告“重新播放”“上一條”來(lái)重新觀看一條廣告。或者“汽車”來(lái)點(diǎn)播想要看的汽車廣告。
這樣的語(yǔ)音操作,不需要增加額外的鍵盤輸入和觸摸屏輸入,又可以讓用戶與廣告充分互動(dòng),取得更佳的效果。
五、結(jié)語(yǔ)
使用LD3320 芯片可以在一定程度上完成這樣的語(yǔ)音控制系統(tǒng),給人們的生活帶來(lái)更便利的語(yǔ)音交互界面。作為一種新的人機(jī)交互界面,會(huì)逐步地走入人們的日常生活,在適合用語(yǔ)音控制的地方給人們提供更多的便利。
參考文獻(xiàn):
[1]陳喜春.基于LD3320語(yǔ)音識(shí)別專用芯片實(shí)現(xiàn)的語(yǔ)音控制,[J]. 電子技術(shù)設(shè)計(jì)與應(yīng)用. 2011年11月
[2]金鑫,田犇,闕大順. 基于的LD3320語(yǔ)音控制系統(tǒng)設(shè)計(jì)實(shí)現(xiàn).[J].電腦與信息技術(shù).2011年12月.第19卷第6期
[3]洪家平.LD3320的嵌入式語(yǔ)音識(shí)別系統(tǒng)的應(yīng)用.[J].單片機(jī)與嵌入式系統(tǒng)應(yīng)用.2012年.第2期
【基于LD3320的語(yǔ)音識(shí)別系統(tǒng)在家庭電路中的模擬應(yīng)用】相關(guān)文章:
基于BP網(wǎng)遙感影像分類研究與應(yīng)用08-10
蒙特卡洛模擬技術(shù)在隨機(jī)交通分配中的應(yīng)用分析05-11
目標(biāo)規(guī)劃及其在經(jīng)濟(jì)中的應(yīng)用05-11
氣管插管在院前急救中的應(yīng)用05-29
Openprocess在熱網(wǎng)監(jiān)控系統(tǒng)中的應(yīng)用06-04
基于Gene8310的嵌入式家庭服務(wù)機(jī)器人05-11
精益生產(chǎn)在企業(yè)管理中的應(yīng)用05-26