

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、近年來,隨著智能設(shè)備發(fā)展的如火如荼,也帶動了人機(jī)交互這一核心組成部分的進(jìn)步。人機(jī)交互從之前的手勢、手指操作也逐漸向語音這一人類最為自然、便捷、高效的交流方式上轉(zhuǎn)變。語音作為人機(jī)交互的方式包括兩方面內(nèi)容,第一是讓機(jī)器發(fā)出聲音,這是語音合成的研究范疇,第二是讓機(jī)器理解人說的話,這里面又包括能聽懂人類發(fā)音的語義信息,稱之為語音識別;或者能讓機(jī)器辨別出是誰在說話,稱為說話人識別,這也是本文的研究目標(biāo)和重點之一。目前語音合成和語音識別已經(jīng)較為普遍
2、地應(yīng)用到智能和其他一些設(shè)備上,但是能讓機(jī)器區(qū)分出是誰在說話的說話人識別技術(shù)雖然在實驗室條件下的研究較為成熟,但是其在日常應(yīng)用中較少出現(xiàn),不過其廣闊的應(yīng)用前景使嵌入式相關(guān)的說話人識別逐漸成為當(dāng)下的研究熱點。
ARM作為目前最為常用的嵌入式處理器,具有低功耗、低成本、高性能的優(yōu)點。并且其外設(shè)端口豐富,有利于開發(fā)多功能系統(tǒng)。本課題的主要任務(wù)是利用現(xiàn)有的資源,選擇合適的說話人識別算法,最終實現(xiàn)具有較好實時性與準(zhǔn)確性的說話人識別系統(tǒng)。<
3、br> 本文提出了基于ARM的說話人識別系統(tǒng)的研究和設(shè)計,主要工作包括理論知識研究、確定系統(tǒng)方案、編寫系統(tǒng)軟件和整體設(shè)計實現(xiàn)四個部分。本文首先對相關(guān)數(shù)字信號處理方面的知識做了介紹,接著對準(zhǔn)確率和實時性的問題進(jìn)行了考量,在理論算法部分選擇了MFCC,GMM,UBM等算法,最后通過C++語言實現(xiàn)對說話識別處理中的預(yù)處理、Mel頻率倒譜系數(shù)特征提取、GMM模型的訓(xùn)練以及對說話人辨認(rèn)和確認(rèn)的識別。本文硬件系統(tǒng)電路包括三星S3C6410處理器以
4、及FLASH存儲器、SDRAM、UDA1341TS音頻處理芯片、LED顯示等結(jié)構(gòu)。在分析了Linux操作系統(tǒng)驅(qū)動程序的工作原理的基礎(chǔ)上,研究了嵌入式Linux下驅(qū)動程序的開發(fā)過程,建立了交叉編譯環(huán)境,完整的開發(fā)出UDA1341TS音頻編解碼芯片在本系統(tǒng)中的驅(qū)動程序,以及 GPIO口的相關(guān)驅(qū)動,將說話人識別程序和驅(qū)動程序經(jīng)過交叉編譯產(chǎn)生的可執(zhí)行程序下載到實驗板上測試運行。經(jīng)測試表明該系統(tǒng)能實時的采集語音信號,完成對說話人的判斷,同時系統(tǒng)具
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 說話人識別系統(tǒng)的研究與實現(xiàn).pdf
- 基于FPGA的說話人識別系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于GMM的說話人識別系統(tǒng)研究與實現(xiàn).pdf
- 基于SOPC的說話人識別系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 基于FPGA的說話人識別系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 說話人識別系統(tǒng)研究與實現(xiàn).pdf
- 基于Windows CE的說話人識別系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 說話人識別系統(tǒng)的研究及實現(xiàn).pdf
- 基于深度學(xué)習(xí)的說話人識別系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 說話人識別系統(tǒng)的研究及DSP實現(xiàn).pdf
- 基于VQ和HMM的說話人識別系統(tǒng)研究與實現(xiàn).pdf
- 說話人識別系統(tǒng)的研究與開發(fā).pdf
- 基于DSP的說話人識別系統(tǒng).pdf
- 基于GMM說話人分類的說話人識別系統(tǒng)研究.pdf
- 基于文本提示的說話人識別系統(tǒng)的研究和實現(xiàn).pdf
- 基于LonWorks總線技術(shù)的說話人識別系統(tǒng)研究與實現(xiàn).pdf
- 基于GMM的說話人識別系統(tǒng)研究.pdf
- 基于網(wǎng)絡(luò)的說話人識別系統(tǒng)研究.pdf
- 分布式說話人識別系統(tǒng)的研究與實現(xiàn).pdf
- 說話人識別系統(tǒng)的魯棒性研究與實現(xiàn).pdf
評論
0/150
提交評論