欠定盲源分離算法及在語音處理中的應(yīng)用研究.pdf_第1頁
已閱讀1頁,還剩121頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著信息和計算機技術(shù)的發(fā)展,人們對信息處理方法的要求越來越高。很多實際應(yīng)用中通過傳感器獲得的是一些有用信號的混疊信號或帶噪聲的混疊信號,如何從這些隱藏在混疊信號中的原始信號分離出來,是一些應(yīng)用中必須解決的問題,盲源分離技術(shù)正是在這種背景下應(yīng)運而生的。該技術(shù)一經(jīng)提出,便引起了許多學(xué)者的廣泛關(guān)注和重視。作為一種新的數(shù)據(jù)處理方法,盲源分離技術(shù)是人工神經(jīng)網(wǎng)絡(luò)、統(tǒng)計信號處理、信息理論、計算機學(xué)科等相結(jié)合的產(chǎn)物,在生物醫(yī)學(xué)、醫(yī)療圖像、語音信號處理、

2、通信系統(tǒng)、信息檢索等方面都具有非常重要的實際應(yīng)用價值。 盲源分離技術(shù)就是在信源信號和混疊過程均未知的情況下,僅根據(jù)少量的先驗信息,從觀測信號中恢復(fù)或估計出信源信號。這一先驗信息就是盲源分離中的基本假設(shè)條件—信源信號之間是相互統(tǒng)計獨立的,這是一個很寬松的條件,因此盲源分離技術(shù)在眾多的領(lǐng)域中獲得了廣泛的應(yīng)用,近年來成為現(xiàn)代信號處理領(lǐng)域中的一個新的研究熱點。 在早期的盲源分離研究中,一般都要做出觀測信號的數(shù)目不少于源信號的數(shù)目

3、的假設(shè)。然而,隨著對盲信號處理研究的不斷深入,作為常規(guī)模型的擴展,基于欠定模型的盲信號處理算法近年來得到了廣泛的關(guān)注。這類算法主要解決源信號數(shù)目多于觀測信號數(shù)目情況下的問題,更接近于盲源分離實際的情況。由于在此條件下系統(tǒng)是不可逆的,在研究的方法上與標準的盲源分離算法也有所不同,目前基于統(tǒng)計概率模型的過完備描述算法和基于稀疏特征的分離算法是研究欠定盲源分離的主要方法。 本論文系統(tǒng)回顧了盲源分離技術(shù)的發(fā)展歷史、研究現(xiàn)狀和相關(guān)的經(jīng)典算

4、法,圍繞欠定情況下盲源分離問題的一些關(guān)鍵技術(shù)進行了一些探索性的研究,包括欠定情況下源信號的可分離性、信源個數(shù)的估計、信源的稀疏性處理和欠定的非線性分離方法等,提出了一系列欠定盲源分離的算法,這些內(nèi)容屬于擴展的盲源分離問題,具有相當(dāng)?shù)睦碚撘饬x和實際的應(yīng)用價值。同時作為盲源分離技術(shù)的一個應(yīng)用,在語音話者識別方面做了一定的研究工作。過完備描述算法作為一種擴展的盲源分離算法,在對信號特征刻畫方面具有相當(dāng)大的靈活性,不僅可以解決欠定盲源分離的問題

5、,同時還可以得到描述信號高階統(tǒng)計信息的過完備基函數(shù)。以此基函數(shù)為特征建立的基于文本無關(guān)的話者識別系統(tǒng)取得了很好的識別效果。本論文的主要成果概括如下: 1.基于統(tǒng)計概率模型的過完備描述算法,該算法分為兩步進行,首先在混疊矩陣固定的情況下對信源進行估計,然后在信源固定的情況下訓(xùn)練混疊矩陣。在具有二個觀測信號或觀測信號較少的情況下,提出了采用最短路徑的方法來對信源進行估計,以提高訓(xùn)練速度,避免了求逆矩陣帶來的運算量。 2.在采

6、用兩步分離的欠定盲源分離算法中,混疊矩陣的精確估計是實現(xiàn)分離的前提,對信源作稀疏處理后,采用一新的加權(quán)勢函數(shù),在不增加運算量的前提下,低分辨率的情況即可以準確的估計出信源的個數(shù),同時在聚類方向的鄰域內(nèi)采用高分辨率來精確的估計混疊矩陣。實驗表明該算法可給出精確的估計,即使在觀測信號中含有噪聲的情況下,也可以保證很好的估計性能。 3.在欠定盲源分離的分離方法上,傳統(tǒng)的基于最小化L1范數(shù)分離算法可給出確定的解,然而由于該算法是在最大化

7、后驗概率的情況下得到的,采用線性規(guī)劃算法在信源稀疏性較差的情況下并不能給出理論上的最佳分離值。鑒于L1范數(shù)分離算法的缺點,提出了兩種改進的方法。第一,提出了基于在聚類方向加權(quán)的欠定盲源分離算法,該算法在尋找最佳分離矩陣時能較好的反映源信號的變化情況,在信源稀疏性較差的情況下較傳統(tǒng)L1范數(shù)分離算法能給出更高的信源分離信噪比,特別在信源中含有幅度較小的信源時,可避免由于L1范數(shù)分離算法造成的分離不出小信號的情況。第二,提出了基于最小均方誤差

8、的欠定盲源分離算法,該算法在尋找最佳分離矩陣時能較好的跟蹤源信號的內(nèi)在變化,特別在信源稀疏性較差的情況下較傳統(tǒng)L1范數(shù)分離算法能給出更高的信源分離信噪比,通過對語音信號的分離并與原始語音信號對比試聽,在語音的連續(xù)性和噪聲方面都能達到滿意的效果,具有實際應(yīng)用的價值。 4.含噪欠定盲源分離算法。由于噪聲的影響將使算法的性能下降,然而在分離算法上實現(xiàn)去噪是非常困難的,為此含噪盲源分離算法常采用時頻變換的技術(shù),在進行分離之前先對觀測信號

9、進行濾波處理,然后考慮無噪聲情況下的盲源分離。本文提出了一種新的基于高階統(tǒng)計稀疏表征的欠定盲源分離算法,通過小波線性變換在變換域中對混疊信號進行分離,利用小波變換將信號能量“集中”在變換域中少數(shù)系數(shù)上的特征,既完成了對源信號的稀疏性處理,又可實現(xiàn)對噪聲的消除,同時符合盲源分離的數(shù)學(xué)模型和先驗假設(shè),比基于二階統(tǒng)計特征方法有更大的優(yōu)越性,實驗中取得了較好的分離效果。 5.在話者識別應(yīng)用方面。有效的特征信息一直是識別系統(tǒng)的關(guān)鍵,有效的

10、話者特征同樣是話者識別系統(tǒng)的關(guān)鍵。對于語音信號而言,不但包含有與話者有關(guān)的物理信息,同時也包含有語義信息,研究表明這兩方面的信息可以認為是相互獨立的,這與盲源分離模型的假設(shè)相一致。為此我們采用盲源分離技術(shù)中的過完備描述算法,將信號表示成基函數(shù)的線性組合,算法中通過設(shè)置基函數(shù)系數(shù)的分布特性來實現(xiàn)信號的分解,若假定系數(shù)具有稀疏的特性,即設(shè)置系數(shù)的分布為超高斯分布,則分解得到的基函數(shù)可準確地描述信號的高階統(tǒng)計結(jié)構(gòu)信息。該特征可用于語音信號處理

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論