場(chǎng)景分類視覺(jué)字典容量的自動(dòng)獲取研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩73頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、根據(jù)場(chǎng)景含義對(duì)圖像進(jìn)行分類是圖像理解研究的熱點(diǎn),是研究人類理解圖像語(yǔ)義含義的重要方向之一。近年來(lái),場(chǎng)景分類在圖像檢索、醫(yī)學(xué)圖像的識(shí)別、計(jì)算機(jī)視覺(jué)和機(jī)器人,對(duì)周圍環(huán)境的感知等領(lǐng)域具有重要而現(xiàn)實(shí)的應(yīng)用前景。面對(duì)日益龐大的數(shù)字圖像,依靠經(jīng)典的人工標(biāo)注的方式對(duì)圖像進(jìn)行標(biāo)注獲取圖像特征,然后對(duì)圖像進(jìn)行分類的工作量將變得難以承受,因此,研究更智能化的場(chǎng)景分類方式愈加重要。場(chǎng)景分類的過(guò)程包括:場(chǎng)景圖像的特征提取、視覺(jué)字典的構(gòu)建、分類結(jié)果預(yù)測(cè)等。在視覺(jué)

2、字典的構(gòu)建過(guò)程中,視覺(jué)字典合理容量的獲取就成為了影響場(chǎng)景分類的精度與效率一個(gè)關(guān)鍵因素。針對(duì)當(dāng)前完全依賴反復(fù)人為實(shí)驗(yàn)摸索才能獲得視覺(jué)字典容量的現(xiàn)狀,提出了一種使用AP聚類算法自動(dòng)計(jì)算視覺(jué)字典合理容量的方法。這個(gè)方法避免了人為實(shí)驗(yàn)摸索去獲得視覺(jué)字典容量,顯著提高了算法的運(yùn)算效率。本文的主要工作如下:
  首先,本文介紹了場(chǎng)景分類等相關(guān)的背景知識(shí),以及它們的研究意義;分析了聚類算法和視覺(jué)字典容量獲取的研究現(xiàn)狀。
  其次,本文給出

3、了場(chǎng)景分類的基本流程圖。闡述了獲取SIFT(Scale-invariant featuretransform,尺度不變特征轉(zhuǎn)換)特征的詳細(xì)過(guò)程、K-均值聚類算法和AP(AffinityPropagation,吸引子傳播)聚類算法,并且通過(guò)對(duì)隨機(jī)產(chǎn)生的100個(gè)數(shù)據(jù)點(diǎn)的聚類結(jié)果進(jìn)行對(duì)比,分析比較了兩種聚類算法的優(yōu)缺點(diǎn)。K-均值聚類算法的聚類中心數(shù)目要人為預(yù)先指定,而且初始聚類中心的不同會(huì)導(dǎo)致聚類結(jié)果的不同。而AP聚類則是通過(guò)算法的迭代自動(dòng)獲

4、取聚類中心,而且在迭代的過(guò)程中,經(jīng)過(guò)44次就趨于穩(wěn)定。此外,還分析了AP聚類算法中的兩個(gè)參數(shù)對(duì)聚類結(jié)果的影響。實(shí)驗(yàn)表明,在無(wú)先驗(yàn)知識(shí)的情況下,AP聚類算法要優(yōu)于K-均值聚類算法。
  第三,本文對(duì)SIFT特征的提取方法進(jìn)行了深入研究,給出了當(dāng)前提取SIFT特征構(gòu)建視覺(jué)單詞的幾種方法。通過(guò)實(shí)驗(yàn)仿真對(duì)比了使用均勻網(wǎng)格采樣法和隨機(jī)采樣法提取場(chǎng)景圖像SIFT特征的優(yōu)缺點(diǎn),實(shí)驗(yàn)結(jié)果表明,均勻采樣法更適用于本文對(duì)場(chǎng)景分類的研究。
  第

5、四,本文對(duì)提取得到的特征矩陣數(shù)據(jù)進(jìn)行了預(yù)處理。然后分別使用K-均值聚類算法和AP聚類算法獲取視覺(jué)字典容量,使用SVM進(jìn)行場(chǎng)景分類。使用K-均值聚類算法獲取了一條視覺(jué)字典容量和識(shí)別率之間的關(guān)系曲線。然后改變AP聚類中的參數(shù)——參考度,分析了參數(shù)對(duì)場(chǎng)景分類的影響。并使用IGP(In-Group Proportion,類內(nèi)比例)指標(biāo)對(duì)聚類效果進(jìn)行了評(píng)價(jià)。
  第五,本文對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了分析。首先,把用K-means聚類算法得出的識(shí)別率與

6、視覺(jué)字典容量之間的關(guān)系曲線和通過(guò)AP聚類算法自動(dòng)獲取視覺(jué)字典容量進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明:使用AP聚類算法能夠較快的獲取視覺(jué)字典容量,而且場(chǎng)景分類的識(shí)別率可以達(dá)到81%以上。而使用K-means聚類算法,得出的識(shí)別率與視覺(jué)字典容量之間的關(guān)系曲線并無(wú)規(guī)律,分類精度最高的視覺(jué)字典容量分別為350、750、1100和1350。本文還給出了幾個(gè)重要的參數(shù)對(duì)實(shí)驗(yàn)結(jié)果的影響,通過(guò)IGP的值選擇參考度的值,驗(yàn)證了AP聚類的有效性和得到的視覺(jué)字典容量的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論