基于機器視覺的場景目標檢測與分類研究.pdf_第1頁
已閱讀1頁,還剩79頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、場景目標檢測與分類技術(shù)是機器視覺研究領(lǐng)域的熱點問題。目標的檢測、分類以及語義分析是實現(xiàn)場景理解的先決條件。場景理解的主要信息來源有圖像和視頻,再結(jié)合需要檢測的處理對象不同,將場景目標檢測分為基于視頻序列和基于單幀圖像的目標檢測。前者常利用多幀圖像信息檢測出動態(tài)變化的區(qū)域,再進行目標分類和跟蹤。后者是在單幅圖像中識別并提取出所有已學習過的感興趣類別目標。目標正確識別及在原圖中的精準定位是高層次視覺分析任務(wù)的基礎(chǔ)步驟之一。近年來,深度卷積神

2、經(jīng)網(wǎng)絡(luò)具有通過對大數(shù)據(jù)樣本的學習而自主獲取物體特征的特性,避免了傳統(tǒng)識別算法中復(fù)雜的特征提取和數(shù)據(jù)重建過程,是解決各類計算機視覺問題的一類有效方法。本文主要研究內(nèi)容如下:
  (1)提出了基于卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)的動態(tài)目標分類方法。在整個方法中利用邏輯性分析解決了高斯混合模型(GMM)提取的運動區(qū)域存在多目標融合的情況,得到較為完整且獨立的運動目標。再利用深度卷積神經(jīng)網(wǎng)絡(luò)去學

3、習運動目標的固有靜態(tài)特征,結(jié)合softmax回歸分類器進行分類。該方法通過實驗說明在運動目標區(qū)域檢測不完整和同類別重疊等情況仍能準確分類,同時擁有分類精度高、處理速度快的優(yōu)點。
 ?。?)提出基于ACF(Aggregated Channels Feature)及卷積神經(jīng)網(wǎng)絡(luò)的圖像目標檢測方法。針對ACF檢測圖像行人和車輛目標存在部分誤檢的問題,利用經(jīng)卷積神經(jīng)網(wǎng)絡(luò)對候選框進行二次識別,剔除誤檢的背景框。該方法既利用了ACF召回率高的

4、特點,也結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)高識別率的特點。最后通過實驗說明了改進方法在不影響檢測實時性和召回率的同時大大提升了檢測準確率。
 ?。?)提出基于ACF及多任務(wù)式學習的卷積神經(jīng)網(wǎng)絡(luò)的圖像目標檢測方法。此方法不僅能夠準確快速的檢測出圖像中的目標,還可以根據(jù)多任務(wù)式學習的特點對目標增加豐富的語義信息。通過行人和車輛檢測實驗,說明了該方法在提高檢測準確率的同時可以獲得行人、車輛目標的混合行為語義。如一個候選框在判別為是一個行人的基礎(chǔ)上,還可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論