

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、物體檢測,即給定一張圖像,識別出其中的目標物體并對其定位,是計算機視覺領(lǐng)域研究的一個重要和基礎問題。最近幾年隨著深度學習的快速發(fā)展,基于深度學習的物體檢測技術(shù)越來越受到重視。無人駕駛汽車、個人智能助手、智能安防等領(lǐng)域都依賴準確高效的物體檢測算法。深度學習最大的優(yōu)勢就是端到端的訓練和部署,使用通用的模型和大量標注數(shù)據(jù)就能得到非常好的效果。圍繞基于深度學習的物體檢測,本文分別從數(shù)據(jù)獲取和模型優(yōu)化兩個核心問題進行了研究,并再此基礎上實現(xiàn)了一個
2、物體檢測系統(tǒng)。本文主要分為以下三個部分:
一、自然場景中的平面圖案檢測具有非常廣泛的應用需求,深度學習在這類應用中被證明具有較好的檢測效果,但在真實場景中很難收集到大量可用于訓練深度模型的圖像。為了應對大量訓練樣本獲取的困難,本文構(gòu)建了一個快速自動生成大量訓練樣本的方法。該方法通過對少量的模板樣本圖片應用幾何和紋理變換,模擬多種自然場景中的效果,合成用于檢測的訓練樣本。實驗結(jié)果表明,使用本文方法合成的訓練樣本可以取得與使用人工
3、標注的真實樣本相近的效果。該方法減少了對人工標注數(shù)據(jù)的依賴,降低了數(shù)據(jù)獲取成本。
二、Faster RCNN是物體檢測中被廣泛應用的深度神經(jīng)網(wǎng)絡模型。本文針對Faster RCNN方法對小尺寸物體檢測效果不好的情況,使用多尺度的卷積特征進行物體的邊框提取和分類,并通過拼接多個層級的特征圖,使得網(wǎng)絡在抽取高層語義信息的同時不會丟失細節(jié)的圖像信息,實現(xiàn)在多尺度范圍上更準確的檢測。通過Pascal VOC數(shù)據(jù)集上的實驗結(jié)果表明,對比
4、使用單層特征圖的網(wǎng)絡,本文使用的網(wǎng)絡對小目標物體的檢測有著更好的檢測效果。
三、鑒于使用深度學習方法進行物體檢測具有相對統(tǒng)一的流程,可以通過模塊化的方法組合實現(xiàn),本文實現(xiàn)了一個可視化的物體檢測訓練和識別系統(tǒng)。該系統(tǒng)使用B/S架構(gòu),采用模塊化設計,支持多種數(shù)據(jù)集和物體檢測網(wǎng)絡,覆蓋了數(shù)據(jù)輸入、神經(jīng)網(wǎng)絡訓練、模型評價等整個物體檢測流程。使用該系統(tǒng),不具有深度學習專業(yè)知識的用戶,通過web端網(wǎng)頁操作,就可根據(jù)自己的需要完成物體檢測深
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 自然場景中的文字檢測與識別技術(shù)研究.pdf
- 基于物體檢測的場景分類方法研究.pdf
- 自然場景下的文本檢測技術(shù)研究.pdf
- 機器人視覺系統(tǒng)中的物體檢測技術(shù)研究.pdf
- 視頻監(jiān)控場景中的運動物體檢測和跟蹤.pdf
- 視頻場景檢測的相關(guān)技術(shù)研究.pdf
- 復雜自然場景圖像中的文本檢測與識別技術(shù)研究.pdf
- 自然場景識別技術(shù)研究.pdf
- 自然場景中的文本檢測研究.pdf
- 復雜場景下基于深度學習的物體檢測與識別算法研究.pdf
- 復雜場景下運動物體檢測與跟蹤算法的研究.pdf
- 人臉識別中的活體檢測技術(shù)研究.pdf
- 大規(guī)模自然場景繪制技術(shù)研究.pdf
- 自然場景圖像中的文字檢測.pdf
- 自然場景中漢字識別關(guān)鍵技術(shù)研究.pdf
- 自然場景下行人的視頻跟蹤技術(shù)研究.pdf
- 演示學習中物體檢測與跟蹤算法研究.pdf
- 自適應多窗口的實時物體檢測技術(shù)的研究.pdf
- 自然場景中路牌漢字識別技術(shù)研究.pdf
- 自然場景圖像分割關(guān)鍵技術(shù)研究.pdf
評論
0/150
提交評論