自然場景中文本信息提取方法.pdf_第1頁
已閱讀1頁,還剩135頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、自然場景中不僅包含大量的圖形信息,而且存在豐富的文本信息。這些文本信息對場景內(nèi)容的描述與理解有重要的價(jià)值,是場景圖像檢索的關(guān)鍵線索。因而迫切需要一種自動化的工具,通過自然場景中文本認(rèn)知獲取場景中的文本信息,為檢索、查詢、瀏覽場景圖像資料和理解場景內(nèi)容服務(wù),提高圖像資料的管理效率。
  自然場景中文本認(rèn)知是指在對文本所依存的環(huán)境無限制或較少限制的條件下,對自然場景中文本的識別與理解。盡管傳統(tǒng)文檔分析技術(shù)已經(jīng)取得了巨大的成果,但是通常

2、只能處理文檔上的文本字符,無法處理自然場景中文本字符。因此自然場景中文本認(rèn)知逐漸成為研究的熱點(diǎn)。
  本文對自然場景中文本認(rèn)知的相關(guān)技術(shù)進(jìn)行研究,重點(diǎn)研究自然場景中文本信息提取方法。自然場景中文本信息提取是在圖像中檢測文本的存在,確定文本區(qū)域的位置,并將文本區(qū)域中的字符提取出來。論文通過對圖像中文本特點(diǎn)的分析,提出基于模糊同質(zhì)性映射的文本信息提取方法,能夠同時(shí)處理人工文本和場景文本,具有較強(qiáng)的通用性。該方法采用基于學(xué)習(xí)的文本檢測方

3、法和基于文本像素密度的文本定位方法確定圖像中的文本區(qū)域,并通過多尺度變換與模板匹配的方法提取字符。與其他文本信息提取方法相比具有以下優(yōu)點(diǎn):圖像的同質(zhì)性在很大程度上與圖像的局部信息相關(guān),能夠反映文本區(qū)域的本質(zhì)特征;模糊理論較好描述了人類視覺中的模糊性和隨機(jī)性,因此更適于處理背景復(fù)雜的圖像;多尺度變換與模板匹配充分利用文本區(qū)域的結(jié)構(gòu)特征,降低顏色復(fù)雜文本字符的提取難度。本文著重對以下問題進(jìn)行了研究:
  1.對圖像空間映射進(jìn)行了研究,

4、將同質(zhì)性映射引入文本檢測,并提出了改進(jìn)的同質(zhì)性映射定義。空間映射能夠增強(qiáng)文本區(qū)域的特征,提高文本檢測的性能。重點(diǎn)比較了不同類型空間映射對文本檢測的影響,實(shí)驗(yàn)結(jié)果表明同質(zhì)性映射能夠更準(zhǔn)確地刻畫文本區(qū)域與非文本區(qū)域之間的差異,為文本檢測奠定基礎(chǔ)。
  2.提出了基于模糊同質(zhì)性映射的文本檢測方法。在同質(zhì)性定義的基礎(chǔ)上,利用模糊理論處理圖像本身所具有的模糊屬性,將二者相結(jié)合定義模糊同質(zhì)性映射,充分反映圖像區(qū)域的局部均勻程度,適用于背景比較

5、復(fù)雜的自然場景中文本檢測,尤其適用于一些背景與文本區(qū)域視覺特征近似的圖像。3.為了提取文本區(qū)域內(nèi)的字符信息,需要獲得文本區(qū)域的范圍和確切位置,提出基于文本像素密度的文本定位方法,并利用文本區(qū)域的特點(diǎn)和幾何統(tǒng)計(jì)信息對文本候選區(qū)域進(jìn)行篩選。圖像中文本字符尺寸的差異給文本定位造成很大困難,采用多分辨分析技術(shù),將多個(gè)文本定位結(jié)果融合得到多分辨分析下的文本定位結(jié)果。通過在ICDAR’2005開放測試集上測試,實(shí)驗(yàn)結(jié)果表明該文本定位方法具有較好的性

6、能。
  4.提出了多尺度變換與模板匹配的文本提取方法。由于圖像中文本的諸多變化,傳統(tǒng)字符分割技術(shù)無法正確分割自然場景中的文本字符。首先通過定義文本區(qū)域的標(biāo)準(zhǔn)模板、存在模板和多尺度變換來描述文本區(qū)域的變化,然后給出了多尺度變換與模板匹配的文本提取算法。將該方法應(yīng)用到車牌精確定位與字符分割中,實(shí)驗(yàn)表明,該方法對具有確定存在形式的文本區(qū)域及其各種形變具有很好的定位和字符分割能力,同時(shí)該方法有很強(qiáng)的抗干擾能力,尤其對斷裂和粘連字符的分割

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論