

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、漢字已有數(shù)千年的歷史,也是世界上使用人數(shù)最多的文字。然而,漢字是非字母化、非拼音化的文字,因此,快速高效地將漢字輸入計算機,是信息處理的一個關(guān)鍵問題。人工鍵入勞動強度大,對于大量的已有文檔資料,漢字自動識別輸入就成為了最佳的選擇。它在中文信息處理,辦公自動化,機器翻譯,人工智能等高科技領(lǐng)域,都有著重要的實用價值和理論意義。本文在研究當前光學字符識別(OCR)系統(tǒng)及相關(guān)識別技術(shù)的基礎(chǔ)上,設(shè)計開發(fā)了一套印刷體漢字識別系統(tǒng)。主要工作如下:其一
2、,為了解決單個分類器分類效果不理想的情況,本文從分類器集成的角度出發(fā),設(shè)計了多個具有特征互補,匹配方法不同的分類器,有效的提高了漢字分類的識別效果。 其二,為了提高圖像預處理質(zhì)量,解決二值化過程中全局二值化適應性差,局部二值化速度慢的問題,本文提出了一種基于文字邊界輪廓提取的二值化方法。算法首先提取出文本圖像的邊界輪廓,然后根據(jù)已提出的邊界輪廓和原圖的信息,對輪廓內(nèi)的空白部分進行填充來完成圖像的二值化。實驗結(jié)果表明,此方法速度明
3、顯快于局部二值化方法,二值化效果優(yōu)于全局法。 此外,本文對漢字識別過程中的關(guān)鍵步驟進行了研究,提出了一些新的方法:1)在版面分析中,利用數(shù)學形態(tài)學方法,采用基于組件的方法來進行版面分析;2)在圖像的傾斜校正中,提出了基于最佳特征點的迭代最小二乘法算法;3)在特征提取方面,給出了漢字結(jié)構(gòu)點,連通體,封閉區(qū)域,筆劃等特征的提取方法。在對筆劃撇、捺提取中提出了一種基于方向加權(quán)的筆劃提取方法??傊?,利用以上算法得到的印刷體漢字識別系統(tǒng)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 印刷體文字識別系統(tǒng)的研究與實現(xiàn).pdf
- 印刷體藏文識別系統(tǒng)的研究與實現(xiàn).pdf
- 印刷體數(shù)字識別系統(tǒng)的FPGA實現(xiàn).pdf
- 印刷體漢字識別系統(tǒng)的特征提取和匹配識別研究.pdf
- 印刷體漢字快速識別技術(shù)的研究.pdf
- 印刷體中文文檔識別系統(tǒng)的研究.pdf
- 印刷體漢字識別預處理的研究.pdf
- 印刷體數(shù)學公式識別系統(tǒng)的設(shè)計與實現(xiàn)——分割、識別與重組.pdf
- 基于神經(jīng)網(wǎng)絡(luò)的印刷體俄文識別系統(tǒng)研究與實現(xiàn).pdf
- 中文印刷體文檔內(nèi)容識別系統(tǒng)研究.pdf
- 中文印刷體文檔數(shù)學公式識別系統(tǒng).pdf
- 基于印刷體漢字識別的快遞郵包分揀系統(tǒng).pdf
- 印刷體漢字識別技術(shù)的研究畢業(yè)設(shè)計
- 基于印刷體漢字識別的快遞郵包分揀系統(tǒng)
- 基于Hadoop平臺的印刷體蒙古文字識別系統(tǒng)的研究與實現(xiàn).pdf
- 包裝箱表面印刷體漢字識別算法研究.pdf
- 畢業(yè)論文----印刷體漢字識別方法的研究
- 基于DSP的印刷體漢字識別預處理算法的設(shè)計與實現(xiàn).pdf
- 印刷體中文文檔中表格和漢字的識別研究.pdf
- 基于BP神經(jīng)網(wǎng)絡(luò)的印刷體字符識別系統(tǒng)的研究.pdf
評論
0/150
提交評論