基于更新標識符的改進分數(shù)編碼方案研究.pdf_第1頁
已閱讀1頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、目前,XML已經(jīng)成為Web數(shù)據(jù)存儲、表示和交換的重要標準。XML具有良好的可拓展性與開放性、較高的壓縮比、能夠保證數(shù)據(jù)的結構完整性等諸多優(yōu)點,但同時它也存在冗余信息多、分支結構多等缺點。如何高效管理XML數(shù)據(jù)成為XML技術領域的研究熱點,為此學者們提出了很多特定的編碼方案。這些數(shù)據(jù)編碼方案在很大程度上提高了XML數(shù)據(jù)的編碼和管理效率,但也存在一些不足,比如查詢效率不高,當XML數(shù)據(jù)頻繁或者大幅度更新時需要重新編碼、更新代價較大。本文就此

2、開展相關方面的研究。
  本文在深入分析已有編碼方案的基礎上,提出了一種基于更新標識符的改進分數(shù)編碼方法UIFES,該編碼將結點信息和路徑信息分解,分別保存在不同的表中,避免記錄重復的結點信息和路徑信息,節(jié)省了存儲空間;同時該編碼將所有的結點路徑保存在路徑信息表中,在查詢時通過路徑編號來查找結點位置,避免了現(xiàn)有查詢算法的結構連接操作,而且不受查詢路徑表達式長度和中間結果集規(guī)模的影響,大大提高了查詢效率;最后該編碼利用分數(shù)界定碼和更

3、新標志碼來解決預留空間用完的情況,使得在某些特殊情況下都不需要重新編碼,更新代價很小,極大地提高了編碼的更新效率。
  總結來說,本文的主要工作如下:
  (1)深入分析了現(xiàn)有的XML數(shù)據(jù)編碼方案,并指出了這些編碼方案各自的優(yōu)缺點。
  (2)提出了一種新的XML數(shù)據(jù)編碼方案,即UIFES編碼。該編碼綜合運用了分數(shù)編碼和前綴編碼的優(yōu)點,既能有效支持結點的動態(tài)更新,又具有較高的查詢效率。與前綴編碼相比,它的查詢效率更高;

4、與分數(shù)編碼相比,它的動態(tài)更新性能更好。
  (3)針對本文提出的編碼方案詳細說明了相關定義和實現(xiàn)算法;對編碼的特性進行了介紹,給出了編碼更新算法和查詢算法,并結合實例討論了插入新結點后編碼的更新情況,詳細說明了查詢過程。
  (4)通過實驗對UIFES編碼和其它對照組編碼在靜態(tài)編碼效率、動態(tài)更新效率、查詢效率等方面進行了分析和比較,驗證了UIFES編碼的有效性。
  實驗結果證明,與現(xiàn)有的編碼方案相比,UIFES編碼在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論