

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、相似性搜索在數(shù)據(jù)挖掘、多媒體信息檢索、社交網(wǎng)絡(luò)分析以及生物學等領(lǐng)域的研究應(yīng)用一直備受關(guān)注?,F(xiàn)有的大部分方法往往采用具有度量屬性的距離方法作為相似性度量,且在所有維度的屬性值上計算相似度得分。然而,研究表明對象的屬性值可能在接收、傳輸和轉(zhuǎn)換過程中,由于錯誤讀或噪聲,會出現(xiàn)一些異常值,如當前對象與其他對象在某些維度上的值存在高差異性等,最終使得搜索目標的準確率下降。所以,就有研究提出了基于部分維度或子空間的相似性搜索問題,試圖將上述影響降到
2、最低,但所有數(shù)據(jù)對象與查詢對象須在用戶事先選定的相同部分維度對應(yīng)屬性值上進行相似度計算,解決辦法依然不夠靈活有效。
目前,隨著云計算的逐漸普及,使得集中式環(huán)境下的方案迫切需要滿足大數(shù)據(jù)的應(yīng)用需求,而單臺服務(wù)器以及傳統(tǒng)的技術(shù)架構(gòu)已經(jīng)無法迎接處理海量數(shù)據(jù)的挑戰(zhàn),因此采用一種穩(wěn)定且較成熟的分布式計算框架,如 MapReduce,既可以解決單機算法的可擴展性又保證了分布式算法的運算性能。
另外,索引技術(shù)一直是數(shù)據(jù)庫研究方向的
3、重要內(nèi)容,選擇合適的索引方法能夠從根本上提高原有算法的時間性能。同樣,隨著研究工作的推進,本文的集中式環(huán)境下的方案也可以利用索引結(jié)構(gòu)進一步得到優(yōu)化,并且可以適應(yīng)不同搜索查詢的需求,如泛數(shù)據(jù)下的相似性連接查詢等。結(jié)合上述內(nèi)容,本文的主要研究工作概述如下:
1、針對現(xiàn)有子空間相似性搜索研究依然存在的不足,本文提出了一種基于特殊距離度量方法的子空間相似性搜索方案。由于此方案下的相似度排名是根據(jù)查詢對象和不同數(shù)據(jù)對象可能在不同部分維度
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 時間序列相似搜索方法的研究.pdf
- 自搜索規(guī)則匹配的研究.pdf
- Web頁面相似度搜索問題研究.pdf
- 形狀相似度算法研究及其在相似人臉匹配中的應(yīng)用.pdf
- 相似字符串匹配過濾算法研究.pdf
- 基于相似度的語義Web服務(wù)匹配研究.pdf
- 圖像檢索技術(shù)中相似性搜索方法研究.pdf
- 基于深度學習的相似圖像搜索算法研究.pdf
- 基于相似度計算的本體匹配方法研究.pdf
- 機械產(chǎn)品性能特征相似匹配方法研究.pdf
- 基于微分幾何的局部相似目標匹配算法研究.pdf
- 基于案例的手機故障相似度匹配算法研究.pdf
- 基于形態(tài)特征的時間序列相似性搜索研究.pdf
- 信息網(wǎng)絡(luò)中的相似度搜索問題研究.pdf
- 多元時間序列相似性搜索算法研究.pdf
- SQL程序結(jié)構(gòu)相似匹配及自動評估方法研究.pdf
- 具有學習能力的自搜索規(guī)則匹配的研究.pdf
- 基于匹配濾波的LTE小區(qū)搜索技術(shù)研究.pdf
- 基于大規(guī)模相似性搜索的Hashing算法研究.pdf
- 基于隱含語義哈希算法的相似性搜索研究.pdf
評論
0/150
提交評論