多樣性密度學習算法的研究與應用.pdf_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、多示例學習是與監(jiān)督學習、非監(jiān)督學習和強化學習并列的第四類學習框架,目前已廣泛應用于藥物設計、圖像搜索等領域,并已獲得很好的效果。在多示例學習中,訓練樣本是由多個示例組成的包,包是有概念標記的,但示例本身卻沒有概念標記,學習的目的是預測新包的類別。
  多樣性密度(DD)算法是一種典型的多示例學習算法,能夠根據概率學習到比較接近的目標函數,但DD算法尚存在兩點不足。首先,DD算法只學習到一個目標函數,該算法的學習能力有待提高;其次,

2、在預測新包時,如果一個包中至少包含一個正例,則該包是一個正包,否則即為反包,沒有考慮某些樣本存在正例稀疏的特點,在對重疊示例的包進行分類時,通常出現把反包誤分為正包的情況。
  首先,本文針對DD算法只能學習到一個目標函數的缺點,提出了多概念DD算法,多概念DD算法通過學習多個目標函數,較全面的描述目標概念。
  其次,本文針對在預測新包時,沒有考慮某些樣本存在正例稀疏的特點,提出了基于重疊示例的分類算法,該算法通過改變示例

3、在包分類時的影響策略,消除反包中個別示例的噪聲。
  本文在理論優(yōu)化的基礎上,將改進算法應用在圖像檢索和鑒別microRNA前體中。在圖像檢索中,將多概念DD算法與基于重疊示例的分類算法相結合,多概念DD算法全面獲得了讀者感興趣的概念,重疊示例的分類算法濾除了反包中個別有正例性質的噪聲,并且實驗結果優(yōu)于以前的DD算法;另外,本文使用多示例學習算法鑒別microRNA前體的真?zhèn)?,使用重疊示例的分類算法對真?zhèn)蝝icroRNA前體進行分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論