樸素貝葉斯分類器預測擬南芥蛋白質相互作用及蛋白質功能注釋.pdf_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、蛋白質是生命體功能真正的執(zhí)行者,而蛋白質之間的相互作用在大多數(shù)的生物學過程比如細胞代謝、轉錄、調控機制、信號傳導中發(fā)揮著重要作用。擬南芥基因組的測序完成后,有關功能基因組的研究已經全面展開。研究擬南芥蛋白質相互作用,特別是識別那些擬南芥特有的蛋白質,對于了解擬南芥蛋白質功能有著非常重要的作用。后基因組時代的到來為生物信息學在全基因組范圍預測擬南芥蛋白質相互作用提供了豐富的數(shù)據和信息。近年來隨著大規(guī)模實驗技術、比較基因組學、生物信息學的發(fā)

2、展,在蛋白質相互作用研究領域涌現(xiàn)出了各種預測方法,但是不同方法之間存在巨大差異,有其內在的偏好性。有機地整合不同的方法,對每種方法取長補短成為現(xiàn)階段的研究熱點。
  本論文中首先收集了有助于預測擬南芥蛋白質相互作用的基因組數(shù)據以及蛋白質組數(shù)據,包括4種模式生物的共14987對蛋白質相互作用數(shù)據、3020對蛋白質功能域相互作用數(shù)據、擬南芥蛋白質功能域組成數(shù)據117090條、5組實驗的445張芯片的不同擬南芥生物樣本的基因表達譜數(shù)據、

3、1960組擬南芥蛋白質生物功能注釋數(shù)據、以及261種其他物種基因組序列數(shù)據。同時使用了現(xiàn)階段在全基因組范圍內預測蛋白質相互作用的方法,如基于蛋白質相互作用跨物種的保守性理論(Ortholog)、基因表達譜相似理論(Co-Expression)、功能結構域相互作用理論(Domain Pair Interaction)、最小共享生物途徑理論(Share BiologicalProcess)、基因系統(tǒng)發(fā)生譜理論(Gene phylogenet

4、ic profiles method)、基因融合理論(Gene Fusion method)、基因鄰近理論(Gene Neighbors method)等預測理論。
  論文中對以上理論進行檢驗并針對樸素貝葉斯分類器進行優(yōu)化。樸素貝葉斯分類器是一種簡單高效的分類算法,被廣泛應用于整合離散型數(shù)據類型。本論文中搜集的DIP、Bind、IntAct、TAIR等數(shù)據庫、文獻搜集到的擬南芥蛋白質相互作用集合同4666對相互作用作為正極數(shù)據和

5、基因本體論注釋數(shù)據庫的亞細胞定位數(shù)據構建196855對蛋白質相互作用作為負極數(shù)據構成樸素貝葉斯分類器的訓練集。本文使用樸素貝葉斯分類器,結合構建的訓練集,對擬南芥全部蛋白質進行相互作用預測。最后預測得到了22622對相互作用的蛋白對,并通過預測的擬南芥蛋白質相互作用構建了擬南芥蛋白質相互作用數(shù)據庫(ATPID)。結合擬南芥鹽堿脅迫蛋白質構建了擬南芥鹽脅迫下的蛋白質相互作用網絡,揭示了其中重要的功能模塊,同時還運用預測的蛋白質相互作用網絡

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論