生物網(wǎng)絡分析及其在復雜疾病研究中的應用.pdf_第1頁
已閱讀1頁,還剩95頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、如何診斷和治療以癌癥為代表的復雜疾病一直是生物醫(yī)學研究的重點和難點。但這方面的研究長期以來受限于生物實驗技術和實驗結果分析技術,沒能取得重大的突破。高通量生物技術的快速發(fā)展為復雜疾病的研究提供了海量的數(shù)據(jù)來源,尤其是以基因調控網(wǎng)絡和蛋白質相互作用網(wǎng)絡為代表的生物網(wǎng)絡很好的表示了生物大分子間的復雜關系,為復雜疾病的研究提供了很好的數(shù)據(jù)支持。正是由于這類生物網(wǎng)絡數(shù)據(jù)的大量積累,研究人員迫切的需要新的分析技術對生物網(wǎng)絡進行分析,并最終對復雜疾

2、病的研究、診斷和治療提供支持。
   本文從評估生物大分子間相互作用數(shù)據(jù)的可靠性出發(fā),對圖聚類、多數(shù)據(jù)融合的動態(tài)網(wǎng)絡構建等技術進行了研究,最終將這些分析技術應用到復雜疾病的疾病基因和生物過程的識別中。主要的研究工作包括:
   針對目前高通量實驗技術所產(chǎn)生的生物網(wǎng)絡存在假陽性高和假陰性高的問題,利用Gene Ontology注釋信息和語義相似性對現(xiàn)有的蛋白質相互作用數(shù)據(jù)的可靠性進行評估,通過統(tǒng)計分析和機器學習尋找最適合于

3、評估蛋白質相互作用可靠性的語義相似性定義。
   現(xiàn)在直接從公開數(shù)據(jù)庫中得到的生物網(wǎng)絡都是靜態(tài)的,但這顯然沒有反應出生物的動態(tài)性。我們通過對時序基因表達數(shù)據(jù)和組織特異性基因表達數(shù)據(jù)進行分析,并將其與現(xiàn)有的靜態(tài)生物網(wǎng)絡融合,構建出了具有一定時空動態(tài)特性的生物網(wǎng)絡,并對這種動態(tài)網(wǎng)絡進行了基本的分析,并將其跟靜態(tài)網(wǎng)絡做了比較。
   現(xiàn)有的大部分用于從生物網(wǎng)絡中挖掘功能模塊和復合物的算法都只是基于生物網(wǎng)絡的拓撲結構。通過分析發(fā)

4、現(xiàn),關鍵蛋白質在功能模塊和復合物中的分布式不均勻的,而且功能模塊和復合物都存在核結構,因此在聚類過程中有必要對關鍵蛋白和非關鍵蛋白做不同的處理。據(jù)此,我們提出了基于關鍵蛋白質的圖聚類算法,EPOF。將該算法應用到酵母的蛋白質相互作用網(wǎng)絡上,通過GO富集分析和跟已知的復合物進行比較,EPOF算法的性能比其他同類算法有顯著提高。
   最后,在對生物網(wǎng)絡進行各種分析的基礎之上,我們利用圖聚類算法對疾病和藥物對照研究中的基因表達數(shù)據(jù)進

5、行分析,并用GO語義相似性對聚類結果進行比較,識別出跟疾病相關的生物過程。同時,我們還利用疾病的Gene Signature和生物網(wǎng)絡數(shù)據(jù)融合不同的Gene Signature,并識別出跟疾病有密切關系的基因。
   本文從生物網(wǎng)絡數(shù)據(jù)的預處理開始,研究了生物網(wǎng)絡的各種分析方法,最終將這些方法應用到復雜疾病的研究中,取得了較好的結果。本文的研究內容和成果,為從系統(tǒng)的角度對各種復雜疾病展開研究提供了支持,有助于推動我們對以癌癥為代

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論