肽結構表征及統(tǒng)計建模方法學研究與應用.pdf_第1頁
已閱讀1頁,還剩191頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、肽作為一種極為重要的生物活性物質,它在諸多生理和生化過程中扮演著中心角色。統(tǒng)計學方法研究肽的結構與功能關系需要解決分子結構表征和統(tǒng)計建模兩方面問題。本文以此為入手點,通過提出、改進、引入和比較一系列表征方法和建模工具對肽的統(tǒng)計模擬方法學進行了系統(tǒng)研究。在肽的結構表征方面,本文在三個層次開展了探索工作:①定義了用于描述肽組成殘基單元的氨基酸理化性質歸類得分(DPPS)和拓撲標度(T標度),是為第一層次的單元參數化方法。②提出了用于表征不等

2、長肽序列氨基酸組成及其交互信息的氨基酸組成/環(huán)境作用描述子(ACD/EID)系統(tǒng),是為第二層次的序列參數化方法。③設計了基于自洽平均場理論/旋轉異構子庫的側鏈構象分析(SCSA)方法和量子力學/分子力學.泊松波爾茲曼/表面加和模型(QM/MM-PB/SA)組合策略用于分析處于復合狀態(tài)的肽/蛋白質結合自由能,是為第三層次的結構參數化方法。在肽的統(tǒng)計建模方面,本文主要做了以下幾點工作:①新方法的應用:首次將新型機器學習算法高斯過程(GP)和

3、隨機森林(RF)應用到肽的統(tǒng)計模擬領域,探討了它們與傳統(tǒng)建模方法的性能差異。②新方法的提出:將遺傳算法(GA)用于GP變量選擇以期提高后者建模質量,從而得到了GA/GP:將免疫算法(IA)與神經網絡(NN)加以嵌合以期避免后者單獨建模時存在的諸多問題(如低效率、過擬合和局部極小等),從得到了免疫神經網絡(INN)。③建模方法的系統(tǒng)比較:通過對八種統(tǒng)計回歸方法用于肽統(tǒng)計建模所表現出的多種性能進行系統(tǒng)比較給出了這些方法的應用指導參考。④樣本

4、集劃分方法的設計:專門為肽類樣本集劃分而設計了一種有效無偏的方法SpScore,該法可以實現劃分所得訓練集/測試集內部多樣性和外部相似性的最佳平衡。⑤軟件開發(fā):在Matlab環(huán)境下開發(fā)了多類統(tǒng)計建模方法的統(tǒng)一實現平臺ZP-emplore,并對其進行了系統(tǒng)的測試。下面對這些方法的具體應用做一個概要介紹。
   采用T標度結合最小二乘回歸(PLS)、支持向量機(SVM)和免疫神經網絡(INN)對血管緊張素轉化酶(ACE)抑制二肽和彈

5、性蛋白酶模擬底物進行了定量序效模擬研究,效果良好。結果表明,ACE抑制劑生物功能主要與單個氨基酸的拓撲性質密切相關,尤其是二位殘基體積大小直接影響著二肽對ACE的抑制效力;而彈性蛋白酶模擬底物的酶催化反應動力學特征則遠為復雜,其主要取決于殘基拓撲性質二次項和交互項的非線性作用。
   使用DPPS和SCSA在不同水平對人類HLA~A-0201蛋白/抗原九肽識別和結合過程的非鍵性質加以表征并與實驗親和力進行線性相關建模研究,確認基

6、于氨基酸殘基單元的DPPS描述子和基于復合物結構性質的SCSA方法皆可取得滿意的建模效果。對所得統(tǒng)計模型分析可知,HLA-A~0201對抗原肽識別受疏水和氫鍵影響為甚,靜電次之,立體效應作用最小;九肽的錨定殘基P2和P9位對結合貢獻最大,其次為第二錨定殘基P1、P3和P7,而非錨定殘基P4、P5、P6和P8影響輕微。此外還發(fā)現,長期被忽視的構象熵損失亦在抗原提呈過程中發(fā)揮重要效應。
   應用QM/MM-PB/SA策略對OppA

7、蛋白/三肽復合物晶體結構進行分析,通過能量分解、位點對比和統(tǒng)計模擬初步揭示了OppA對肽識別所表現出的廣泛特異性的分子機制:肽的N端和主鏈只對結合貢獻巨大的穩(wěn)定化自由能,但未對不同肽配基進行特異性區(qū)分;主要發(fā)生于肽側鏈的去溶劑化效應由于OppA活性口袋水合空腔的存在而極大地抵消了它對結合特異性的貢獻;大的中心殘基與周圍基質的不利立體碰撞可在一定程度上被有利的去溶劑化自由能(對疏水殘基而言)或長程靜電吸引(對極性殘基而言)所補償,從而不會

8、顯著增加其特異性表型。
   GA/GP結合SpScore樣本劃分技術用于雙載蛋白SH3域/十肽配基親和力分析,通過對肽配基各個位點性質選擇和統(tǒng)計建模得到了定量親和力預測模型,在此基礎上系統(tǒng)地探討了肽的結構特征對活性影響情況。分析GP超參數得知,肽的組成殘基性質與親和性之間存在線性月乍線性混合函數依賴關系,且以非線性為主。另外,多樣的非鍵性質對SH3域/肽結合貢獻顯著;特別地,P2位的立體和疏水性、P0位的電子性質及P-3位的靜

9、電和氫鍵對十肽配基的親和力起決定性作用。
   基于GA變量選擇,采用幾類機器學習方法模擬了一組組氨酸富含肽在金屬螯合色譜柱上的保留行為。結果表明,GA可以有效改善不同方法的統(tǒng)計建模性能及所得模型的穩(wěn)定性和預測能力。最優(yōu)GA/GP模型認為,肽的結構特征與色譜保留行為之間存在較為明顯的非線性聯系,同時線性因素也扮演了重要的角色;在各類結構性質中,配位作用和靜電貢獻對肽的保留行為影響最甚,而其他因素諸如溶劑和氫鍵也發(fā)揮了重要的功效。

10、
   基于ACD/EID描述子系統(tǒng),將八類回歸技術應用于統(tǒng)計模擬研究大腸桿菌(Ecoil)蛋白質組肽片段的液相色譜保留時間。通過對不同統(tǒng)計建模工具在擬合度、穩(wěn)定性、預測力、無偏性、解釋性和計算效率等多方面性能的系統(tǒng)比較可知,非線性方法比線性方法建模效果更佳但也更為耗時;在非線性方法中高斯過程和誤差反傳神經網絡具有最優(yōu)的穩(wěn)定性、無偏性和預測能力,其次為徑向基神經網絡和隨機森林,而兩類支持向量機表現最差。進一步對不同模型深入分析發(fā)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論