基于保守結(jié)構(gòu)域比對在22周人胎肝EST庫中發(fā)現(xiàn)新轉(zhuǎn)錄因子.pdf_第1頁
已閱讀1頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、研究目的:肝臟是人體代謝的主要器官,具有分泌膽汁、解毒以及吞噬、防御等重要的生理功能。此外,在4-6月孕齡時,人胎肝還是造血、免疫、肝臟系統(tǒng)干祖細胞及其基質(zhì)細胞的來源,其中的造血干細胞可向各系成熟的血細胞發(fā)育分化。 復雜的生命現(xiàn)象在很大程度上是由大量受嚴格調(diào)控的基因的表達所決定的。真核細胞基因表達調(diào)控的關(guān)鍵步驟是轉(zhuǎn)錄調(diào)控,其機制十分復雜,涉及大量的轉(zhuǎn)錄因子和核內(nèi)調(diào)控基因。據(jù)估計在人類的基因中含有2000-3000種轉(zhuǎn)錄因子(tr

2、anscription factor,TF),而22周的人胎肝(Human Fetal nver aged 22 Weeks,HFL22W)cDNA文庫中已知的轉(zhuǎn)錄因子與轉(zhuǎn)錄調(diào)控因子僅95種<'[1]>,因此胎肝中很可能存在一些尚未發(fā)現(xiàn)的、在生理過程及重要疾病(如腫瘤)的發(fā)生、發(fā)展中扮演重要角色的轉(zhuǎn)錄因子。 近年來,基因組和蛋白質(zhì)組以及生物信息學的發(fā)展,使高通量地對轉(zhuǎn)錄因子進行篩選、鑒定和功能研究成為可能。這方面的實驗和技術(shù)均以

3、轉(zhuǎn)錄因子的結(jié)構(gòu)特征和作用特點為基礎(chǔ),對具有特定功能或特定結(jié)構(gòu)域的轉(zhuǎn)錄因子進行篩選。本文基于對轉(zhuǎn)錄因子各家族同源序列及結(jié)構(gòu)域的分析研究,對HFL22W EST數(shù)據(jù)庫中含有轉(zhuǎn)錄因子保守結(jié)構(gòu)域的序列進行總結(jié)歸納和分類,以期能規(guī)模化地篩選出未知轉(zhuǎn)錄因子。 首先,我們下載TRANSFAC 6.0轉(zhuǎn)錄因子數(shù)據(jù)庫中4218個轉(zhuǎn)錄因子文件,從中提取轉(zhuǎn)錄因子序列并格式化為FASTA格式數(shù)據(jù)庫一提取轉(zhuǎn)錄因子中各特征性的、保守的結(jié)構(gòu)域的蛋白質(zhì)序列,格

4、式化并送入FASTA格式數(shù)據(jù)庫。TRANSFAC由德國國家生物工程研究中心建立并管理,是關(guān)于轉(zhuǎn)錄因子及其在基因組上的結(jié)合位點和與DNA結(jié)合的profiles數(shù)據(jù)庫<'[2]>,由SITE、GENE、FACTOR、CLASS、MATRIX、CELLS、METHOD和REFERENCE等數(shù)據(jù)表構(gòu)成。 本實驗室采用cDNA大規(guī)模測序策略對22周齡人胎肝cDNA文庫進行大規(guī)模測序,獲得了20282條EST。經(jīng)過電子延伸、拼接、分類得到2

5、125個已知基因和2800個未知基因。我們以ATGpr程序分析這些未知基因序列的ORF并翻譯成蛋白質(zhì)序列。本文采取的策略是用ATGpr預測未知基因序列,選其結(jié)果中具有最大可信度(Reliabilitv)或有最大的長度的兩條ORF,并滿足Reliabilitv>0.12<'[3]>,length>70,有終止密碼子。 我們使用兩種不同的篩選方法:(一)對轉(zhuǎn)錄因子中各特征性的保守結(jié)構(gòu)域構(gòu)建這些模體的正則表達式?;谶@些共有模體的正則

6、表達式對HFL22W cDNA翻譯蛋白質(zhì)序列庫規(guī)?;乇葘Σ檎?,篩選出含有某類轉(zhuǎn)錄因子特征性結(jié)構(gòu)域的cDNA翻譯蛋白質(zhì)序列作為候選序列。(二)采用MEME軟件分析各類轉(zhuǎn)錄因子的保守結(jié)構(gòu),并根據(jù)分析結(jié)果在HFL22W cDNA翻譯蛋白質(zhì)序列庫中尋找候選序列。 進一步分析候選序列,與其它轉(zhuǎn)錄因子結(jié)構(gòu)域進行比對及其它生物信息學分析,確定其是否可能是一個新的未知轉(zhuǎn)錄因子。 結(jié)果:按類別對轉(zhuǎn)錄因子作分析和發(fā)掘,對找到的轉(zhuǎn)錄因子候選

7、序列作了進一步的生物信息學分析,從類型、數(shù)目、位置、結(jié)構(gòu)、功能等方面對序列中預測的結(jié)構(gòu)域作了綜合分析。 (一)數(shù)據(jù)和數(shù)據(jù)處理 編寫Perl程序從TRANSFAC轉(zhuǎn)錄因子文件中提取所需要的信息,構(gòu)建了全部轉(zhuǎn)錄因子序列和結(jié)構(gòu)域序列的數(shù)據(jù)庫文件。 我們對2800個未知基因的序列進行了ORF分析和蛋白質(zhì)預測,并以所預測的蛋白質(zhì)序列作為篩選轉(zhuǎn)錄因子的候選序列。編寫了perl程序從ATGpr的輸出結(jié)果中提取了1503條ORF

8、翻譯蛋白序列作為預測轉(zhuǎn)錄因子的候選序列集合,其中1010條同時有最長ORF長度和最大可信度,271條有最長ORF長度,222條有最大可信度。與轉(zhuǎn)錄因子序列類似,我們構(gòu)建了這些蛋白質(zhì)序列的數(shù)據(jù)庫文件,以FASTA格式文件存儲。 (二)C0002類轉(zhuǎn)錄因子的分析與發(fā)掘 TRANSFAC的C0002類轉(zhuǎn)錄因子是Cys4 zinc finger of nuclear receptor type轉(zhuǎn)錄因子,即具有Cys4型鋅指結(jié)構(gòu)的

9、細胞核受體型蛋白。這一類轉(zhuǎn)錄因子的共同特征是具有兩個不同大小、組成和功能的鋅指結(jié)構(gòu)。 我們采用了兩種方法查找C0002類的轉(zhuǎn)錄因子: 1.以鋅指結(jié)構(gòu)域正則表達式比對數(shù)據(jù)庫 構(gòu)建鋅指結(jié)構(gòu)域正則表達式,用程序regexp_FL22W對上述正則表達式查找HFL22W蛋白序列庫。結(jié)果匹配到2條蛋白序列(C4992、F0418),并確定了鋅指結(jié)構(gòu)的位置。 2.MEME軟件分析 MEME程序是一套模體分析工具

10、,是基序啟發(fā)的多EM(Multiple EM for MotifElicitation)的縮寫,EM指期望值最大化(Expectation Maximization),是統(tǒng)計學中預測丟失值或未觀察到的值的方法。MEME的結(jié)果與第一種方法的結(jié)果一致,找到同樣的序列和鋅指結(jié)構(gòu)。 用BLAST比對其它轉(zhuǎn)錄因子結(jié)構(gòu)域分析了兩條序列。用prosite對兩條序列作進一步生物信息學分析。 (三)C0001類轉(zhuǎn)錄因子的分析與發(fā)掘

11、 TFⅢA/Krueppel類型轉(zhuǎn)錄因子含Cys2His2型鋅指結(jié)構(gòu)。每個鋅指結(jié)構(gòu)包含2個半胱氨酸和2個組氨酸殘基配位一個鋅離子,有時其中一個組氨酸可以被一個半胱氨酸取代<'[4]>。鋅離子對與DNA結(jié)合起重要作用。 同樣以鋅指結(jié)構(gòu)域正則表達式比對數(shù)據(jù)庫和以MEME軟件兩種方法分析發(fā)掘轉(zhuǎn)錄因子。 1.用程序regexp_FL22W以正則表達式查找HFL22W蛋白質(zhì)序列庫,找到17條蛋白質(zhì)序列。這17條序列與其它轉(zhuǎn)錄因子結(jié)

12、構(gòu)域作BLAST比對,有6條序列匹配到與轉(zhuǎn)錄激活或其它功能相關(guān)的轉(zhuǎn)錄因子結(jié)構(gòu)域。 2.以MEME軟件分析 結(jié)果找到16條序列,與第一種方法找到的重復。 對6條序列進行了SMART結(jié)構(gòu)分析和二級結(jié)構(gòu)預測,結(jié)果顯示了與轉(zhuǎn)錄因子及其結(jié)構(gòu)域相關(guān)的提示。 結(jié)論:基于已有的EST數(shù)據(jù)庫和轉(zhuǎn)錄本數(shù)據(jù)庫,使用生物信息學的分析方法,通過對轉(zhuǎn)錄因子特有序列的同源性搜索篩選新的轉(zhuǎn)錄因子,具有快速、全面、規(guī)?;葍?yōu)勢,可以為轉(zhuǎn)錄

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論