-
如何預(yù)測(cè)新基因編碼蛋白的氨基酸序列
發(fā)布時(shí)間: 2021-08-21 點(diǎn)擊次數(shù): 2294次當(dāng)我們想研究一個(gè)新基因的功能時(shí),我們首先預(yù)測(cè)一下它是否編碼蛋白,如果編碼蛋白,那編碼出的蛋白的最有可能的氨基酸序列是什么?
當(dāng)我們預(yù)測(cè)出該基因編碼的蛋白的氨基酸序列后,在數(shù)據(jù)庫(kù)中比對(duì),如果比對(duì)出了一個(gè)高度相似的已知蛋白,那我們可以根據(jù)該蛋白的功能來(lái)大概的推測(cè)我們要研究的新基因所編碼的蛋白的功能,這將為我們之后研究該新基因的功能提供方向。
接下來(lái)我們就來(lái)說(shuō)一下怎樣預(yù)測(cè)一個(gè)新基因編碼的蛋白的氨基酸序列。首先我們需要做的就是通過(guò) 5’- and 3’-RACE 技術(shù)得到該基因的全長(zhǎng) cDNA 序列,然后按以下步驟進(jìn)行即可。
1.首先打開(kāi):web.expasy.org/translate/
2.將 DNA/RNA 序列輸入白色框中(應(yīng)輸入 cDNA 序列)
3.點(diǎn)擊下方的 TRANSLATE SEQUENCE。
4.點(diǎn)擊 TRANSLATE SEQUENCE 后會(huì)看到如下結(jié)果(紅色部分為可能的該段 DNA 序列的 ORF 編碼的氨基酸,因?yàn)檩斎?cDNA 序列后,并不是該段序列上的所有堿基都用來(lái)編碼氨基酸, 而是只有位于 ORF 框內(nèi)的堿基用來(lái)編碼氨基酸,ORF 是不確定,所以編碼的蛋白也不確定,那我們現(xiàn)在要做的就是得到最有可能的 氨基酸序列,紅色區(qū)域?yàn)楦鞣N可能)。
5.一般我們認(rèn)為紅色最多(即最長(zhǎng))的就是該段 cDNA 序列編碼的氨基酸序列。
6.因?yàn)榈谝粋€(gè)紅色最多(即最長(zhǎng)),那接下來(lái)就點(diǎn)擊第一個(gè)。
7.點(diǎn)擊進(jìn)入后會(huì)看到以下結(jié)果,我們會(huì)看到紅色中有許多的藍(lán)色字母(畫(huà)紅線的部分),如果我們仔細(xì)看了之后會(huì)發(fā)現(xiàn)藍(lán)色部分就是M---甲硫氨酸,我們都知道真核蛋白的起始氨基酸都是甲硫氨酸,也就是說(shuō)畫(huà)紅線的部分就是可能的起始氨基酸部分,那只有一個(gè)是最有可能的,那就是使氨基酸序列最長(zhǎng)的。因?yàn)橄聢D的結(jié)果中只有一個(gè)終止------在最后面,那我們選擇第一個(gè)劃線的 M 作為起始氨基酸使編碼的氨基酸序列最長(zhǎng) ,所以第一個(gè)M 最有可能是起始氨基酸。
8.那接下來(lái)就點(diǎn)擊第一個(gè)藍(lán)色的M,點(diǎn)擊后進(jìn)入會(huì)看到以下結(jié)果(紅色框內(nèi)即為該段cDNA序列最有可能編碼的氨基酸序列)
9.我們還可以看到在結(jié)果的的最下方有一些工具(點(diǎn)擊第一個(gè)劃線部分可以得到該段氨基酸序列的 Fast 格式。那下方的四個(gè)劃線部分就是一些分析蛋白氨基酸序列的一些工具,比如可以拿該段氨基酸序列在數(shù)據(jù)庫(kù)中 Blast,劃線部分的這些工具就是對(duì)該段氨基酸序列進(jìn)行進(jìn)一步的分析,得到有關(guān)該段氨基酸序列更多的信息)。
-
血清系列
-
細(xì)胞轉(zhuǎn)染
-
支原體清除
-
細(xì)胞凍存
-
實(shí)驗(yàn)耗材
-
分子試劑
-
細(xì)胞增殖與凋亡
-
Biozellen系列
-
培養(yǎng)基
-
ELISA試劑盒
-
TOYOBO(東洋紡)
-
ZYMO RESEARCH
-
Greiner(格瑞納)
-
IKA(艾卡)
-
化學(xué)發(fā)光底物(ECL)
-
PROSPEC系列
-
Epigentek系列
-
微生物檢測(cè)
-
細(xì)胞生物學(xué)
-
Corning康寧
-
解離試劑
-
細(xì)胞類-實(shí)驗(yàn)耗材
-
原代細(xì)胞
-
植物檢測(cè)系列試劑盒
-
SERANA
-
細(xì)胞系
-
生化試劑盒
-
環(huán)境檢測(cè)系列試劑盒(AKEN)
-
類器官培養(yǎng)
-
緩沖器和解決方案
-
生物三凝膠基質(zhì)
-
細(xì)胞因子分子
-
生物樣本庫(kù)