文档库 最新最全的文档下载
当前位置:文档库 › ncbi中查找基因序列的方法和三个登录号

ncbi中查找基因序列的方法和三个登录号

ncbi中查找基因序列的方法和三个登录号
ncbi中查找基因序列的方法和三个登录号

ncbi中查找基因序列的方法和三个号码

一.例子:查找酿酒酵母(Saccharomyces cerevisiae)里的海藻糖合成酶基因(tps1)

即可出现很多条目,找到Saccharomyces cerevisiae的就是NC_001134了,点击后就进入该基因所在染色体的界面了,再在“编辑”中“查找”tps1就可以看该基因所在的位置,再点击CDS或者GeneID:852423都可以出现相关链接!

当然,如果你在文献查到目的蛋白的序列号如NP_009684.1或者GeneID:852423,那分别在Search后选择Protein或者Gene也可以出现相关链接!

二.基因CDS区界面的3个号码

https://www.wendangku.net/doc/2a7664203.html,/entrez/viewer.fcgi?val=50593115&from=488899&to=490386& view=gbwithparts

找到后,我发现该界面有3个标记,一个是NC_001134 ,其次是gi:50593115,最后是FEATURES中的gene中的/db_xref= “GeneID:852423”,他们分别是什么号码,用在什么地方呢?尝试中,终于发现,

在Search“Nucleotide”或者“Core Nucleotide”时,for后面是NC_001134,最终go 到该基因所在染色体全长序列的信息,所以NC_001134应该是该染色体的登录号吧?

在Search“Nucleotide”或者“Core Nucleotide”时,for后面是50593115,最终go到该基因所在染色体全长序列的信息,所以50593115应该是该染色体的号吧?

在Search“Gene”时,for后面是852423,最终go到该基因的信息,所以852423应该是该基因的登录号吧?所以我们如果要记住目的基因在ncbi中的位置就记住这个GeneID!

其他像NP_009684当然是基因编码的蛋白质的登录号啦,不说了。

我们在文献中查到的基因往往给的是Gene ID

三.引物设计第一步--找编码序列的方法

在Search“Gene”时,for后面是852423,最终go到目的基因的信息

点击中的FASTA,获得的就是mRNA的非模

板链(其实就是mRNA里的U换成了T),也可以说是CDNA的互补片段,因为与编码的蛋白质一一对应,所以也就是引物设计真正的模板!引物设计后面的PCR要克隆的就是这段序列!所以千万不要搞错了!点击GENBANK,获得的是CDS区的序列和相关信息,这个CDS区包括CDNA,也包括其他不编码的序列,所以PCR没必要把CDS区全部克隆出来!其实在CDS界面(或者说点击GENBANK后出现的界面里),把Display里的GENBANK (full)改成FASTA也可以!

其实在该界面中我们还可以了解到其他信息

1.点击reference sequence details,可以看到NP_009684.1,点击他,可以看到目的蛋白质

的信息

2.点击获得的是目的基因的图谱,然后点击

TPS1后面的sv,也可以看到编码序列了,当然这里的DNA序列和蛋白质一一对应,更说明是设计引物的模板(这个图谱界面也可以在2的点击GENBANK后获得的CDS区中点击852423链接获得,或者说条条链接通罗马!)

四.关于CDS和CDNA的关系

ncbi中的CDS就是编码序列,包括CDNA全部,也含有其他序列,毕竟CDNA是人为根据mRNA反转录得到的,而CDS区生物本身的,有些不编码的序列,好像CDNA是纯净物,CDS有点渣子,呵呵。CDNA的互补序列既然是与编码的蛋白质一一对应的,当然是ATG起始的,TAA TAG TGA终止的。

相关文档