NCBI信息查询
1.按照下列步骤进行查询:
1)检索核酸序列库(主要是Genbank),Nymphaeaceae(睡莲科):
进入NCBI主页,https://www.wendangku.net/doc/4a15559815.html,;
选库“nucleotide”(主要是Genbank),索引框中输入“Nymphaeaceae”,检索;
在目录中找到Accession: FJ416902.1的记录,点击进入;
查看其Genbank格式记录中的各种信息;用Fasta 格式显示(左上角)。
(问题:Fasta格式和Genbank格式有什么不同,它由哪几部分组成?)
拷贝序列(从“>”开始,即包括注释行),备份至word 文档--- blast.doc。
2)试用BLASTn(用以上拷贝的序列):
点击NCBI主页右侧栏(Popular Resources)的BLAST链接,进入Blast网页,然后选择Basic BLAST 下面的“nucleotide BLAST”;
将上面所拷贝的序列(Fasta格式,从“>”开始,包括注释行)粘贴到序列输入窗口;
选库“nucleotide collection(nr/nt)”(主要是Genbank);选Optimize for: BLASTn。
按BLAST键,进入等待界面,等待数秒或数十秒,进入BLAST查询结果画面;
观察BLAST查询结果的题头信息——
理解各项所代表的意义。问题:左侧栏中Description的内容是什么?来源于哪里?
观察此查询结果的具体内容:
A. Graphic summary: Distribution of N Blast Hits on the Query Sequence;
B. Descriptions: Sequences producing significant alignments(注意:分数最高的应该就是你所拷贝片断的来源序列, E值随分数降低而增大);
C. Alignments(具体比对);其实,在上面的Graphic summary点击命中序列的色条,可直接进入相应的Alignments信息。
将上述Blastn 的三种结果也拷贝到blast.doc。
作业:自己按照此思路设计一个例子(换个关键词),并仔细观察理解“沿途经过”的
各个页面的各种信息。将你的例子的结果信息(包括Fasta格式的提交序列和Blast的三种结果)存到另一个以你名字命名的word文档,删减压缩至两页以内,打印出来,下次理论课时由学习委员统一上交。
2.练习(在以上任务完成后可以做):
1)学用“Entrez”集成检索工具:进入NCBI主页,选库“All Database”,索引框输入“DCC AND "V ogelstein B" [AU]”(DCC是指“直肠癌”),等待跨库检索的结果。点击Nucleotide 库的检索命中链接,看相关的记录。点击题目链接可看具体信息页面,点击右侧“Links”菜单,选相关链接,如“gene”,“protein”,和“PubMed”看相关信息,等等……甚至可以直接Blast此序列(找到了直接Blast的链接了吗?)。
2)以“DCC”为关键词,试查询Unitprot:https://www.wendangku.net/doc/4a15559815.html,/中的相关信息。
3)用类似刚才试用BLASTn的方法试用BLASTp,注意程序选择和库选择,详细观察查询结果。