文档库

最新最全的文档下载
当前位置:文档库 > NCBI在线Blast的图文说明

NCBI在线Blast的图文说明

NCBI在线Blast的图文说明

Posted on 14 五月 2009 by 柳城,阅读 4,824 简洁版

Blast(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST 结果中的得分是对一种对相似性的统计说明。

BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。

Blast中常用的程序介绍:

1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

NCBI在线Blast的图文说明

2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。

NCBI在线Blast的图文说明

3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。

NCBI在线Blast的图文说明

4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX 相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。

NCBI在线Blast的图文说明

NCBI在线Blast的图文说明

5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。

6,blast结果的描述区域。注意分值与E值。分值越大越靠前了,E值越小也是这样。

NCBI在线Blast的图文说明

7,blast结果的详细比对结果。注意比对到的序列长度。评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。加上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1405,看Identities这一值,才匹配到1344bp,而输入的序列长度也是为1344bp(看上面的图),就说明比对到的序列要长一点。由Qurey(起始1)和Sbjct(起始35)的起始位置可知,5'端是是多了一段的。有时也要注意3'端的。

NCBI在线Blast的图文说明

附:

E值(Expect):表示随机匹配的可能性,E值越大,随机匹配的可能性也越大。E值接近零或为零时,具本上就是完全

匹配了。

一致性(Identities):或相似性。匹配上的碱基数占总序列长的百分数。

缺失或插入(Gaps):插入或缺失。用"—"来表示。

本文详细出处参考:http://www.wendangku.net/doc/1ffa514efe4733687e21aae2.html/475/

Peptide Sequence Databases蛋白序列的数据库

nr

All non-redundant GenBank CDS translations + RefSeq Proteins + PDB + SwissProt + PIR + PRF

所有非冗余的的GenBank CDS区的翻译序列 + 参考序列的蛋白 + PDB数据库 + SwissProt蛋白数据库 + PRF蛋白数据

refseq

RefSeq protein sequences from NCBI's Reference Sequence Project.

所有NCBI的参考序列

swissprot

Last major release of the SWISS-PROT protein sequence database (no updates).

swissprot的蛋白数据库

pat

Proteins from the Patent division of GenPept.

专利的蛋白数据库

pdb

Sequences derived from the 3-dimensional structure from Brookhaven Protein Data Bank.

PDB数据库

month

All new or revised GenBank CDS

translation+PDB+SwissProt+PIR+PRF released in the last 30 days.

一个月内新增加的蛋白序列

env_nr

Protein sequences from environmental samples.

来自environmental samples的蛋白序列

Nucleotide Sequence Databases核酸数据库

nr

All GenBank + RefSeq Nucleotides + EMBL + DDBJ + PDB sequences (excluding HTGS0,1,2, EST, GSS, STS, PAT, WGS). No longer "non-redundant".

所有GenBank的核酸序列 + 参考序列中的核酸序列+ EMBL +DDBJ +PDB核酸序列(但不包括HTG,EST,GSS等序列)

refseq_rna

RNA entries from NCBI's Reference Sequence project

NCBI参考序列中的核酸序列

refseq_genomic

Genomic entries from NCBI's Reference Sequence

project

NCBI参考序列中的基因组序列

est

Database of GenBank + EMBL + DDBJ sequences from EST Divisions

来自GenBank + EMBL + DDBJ 的EST序列

est_human

Human subset of est.

人的EST序列

est_mouse

Mouse subset.

小鼠的EST序列

est_others

Non-Mouse, non-Human subset of est.、

除了人与小鼠之外的EST序列

gss

Genome Survey Sequence, includes single-pass genomic data, exon-trapped sequences, and Alu PCR sequences.

htgs

Unfinished High Throughput Genomic Sequences: phases 0, 1 and 2 (finished, phase 3 HTG sequences are in nr)

未发布的高通量的基因组测序

pat

Nucleotides from the Patent division of GenBank.

专利的核酸序列

pdb

Sequences derived from the 3-dimensional structure from Brookhaven Protein Data Bank

PDB核酸序列

month

All new or revised GenBank + EMBL + DDBJ + PDB sequences released in the last 30 days.

一个月内新增的核酸序列

dbsts

Database of GenBank+EMBL+DDBJ sequences from STS Divisions .

STS数据库

chromosome

A database with complete genomes and chromosomes from the NCBI Reference Sequence project..

NCBI参考序列计划中所有的完整基因组和染色体序列

wgs

A database for whole genome shotgun sequence entries. 基因组鸟枪法测序得到的序列

env_nt

Nucleotide sequences from environmental samples, including those from Sargasso Sea and Mine Drainage projects.

来自environmental samples的核酸序列。

本文详细出处参考:http://www.wendangku.net/doc/1ffa514efe4733687e21aae2.html/476/