文档库 最新最全的文档下载
当前位置:文档库 › NCBI_功能详细介绍

NCBI_功能详细介绍

NCBI_功能详细介绍
NCBI_功能详细介绍

GenBank Overview

基本信息

?什么是GenBank?GenBank是一个有来自于70,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。

?纪录样本- 关于GenBank的各个字段的详细描述,以及同Entrez搜索字段的交叉索引。

?访问GenBank - 通过Entrez Nucleotides来查询。用accession number,作者姓名,物种,基因/蛋白名字,还有许多其他的文本术语来查询。关于Entrez更多的信息请看下文。用BLAST来在GenBank和其他数据库中进行序列相似搜索。用E-mail来访问Entrez和BLAST可以通过Query 和BLAST服务器。另外一种选择是可以用FTP下载整个的GenBank和更新数据。

?增长统计- 参见公布通知的2.2.6(每个分类的统计),2.2.7(每个物种的统计),2.2.8(GenBank 增长)小节。

?公布通知,最新- 最近和即将有的变化,GenBank的分类,数据增长统计,GenBank的引用。

?公布通知,旧- 同上相同,是过去公布的统计。

?遗传密码- 15个遗传密码的概要。用来确保GenBank中纪录的编码序列被正确的翻译。(向)GenBank提交(数据)

?关于提交序列数据,收到accession number,和对纪录作更新的一般信息。

?BankIt - 用于一条或者少数条提交的基于WWW的提交工具软件。(请在提交前用VecScreen去除载体)

?Sequin - 提交软件程序,用于一条或者很多条的提交,长序列,完整基因组,alignments,人群/种系/突变研究的提交。可以独立使用,或者用基于TCP/IP的“network aware”模式,可以链接到其他NCBI的资源和软件比如Entrez和PowerBLAST。(请在提交前用VecScreen去除载体)?ESTs - 表达序列标签,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE 实验的cDNA序列。

?GSSs - 基因组调查序列,短的、单次(测序)阅读的cDNA序列,exon trap获得的序列,cosmid/BAC/YAC末端,及其他。

?HTGs - 来自于大规模测序中心的高通量基因组序列,未完成的(阶段0,1,2)和完成的(阶段3)序列。(注意:完成的人类的HTG序列可以同时在GenBank和Human Genome Sequencing页面上访问。)

?STSs - 序列标签位点。短的在基因组上可以被唯一操作的序列,用于产生作图位点。

?注:SNPs - 人类的和其他物种的遗传变异数据可以提交到NCBI数据库的单核苷酸多态性库中(dbSNP)。

国际核苷酸序列数据库合作组织

?GenBank,DDBJ,EMBL - 合作计划的概述,并链接到相应的主页。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)数据库共享的数据是每天都交换的,因此他们是相等的。数据纪录的格式和搜索方式可能会不一样,但是accession number,序列数据和注解都是一模一样的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相应纪录,得到的结果是完全一样的序列数据,参考内容等等。

?DDBJ/EMBJ/GenBank特性表—特性表格式和标准被合作数据库用在序列记录的注释上,使得数据共享成为可能,包括详细的描述生物特性和特性限定语的附录,以及IUPAC规定的核苷酸和氨基酸的代号。

FTP GenBank and Daily Updates

?GenBank普通文件格式—参见GenBank记录样本和在GenBank公布通知中的详细描述,下载大多数最近的完全公告和日常积累或非积累更新数据。

?ASN.1格式—摘要句法记号1,国际标准组织(ISO)数据表示格式,下载大多数最近的完全公告和日常积累或非积累更新数据。

?FASTA格式—定义行号后只跟随序列数据(示例),参见描述数据库的readme文件,包括nt.Z (每天更新的非冗余BLAST核酸数据库,包括GenBank+EMBL+DDBJ+PDB序列,但是不包括EST, STS, GSS, or HTGS序列),nr.Z(每日更新的非冗余蛋白质),est.Z, gss.Z, htg.Z, sts.Z,和其它文件。

分子数据库概览

核酸序列

?Entrez核酸—用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索核酸序列记录(在GenBank + PDB中)。更多的关于Entrez的信息见下。如果要检索大量数据,也可使用Batch Entrez(批量Entrez)。

?RefSeq — NCBI数据库的参考序列。校正的,非冗余集合,包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。

?dbEST —表达序列标签数据库,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。

?dbGSS —基因组调查序列的数据库,短的、单次(测序)阅读的cDNA序列,exon trap获得的序列,cosmid/BAC/YAC末端,及其他。

?dbSTS —序列标签位点的数据库,短的在基因组上可以被唯一操作的序列,用于产生作图位点。

?dbSNP —单核苷酸多态性数据库,包括SNPs,小范围的插入/缺失,多态重复单元,和微卫星变异。

完整的基因组

?参见下面Genome和Maps部分,包括各种物种资源,人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒。

?UniGene —被整理成簇的EST和全长mRNA序列,每一个代表一种特定已知的或假设的人类基因,有定位图和表达信息以及同其它资源的交叉参考。序列数据可以以cluster形式在Unigene网页下载,完整的数据可以从FTP站点repository/UniGene目录下下载。

o人类UniGene

o小鼠UniGene

o大鼠UniGene

o斑马鱼UniGene

?BLAST —将你的序列同核酸库中的的序列比较,检索相似的序列。(更详细的信息见下面Tools/Sequence相似搜索部分)

蛋白序列

?Entrez蛋白—用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索蛋白序列记录(在GenPept + Swiss-Prot + PIR + RPF + PDB中)。更多的关于Entrez的信息见下。如果要检索大量数据,也可使用Batch Entrez(批量Entrez)。

?RefSeq —NCBI数据库的参考序列。Curated, 非冗余集合包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。

?FTPGenPept —下载“genpept.fsa.Z”文件,这个文件包含了从GenBank/EMBL/DDBJ记录中翻译过来的FASTA格式的氨基酸序列,这些记录都有一到两个CDS特性的描述。

完整基因组

?参见下面Genome和Maps部分,包括各种物种资源,人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒。

?Entrez基因组—提供了一个编码区的概要和各种物种的分类表(TaxTable)。编码区概要列出了在基因组中所有的的蛋白,并提供链接到FASTA文件和BLAST。分类表总结了蛋白BLAST 分析的结果,建议他们的可能功能,并用颜色编码的图来显示物种同其它物种之间的关系(参见下面'Genomes和Maps,'部分Entrez基因组的一般描述)

?FTP基因组蛋白—从ftp站点的genbank/genomes目录下下载各种物种的FASTA格式的氨基酸序列*.faa和蛋白表文件*.ptt。参见readme文件。蛋白表也可以在Entrez基因组中看到。

?PROW — Web上的蛋白资源,关于大约200种人类的CD细胞表面分子的简短官方向导。互相检索,为每个CD抗原提供大约20中标准信息的分类(生化功能,配体,等等)?BLAST —将你的序列同蛋白库中的的序列比较,检索相似的序列。(更详细的信息见下面Tools/Sequence相似搜索部分)

结构

?结构主页—关于NCBI结构小组的一般信息和他们的研究计划,另外也可以访问分子模型数据库(MMDB)和用来搜索和显示结构的相关工具。

?MMDB:分子模型数据库—一个关于三维生物分子结构的数据库,结构来自于X-ray晶体衍射和NMR色谱分析。MMDB是来源于Brookhaven蛋白数据库(PDB)三维结构的一部分,排除了那些理论模型。MMDB重新组织和验证了这些信息,从而保证在化学和大分子三维结构之间的交叉参考。数据的说明书包括生物多聚体的空间结构,这个分子在化学上是如何组织的,以及联系两者的一套指针。利用将化学,序列,和结构信息整合在一起,MMDB计划成为基于结构的同源模型化和蛋白结构预测的资源服务。MMDB的记录以ASN.1格式存储,可以用Cn3D, Rasmol, 或Kinemage来显示。另外,数据库中类似的结构已经被用VAST确认,新的结构可以用VASTsearch 来同数据库进行比较。

?Cn3D —“See in 3-D”,一个用于NCBI数据库的结构和序列相似显示工具,它允许观察3-D结构和序列—结构或结构—结构同源比较。Cn3D用起来就象你浏览器上的一个帮助工具。

?VAST —矢量同源比较搜索工具—一个在NCBI开发的计算算法,用于确定相似的蛋白三维结构。

每一个结构的“结构邻居”都是预先计算好的,而且可以通过MMDB的结构概要页面的链接访问。

这些邻居可以用来确认那些不能被序列比较识别的远的同源性。

?VAST 搜索—结构—结构相似搜索服务。比较一个新解出的蛋白结构和在MMDB/PDB数据库中的结构的三维坐标。VAST搜索计算一系列可能会被交互浏览的结构邻居,用分子图形来观察重叠和同源相似。

分类学

?NCBI的分类数据库主页—关于分类计划的一般信息,包括分类资源和同NCBI分类学家合作的外部管理者的列表。

?分类浏览器—搜索NCBI的分类数据库,包括大于70000个物种的名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。可以检索一个特定种或者更高分类(如属,科)的核酸,蛋白,和结构记录。如果有新物种的序列数据被放到数据库中,这个物种就北加到(分类)数据库中。NCBI的分类数据库的目的是为序列数据库建立一个一致的种系发生分类学。

文献数据库概要

?PubMed —一个关于生物医药科学的检索系统,包括引用,摘要,和杂志的索引术语。它包括直接由出版商提供给NCBI的文献引用以及链接到在出版商网址上的全文的URLs。PubMed包括MEDLINE和PREMEDLINE的完整内容。它还包括一些被MEDLINE认为超出范围的文章和杂志,(这些文章或杂志)由于内容或在某一时期不在索引范围内。因此PubMed是比MEDLINE的更大的集合。

?杂志浏览器—允许你去查找收录到PubMed系统的杂志的名字,MEDLINE的缩写,或ISSN号码。

?PubRef(开发中)—一个关于来自于广大范围的科学杂志的数目记录,和链接到出版商网址的全文。PubRef包含了PubMEd,加上了来自其它学科的杂志出版商提供的引用和摘要。因此它是比PubMed更大的集合。这个计划的启动是因为NAS要求为科学领域的电子杂志提供一个“白皮书”

服务。

?PubMed中心(开发中)— PubMed中心是一个无障碍的NIH资源,用于在生命科学领域中同业互查的基础研究报告。从2000年一月开始接受杂志文章。所有在PubMed中心的材料将由目前任一主要的摘要和索引服务中列出的杂志提供,或者在编辑委员会中拥有3个以上有主要资金机构的研究经费的拥有人的杂志提供。

?OMIM —在线人类孟德尔遗传—经常更新的人类基因和遗传失调的目录,有链接到其它相关的文献参考,序列记录,和相关数据库。

?书籍—同书籍出版商合作NCBI为网络改编了教科书,并把他们链接到PubMed—生物医药书目数据库。这是为了给PubMed提供背景信息,这样使用者可以探究在PubMed搜索结果中不熟悉的概念。目前收录的书有:

?Molecular Biology of the Cell, 3rd ed. Alberts B., Bray D., Lewis J., Raff M., Roberts K., Watson J.D., 1994, Garland Publishing.

?外部链接—一个登记服务,用于建立从在Entrez中的特定的文章,杂志,或生物数据到外部网址的链接。第三方可以提供一个URL,资源名字,关于他们网址的简要的描述,和关于从NCBI 数据的哪里他们希望建立链接的详细说明。这个详细说明可以用对Entrez有效的布尔查询来写,也可以用特定的文章或序列的标志列表来写。这样NCBI PubMed的用户将可以通过“NCBI小房间”服务(开发中)来选择哪个外部链接在他们的搜索中是可见的。

?引用匹配—允许你找到任何一篇在PubMed数据库中的文章的PubMed ID或MEDLINE UID,给出书目信息(杂志,卷,页码等)。

?单篇文章的引用匹配。

?许多文章的批量引用匹配。

?E-mail引用匹配也是可以的,也可以用于单篇或许多文章。如果要获得帮助文件,给citation_matcher@https://www.wendangku.net/doc/595049644.html,写一封只有内容为HELP的E-Mail。

?

?

Genomes and Maps Overview

?

?Entrez基因组:人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒,和真核细胞器。

?Entrez基因组(各种物种)

?Entrez基因组—超过800种在GenBank中被完整测序的物种,包括大于500种病毒,〉25种细菌,酵母,和许多viroids,质粒,和细胞器。还包括正在进行中的基因组,比如人,小鼠,线虫,疟原虫,果蝇,利什曼原虫,水稻,和玉米。提供完成的基因组/染色体的图形概览,并可以探究

那些逐步细化的区域。也提供那些已经被NCBI工作人员分析过的物种的编码区的摘要和

TaxTables。另外,Entrez Map Viewer,Entrez基因组的一个软件组成部分,提供整合的果蝇(细

胞遗传学和序列图谱)和人类(细胞遗传学,遗传连锁,序列,放射杂交,和其它图谱)的染色

体图谱的浏览。

?通过每个物种的Entrez基因组页面来下载〈350kb的基因组。

?通过NCBI ftp站点来下载〉350kb的基因组—参见在genbank/genomes目录下的readme文件,ftp

链接在每个物种的Entrez基因组页面上也有。

?NCBI站点地图---Human Genome人

?》》》NCBI 资源介绍

类基因组数据介绍

?向导

?人类基因组资源向导—可用的人类基因组数据资源概览。包括关于人类基因组的公告和进展报告和提供对以前分离的数据的集中访问。

?人类基因组序列数据的状态—描述了目前在GenBank中的数据的范围,包括完成的和草图高通量基因组序列数据的讨论。

?染色体

?人类基因组测序—每一条染色体,概述了人类基因组计划的测序进展(图示和统计)。提供对基因组序列数据的访问,也有链接到参与的国际基因组中心,各种STS图谱,疾病基因信息,和选择出的参考文献。列出完成的contig的大小和位置。Contig可以被显示出来,以表示组成他们的GenBank中的记录的成分,或者那些由e-PCR确定的位于其上的STS标记。Contig用在GenBank 中处于第三期的HTG序列记录来组装起来,组装的办法是用Jang, et al描述的过程,并给于一个NT_*的accession number,作为RefSeq计划的一部分。关于各期HTG序列的详细说明见HTG网页。

?Entrez图谱浏览器—整合的染色体图谱—图谱浏览器是Entrez基因组的一个软件组成部分,用来显示一个或多个用共同标记或基因名字互相align过的图谱,以及用相同序列进行比较过的序列图谱。在人类基因组数据和搜索技巧文件中有关于20种序列,细胞遗传,遗传连锁,放射杂交,和其它的图谱。Entrez图谱浏览器的帮助文件提供了关于如何使用这个工具的一般说明。

?FTP —每个染色体都有一个文件目录包含各种格式的完成的基因组contig(NT_*记录):

?hs_chr*.asn ASN.1 格式(description above)

?hs_chr*.fna.gz FASTA 格式(description above)

?hs_chr*.gbk.gz GenBank flat file 格式

?(目前注解包括STS标记,已知和预期的基因将被在将来几个月中加入)

?hs_chr*.gbs GenBank summary 格式

?(这个格式不含有序列数据,但是包含一个“CONTIG”字段,表明这个contig是如何有独立的GenBank记录组装起来的。)

?BLAST人类基因组序列数据

?BLAST人类染色体—将一个核酸或蛋白序列同已经完成的HTG contig比较。Contig用在GenBank中处于第三期的HTG序列记录来组装起来,组装的办法是用Jang, et al描述的过程,并给于一个NT_*的accession number,作为RefSeq计划的一部分。关于各期HTG序列的详细说明见HTG网页。同人类染色体作BLAST是人类基因组测序页面的一个组成部分。

?BLAST htgs数据库—将一个核酸或蛋白序列同未完成的HTG序列(第0,1,2期)进行比较(关于各期HTG序列的详细说明见HTG网页)。尽管htgs数据库包含有来自许多物种的序列,你可以使用Advanced BLAST页面来限定你的搜索只在人类。

?BLAST gss数据库—将一个核酸或蛋白序列同随机的“单次(测序)阅读”的基因组调查序列比较,如同cosmid/BAC/YAC末端序列,exon trap获得的基因组序列,和Alu PCR序列。尽管gss数据库包含有来自许多物种的序列,你可以使用Advanced BLAST页面来限定你的搜索只在人类。

?基因

?位点链接(LocusLink)—为校正过的序列和遗传位点的描述信息提供一个单次查询界面。LocusLink给每个位点发布一个稳定的ID,并提供官方的命名,同名,序列accesssion number,表型,EC号码,OMIM号码,Unigene簇,图谱信息,和相关的网址。

LocusLink是NCBI,人类基因命名委员会,OMIM和其它组织的合作结果。LocusLink目前包含人类,小鼠,大鼠,斑马鱼,和果蝇的位点,物种可以被分开或合在一起查询。

?OMIM —在线人类孟德尔遗传—经常更新的人类基因和遗传失调的目录,有链接到其它相关的文献参考,序列记录,和相关数据库。

?RefSeq — NCBI数据库的参考序列。校正的,非冗余集合,包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。

?UniGene —被整理成簇的EST和全长mRNA序列,每一个代表一种特定已知的或假设的人类基因,有定位图和表达信息以及同其它资源的交叉参考。序列数据可以以cluster形式在Unigene网页下载,完整的数据可以从FTP站点repository/UniGene目录下下载。?序列

?人类基因组测序—每一条染色体,概述了人类基因组计划的测序进展(图示和统计)。提供对基因组序列数据的访问,也有链接到参与的国际基因组中心,各种STS图谱,疾病基因信息,和选择出的参考文献。列出完成的contig的大小和位置。Contig可以被显示出来,以表示组成他们的GenBank中的记录的成分,或者那些由e-PCR确定的位于其上的STS标记。Contig用在GenBank 中处于第三期的HTG序列记录来组装起来,组装的办法是用Jang, et al描述的过程,并给于一个NT_*的accession number,作为RefSeq计划的一部分。关于各期HTG序列的详细说明见HTG网页。

?RefSeq — NCBI数据库的参考序列。校正的,非冗余集合,包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。

?Entrez —对GenBank, EMBL, DDBJ, PIR-International, PRF, Swiss-Prot, and PDB数据库中的核酸和蛋白序列数据提供整合的访问,同时提供对3D蛋白结构,基因组图谱信息和PubMed MEDLINE的访问。Entrez包含了对每个数据库记录的预先计算好的相似搜索,产生一个相关序列,结构,和MEDLINE记录的表。包括了来自〉70000个物种的序列数据,可以用物种字段来限制记录只在人类搜索。

?UniGene —被整理成簇的EST和全长mRNA序列,每一个代表一种特定已知的或假设的人类基因,有定位图和表达信息以及同其它资源的交叉参考。序列数据可以以cluster形式在Unigene网页下载,完整的数据可以从FTP站点repository/UniGene目录下下载。?DbEST —表达序列标签数据库—短的(300—500bp)的cDNA序列,代表mRNA的单次(测序)阅读。常常有大量的EST被测序,并代表了在一个给定的组织或一个给定的发育阶段的基因表达的快照。同时包含了由CGAP计划产生的ESTs,和来自差异显示及RACE实验的序列。

?克隆

?克隆登记—由多方人类基因组测序中心使用的数据库,用来记录哪些克隆已经被选来测序,哪些正在被测序,哪些已经完成,哪些已经被送到GenBank中去了。包括BACs, PACs, cosmids, fosmids。使用统一的克隆名字表示克隆在微量板上的位置(板号,行,和列),位置前面加上库的缩写,来产生唯一的名字。包括了克隆定购的信息。

?基因组图谱

?Entrez基因组—链接到人类基因组测序站点的人类染色体视图。Entrez基因组同时包括了一个人类线粒体的视图(通过真核细胞器来访问),可以查看完整情况或查看逐步详细的信息。

?Entrez图谱浏览器—整合的染色体图谱—图谱浏览器是Entrez基因组的一个软件组成部分,用来显示一个或多个用共同标记或基因名字互相align过的图谱,以及用相同序列进行比较过的序列图谱。在人类基因组数据和搜索技巧文件中有关于20种序列,细胞遗传,遗传连锁,放射杂交,和其它的图谱。Entrez图谱浏览器的帮助文件提供了关于如何使用这个工具的一般说明。

?GeneMap’99 —〉35000个人类基因标记的物理图谱,由国际放射杂交图谱联合用一致的RH试剂和方法建成。提供了突出了染色体上关键标志(富含基因区)的框架,从而加速了测序,代表了超过100名科学家的国际合作努力。

?NCBI RH图谱— NCBI整合的RH图谱,包括来自GeneMap’99的G3和GB4的RH单子上的23723个标记。这些标记相对于1084个框架标记(一个G3和GB4共同的子集)被绘制。所有的标记被统一在GB4的尺度上。R. Agarwala et al.的文章提供了详细的整合策略,以及评估整合图谱质量的方法。

?Mitelman癌症染色体变异摘要—由Drs. Mitelman, Mertens, 和Johansson建立的基因组范围的人类癌症中染色体断裂位点图谱。

参见Nature Genetics, Vol. 15(Spec. No.):417-74 (April 1997)的超文本版本。

?OMIM基因图—被报道的和被许多定位方法决定的基因的细胞遗传位点。可以用基因代号或细胞遗传染色体位点来搜索。可以从OMIM页面上访问。

?OMIM致病图—按字母排列的疾病和相应的细胞遗传图位点,链接到OMIM的条目。可以从OMIM页面访问。

人类/小鼠同源图—University of California at Davis的M. F. Seldin建立,一张比较人和老鼠在同源区段DNA上基因的表,按在每个基

因组上的位置排列。

?绘制的标记

?dbSTS —序列标签位点的数据库,短的在基因组上可以被唯一操作的序列,因而可以确定在物理图谱上的特定位置。

?电子PCR(e-PCR)—找到一个查询序列的假设位点图。用于在DNA序列上发现STS位点计算过程。

?GeneMap’99 —〉35000个人类基因标记的物理图谱,由国际放射杂交图谱联合用一致的RH试剂和方法建成。提供了突出了染色体上关键标志(富含基因区)的框架,从而加速了测序,代表了超过100名科学家的国际合作努力。

?人类基因组测序—绘制的标记已经用e-PCR自动被放到完成的HTG序列组成的contig上。标记来源于dbSTS, GeneMap'99(基于基因的标记),Stanford G3 RH单子(又有基因标记也有非基因标记),Whitehead GB4 RH单子和YAC图谱(又有基因标记也有非基因标记),Genethon遗传图谱,和一些染色体特异的图谱,如NHGRI的7号染色体图谱,Washington University的X染色体图谱。

?OMIM基因图—被报道的和被许多定位方法决定的基因的细胞遗传位点。可以用基因代号或细胞遗传染色体位点来搜索。可以从OMIM页面上访问。

?基因表达

?CGAP cDNA表达谱—在UniGene簇和cDNA库中的ESTs分布。可以在CGAP页面上访问。

?SAGEmap — CGAP SAGE(Serial Analysis of Gene Expression)库的差异显示。也包含了对在人类GenBank记录中的SAGE标签的完整分析,在人类GenBank记录中一个UniGene的标志被分配给了每个含有一个SAGE标签的人类序列

?遗传变异

?dbSNP —单核苷酸多态性数据库,包括SNPs,小范围的插入/缺失,多态重复单元,和微卫星变异。DbSNP包含种族特异的频率和基因型数据,实验条件,分子上下文,及中性多态和临床变异的定位信息。

?OMIM —在线人类孟德尔遗传—约900个OMIM记录的等位变异。为了查看这些OMIM记录的列表,在等位变异字段上搜索“0001”。或者,把一个疾病的名字同“0001”放到一起。如:Gaucher & 0001。

?位点特异突变数据库—从OMIM主页和相关的LocusLink条目链接到许多外部数据库。

?失调

?基因和疾病—介绍遗传因素和人类疾病的关系。有约60种遗传疾病的概要信息,以及链接到相关数据库和组织。

?Mitelman癌症染色体变异摘要—由Drs. Mitelman, Mertens, 和Johansson建立的基因组范围的人类癌症中染色体断裂位点图谱。

参见Nature Genetics, Vol. 15(Spec. No.):417-74 (April 1997)的超文本版本。

?OMIM —在线人类孟德尔遗传—经常更新的人类基因和遗传失调的目录,有链接到其它相关的文献参考,序列记录,和相关数据库。

?OMIM Morbid Map - alphabetical listing of diseases and corresponding cytogenetic map locations, with links to OMIM entries. Accessible from OMIM page (see Genes).

?OMIM致病图—按字母排列的疾病和相应的细胞遗传图位点,链接到OMIM的条目。可以从OMIM页面访问。

?癌症研究

?CCAP —癌症染色体变异计划—计划用来加速同恶性转移相关的显著染色体变异的定义和详细的特征描述。

?CGAP —癌症基因组剖析计划—交叉学科项目,目的是基于cDNA库,鉴定在不同癌症阶段的人类基因表达,和决定正常,癌前和恶性细胞的分子表达谱。是NCI,NCBI和其它许多实验室的合作。

?Mitelman癌症染色体变异摘要—由Drs. Mitelman, Mertens, 和Johansson建立的基因组范围的人类癌症中染色体断裂位点图谱。

参见Nature Genetics, Vol. 15(Spec. No.):417-74 (April 1997)的超文本版本。

?SAGE分析—在癌症库中的SAGE标签的差异表达。

NCBI分子数据库介绍

NCBI分子数据库介绍 信息来源:中国生命科学论坛更新时间:2003-10-12 2:33:00 核酸序列(nucleotides) ·Entrez核酸- 用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索核酸序列记录(在GenBank + PDB中)。更多的关于Entrez的信息见下。如果要检索大量数据,也可使用Batch Entrez (批量Entrez)。 ·RefSeq - NCBI数据库的参考序列。校正的,非冗余集合,包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。 ·dbEST - 表达序列标签数据库,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。 ·dbGSS -基因组调查序列的数据库,短的、单次(测序)阅读的cDNA序列,exon trap获得的序列,cosmid/BAC/YAC 末端,及其他。 ·dbSTS -序列标签位点的数据库,短的在基因组上可以被唯一操作的序列,用于产生作图位点。 ·dbSNP - 单核苷酸多态性数据库,包括SNPs,小范围的插入/缺失,多态重复单元,和微卫星变异。 完整的基因组 ·参见Genome 和Maps 部分,包括各种物种资源,人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒。 ·UniGene - 被整理成簇的EST和全长mRNA 序列,每一个代表一种特定已知的或假设的人类基因,有定位图和表达信息以及同其它资源的交叉参考。序列数据可以以cluster 形式在Unigene 网页下载,完整的数据可以从FTP站点repository/UniGene 目录下下载。 1.奶牛UniGene 2.人类UniGene 3.小鼠UniGene 4.大鼠UniGene 5.斑马鱼UniGene ·BLAST - 将你的序列同核酸库中的的序列比较,检索相似的序列。(更详细的信息见下面Tools/Sequence 相似搜索部分) 蛋白序列(proteins) · Entrez蛋白-用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索蛋白序列记录(在GenPept + Swiss-Prot + PIR + RPF + PDB中)。更多的关于Entrez的信息见下。如果要检索大量数据,也可使用Batch Entrez(批量Entrez)。

一步一步教你使用NCBI数据库资源

一步一步教你使用NCBI数据库资源 随着ncbi数据库各种资源的涌现,NCBI已经成为科研工作者必不可少的资料查找,数据分析的工具。那么NCBI 数据如何使用,新手入门一步一步教你认识和使用NCBI数据库。 一综合数据库 NCBI数据库集美国国立生物技术信息中心(National Center for Biotechnology Information),即我们所熟知的NCBI 是由美国国立卫生研究院(NIH)于1988年创办。创办NCBI 的初衷是为了给分子生物学家提供一个信息储存和处理的 系统。除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还可以提供众多功能强大的数据检索与分析工具。目前,NCBI提供的资源有Entrez、Entrez Programming Utilities、My NCBI、PubMed、PubMed Central、Entrez Gene、NCBI Taxonomy Browser、BLAST、BLAST Link (BLink)、Electronic PCR等共计36种功能,而且都可以在NCBI的主页https://www.wendangku.net/doc/595049644.html,上找到相应链接,其中多

半是由BLAST功能发展而来的。 1 NCBI最新进展 1.1 PubMed搜索功能的增强 去年,NCBI对PubMed进行了几项改进工作,改动最大的是搜索界面和摘要浏览界面。其中,搜索界面中新增了“Advanced Search”选项(这实际上是对以往“Limits”和“Preview/Index”功能的整合),并且增加了一个新的窗口,用户可以在此窗口下通过“论文作者名”、“论文所属杂志名称”、“论文出版日期”等限定条件进行搜索。而且,“论文作者名”和“论文所属杂志名称”还设有文本框自动填充功能。现在,在PubMed数据库中进行文本搜索的同时还可以立即通过两个“内容传感器(content sensors)”进行分析。一个“内容传感器”是根据作者姓名、所属杂志名称或杂志名缩写、出版日期、卷号或刊号等信息进行分析,然后将符合条件的搜索结果排列到结果列表的顶端。另一个“内容传感器”是根据文章是否与用户给出的条件,例如是否与某种药物相关,在NCBI的新增数据库PubMed Clinical Q&A 中进行搜索,然后给出搜索结果。

NCBI_功能详细介绍[1]

GenBank Overview 基本信息 ?什么是GenBank?GenBank是一个有来自于70,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。 ?纪录样本- 关于GenBank的各个字段的详细描述,以及同Entrez搜索字段的交叉索引。 ?访问GenBank - 通过Entrez Nucleotides来查询。用accession number,作者姓名,物种,基因/蛋白名字,还有许多其他的文本术语来查询。关于Entrez更多的信息请看下文。用BLAST来在GenBank和其他数据库中进行序列相似搜索。用E-mail来访问Entrez和BLAST可以通过Query 和BLAST服务器。另外一种选择是可以用FTP下载整个的GenBank和更新数据。 ?增长统计- 参见公布通知的2.2.6(每个分类的统计),2.2.7(每个物种的统计),2.2.8(GenBank 增长)小节。 ?公布通知,最新- 最近和即将有的变化,GenBank的分类,数据增长统计,GenBank的引用。 ?公布通知,旧- 同上相同,是过去公布的统计。 ?遗传密码- 15个遗传密码的概要。用来确保GenBank中纪录的编码序列被正确的翻译。(向)GenBank提交(数据) ?关于提交序列数据,收到accession number,和对纪录作更新的一般信息。 ?BankIt - 用于一条或者少数条提交的基于WWW的提交工具软件。(请在提交前用VecScreen去除载体) ?Sequin - 提交软件程序,用于一条或者很多条的提交,长序列,完整基因组,alignments,人群/种系/突变研究的提交。可以独立使用,或者用基于TCP/IP的“network aware”模式,可以链接到其他NCBI的资源和软件比如Entrez和PowerBLAST。(请在提交前用VecScreen去除载体)?ESTs - 表达序列标签,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE 实验的cDNA序列。 ?GSSs - 基因组调查序列,短的、单次(测序)阅读的cDNA序列,exon trap获得的序列,cosmid/BAC/YAC末端,及其他。 ?HTGs - 来自于大规模测序中心的高通量基因组序列,未完成的(阶段0,1,2)和完成的(阶段3)序列。(注意:完成的人类的HTG序列可以同时在GenBank和Human Genome Sequencing页面上访问。) ?STSs - 序列标签位点。短的在基因组上可以被唯一操作的序列,用于产生作图位点。 ?注:SNPs - 人类的和其他物种的遗传变异数据可以提交到NCBI数据库的单核苷酸多态性库中(dbSNP)。 国际核苷酸序列数据库合作组织 ?GenBank,DDBJ,EMBL - 合作计划的概述,并链接到相应的主页。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)数据库共享的数据是每天都交换的,因此他们是相等的。数据纪录的格式和搜索方式可能会不一样,但是accession number,序列数据和注解都是一模一样的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相应纪录,得到的结果是完全一样的序列数据,参考内容等等。 ?DDBJ/EMBJ/GenBank特性表—特性表格式和标准被合作数据库用在序列记录的注释上,使得数据共享成为可能,包括详细的描述生物特性和特性限定语的附录,以及IUPAC规定的核苷酸和氨基酸的代号。

教你如何使用NCBI

一步一步教你使用NCBI 查找DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST序列比对等 作者:urbest 2007-8-1 苏州大学生命科学学院

最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用BLAST进行序列比对……,这些问题在NCBI上都可以方便的找到答案。现在我就结合我自己使用NCBI的一些经历(经验)跟大家交流一下BCBI的使用。希望大家都能发表自己的使用心得,让我们共同进步! 我分以下几个部分说一下NCBI的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的mRNA、cDNA、蛋白序列 Part three 运用STS查找已经公布的引物序列 Part four 如何运用BLAST进行序列比对、检验引物特异性 特别感谢本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我投票却暂时不能投票的)各位战友表示真诚的感谢,谢谢各位战友! 请大家对以下我发表的内容提出自己的意见。关于NCBI其他方面的使用也请水平较高的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分 利用Map viewer查找基因序列、mRNA序列、 启动子(Promoter) 下面以人的IL6(白细胞介素6)为例讲述一下具体的操作步骤 1.打开Map viewer页面,网址为:https://www.wendangku.net/doc/595049644.html,/mapview/index.html 在search的下拉菜单里选择物种,for后面填写你的目的基因。操作完毕如图所示: 2.点击“GO”出现如下页面:

怎么使用NCBI[1]

怎么使用NCBI (National Center for Biotechnology Information), 美国国家生物技术信息中心 [url]https://www.wendangku.net/doc/595049644.html,/[/url] NCBI是NIH的国立医学图书馆(NLM)的一个分支。 NCBI提供检索的服务包括: 1.GenBank(NIH遗传序列数据库):一个可以公开获得所有的DNA序列的注释过的收集。GenBank是由NCBI受过分子生物学高级训练的工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库(EMBL和DDBJ)交换数据建立起数据库的。它同日本和欧洲分子生物学实验室的DNA数据库共同构成了国际核酸序列数据库合作。这三个组织每天交换数据。其中的数据以指数形式增长,最近的数据为它已经有来自47000个物种的30亿个碱基。 2.Molecular Databases(分子数据库): Nucleotide Sequence(核酸序列库):从NCBI其他如Genbank数据库中收集整理核酸序列,提供直接的检索。 Protein Sequence (蛋白质序列库):与核酸类似,也是从NCBI多个不同资源中编译整理的,方便研究者的直接查询。 Structure(结构)-——关于NCBI结构小组的一般信息和他们的研究计划,另外也可以访问三维蛋白质结构的分子模型数据库(MMDB)和用来搜索和显示结构的相关工具。MMDB:分子模型数据库—一个关于三维生物分子结构的数据库,结构来自于X-ray晶体衍射和NMR色谱分析。 Taxonomy(分类学)——NCBI的分类数据库,包括大于7万余个物种的名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。其目的是为序列数据库建立一个一致的种系发生分类学。 3.Literature Databases(文献数据库) (1)PubMed是NLM提供的一项服务,能够对MEDLINE上超过1200万条的上世纪六十年代中期至今的杂志引用和其他的生命科学期刊进行访问,并可以连接到参与的出版商网络站点的全文文章和其他相关资源。 (2)PMC/PubMed Center:也是NLM的生命科学期刊文献的数字化存储数据库,用户可以免费获取PMC的文章全文,除了部分期刊要求对近期的文章付费。 (3)OMIM(孟德尔人类遗传):有关人类基因和无序基因的目录数据库由Victor A.McKusick 和他的同事共同创造和编辑的,由NCBI网站负责开发,其中也包括对MEDINE众多资源和Entrez系统的序列记录,以及NCBI中其他有关资源的链接。

NCBI数据库集

NCBI数据库集 生物信息学 2010-08-20 16:08:59 阅读202 评论0字号:大中小订阅 NCBI数据库集 https://www.wendangku.net/doc/595049644.html,/?p=20049 一综合数据库 NCBI数据库集 美国国立生物技术信息中心(National Center for Biotechnology Information),即我们所熟知的NCBI是由美国国立卫生研究院(NIH)于1988年创办。创办NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统。除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还可以提供众多功能强大的数据检索与分析工具。目前,NCBI提供的资源有Entrez、Entrez Programming Utilities、My NCBI、PubMed、PubMed Central、Entrez Gene、NCBI Taxonomy Browser、BLAST、BLAST Link (BLink)、Electronic PCR等共计36种功能,而且都可以在NCBI的主页https://www.wendangku.net/doc/595049644.html,上找到相应链接,其中多半是由BLAST功能发展而来的。 1 NCBI最新进展 1.1 PubMed搜索功能的增强 去年,NCBI对PubMed进行了几项改进工作,改动最大的是搜索界面和摘要浏览界面。其中,搜索界面中新增了“Advanced Search”选项(这实际上是对以往“Limits”和“Preview/Index”功能的整合),并且增加了一个新的窗口,用户可以在此窗口下通过“论文作者名”、“论文所属杂志名称”、“论文出版日期”等限定条件进行搜索。而且,“论文作者名”和“论文所属杂志名称”还设有文本框自动填充功能。现在,在PubMed数据库中进行文本搜索的同时还可以立即通过两个“内容传感器(content sensors)”进行分析。一个“内容传感器”是根据作者姓名、所属杂志名称或杂志名缩写、出版日期、卷号或刊号等信息进行分析,

NCBI所有数据库简介

美国国家生物技术信息中心 (National Center of Biotechnology Information) 唐志立它的使命包括四项任务: 1. 建立关于分子生物学,生物化学,和遗传学知识的存储和分析的自动系统 2. 实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的,先进方法的研究 3. 加速生物技术研究者和医药治疗人员对数据库和软件的使用。

山东师范大学 2016年4月10日星期日30则留学生经典笑话,英语不好伤不起!凭你在国内口语练得多么娴熟,去了国外,照样有犯痴呆傻的时候! 1、有次房东问我:did u eat anyting yet? 我说:no. 她听后重复了一遍:so u didn‘t eat anyting. 我说:yes. 房东老太太犹豫了下又问:did u eat? 我说:no. 她接着说:so u didn‘t eat. 我说:yes. 估计她当时要崩溃了…… 2、刚上班不久,有个公司的A/R打电话来催支票,我循例问了一下他是哪间公司打来的,那男的很有礼貌的说:This is xxx calling from Beach Brother.

听懂了很开心,不过由于对公司名字还不熟,心想先用笔记下来公司名,省得等下忘记了,正得意忘形之间,顺嘴开始拼写人家公司的名字,还说得一本正经:b.i.t.c.h.bitch, correct? 那男的终于还是没能忍住怒火,近似于怒吼似的对我喊道:NO! B.E.A. C.H.BEACH! 接下来的一年里,没再跟这间公司有过任何生意往来…… 3、我男朋友以前在温哥华乘skytrain 的时候,一个白人女人说:I am sorry. 他直接说:you are welcome. 对方都呆了。 4、第一次跟老外去打painball,玩的是抢旗的那种。由于第一次玩,一直跟着个看起来很专业的队友跑,一路上躲着子弹跑到对方的base. 我们人都挂了,对方就剩一个人在看老家,就听那老外跟我说了一大堆术语,我

如何在ncbi上检索

如何在ncbi上检索NCBI包括五个部分,第一部分是欢迎进入NCBI,包括NCBI的最新信息、计划与活动、读者来信、服务地址和用户评论等。第二部分是基因序列数据库(GenBank),包括基因库概述、检索与投稿。第三部分是数据库服务,包括免费的PubMed检索、Entrez 检索、BLAST序列族性检索、电子邮件服务(详见本章第四节)、匿名FTP服务。第四部分是NCBI的其它资源。GenBank的检索在NCBI主页的第二部分点击"Searching GenBank",即可进入GenBank的检索屏幕。NCBI?提供了五种检索,即Entrez浏览检索、BLAST序列类似性检索、dbEST检索、dbSTS?检索和文本检索(Text Searching)。一、Entrez浏览检索1.Entrez检索的数据库及其检索信息Entrez浏览器(Entrez Browser)可以检索以下与NCBI?链接的基因序列数据库的分子生物数据和书目文献资料。???? (1) GenBank、EMBL、DDBJ中的DNA序列; ???? (2) SWISS-PROT、PIR、PRF、PDB中的蛋白质序列以及DNA序列数据库中翻译的蛋白质序列; ???? (3) 基因和染色体图像数据; ???? (4) PDB以及收入NCBI分子模型数据库(MMDB)的蛋白质三维结构; ???? (5) 通过PubMed检索Medline和PreMedline数据库。???? 2.Entrez检索功能???? Entrez提供了以下三种检索功能。 ?? (1)自由词检索功能??? 用户可以通过文本词、关键词、截词、期刊名或文献的作者检索Entrez数据库。截词用*号,期刊名必须用Medline刊名缩写,作者姓名必须是姓在前,名在后,用首字母缩写。????(2)索引词表(List Terms)检索功能 ????索引词表检索是当你键入检索词,Entrez?在你选定的字段中显示从该检索词开始的一个索引词表窗口,这时,你可以选择一个或几个词进行检索,这对单词拼写不准确时非常有用。?例如:在输入框中键入"P53",选择文本字段(Text Words)和索引词表(List Terms)?检索功能,再点击"Search",这时返回一个以"P53"开始的索引词表窗口,浏览选择一个或几个索引词,点击"Search",Entrez将返回检索结果。 ????(3)自动检索功能 ????自动检索功能就是Entrez浏览器根据用户输入的检索式自动进行检索,返回当前检索式检出的文献数,如满意,可进一步取得检索结果,如不满意,则可对当前检索式进行修改,直到用户满意为此。例如在输入框键入"P53",?选择所有字段和自动检索功能,?点击"?Search?",?Entrez返回一个Web页,包括当前检出文献数、加词检索和修改当前检索三个部分。如果你对检出文献数不满意(过多或过少),可以在加词检索部分增加更专指的检索词,以提高查准率,也可以在修改当前检索部分选择某一布尔算符(AND、OR、NOT、ANDNOT),对当前的检索策略进行修改,直到你满意为止。 ????对于检出文献,用户可以选择浏览格式进行浏览,也可以打印或存盘。 ????3 Entrez检索规则 (1)Entrez支持"*"号截词检索; ? (2)Entrez对你键入的词可以进行逻辑识别。例如:键入"Lipman DJ Genomics",Entrez将它识别为作者的姓名Lipman DJ和自由词?Genomics?,?并将提问式转换为"?Lipman ?DJ?"?AND Genomics。对于Entrez不能识别的提问式,如bac 1,必须加双引号,?系统就会将它们作为一个词进行检索; (3)Entrez支持复杂的布尔逻辑检索; (4)Entrez支持限定字段检索; 字段标识符的全称如下: WORD=Text Word, TITL=Title Word,

相关文档