文档库 最新最全的文档下载
当前位置:文档库 › 蛋白质家族和结构域

蛋白质家族和结构域

蛋白质家族和结构域
蛋白质家族和结构域

1蛋白质家族和结构域数据库

1.1蛋白质模体及结构域数据库

模体和结构域

PROSITE数据库

PRINTS数据库

BLOCKS数据库

ProDom数据库

Pfam数据库

SMART数据库

InterPro数据库

Conserved Domain数据库

CDART

模体(motifs)和结构域(domains):

Biologists can gain insight of the protein function based on identification of short consensus sequences related to known functions. These consensus sequence patterns are termed motifs and domains.

A motif is a short conserved sequence pattern associated with distinct functions of a protein or DNA.

It is often associated with a distinct structural site performing a particular function.

A typical motif, such as a Zn-finger motif, is ten to twenty amino acids long.

A domain is also a conserved sequence pattern, defined as an independent functional and structural unit.

Domains are normally longer than motifs.

A domain consists of more than 40 residues and up to 700 residues, with an average length of 100 residues.

A domain may or may not include motifs within its boundaries.

Examples,transmembrane domains, ligand-binding domains.

Identification of motifs and domains heavily relies on multiple sequence alignment as well as profile and hidden Markov model (HMM) construction

PROSITE(蛋白质家族及结构域数据库):

The first established sequence pattern database https://www.wendangku.net/doc/fd17240870.html,/prosite/

是蛋白质家族和结构域数据库,包含具有生物学意义的位点、模式、可帮助识别蛋白质家族的统计特征。

PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等。

PROSITE还包括根据多序列比对而构建的序列统计特征,能更敏感地发现一个(未知)序列是否具有相应的特征。

The functional information of these patterns is primarily based on published literature.

PRINTS(蛋白质模体指纹数据库):

A fingerprint is a group of conserved motifs used to characterise a protein family; its diagnostic power is refined by iterative scanning of a SWISS-PROT/TrEMBL composite. Usually the motifs do not overlap, but are separated along a sequence, though they may be contiguous in 3D-space.. https://www.wendangku.net/doc/fd17240870.html,/dbbrowser/PRINTS/

提供蛋白质同源性分析,蛋白质模体指纹分析,系统发生和序列进化分析,以及微阵列分析,并提供生物信息学和PRINTS数据库数据下载。

BLOCKS:

A database of blocks

Blocks:ungapped multiple alignments derived from the most conserved, ungapped regions of homologous protein sequences.

The blocks, which are usually longer than motifs, are subsequently converted to PSSMs. Because blocks often encompass motifs, the functional annotation of blocks is thus consistent with that for the motifs

https://www.wendangku.net/doc/fd17240870.html,/blocks.

检测和鉴定蛋白质模体,有BLOCK search、Get Blocks和Block Maker工具

A query sequence can be used to align with precomputed profiles in the database to select the highest scored matches.

ProDom

Domain database

ProDom is a comprehensive set of protein domain families automatically generated from the SWISS-PROT and TrEMBL sequence databases

The domains are built using recursive iterations of PSI-BLAST.

http://prodom.prabi.fr/prodom/current/html/home.php

提供相似性搜索、来自SWISSPROT相关结构域的多序列比对

Pfam(Protein families database of alignments and HMMs)

A database with protein domain

derived from sequences in SWISSPROT and TrEMBL. Each motif or domain is represented by an HMM profile generated from the seed alignment of a number of conserved homologous proteins. https://www.wendangku.net/doc/fd17240870.html,/

The Pfam database is composed of two parts

Pfam-A involves manual alignments

Pfam-B, automatic alignment in a way similar to ProDom( PSI-BLAST ).

The functional annotation of motifs in Pfam-A is often related to that in PROSITE. Pfam-B only contains sequence families not covered in Pfam-A.

Because of the automatic nature, Pfam-B has a much larger coverage but is also more error prone because some HMMs are generated from unrelated sequences.

SMART (Simple Modular Architecture Research Tool):

Contains HMM profiles constructed from manually refined protein domain alignments. http://smart.embl-heidelberg.de/

Alignments in the database are built based on

tertiary structures whenever available

or based on PSI-BLAST profiles.

Alignments are further checked and refined by human annotators before HMM profile construction.

Protein functions are also manually curated.

The database may be of better quality than Pfam with more extensive functional annotations. Compared to Pfam, the SMART database contains an independent collection of HMMs, with emphasis on signaling, extracellular, and chromatin-associated motifs and domains.

Sequence searching in this database produces a graphical output of domains with well-annotated information with respect to cellular localization, functional sites, superfamily, and tertiary structure

InterPro:

An integrated pattern database https://www.wendangku.net/doc/fd17240870.html,/interpro/

The database integrates information from PROSITE, Pfam, PRINTS, ProDom, and SMART databases.

The sequence patterns from the five databases are further processed. Only overlapping motifs and domains in a protein sequence derived by all five databases are included.

A popular feature of this database is a graphical output that summarizes motif matches and has links to more detailed information.

CDD( Conserved Domain Database)

a collection of multiple sequence alignments for ancient domains and full-length proteins. https://www.wendangku.net/doc/fd17240870.html,/Structure/cdd/cdd.shtml

The CD-Search service may be used to identify the conserved domains present in a protein query sequence: https://www.wendangku.net/doc/fd17240870.html,/Structure/cdd/wrpsb.cgi RPS-BLAST (Reverse PSI-BLAST) is the search tool used in the CD-Search service.

uses a query sequence to search against a pre-computed profile database generated by PSI-BLAST. The role of the PSSM has changed from "query" to "subject", hence the term "reverse" in RPS-BLAST.

It performs only one iteration of regular BLAST searching against a database of PSI-BLAST profiles to find the high-scoring gapped matches.

CDART (Conserved Domain Architecture) :

A domain search program https://www.wendangku.net/doc/fd17240870.html,/BLAST/

Combines the results from RPS-BLAST, SMART, and Pfam.

The resulting domain architecture of a query sequence can be graphically presented along with related sequences.

CDART is not a substitute for individual database searches because it often misses certain features that can be found in SMART and Pfam.

1.2 蛋白质家族数据库

COG (Cluster of Orthologous Groups ):

A protein family database based on phylogenetic

classification. https://www.wendangku.net/doc/fd17240870.html,/COG/

It is constructed by comparing protein sequences encoded in completely sequenced genomes. Unicellular clusters:检索工具为COGnitor program

Eukaryotic Clusters:检索工具为KOGnitor

A query sequence can be assigned function if it has significant similarity matches with any member of the cluster.

ProtoNet:

A database of clusters of homologous proteins similar to COG. www.protonet.cs.huji.ac.il/

Orthologous protein sequences in the SWISSPROT database are clustered based on pairwise sequence comparisons between all possible protein pairs using BLAST.

Protein relatedness is defined by the E-values from the BLAST alignments.

A query protein sequence can be submitted to the server for cluster identification and functional annotation.

1.3、蛋白质结构数据库

PDB(Protein Data Bank)

PDB中含有通过实验(X射线晶体衍射,核磁共振NMR)测定的生物大分子的三维结构蛋白质

核酸

糖类

其它复合物

https://www.wendangku.net/doc/fd17240870.html,/pdb

SCOP(Structural Classification of Proteins )蛋白质结构分类数据库

提供关于已知结构的蛋白质之间结构和进化关系的详细描述,包括蛋白质结构数据库PDB 中的所有条目。 https://www.wendangku.net/doc/fd17240870.html,/scop/

SCOP数据库除了提供蛋白质结构和进化关系信息外,对于每一个蛋白质还包括下述信息:到PDB的连接,序列,参考文献,结构的图像等。

可以按结构和进化关系对蛋白质分类,分类结果是一个具有层次结构的树,其主要的层次是家族、超家族和折叠:

家族:具有明显的进化关系

超家族:具有远源进化关系,具有共同的进化源

折叠类:主要结构相似

DSSP(蛋白质二级结构数据库)

对生物大分子数据库PDB中的任何一个蛋白质,根据其三维结构推导出对应的二级结构。http://www.sander.embl-heidelberg.de/dssp/

对研究蛋白质序列与蛋白质二级结构及空间结构的关系非常有用

除了二级结构以外,DSSP还包括蛋白质的几何特征及溶剂。

HSSP(蛋白质同源序列比对数据库)

二级数据库 http://www.sander.embl-heidelberg.de/hssp/

数据来源于PDB,或来源于SWISS-PROT

对于PDB中的每一个蛋白质,HSSP将与其同源的所有蛋白质序列对比排列起来,从而将相似序列的蛋白质聚集成结构同源的家族。

HSSP有助于分析蛋白质的保守区域,研究蛋白质的进化关系,有助于蛋白质的分子设计。

1.4、其它生物大分子数据库

MMDB (Molecular Modeling Database)

MMDB 是(NCBI)Entrez的一个部分,数据库的内容包括来自于实验的生物大分子结构数据。https://www.wendangku.net/doc/fd17240870.html,/entrez/query.fcgi?db=Structure

与PDB相比,对于数据库中的每一个生物大分子结构,MMDB具有许多附加的信息,如分子的生物学功能、产生功能的机制、分子的进化历史等。

还提供生物大分子三维结构模型显示、结构分析和结构比较工具。

dbSNP( Single nucleotide polymorphisms,单核苷酸多态性数据库)

https://www.wendangku.net/doc/fd17240870.html,/entrez/query.fcgi?db=snp

OMIM (Online Mendelian Inheritance in Man)

是关于人类基因和遗传疾病的分类数据库

该数据库收集了已知的人类基因及由于这些基因突变或者缺失而导致的遗传疾病。

https://www.wendangku.net/doc/fd17240870.html,/entrez/query.fcgi?db=OMIM

EPD

真核基因启动子数据库 http://www.epd.isb-sib.ch/

提供从EMBL中得到的真核基因的启动子序列,目标是帮助实验研究人员、生物信息学研究人员分析真核基因的转录信号。

TRRD (Transcription Regulatory Regions Database )

关于基因调控信息的集成数据库

该数据库搜集真核生物基因转录调控区域结构和功能的信息。

每一个TRRD的条目对应于一个基因,包含特定基因各种结构-功能特性 http://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/

2 蛋白质功能预测

蛋白质结构与功能的研究已有相当长的历史,由于其复杂性,对其结构与功能的预测不论是方法论还是基础理论方面均较复杂。

蛋白质功能预测的一般过程:

数据库同源性搜索——根据同源信息预测功能

未知蛋白质序列(结构)是否和已知功能蛋白质的序列(结构)相似

根据序列特征预测功能

蛋白质的许多特性可直接从序列上分析获得,如疏水性,它可以用于预测序列是否位跨膜螺旋(transmenbrane helix)或是前导序列(leader sequence)。

模体或结构域搜索——通过比对模体或结构域数据库确定功能

未知蛋白包含保守的模体或结构域,则具有该模体和结构域的功能

2.1根据同源信息预测功能

相似序列→同源性→相似功能

数据库的相似性搜索是最可靠的确定蛋白质功能的方法。

一个显著的匹配应至少有25%的相同序列和超过80个氨基酸的区段。

一般的策略是

首先进行BLAST检索,

如果不能提供相关结果,运行FASTA;

如果FASTA也不能得到有关蛋白质功能的线索,最后可选用完全根据Smith-Waterman算法设计的搜索程序。

BLITZ: https://www.wendangku.net/doc/fd17240870.html,/searches/blitz.html

ParAlign: https://www.wendangku.net/doc/fd17240870.html,/

2.2 根据序列特征预测功能

查找未知蛋白中是否包含与特定蛋白质家族或功能域有关的亚序列或保守区段Transmembrane

Signal peptide

Domain & Motif

Coiled coil

Subcellular Location

二级结构

疏水性信息分析

ProtScale : https://www.wendangku.net/doc/fd17240870.html,/cgi-bin/protscale.pl

能计算超过50种蛋白质的特性。

可通过输入框将序列粘贴进去,也可输入SWISS-PROT的记录号。

设定输入框的宽度参数,该参数将指示系统每次运行计算和显示的残基数,其缺省值为9。如果想考虑跨膜螺旋特性,该参数设置应为20,因为一个跨膜螺旋通常有20个氨基酸长度

预测序列的跨膜螺旋:

跨膜蛋白由跨越脂质膜的片段(通常是螺旋)以及膜外连接这些片断的卷曲区域组成的。

跨膜的片段往往含有较高比例的疏水残基,长度常常在20个残基以上,这种相对较长的疏水残基片断在可溶性球蛋白中很少见,因而可以依靠疏水残基片断来进行预测。

跨膜螺旋是可以根据序列数据比较准确预测的蛋白质特性之一。

预测跨膜片段的工具,包括

TMPred:https://www.wendangku.net/doc/fd17240870.html,/software/TMPRED_form.html

TMHMM: http://www.cbs.dtu.dk/services/TMHMM/

TopPred:http://bioweb.pasteur.fr/seqanal/interfaces/toppred.html

Tmbase:跨膜螺旋数据库https://www.wendangku.net/doc/fd17240870.html,/software/tmbase/TMBASE_doc.html TMAP:http://www.embl-heidelberg.de/tmap/tmap/tmap_sin.html

这些程序使用不同的统计模型,总体上,预测准确率在80~95%左右。其中许多工具也预测跨膜拓扑,即预测α螺旋对于膜的方向。例如i→o(in to out,从内到外),螺旋的N端在膜包围的细胞或细胞器以内,而螺旋的C端在膜外。

前导序列或特殊区室靶蛋白信号的预测

信号肽预测工具

SignalP:http://www.cbs.dtu.dk/services/SignalP

细胞内定位

PSORT:http://psort.nibb.ac.jp/form.html

TargetP: http://www.cbs.dtu.dk/services/TargetP/

卷曲螺旋:控制蛋白质寡聚化的元件,可能是蛋白质结构域之间的间隔

COILS: https://www.wendangku.net/doc/fd17240870.html,/software/COILS_form.html

Paircoil: https://www.wendangku.net/doc/fd17240870.html,/cgi-bin/score

2.3通过比对模体或结构域数据库确定功能

Prosite

SMART

Pfam

Prints

Blocks

COGS

3 蛋白质结构预测

蛋白质结构:一般情况下,蛋白质的结构分为4个层次:

初级结构——蛋白质序列;

二级结构——а-螺旋和β-折叠片(β-sheets)模式;

蛋白质折叠(fold):介于二级和三级结构之间的蛋白质结构层次

三级结构——残基在空间的布局;

四级结构——蛋白质之间的互作。

概念:蛋白质结构预测是指仅依据蛋白序列信息来预测蛋白质中每个原子在三维空间中的相对位置

蛋白质结构预测意义:

目前对结构知识得了解仍然相当有限,因为实验确定蛋白质结构的过程非常缓慢,而且大量的蛋白质结构不能通过实验方法测得。

数据库中包含近30 000个蛋白质结构数据(PDB库),但序列数据库却含有几十万条序列(2004年)。这是人们进行蛋白质结构预测的主要驱动因素之一。

另一个因素是结构的认识有利于进一步认识蛋白质的功能。

另外许多药物选择性地结合靶蛋白,而蛋白质结构的知识可以有助于合理的设计药物(药物分子根据它作用的蛋白质分子的结构来设计)。

蛋白质结构预测方法

基于已有知识的预测方法:

二级结构预测法

比较建模法

折叠识别法

从头预测:

3.1 基于已有知识的预测方法

3.1.1 二级结构预测

二级结构预测常常被认为是预测蛋白质结构的第一步。

二级结构预测并不能得出蛋白质中原子的空间位置,而是对每个残基二级结构状态进行预测,即预测该残基是处于螺旋、折叠或无规卷曲中的哪一种,因此这种预测有时也被称为三态预测。

Chou-Fasman方法与GOR法:

使用氨基酸对二级结构的偏好性这个信息。

这种基于局部氨基酸组成的单一序列预测方法的精度相当低,通常,预测出处于正确二级结构状态中的残基比例要低于60%。

利用进化信息进行预测:

20世纪90年代初,人们意识到利用多序列比对得出的进化信息,可以显著地提高二级结构预测的质量。如残基对某种类型的二级结构有高度偏好保守模式信息序列和结构数据库中数据发生了爆炸式的增长,使得二级结构预测算法可以利用的进化和结构信息也大为增加;加之多序列比对算法本身的改善,促使二级结构预测的精度大大提高。

技术方法:

PSI-PRED:人工神经网络模型(next)

PHDSec:人工神经网络模型https://www.wendangku.net/doc/fd17240870.html,/predictprotein/

JPRED:三层神经网络方法https://www.wendangku.net/doc/fd17240870.html,/~www-jpred/submit.html :

这些方法的准确率都在70%以上,公认预测精度最好的是PSI-PRED

PSI-PRED

https://www.wendangku.net/doc/fd17240870.html,/psipred/

PSI-PRED用到了两级神经网络。它首先用PSI-BLAST迭代搜索序列数据库,并根据搜索出来的蛋白质建立目标蛋白质的profile (序列谱),从而将蛋白质氨基酸序列用profile来表示,对每个位点最终选择前后共15个位点组成一个窗口(windows)输入神经网络进行二级结构预测。

PSI-PRED的预测准确率可达75%。

跨膜片段的预测:

标准二级结构预测方法应用到跨膜蛋白的预测中结果非常的糟糕

依靠疏水残基片断来进行预测(※)

3.1.2 同源建模方法(Homology Modeling):

如果两个蛋白质序列在80个以上残基的序列比对中显示出25%的一致性,那么这两个蛋白质就具有相似的结构,这就是同源建模方法的理论基础。

如果一条结构未知的序列(通常称为目标序列)可以在已知结构库中找到一条或一条以上蛋白质满足上面的条件,那么已知的结构就可以用作目标序列的结构,所用的已知的蛋白质结构通常称作模板结构。

同源建模工具

SWISS-MODEL https://www.wendangku.net/doc/fd17240870.html,/SWISS-MODEL.html

SWISS-MODEL中一共有三个工作方式:

First Approach mode:

Alignment Interface mode:

Project(Optimise)mode:

SWISS-MODEL还能对寡聚蛋白质和GPCR(G Protein-Coupled Receptors )进行单独的建模。

3.1.3 折叠识别方法

折叠模式是关于蛋白质的一个结构类,那些具有相似的二级结构组成、数目以及排列的蛋白质被归入到一个相同的折叠模式类里面。

在一个折叠模式类里面的蛋白质序列相似度不一定很高,但它们都有相似的结构特征。

据理论分析,大自然中存在的总的折叠模板类数目少于1000个。所以就可以利用这些知识来提出一种新的蛋白质结构预测方法,也就是折叠识别的方法(Fold Recognition)。

克服同源建模方法发展的“瓶颈”:同源建模的方法单纯用序列相似度阈值作为判断结构相似与否,很可能遗漏一些原本相似的结构。因为蛋白质结构比序列有更强的保守性,即使序列相似度很低,结构也有可能有很高的相似性。但如果通过降低相似度阈值的方法提高预测敏感度,会导致其特异性降低,这是制约同源建模方法发展的“瓶颈”。

折叠识别方法:

基于序列比对法

Threading 方法

Threading方法不通过序列相似性比较来判断两个蛋白质的结构是否相关,而是直接判断待测序列和已知结构模板间的相关程度。

Threading方法认为天然结构中残基间相互的吸引或者排斥有一定的倾向性,也就是说某些残基出现在一定空间范围内对结构有稳定作用,而另外一些则会使结构变的不稳定,并假设这种作用能有一个能量函数加以描述。计算某条蛋白质序列安放到结构模板之后其残基间这种作用力分值,通过结果来判断未知结构和该模板结构之间的相似性。能量函数是通过统计已知结构库中残基对在一定范围内出现的频率,这个频率反映了残基间吸引或者排斥倾向,这个频率转换的分值也通常称作接触能。

折叠识别的网络服务:

FUGE: https://www.wendangku.net/doc/fd17240870.html,/~fugue/

3D-PSSM:https://www.wendangku.net/doc/fd17240870.html,/~3dpssm/index2.html

Gen-THREADER(next)

GenTHREADER https://www.wendangku.net/doc/fd17240870.html,/threader/ (下载)https://www.wendangku.net/doc/fd17240870.html,/psipred/psiform.html (PSIPRED 在线服务的项目之一)

Gen-THREADER应用二级神经网络在折叠模板库中搜索目标蛋白质的结构模板。用户只需要提交目标蛋白质的序列,Gen-THREADER就会通过邮件返回预测的结果。邮件返回的结果中将包含排列在前面10位的折叠模板的名称、预测可信度(分为Certain, High, Medium, Low, Guess五个不同的等级)、比对能量值以及目标蛋白质和模板蛋白质的序列比对结果。(next)

3.2 从头预测方法

Anfinsen于1974提出蛋白质天然构象是处于全局自由能最小状态,这就为通过计算蛋白质构象能来预测蛋白质三级结构提供了理论依据。

从头预测方法存在两个方面的问题:

首先,蛋白质折叠过程是一个非常复杂的动力学过程,受蛋白质组成以及外界(溶液)环境的影响,如今还没有一个很好的理论能描述这个过程。

其次,从头预测方法将自由能最小的构象作为天然的构象,能否找到这个天然构象还取决于

选取的能量函数是否能真实的反映蛋白质内部分子间相互作用以及能量关系,还没有一个很好的能量函数能反映蛋白质折叠。

正是由于这些制约,相比较前面所讲的同源建模、二级结构预测和折叠识别等方法,从头预测的方法目前并没有得到大范围的应用。

蛋白质结构预测的策略

第一步:判断目标序列中是否包含关键性的特征:

跨膜片段

查寻这个蛋白质中可能存在的已知结构域,如用 Interpro、PSI-BLAST之类的工具

第二步:是否能采用比较建模法

当不能用比较建模时,下一步则应该是二级结构预测

对于球蛋白的结构域的预测要比膜蛋白更加准确

二级结构预测完成之后则是进行折叠识别

预测精度通常也要比标准比较建模法低得多

蛋白质结构预测技术评估大赛 (Critical Assessment of Techniques for Protein Structure Prediction,CASP):

https://www.wendangku.net/doc/fd17240870.html,/

CASP是一个世界性的蛋白质结构预测技术评比活动。1994年,第一届CASP在美国马里兰大学生物技术研究所的约翰·莫尔特(John Moult)倡议、组织下举行,此后每两年举行一次。

First Approach mode:

如果没有除序列之外的任何信息,那么可以首先用First Approach mode来决定序列是否能通过同源方法建模。直接提交序列,SWISS-MODEL将在已知结构蛋白质数据库中搜索它的同源蛋白质,只有当序列相似度大于25%时才会建立结构模型,并返回寻找到的模板结构。Alignment Interface mode:

如果已经得到了这条蛋白质的同源蛋白质以及它们的多序列比对结果,而且它的同源蛋白中包含了已知结构的蛋白质,那么可以通过Alignment Interface mode直接进行结构建模。Project(Optimise)mode:

对First Approach mode得到的结构模型进行优化,Project mode利用生物化学信息来修正结构模型上存在的能量不合理区域。并且Project mode允许用户自行调整,以得到更精确的模型。

抗体的基本结构(精制甲类)

免疫球蛋白目录 1. 拼音 2. 英文参考 3. 概述 4. 免疫球蛋白分子的基本结构 1. 轻链和重链 2. 可变区和恒定区 3. 功能区 4. J链和分泌成分 5. 单体、双体和五聚体 6. 酶解片段 5. 免疫球蛋白分子的功能 1. 特异性结合抗原 2. 活化补体 3. 结合Fc受体 4. 通过胎盘 6. 免疫球蛋白分子的抗原性 1. 同种型 2. 同种异型 3. 独特型 7. 免疫球蛋白分子的超家族 1. 免疫球蛋白超家族的组成 2. 免疫球蛋白超家族的特点 8. 各类免疫球蛋白的生物学活性 1. IgG 2. IgA 3. IgM 4. IgD 5. IgE 9. 免疫球蛋白基因的结构和抗体多样性 1. Ig重链基因的结构和重排 2. Ig轻链基因的结构和重排 3. 抗体多样性的遗传学基础

10. 药理作用 11. 药品说明书 1. 适应症 2. 用量用法 12. 相关文献 具有抗体活性的血清蛋白称为免疫球蛋白,又称为抗体。是由机体的B淋巴细胞在抗原的刺激下分化、分裂而成的一组特殊球蛋白。人和动物的免疫血清中的免疫球蛋白极不均一,其组成、结构、大小、电荷、生物学活性等都有很大差异,约占机体全部血清蛋白的20~25%。目前已在人、小鼠等血清中先后分纯得到5类免疫球蛋白,1968年,世界卫生组织统一命名为免疫球蛋白G(IgG)、免疫球蛋白M(IgM)、免疫球蛋白A(IgA)、免疫球蛋白D(IgD)、免疫球蛋白E(IgE)。 免疫球蛋白分子的基本结构 Porter等对血清IgG抗体的研究证明,Ig单体分子的基本结构是由四条肽链组成的。即由二条相同的分子量较小的肽链称为轻链和二条相同的分子量较大的肽链称为重链组成的。轻链与重链是由二硫键连接形成一个四肽链分子称为Ig分子的单体,是构成免疫球蛋白分子的基本结构。Ig单体中四条肽链两端游离的氨基或羧基的方向是一致的,分别命名为氨基端(N端)和羧基端(C端)。 图2-3 免疫球蛋白分子的基本结构示意图 轻链和重链

三种分析蛋白结构域的方法

三种分析蛋白结构域(Domains)的方法 1,SMART入门,蛋白结构和功能分析 SMART介绍 SMART (a Simple Modular Architecture Research Tool) allows the identification and annotation of genetically mobile domains and the analysis of domain architectures. More than 500 domain families found in signalling, extracellular and chromatin-associated proteins are detectable. These domains are extensively annotated with respect to phyletic distributions, functional class, tertiary structures and functionally important residues. Each domain found in a non-redundant protein database as well as search parameters and taxonomic information are stored in a relational database system. User interfaces to this database allow searches for proteins containing specific combinations of domains in defined taxa. For all the details, please refer to the publications on SMART. SMART(,可以说是蛋白结构预测和功能分析的工具集合。简单点说,就是 集合了一些工具,可以预测蛋白的一些二级结构。如跨膜区(Transmembrane segments),复合螺旋区(coiled coil regions),信号肽(Signal peptides),蛋白结构域(PFAM domains)等。 SMART前该知道的 1,SMART有两种不同的模式:normal 或genomic 主要是用的数据库不一样。Normal SMART, 用的数据库 Swiss-Prot, SP-TrEMBL 和 stable Ensembl proteomes。Genomic SMART, 用全基因组序列。详细列表:,一些名词解释 进行时 可以直接用各个数据库蛋白的ID。如Uniprot/Ensembl??ID / Accession number (ACC)。或是直接蛋白序列。运行SMART也可选择signal peptides、PFAM domains等的预测,勾上就是。看下图 SMART结果 运行后的结果用图表表示。其实运行后的结果都有明确的解释。详细请看下面。

免疫球蛋白的试题及答案

第四章免疫球蛋白 名词解释: 1.抗体(antibody) 2.Fab(fragment antigen binding) 3.Fc(fragment crytallizable) 4.免疫球蛋白(Immunoglobulin Ig) 5.超变区(hypervariable region,HVR) 6.可变区(variable region,V区) 7.单克隆抗体(Monoclonal antibody, mAb) 8.ADCC(Antibody –dependent cell-mediatedcytotoxicity) 9.调理作用(opsonization) 10.J链(joining chain) 11.分泌片(secretory piece) 12.Ig功能区(Ig domain) 13.Ig折叠(Ig folding) 14.CDR(complementary-determining region) 问答题 1.简述抗体与免疫球蛋白的区别和联系。 2.试述免疫球蛋白的主要生物学功能。 3.简述免疫球蛋白的结构、功能区及其功能。 4.简述单克隆抗体技术的基本原理。 参考答案 名词解释 1.抗体(Antibody) :是B 细胞特异性识别Ag后,增殖分化成 为浆细胞,所合成分泌的一类能与相应抗原特异性结合的、具有免疫 功能的球蛋白。 2.Fab(Fragment antigen binding):即抗原结合片段,每个Fab 段由一条完整的轻链和重链的VH和CH1功能区构成,可以与抗原表位 发生特异性结合。 3.Fc片段(fragment crytallizable):即可结晶片段,相当于IgG的CH2和CH3功能区,无抗原结合活性,是抗体分子与效应分子和 细胞相互作用的部位。 4. 免疫球蛋白(Immunoglobulin,Ig):是指具有抗体活性或化 学结构与抗体相似的球蛋白。可分为分泌型和膜型两类。 5.高变区(hypervariable region ,HVR):在Ig分子VL和VH 内,某些区域的氨基酸组成、排列顺序与构型更易变化,这些区域为 超变区。 6.可变区(V区):在Ig多肽链氨基端(N端),L链1/2与H链1/4 区域内,氨基酸的种类、排列顺序与构型变化很大,故称为可变区。 7.单克隆抗体(Monoclonal antibody ,mAb):是由识别一个抗 原决定簇的B淋巴细胞杂交瘤分裂而成的单一克隆细胞所产生的高度 均一、高度专一性的抗体。 8.ADCC(Antibody –dependent cell-mediatedcytotoxicity):即抗体依赖的细胞介导的细胞毒作用。是指表达Fc受体细胞通过识别 抗体的Fc段直接杀伤被抗体包被的靶细胞。NK细胞是介导ADCC的主要 细胞。

第四章 免疫球蛋白剖析

第四章免疫球蛋白 第一节基本概念 1、抗体:B淋巴细胞在有效的抗原刺激下分化为浆细胞,产生具有与相应抗原发生特异性结合功能的免疫球蛋白,这类免疫球蛋白称为抗体。 1937年,Tiselius用电泳方法将血清蛋白分为白蛋白、α1、α2、β及γ球蛋白等组分,其后又证明抗体的活性部分是在γ球蛋白部分。因此,相当长一段时间内,抗体又被称为γ球蛋白(丙种球蛋白)。实际上,抗体的活性除γ球蛋白外,还存在于α和β球蛋白处。 20世纪40年代初期,Tiselius和Kabat用肺炎球菌多糖免疫家兔,证实了抗体活性与血清丙种球蛋白组分相关。肺炎球菌多糖免疫家兔后可获得高效价免疫血清。然后加入相应抗原吸收以除去抗体,将除去抗体的血清进行电泳图谱分析,发现丙种球蛋白(γ-G)组分明显减少,从而证明了抗体活性是存在于丙种球蛋白内。 2、免疫球蛋白:具有抗体活性或化学结构与抗体相似的球蛋白统称为免疫球蛋白(immunoglobulin,Ig)。 区别: 抗体都是免疫球蛋白,而免疫球蛋白并不都是抗体。如骨髓瘤蛋白,巨球蛋白血症、冷球蛋白血症等患者血清中存在的异常免疫球蛋白结构与抗体相似,但无抗体活性。 免疫球蛋白可分为分泌型(secreted Ig,SIg)和膜型(membrane Ig, mIg)。 前者主要存在于血清及其他体液或外分泌液中,具有抗体的各种功能;后 者是B细胞表面的抗原识别受体。 第二节免疫球蛋白结构

一、免疫球蛋白的基本结构 (一)重链和轻链 免疫球蛋白分子是由两条相同的重链(heavy chain,H链)和两条相同的轻链(light chain,L链)通过链间二硫键连接而成的四肽链结构。X 射线晶体结构分析发现,IgG分子由3个相同大小的节段组成。 1. 重链 分子量约为50~75kD,由450~550个氨基酸残基组成。免疫球蛋白重链恒定区由于氨基酸的组成和排列顺序不同,故其抗原性也不同。据此,可将免疫球蛋白分为五类,即IgM、IgD、IgG、IgA和IgE,其相应的重链分别为μ链、δ链、γ链、α链和ε链。不同的同种型具有不同的特征,包括链内二硫键的数目和位置、连接寡糖的数量、功能区的数目以及铰链区的长度等。同一类Ig根据其铰链区氨基酸组成和重链二硫键的数目和位置的差别,又可分为不同的亚类。如IgG可分为IgG1~IgG4;IgA可分为IgA1和IgA2。IgM、IgD和IgE尚未发现有亚类。 2.轻链 免疫球蛋白轻链的分子量约25 kD,由214个氨基酸残基构成。轻链可分为两型,即κ(kappa)型和λ(lambda)型,一个天然Ig分子上两条轻链的型别总是相同的,两型轻链的功能无差异。不同种属中,两型轻链的比例不同,正常人血清免疫球蛋白κ:λ约为2:1,而在小鼠则为20:1。κ:λ比例的异常可能反映免疫系统的异常,例如人类免疫球蛋白λ链过多,提示可能有产生λ链的B细胞肿瘤。根据λ链恒定区个别氨基酸的差异,又可分为λ1、λ2、λ3和λ 4 四个亚型。 (二)可变区和恒定区 通过分析不同免疫球蛋白重链和轻链的氨基酸序列,发现重链和轻链靠近N端的约110个氨基酸的序列变化很大,称为可变区(variable

蛋白质结构分析原理及工具-文献综述

蛋白质结构分析原理及工具 (南京农业大学生命科学学院生命基地111班) 摘要:本文主要从相似性检测、一级结构、二级结构、三维结构、跨膜域等方面从原理到方法再到工具,系统地介绍了蛋白质结构分析的常用方法。文章侧重于工具的列举,并没有对原理和方法做详细的介绍。文章还列举了蛋白质分析中常用的数据库。 关键词:蛋白质;结构预测;跨膜域;保守结构域 1 蛋白质相似性检测 蛋白质数据库。由一个物种分化而来的不同序列倾向于有相似的结构和功能。物种分化后形成的同源序列称直系同源,它们通常具有相似的功能;由基因复制而来的序列称为旁系同源,它们通常有不同的功能[1]。因此,推测全新蛋白质功能的第一步是将它的序列与进化上相关的已知结构和功能的蛋白质序列比较。表一列出了常用的蛋白质序列数据库和它们的特点。 表一常用蛋白质数据库 网址可能有更新 氨基酸替代模型。进化过程中,一种氨基酸残基会有向另一种氨基酸残基变化的倾向。氨基酸替代模型可用来估计氨基酸替换的速率。目前常用的替代模型有Point Accepted Mutation (PAM)矩阵、BLOck SUbstitution Matrix (BLOSUM)矩阵[2]、JTT模型[3]。 序列相似性搜索工具。序列相似性搜索又分为成对序列相似性搜索和多序列相似性搜索。成对序列相似性搜索通过搜索序列数据库从而找到与查询序列相似的序列。分为局部联配和全局联配。常用的局部联配工具有BLAST和SSEARCH,它们使用了Smith-Waterman 算法。全局联配工具有FASTA和GGSEARCH,基于Needleman-Wunsch算法。多序列相似性搜索常用于构建系统发育树,这里不阐述。表二列举了常用的成对序列相似性比对搜索工具

结构域

结构域 科技名词定义 中文名称:结构域 英文名称:domain;structural domain;motif 其他名称:模体,基序 定义1:多肽链内一段类似球形的折叠区。多数结构域具有一定的一级结构和相应功能。 所属学科:免疫学(一级学科);概论(二级学科);免疫学相关名词(三级学科) 定义2:蛋白质或核酸分子中含有的、与特定功能相关的一些连续的或不连续的氨基酸或核苷酸残基。 所属学科:生物化学与分子生物学(一级学科);总论(二级学科) 定义3:蛋白质多肽链中可被特定分子识别和具有特定功能的三级结构元件。 所属学科:细胞生物学(一级学科);细胞化学(二级学科) 本内容由全国科学技术名词审定委员会审定公布 结构域是生物大分子中具有特异结构和独立功能的区域,特别指蛋白质中这样的区域。在球形蛋白中,结构域具有自己特定的四级结构,其功能部依赖于蛋白质分子中的其余部分,但是同一种蛋白质中不同结构域间常可通过不具二级结构的短序列连接起来。蛋白质分子中不同的结构域常由基因的不同外显子所编码。 目录 编辑本段介绍 (Domain)

在蛋白质三级结构内的独立折叠单元。结构域通常都是几个超二级结构单元的组合 结构域 。 结构域(Structural Domain)是介于二级和三级结构之间的另一种结构层次。所谓结构域是指蛋白质亚基结构中明显分开的紧密球状结构区域,又称为辖区。多肽链首先是在某些区域相邻的氨基酸残基形成有规则的二级结构,然后,又由相邻的二级结构片段集装在一起形成超二级结构,在此基础上多肽链折叠成近似于球状的三级结构。对于较大的蛋白质分子或亚基,多肽链往往由两个或多个在空间上可明显区分的、相对独立的区域性结构缔合而成三级结构,这种相对独立的区域性结构就称为结构域。对于较小的蛋白质分子或亚基来说,结构域和它的三级结构往往是一个意思,也就是说这些蛋白质或亚基是单结构域。结构域自身是紧密装配的,但结构域与结构域之间关系松懈。结构域与结构域之间常常有一段长短不等的肽链相连,形成所谓铰链区。不同蛋白质分子中结构域的数目不同,同一蛋白质分子中的几个结构域彼此相似或很不相同。常见结构域的氨基酸残基数在100~400个之间,最小的结构域只有40~50个氨基酸残基,大的结构域可超过400个氨基酸残基。 编辑本段连接状况 有些球 结构域 形蛋白的一条肽链,或以共价键相连的两条或多条肽链在空间结构上可以区分为若干个球状的子结构,其中的每一个球状子结构就被称为一个结构域。

免疫球蛋白的结构

第一节免疫球蛋白的结构(The Structure of Immunoglobulin) B淋巴细胞在抗原刺激下增殖分化为浆细胞,产生能与相应抗原发生特异性结合的免疫蛋白,这类免疫球蛋白被称为抗体(antibody, Ab)。 1937年,Tiselius用电泳方法将血清蛋白分为白蛋白、α1、α2、β及γ球蛋白等组分,其后又证明抗体的活性部分是在γ球蛋白部分。因此,相当长一段时间内,抗体又被称为γ球蛋白(丙种球蛋白)。 实际上,抗体的活性除γ球蛋白外,还存在于α和β球蛋白处。1968年和1972年的两次国际会议上,将具有抗体活性或化学结构与抗体相似的球蛋白统一命名为免疫球蛋白(immunoglobulin,Ig)。 Ig是化学结构的概念,它包括正常的抗体球蛋白和一些未证实抗体活性的免疫球蛋白,如骨髓瘤病人血清中的M蛋白及尿中的本周氏(Bence Jones, BJ)蛋白等。 免疫球蛋白可分为分泌型(secreted Ig,SIg)和膜型(membrane Ig, mIg)。前者主要存在于血清及其他体液或外分泌液中,具有抗体的各种功能;后者是B细胞表面的抗原识别受体。 ☆☆相关素材☆☆ 图片正常人血清电泳分离图 一免疫球蛋白的基本结构 The basical structure of immunoglobulin 免疫球蛋白分子是由两条相同的重链(heavy chain,H链)和两条相同的轻链(light chain,L链)通过链间二硫键连接而成的四肽链结构。 X射线晶体结构分析发现,IgG分子由3个相同大小的节段组成,位于上端的两个臂由易弯曲的铰链区(hinge region)连接到主干上形成一个"Y"形分子,称为Ig分子的单体,是构成免疫球蛋白分子的基本单位。

抗体的基本结构

1.适应症 2.用量用法 12.相关文献 具有抗体活性得血清蛋白称为免疫球蛋白,又称为抗体。就是由机体得B淋巴细胞在抗原得刺激下分化、分裂而成得一组特殊球蛋白。人与动物得免疫血清中得免疫球蛋白极不均一,其组成、结构、大小、电荷、生物学活性等都有很大差异,约占机体全部血清蛋白得20~25%。目前已在人、小鼠等血清中先后分纯得到5类免疫球蛋白,1968年,世界卫生组织统一命名为免疫球蛋白G(IgG)、免疫球蛋白M(IgM)、免疫球蛋白A(IgA)、免疫球蛋白D(IgD)、免疫球蛋白E(IgE)。 免疫球蛋白分子得基本结构 Porter等对血清IgG抗体得研究证明,Ig单体分子得基本结构就是由四条肽链组成得。即由二条相同得分子量较小得肽链称为轻链与二条相同得分子量较大得肽链称为重链组成得。轻链与重链就是由二硫键连接形成一个四肽链分子称为Ig分子得单体,就是构成免疫球蛋白分子得基本结构。Ig单体中四条肽链两端游离得氨基或羧基得方向就是一致得,分别命名为氨基端(N端)与羧基端(C端)。 图2-3 免疫球蛋白分子得基本结构示意图 轻链与重链 由于骨髓瘤蛋白(M蛋白)就是均一性球蛋白分子,并证明本周蛋白(BJ)就是Ig分子得L链,很容易从患者血液与尿液中分离纯化这种蛋白,并可对来自不同患者得标本进行比较分析,从而为Ig分子氨基酸序列分析提供了良好得材料。

1.轻链(lightchain,L)轻链大约由214个氨基酸残基组成,通常不含碳水化合物,分子量约为24kD。每条轻链含有两个链内二硫键所组成得环肽。L链共有两型:kappa(κ)与lambda(λ),同一个天然Ig分子上L链得型总就是相同得。正常人血清中得κ:λ约为2:1。 2.重链(heavychain,H链)重链大小约为轻链得2倍,含450~550个氨基酸残基,分子量约为55或75kD。每条H链含有4~5个链内二硫键所组成得环肽。不同得H链由于氨基酸得排列顺序、二硫键得数目与们置、含糖得种类与数量不同,其抗原性也不相同,根据H链抗原性得差异可将其分为5类:μ链、γ链、α链、δ链与ε链,不同H链与L链(κ或λ链)组成完整Ig得分子分别称之为IgM、IgG、IgA、IgD与IgE。γ、α与δ链上含有4个环肽,μ与ε链含有5个环肽。重链(heavy chain,H链)由450~570个氨基酸残基组成,分子量约为50~70kD。不同得H链因氨基酸得排列顺序、二硫键得数目与位置、含糖得种类与数量不同,其抗原性也不相同,可将其分为μ链、γ链、α链、δ链、ε链五类,这些H链与L链(κ链或λ链)组成得完整Ig分子分别称为IgM(μ)、IgG(γ)、IgA(α)、IgD(δ)与IgE(ε 可变区与恒定区 通过对不同骨髓蛋白或本周蛋白H链或L链得氨基酸序列比较分析,发现其氨基端(N-末端)氨基酸序列变化很大,称此区为可变区(V),而羧基末端(C-末端)则相对稳定,变化很小,称此区为恒定区(C区)。 1.可变区(variableregion,V区)位于L链靠近N端得1/2(约含108~111个氨基酸残基)与H链靠近N端得1/5或1/4(约含118个氨基酸残基)。每个V区中均有一个由链内二硫键连接形成得肽环,每个肽环约含67~75个氨基酸残基。V区氨基酸得组成与排列随抗体结合抗原得特异性不同有较大得变异。由于V区中氨基酸得种类、排列顺序千变万化,故可形成许多种具有不同结合抗原特异性得抗体。 L链与H链得V区分别称为VL与VH。在VL与VH中某些局部区域得氨基酸组成与排列顺序具有更高得变休程度,这些区域称为高变区(hypervariable region,HVR)。在V区中非HVR部位得氨基酸组面与排列相对比较保守,称为骨架区(framework region)。VL中得高变区有三个,通常分别位于第24~34、50~65、95~102位氨基酸。VL与VH得这三个HVR分别称为HVR1、HVR2与HVR3。经X线结晶衍射得研究分析证明,高变区确实为抗体与抗原结合得位置,因而称为决定簇互补区(plementarity-determining region,CDR)。VL 与VH得HVR1、HVR2与HVR3又可分别称为CDR1、CDR2与CDR3,一般得CDR3具有更高得高变程度。高变区也就是Ig分子独特型决定簇(idiotypic determinants)主要存在得部位。在大多数情况下H链在与抗原结合中起更重要得作用。

免疫球蛋白的结构

第一节免疫球蛋白的结构 (The Structure of Immunoglobulin) B淋巴细胞在抗原刺激下增殖分化为浆细胞,产生能与相应抗原发生特异性结合的免疫蛋 白,这类免疫球蛋白被称为抗体( an tibody, Ab )。 1937年,Tiselius 用电泳方法将血清蛋白分为白蛋白、a 1、a 2、B及丫球蛋白等组分,其后又证明抗体的活性部分是在丫球蛋白部分。因此,相当长一段时间内,抗体又被称为丫 球蛋白(丙种球蛋白)。 实际上,抗体的活性除丫球蛋白外,还存在于a和B球蛋白处。1968年和1972年的两次 国际会议上,将具有抗体活性或化学结构与抗体相似的球蛋白统一命名为免疫球蛋白(immunoglobulin , Ig )。 Ig是化学结构的概念,它包括正常的抗体球蛋白和一些未证实抗体活性的免疫球蛋白,如骨髓瘤病人血清中的M蛋白及尿中的本周氏(Be nee Jon es, BJ )蛋白等。 免疫球蛋白可分为分泌型(secreted lg,Slg )和膜型(membrane Ig, mIg )。前者主要存在于血清及其他体液或外分泌液中,具有抗体的各种功能;后者是B细胞表面的抗原识别 受体。 ☆☆相关素材☆☆ 图片正常人血清电泳分离图 I 丨总血清 -------- igG -------- IgA --------- IgM 一电泳迁移率十 (igES极少、不能定曲表示) 正常人血清电泳分离图 一免疫球蛋白的基本结构The basical structure of immunoglobulin 免疫球蛋白分子是由两条相同的重链( heavy chain , H链)和两条相同的轻链(light chain , L链)通过链间二硫键连接而成的四肽链结构。 X射线晶体结构分析发现,IgG分子由3个相同大小的节段组成,位于上端的两个臂由易弯曲的铰链区(hinge region )连接到主干上形成一个 "Y"形分子,称为Ig分子的单体, 是构成免疫球蛋白分子的基本单位。

蛋白质的功能域、结构及其药物设计----6

第六章 蛋白质的功能域、结构及其药物设计 随着人类基因组全序列测定的完成,预示着基因组研究从结构基因组(Structural Genomics)进入了功能基因组(Functional Genomics)研究时代。研究基因组功能当然首先要研究基因表达的模式。当前研究这一问题可以基于核酸技术,也可以基于蛋白质技术,即直接研究基因的表达产物。测定一个有机体的基因组所表达的全部蛋白质的设想是由Williams于1994年正式提出的,而“蛋白质组”(proteome)一词是Wilkins于1995年首次提出。蛋白质组是指由一个细胞或组织的基因组所表达的全部相应的蛋白质。蛋白质组与基因组相对应,均是一个整体概念,但是两者又有根本的不同:一个有机体只有一个确定的基因组,组成该有机体的所有不同细胞都共享有一个基因组;但是,基因组内各个基因表达的条件、时间和部位等不同,因而它们的表达产物(蛋白质)也随条件、时间和部位的不同而有所不同。因此,蛋白质组又是一个动态的概念。由于以上原因,再加上由于基因剪接,蛋白质翻译后修饰和蛋白质剪接,基因遗传信息的表达规律更趋复杂,不再是经典的一个基因一个蛋白的对应关系,而是一个基因可以表达的蛋白质数目大于一。由此可见,蛋白质组研究是一项复杂而艰巨的任务。 蛋白质结构与功能的研究已有相当长的历史,由于其复杂性,对其结构与功能的预测不论是方法论还是基础理论方面均较复杂。统计学方法曾被成功地应用于蛋白质二级结构预测中,如Chou和Fasman提出的经验参数法便是最突出的例子。 该方法统计分析了各种氨基酸的二级结构分布特征,得出相应参数(P а,P β 和P t )并 用于预测。本章将简要介绍蛋白质结构与功能预测的生物信息学途径。 第一节 蛋白质功能预测 一、根据序列预测功能的一般过程 如果序列重叠群(contig)包含有蛋白质编码区,则接下来的分析任务是确定表达产物——蛋白质的功能。蛋白质的许多特性可直接从序列上分析获得,如疏水性,它可以用于预测序列是否跨膜螺旋(transmenbrane helix)或是前导序列(leader sequence)。但是,总的来说,我们根据序列预测蛋白质功能的唯一方法是通过数据库搜寻,比较该蛋白是否与已知功能的蛋白质相似。有2条主要途径可以进行上述的比较分析: ①比较未知蛋白序列与已知蛋白质序列的相似性; ②查找未知蛋白中是否包含与特定蛋白质家族或功能域有关的亚序列或保守区段。 图6.1给出了根据序列预测蛋白质功能的大致过程。由于涉及数条技术路线,所得出的分析结果并不会总是相一致。一般来说,数据库相似性搜索获得的结果最为可靠,而来自PROSITE的结果相对不可靠。

蛋白质序列、性质、功能和结构分析

蛋白质序列、性质、功能和结构分析 基于网络的蛋白质序列检索与核酸类似,从NCBI或利用SRS系统从EMBL检索。 1、疏水性分析ExPASy的ProtScale程序(https://www.wendangku.net/doc/fd17240870.html,/cgi-bin/protscale.pl)可用来计算蛋白质的疏水性图谱。输入的数据可为蛋白质序列或SWISS-PROT数据库的序列接受号。也可用BioEdit、DNAMAN等软件进行分析。 2、跨膜区分析蛋白质跨膜区域分析的网络资源有: TMPRED:https://www.wendangku.net/doc/fd17240870.html,/software/TMPRED_form.html PHDhtm: http:www.embl-heidelberg.de/Services/ ... predictprotein.html MEMSAT: ftp://https://www.wendangku.net/doc/fd17240870.html, 3、前导肽和蛋白质定位一般认为,蛋白质定位的信息存在于该蛋白自身结构中,并且通过与膜上特殊受体的相互作用得以表达。这就是信号肽假说的基础。这一假说认为,穿膜蛋白质是由 mRNA编码的。在起始密码子后,有一段疏水性氨基酸序列的RNA片段,这个氨基酸序列就称为信号序列(signal sequence)。蛋白质序列的信号肽分析可联网到http://genome.cbs.dtu.dk/services/SignalP/或其二版网址http: //genome.cbs.dtu.dk/services/SignalP-2.0/。该服务器也提供利用e-mail 进行批量蛋白质序列信号肽分析的方案(http://genome.cbs.dtu.dk/services/SignalP/mailserver.html),e-mail 地址为 signalp@ genome.cbs.dtu.dk。蛋白质序列中含有的信号肽序列将有助于它们向细胞内特定区域的移动,如前导肽和面向特定细胞器的靶向肽。在线粒体蛋白质的跨膜运输过程中,通过线粒体膜的蛋白质在转运之前大多数以前体形式存在,它由成熟蛋白质和N端延伸出的一段前导肽或引肽(leader peptide)共同组成。迄今有40多种线粒体蛋白质前导肽的一级结构被阐明,它们约含有20~80个氨基酸残基,当前体蛋白跨膜时,前导肽被一种或两种多肽酶所水解转变成成熟蛋白质,同时失去继续跨膜能力。前导肽一般具有如下性质:①带正电荷的碱性氨基酸(特别是精氨酸)含量较丰富,它们分散于不带电荷的氨基酸序列中间;②缺失带负电荷的酸性氨基酸;③羟基氨基酸(特别是丝氨酸)含量较高;④有形成两亲(即有亲水又有疏水部分)α-螺旋结构的能力。和信号肽与跨膜区结构一样,蛋白质的亚细胞定位也和其功能密切相关,蛋白质亚细胞定位分析可通过如下网址进行:http://predict.

免疫球蛋白分子的结构与功能

、免疫球蛋白分子的基本结构 Porter等对血清IgG 抗体的研究证明,lg分子的基本结构是由四肽链组成的。即由二条 相同的分子量较小的肽链称为轻链和二条相同的分子量较大的肽链称为重链组成的。轻链与重链是由二硫键连接形成一个四肽链分子称为lg分子的单体,是构成免疫球蛋白分子的基 本结构。lg单体中四条肽链两端游离的氨基或羧基的方向是一致的,分别命名为氨基端(N 端)和羧基端(C端)。 图2-3免疫球蛋白分子的基本结构示意图 (一)轻链和重链 由于骨髓瘤蛋白(M蛋白)是均一性球蛋白分子,并证明本周蛋白(BJ)是lg分子的 L链,很容易从患者血液和尿液中分离纯化这种蛋白,并可对来自不同患者的标本进行比较 分析,从而为lg分子氨基酸序列分析提供了良好的材料。 1. 轻链(light chain,L )轻链大约由214个氨基酸残基组成,通常不含碳水化合物,分子量约为24kD。每条轻链含有两个由链内二硫键内二硫所组成的环肽。L链共有两型:kappa(与lambda(入)同一个天然lg分子上L链的型总是相同的。正常人血清中的K入约为2:1。 2. 重链(heavy chain,H链)重链大小约为轻链的2倍,含450?550个氨基酸残基,分子量约为55或75kD。每条H链含有4?5个链内二硫键所组成的环肽。不同的H链由于 ?戰水化合韧

氨基酸组成的排列顺序、二硫键的数目和们置、含的种类和数量不同,其抗原性也不相同,根据H链抗原性的差异可将其分为5类:卩链、丫链、a链、3链和£链,不同H链与L链 (K或入链)组成完整Ig的分子分别称之为IgM、IgG、IgA、IgD和IgE。Y a和3链上含有4个肽,□和&链含有5个环肽。 (二)可变区和恒定区 通过对不同骨髓蛋白或本周蛋白H链或L链的氨基酸序列比较分析,发现其氨基端(N- 末端)氨基酸序列变化很大,称此区为可变区(V),而羧基末端(C-末端)则相对稳定,变化很小,称此区为恒定区。 1. 可变区(variable region,V区)位于L链靠近N端的1/2 (约含108?111个氨基酸残基)和H链靠近N端的1/5或1/4 (约含118个氨基酸残基)。每个V 区中均有一个由链内二硫键连接形成的肽环,每个肽环约含67?75个氨基酸残基。V区氨基酸的组成和排列 随抗体结合抗原的特异性不同有较大的变异。由于V区中氨基酸的种类为排列顺序千变万 化,故可形成许多种具有不同结合抗原特异性的抗体。 L链和H链的V区分别称为VL和VH。在VL和VH中某些局部区域的氨基酸组成和排列顺序具有更高的变休程度,这些区域称为高变区(hypervariable region,HVR )。在V区 中非HVR部位的氨基酸组面和排列相对比较保守,称为骨架区(fuamework rugion )。VL 中的高变区有三个,通常分别位于第24?34、50?65、95?102位氨基酸。VL和VH的这 三个HVR分别称为HVR1、HVR2和HVR3。经X线结晶衍射的研究分析证明,高变区确实为抗体与抗原结合的位置,因而称为决定簇互补区(compleme ntarity-determi ning regi-on,CDR)o VL 和VH 的HVR1、HVR2 和HVR3 又可分另U称为CDR1、CDR2 和CDR3 , 一般的CDR3具有更高的高变程度。高变区也是Ig分子独特型决定簇(idiotypic determ inants 主要存在的部位。在大多数情况下H链在与抗原结合中起更重要的作用。

免疫球蛋白分子的结构与功能

一、免疫球蛋白分子的基本结构 Porter等对血清IgG抗体的研究证明,Ig分子的基本结构是由四肽链组成的。即由二条相同的分子量较小的肽链称为轻链和二条相同的分子量较大的肽链称为重链组成的。轻链与重链是由二硫键连接形成一个四肽链分子称为Ig分子的单体,是构成免疫球蛋白分子的基本结构。Ig单体中四条肽链两端游离的氨基或羧基的方向是一致的,分别命名为氨基端(N 端)和羧基端(C端)。 图2-3 免疫球蛋白分子的基本结构示意图 (一)轻链和重链 由于骨髓瘤蛋白(M蛋白)是均一性球蛋白分子,并证明本周蛋白(BJ)是Ig分子的L链,很容易从患者血液和尿液中分离纯化这种蛋白,并可对来自不同患者的标本进行比较分析,从而为Ig分子氨基酸序列分析提供了良好的材料。 1.轻链(light chain,L)轻链大约由214个氨基酸残基组成,通常不含碳水化合物,分子量约为24kD。每条轻链含有两个由链内二硫键内二硫所组成的环肽。L链共有两型:kappa(κ)与lambda(λ),同一个天然Ig分子上L链的型总是相同的。正常人血清中的κ:λ约为2:1。 2.重链(heavy chain,H链)重链大小约为轻链的2倍,含450~550个氨基酸残基,分子量约为55或75kD。每条H链含有4~5个链内二硫键所组成的环肽。不同的H链由于

氨基酸组成的排列顺序、二硫键的数目和们置、含的种类和数量不同,其抗原性也不相同,根据H链抗原性的差异可将其分为5类:μ链、γ链、α链、δ链和ε链,不同H链与L链(κ或λ链)组成完整Ig的分子分别称之为IgM、IgG、IgA、IgD和IgE。γ、α和δ链上含有4个肽,μ和ε链含有5个环肽。 (二)可变区和恒定区 通过对不同骨髓蛋白或本周蛋白H链或L链的氨基酸序列比较分析,发现其氨基端(N-末端)氨基酸序列变化很大,称此区为可变区(V),而羧基末端(C-末端)则相对稳定,变化很小,称此区为恒定区。 1.可变区(variable region,V区)位于L链靠近N端的1/2(约含108~111个氨基酸残基)和H链靠近N端的1/5或1/4(约含118个氨基酸残基)。每个V区中均有一个由链内二硫键连接形成的肽环,每个肽环约含67~75个氨基酸残基。V区氨基酸的组成和排列随抗体结合抗原的特异性不同有较大的变异。由于V区中氨基酸的种类为排列顺序千变万化,故可形成许多种具有不同结合抗原特异性的抗体。 L链和H链的V区分别称为VL和VH。在VL和VH中某些局部区域的氨基酸组成和排列顺序具有更高的变休程度,这些区域称为高变区(hypervariable region,HVR)。在V区中非HVR部位的氨基酸组面和排列相对比较保守,称为骨架区(fuamework rugion)。VL 中的高变区有三个,通常分别位于第24~34、50~65、95~102位氨基酸。VL和VH的这三个HVR分别称为HVR1、HVR2和HVR3。经X线结晶衍射的研究分析证明,高变区确实为抗体与抗原结合的位置,因而称为决定簇互补区(complementarity-determining regi-on,CDR)。VL和VH的HVR1、HVR2和HVR3又可分别称为CDR1、CDR2和CDR3,一般的CDR3具有更高的高变程度。高变区也是Ig分子独特型决定簇(idiotypic determinants)主要存在的部位。在大多数情况下H链在与抗原结合中起更重要的作用。

抗体的基本结构

抗体的基本结构

免疫球蛋白

具有抗体活性的血清蛋白称为免疫球蛋白,又称为抗体。是由机体的B淋巴细胞在抗原的刺激下分化、分裂而成的一组特殊球蛋白。人和动物的免疫血清中的免疫球蛋白极不均一,其组成、结构、大小、电荷、生物学活性等都有很大差异,约占机体全部血清蛋白的20~25%。目前已在人、小鼠等血清中先后分纯得到5类免疫球蛋白,1968年,世界卫生组织统一命名为免疫球蛋白G

(IgG)、免疫球蛋白M(IgM)、免疫球蛋白A(IgA)、免疫球蛋白D (IgD)、免疫球蛋白E(IgE)。 免疫球蛋白分子的基本结构 Porter等对血清IgG抗体的研究证明,Ig单体分子的基本结构是由四条肽链组成的。即由二条相同的分子量较小的肽链称为轻链和二条相同的分子量较大的肽链称为重链组成的。轻链与重链是由二硫键连接形成一个四肽链分子称为Ig分子的单体,是构成免疫球蛋白分子的基本结构。Ig单体中四条肽链两端游离的氨基或羧基的方向是一致的,分别命名为氨基端(N端)和羧基端(C 端)。 图2-3 免疫球蛋白分子的基本结构示意图 轻链和重链 由于骨髓瘤蛋白(M蛋白)是均一性球蛋白分子,并证明本周蛋白(BJ)是Ig分子的L链,很容易从患者血液和尿液中分离纯化这种蛋白,并可对来自

不同患者的标本进行比较分析,从而为Ig分子氨基酸序列分析提供了良好的材料。 1.轻链(lightchain,L)轻链大约由214个氨基酸残基组成,通常不含碳水化合物,分子量约为24kD。每条轻链含有两个链内二硫键所组成的环肽。L 链共有两型:kappa(κ)与lambda(λ),同一个天然Ig分子上L链的型总是相同的。正常人血清中的κ:λ约为2:1。 2.重链(heavychain,H链)重链大小约为轻链的2倍,含450~550个氨基酸残基,分子量约为55或75kD。每条H链含有4~5个链内二硫键所组成的环肽。不同的H链由于氨基酸的排列顺序、二硫键的数目和们置、含糖的种类和数量不同,其抗原性也不相同,根据H链抗原性的差异可将其分为5类:μ链、γ链、α链、δ链和ε链,不同H链与L链(κ或λ链)组成完整Ig 的分子分别称之为IgM、IgG、IgA、IgD和IgE。γ、α和δ链上含有4个环肽,μ和ε链含有5个环肽。重链(heavy chain,H链)由450~570个氨基酸残基组成,分子量约为50~70kD。不同的H链因氨基酸的排列顺序、二硫键的数目和位置、含糖的种类和数量不同,其抗原性也不相同,可将其分为μ链、γ链、α链、δ链、ε链五类,这些H链与L链(κ链或λ链)组成的完整Ig分子分别称为IgM(μ)、IgG(γ)、IgA(α)、IgD(δ)和IgE(ε 可变区和恒定区 通过对不同骨髓蛋白或本周蛋白H链或L链的氨基酸序列比较分析,发现其氨基端(N-末端)氨基酸序列变化很大,称此区为可变区(V),而羧基末端(C-末端)则相对稳定,变化很小,称此区为恒定区(C区)。

分析蛋白结构域

分析蛋白结构域(Domains)的三种方法 生物信息编程2009-09-24 23:55:50 阅读1235 评论0 字号:大中小订阅 三种分析蛋白结构域(Domains)的方法 1,SMART入门,蛋白结构和功能分析 SMART介绍 SMART (a Simple Modular Architecture Research Tool) allows the identification and annotation of genetically mobile domains and the analysis of domain architectures. More than 500 domain families found in signalling, extracellular and chromatin-associated proteins are detectable. These domains are extensively annotated with respect to phyletic distributions, functional class, tertiary structures and functionally important residues. Each domain found in a non-redundant protein database as well as search parameters and taxonomic information are stored in a relational database system. User interfaces to this database allow searches for proteins containing specific combinations of domains in defined taxa. For all the details, please refer to the publications on SMART. SMART(http://smart.embl-heidelberg.de/),可以说是蛋白结构预测和功能分析的工具集合。简单点说,就是集合了一些工具,可以预测蛋白的一些二级结构。如跨膜区(Transmembrane segments),复合螺旋区(coiled coil regions),信号肽(Signal peptides),蛋白结构域(PFAM domains)等。 SMART前该知道的 1,SMART有两种不同的模式:normal 或genomic 主要是用的数据库不一样。Normal SMART, 用的数据库Swiss-Prot, SP-TrEMBL 和stable Ensembl proteomes。Genomic SMART, 用全基因组序列。详细列表:http://smart.embl-heidelberg.de/smart/list_genomes.pl 2,一些名词解释 http://smart.embl-heidelberg.de/help/smart_glossary.shtml

蛋白质结构与功能的关系

蛋白质结构与功能的关系 专业:植物学 摘要:蛋白质特定的功能都是由其特定的构象所决定的,各种蛋白质特定的构象又与其一级结构密切相关。天然蛋白质的构象一旦发生变化,必然会影响到它的生物活性。由于蛋白质的构象的变化引起蛋白质功能变化,可能导致蛋白质构象紊乱症,当然也能引起生物体对环境的适应性增强。而分子模拟技术为蛋白质的研究提供了一种崭新的手段。在理论上解决了结构预测和功能分析以及蛋白质工程实施方面所面临的难题。它在蛋白质的结构预测和模建工作中占有举足轻重的地位,实现了生物技术与计算机技术的完美结合。 关键词:蛋白质的结构、功能;折叠/功能关系;蛋白质构象紊乱症;分子模拟技术;同源建模 RNase是由124个氨基酸残基组成的单肽链,分子中 8 个Cys的-SH构成4对二硫键,形成具有一定空间构象的蛋白质分子。在蛋白质变性剂和一些还原剂存在下,酶分子中的二硫键全部被还原,酶的空间结构破坏,肽链完全伸展,酶的催化活性完全丧失。当用透析的方法除去变性剂和巯基乙醇后,发现酶大部分活性恢复,所有的二硫键准确无误地恢复原来状态。若用其他的方法改变分子中二硫键的配对方式,酶完全丧失活性。这个实验表明,蛋白质的一级结构决定它的空间结构,而特定的空间结构是蛋白质具有生物活性的保证。前体与活性蛋白质一级结构的关系,由108个氨基酸残基构成的前胰岛素原,在合成的时候完全没有活性,当切去N-端的24个氨基酸信号肽,形成84个氨基酸的胰岛素原,胰岛素原也没活性,在包装分泌时,A、B链之间的33个氨基酸残基被切除,才形成具有活性的胰岛素。 功能不同的蛋白质总是有着不同的序列;种属来源不同而功能相同的蛋白质的一级结构,可能有某些差异,但与功能相关的结构也总是相同。若一级结构变化,蛋白质的功能可能发生很大的变化。蛋白质特定的功能都是由其特定的构象所决定的,各种蛋白质特定的构象又与其一级结构密切相关。天然蛋白质的构象一旦发生变化,必然会影响到它的生物活性。由于蛋白质的构象的变化引起蛋白质功能变化,可能导致蛋白质构象紊乱症,当然也能引起生物体对环境的适应性增强。 虽然蛋白质结构与生物功能的关系比序列与功能的关系更加紧密,但结构与功能的这种关联亦若隐若现,并不能排除折叠差别悬殊的蛋白质执行相似的功能,折叠相似的蛋白质执行差别悬殊功能的现象的存在。无奈,该领域仍不得不将100多年前Fisher提出的“锁一钥

相关文档
相关文档 最新文档