文档库 最新最全的文档下载
当前位置:文档库 › 真核生物启动子预测相关数据库资源概述

真核生物启动子预测相关数据库资源概述

真核生物启动子预测相关数据库资源概述
真核生物启动子预测相关数据库资源概述

真核生物启动子预测相关数据库资源概述

刘玉瑛1,张江丽2(1.首都师范大学生命科学学院,北京100037;2.廊坊师范学院生命科学学院,河北廊坊065000)

摘要启动子是基因表达调控的重要元件,深入研究启动子的结构和功能,是理解基因转录调控机制和表达模式的关键。随着生物技术和计算机技术的高速发展,应用生物信息学技术对启动子进行预测和分析的方法得到了很大发展。对目前常用的真核生物启动子预测相关数据库和软件资源作了简单介绍。

关键词真核生物;启动子;数据库;预测

中图分类号Q24文献标识码A文章编号0517-6611(2007)24-07418-02

The Databases o f Eukaryo tic Promoters and Related So ftw are Resources

LIU Yu2ying et al(Co lleg e of Life Science,Capital N ormal U niv ersity,B eijin g100037)

Abstract Eu kary o tic pro mo ters are i mp ortan t elemen ts in reg ulatio n o f the e xpres si on.T o stud y the structu re and functio n o f a p ro m oter deeply,i t is the key to kno w ho w the gene reg ulates its transcri pti on an d starts its exp ression.With the fast d evelo pmen t o f bio log ical and co m puter techno lo gy,sig nifican t ac hiev ements h av e been made in co mp utatio nal predictio n o n Eu kary o tic pro mo ters.In thi s paper mai nly in tro duces the pro g ress made in the datab ases o f predictin g E ukaryo tic p ro mo ters as w ell as the related so ftw are reso urces w as in tro duced.

Key w ords Wikipedia;Pro m oter;D atab ase;Predicti on

作为基因表达所必需的重要序列信号和基因转录水平上一种重要的调控元件,真核生物的启动子一直是现代分子生物学的研究热点。用实验的方法分析和鉴定启动子是多年以来进行启动子研究的主要途径。近年来,随着人类基因组测序的完成和根据实验获得的对启动子的序列特征与结构功能的认识,利用生物信息学的方法,通过计算机模拟和计算来预测基因启动子的相关信息获得越来越多的应用。笔者对目前常用的几个启动子预测数据库和相关软件资源作一简单介绍。

1真核生物启动子的基本结构

真核生物的启动子有3种类型,分别由R NA聚合酶?、ò和ó进行转录。典型的真核生物启动子由核心启动子、上游元件和应答元件构成。

核心启动子包括起始子和基本启动子。其中起始子是DN A解链并起始转录的位点。基本启动子序列为中心在-25~-30的7bp保守区,其碱基频率为:T85A97T93A85A2 63A83A50,通常被称为T A T A框或Goldberg2Ho gne ss框,具有选择正确的起始位点,保证精确起始的功能。同时,T A T A框还能影响转录速率。如兔的珠蛋白基因中T A T A框的保守序列A T AAA A人工突变为A TG T AA时,转录效率会下降80%。

上游元件主要包括C AA T框和GC框两种,均具有增强转录活性的功能。其中,C AA T框的保守序列是GGC T2 C A A TC T,一般位于上游-75紧靠-80,与其相互作用的因子有C TF家族的成员C P1、C P2和核因子NF21等;GC框的保守序列是G TGGGC G GG GC AA T,常以多拷贝形式存在-90处,识别该序列的转录激活因子为Sp1。两种上游元件同时存在或者只存在其中之一,但并非所有真核基因的启动子都存在上游启动子元件,有些植物细胞中几乎不存在C AA T框。

应答元件通常位于基因上游,能被转录因子识别和结合,从而调控基因的专一性表达。如热激应答元件、激素应答元件、c A M P应答元件、金属应答元件、糖皮质激素应答元

作者简介刘玉瑛(1982-),女,北京人,硕士研究生,研究方向:生物化学与分子生物学。

收稿日期2007204223件和血清应答元件等。应答元件含有短重复序列,不同基因中应答元件的拷贝数相近。

2真核生物启动子预测相关数据库资源

2.1EPD(Eukaryotic promote r database)[1]EP D数据库(http://w w w.e pd.isb2sib.ch/或者f tp://f tp.e pd.isb2sib.c h/ pub/da taba se s/epd)是一个针对真核R NA聚合酶II型启动子的非冗余数据库。现有启动子序列数据1500多个,按层次组织。关于启动子的描述信息直接摘自科学文献。该数据库中所有的启动子均经过一系列实验证实,如:是否为真核R NA聚合酶ò型启动子、是否在高等真核生物中有生物学活性、是否与数据库中的其他启动子有同源性等。同时,EPD 与其他的相关数据库如EM B L、S WI S S2P RO T、TRA NS FAC等,实现了数据的交叉链接。在其最新版本(第76版)中,EPD 将收集的启动子分为6大类:植物启动子、线虫启动子、拟南芥启动子、软体动物启动子、棘皮类动物启动子和脊椎动物启动子,共2997个条目,其中人类启动子有1871个,约占总数的62%。EPD数据库是目前唯一一个源自实验数据的真核生物启动子数据库,是常用的预测软件测评的手段之一。

2.2PLAC E(Plant cis2ac ting regulatory DNA elements)[2]

P LAC E数据库(http://w ww.dna.af frc.go.jp/htdoc s/PL AC E/, F TP服务器为ftp://ftp.dna.a ff rc.go.jp/)是从已发表文献中搜集植物顺式作用元件资料而建立的模体数据库(mo tif data base),始于1991年。目前服务器位于日本农林渔业部。P LAC E数据库中只囊括维管植物的信息,其他与植物顺式作用元件同源的非植物模体也同时被收录。并且所收录信息根据实验最新进展随时得到更新。同时,PL AC E数据库中还包括了对每个模体的描述和在PubM ed中的相关文献编号,以及在DDB J/E MB L/GenB ank的核酸序列数据库的登录号,点击后可阅读相关文献摘要等信息。登陆PL AC E数据库界面,用户可通过关键词、S RS关键词或者同源序列查询顺式作用元件的信息。关键词可以是模体名称、涉及的诱导子或者植物激素、胁迫类型、该基因表达的组织或者器官、原始文献的作者、模体序列、植物种属等。查询结果显示位点(模体)名称、位置、序列和PL ACE登录号,同时,也可以用F AS T A 格式批量上传序列信息。

安徽农业科学,J ou rnal o f Anh ui Ag ri.Sci.2007,35(24):7418-7419责任编辑孙红忠责任校对李洪

2.3TRRD(T ranscription regulatory regions database)[3] TRR D数据库(http://w w w.bione t.nsc.ru/trrd/),即转录调控区数据库。其数据来源于已发表的科学论文,包含特定基因各种结构与功能特性,包括转录因子结合位点、启动子、增强子、沉默子的位置以及基因表达调控模式等。2001年的6.0版本综合了3898篇科学文献中的1167个基因,5537个转录因子结合位点,1714个调控区域,14个座位控制区和5335个表达模式。在TR RD数据库中,所有信息被分列于5个相关的数据表中:TR RD GENES(包含所有TR RD库基因的基本信息和调控单元信息);TRRD SI TES(包括调控因子结合位点的具体信息);TRR DF AC TOR S(包括TRRD中与各个位点结合的调控因子的具体信息);TRR DEXP(包括对基因表达模式的具体描述);TR RDB IB(包括所有注释涉及的参考文献)。TR2 RD的主页提供了对这几个数据表的检索服务。除此之外,数据库还提供了另外2个工具:1序列获得系统(S RS),用于搜索TRR D和与外部信息和软件资源进行整合;oTRR D Vie w er,以基因图谱的形式提供相关信息的描述。

2.4TRANS FAC(T ranscriptional re gulation,from patte rns to profiles)[4]TR ANS F AC数据库(http://w ww.ge ne2regulation.

c o m/或者http://transfac.gbf.de/TRA NS FAC/)是一个真核基因顺式调控元件和反式作用因子数据库,数据搜集的对象从酵母到人类。TRA NS FAC数据库中的数据资源被分为6大类别:S I TE类数据是关于真核基因的不同调控位点信息,GENE 类数据描述具有多个调控位点的基因信息,FAC TOR类数据描述结合于这些位点的蛋白质因子信息,C EL L类数据则说明蛋白质因子的细胞来源,C LAS S类数据包含转录因子分类的基本信息,M A TR IX数据以矩阵的形式定量描述结合位点核苷酸的统计分布。此外,还有几个与TRA NS FAC密切相关的扩展库:P A THODB库收集了转录区域中可能导致病态的突变数据;S/M AR T DB收集了蛋白质结合位点的特征信息及作用于这些位点的蛋白质信息;TR ANS P A T H库用于描述与转录因子调控相关的信号传递的网络;C YTO M ER库表现了人类转录因子在各个器官、细胞类型、生理系统和发育时期的表达状况。

3前景与展望

对真核生物启动子进行计算机预测和鉴定是一项具有挑战性的研究工作。到目前为止,尽管相关数据库和软件资源得到了很大的丰富和发展,但仍存在着明显不足,如:1大多数数据库对于数据的创新、精确性和准确性没有权威评价,数据过多、重复,分类较粗等;o人类公共数据库中,只有极少数被实验证实的顺式作用元件,绝大多数基因的启动子仍然未知;?采用人类基因组信息来预测植物、真菌等远缘物种的基因结构时,数据准确性不高,但目前针对植物、真菌等的生物信息学数据库远没有人类的全面和完善;?数据库中c D NA和ES T簇经常是不完整序列,特别是5c端,故无法确定转录起始位点的确切位置,从而影响启动子的预测;?真核生物的顺式作用元件比原核生物复杂,需要考虑多种因素[5]。因此高效的实验方法和设计良好的预测软件仍是生物学家面临的严峻课题。

随着分子生物学、遗传学和生物信息学的高速发展,更多的真核生物启动子序列将得到分析,各顺式作用元件的功能也会逐渐明确,启动子的计算机预测研究工作也将有更广阔的发展空间。

参考文献

[1]C HRIS TO PH D,VIVIA NE P.Th e Eu ka ry o tic p ro m o ter d atab ase EPD:the im p act

o f in silic o p ri me r e x te nsi o n[J].Nu cleic Acid s Re searc h,2004,32:82-85. [2]KEN IC HI H,YO S HI HIR O U.Pl ant cis2actin g reg u lato ry D N A e lem en ts

(P LAC E)d atab ase:1999[J].Nu cleic Acid s R esearch,1999,27(1):297-300.

[3]KO LC HA NO V N A,LGN A TIEV A E V.T ran scrip tio n reg u lato ry reg io n s d atab ase

(TR RD):its statu s i n2002[J].Nu cleic Acid s Re searc h,2002,30(1):312-317.

[4]M A TY S V,F RIC KE E.TR AN SF AC:tran scrip ti o nal reg u latio n,fro m p attern s to

pro files[J].N ucleic Acid s Research,2003,31(1):374-378.

[5]TO M PA M,LIN,B AIL EY T L,et al.Asse ssin g co m p uta ti o nal to ol s fo r the d is2

co v ery o f t ran scrip tio n facto r bi nd in g si te s[J].Natu re B i o tec h,2006,23:137-144.

(上接第7417页)

每一条扩增带对应着基因组D NA分子上的一个位点。银染AF LP用4对引物在28个材料中共扩增出191条不同分子量的D NA带,这就意味着这4对引物对28个材料的基因组进行191个位点的检测。出现多态性扩增带,说明某个或某些材料在该位点上存在变异。银染AF LP4对引物共发现多态性位点189个,占98.9%,说明在检测的位点中有98.9%的位点材料之间存在变异。这种检测的精度和效率是以往任何一种指纹技术所不能比拟的,因此认为,AF LP 技术是目前检测效率最高的一种。

研究卡瓦胡椒、胡椒及其近缘野生种的分子标记表明,卡瓦胡椒确为胡椒属植物,这与Ja ra millo等建议把胡椒属植物分为3个大的进化枝(clades):即亚洲进化枝、南太平洋进化枝和新热带区进化枝,卡瓦胡椒分在南太平洋进化枝中的结果相一致[10]。卡瓦胡椒虽为胡椒属植物,但与胡椒及其近缘野生种之间亲缘关系较远,有一定距离。卡1和卡2、卡3和卡4、卡5和卡6相似系数均为1,无法区分,可能是分别来自同一株卡瓦胡椒材料的缘故。

参考文献

[1]杨友才,周清明,尹晗琪,等.烟草种质资源遗传多样性及亲缘关系的

AF LP分析[J].中国农业科学,2006,39(11):2194-2199.

[2]杜金友,靳占忠,徐兴友,等.A FLP标记在玉米种质资源鉴定中的应用

[J].西北植物学报,2006,26(5):927-932.

[3]高建明,张守攻,齐力旺,等.杨树重要品种(无性系)的AF LP指纹分析

[J].云南植物研究,2006,28(1):85-90.

[4]黄建安,李家贤,黄意欢,等.茶树品种资源遗传多样性的AF LP研究

[J].园艺学报,2006,33(2):317-322.

[5]杨东,余来宁.R APD和A FL P在分析尼罗罗非鱼遗传多样性研究中的

应用比较[J].江西农业学报,2006,18(2):1-4.

[6]施江.卡瓦胡椒引种繁殖和分子标记的研究[D].儋州:华南热带农业

大学热带作物生物技术国家重点实验室,2004.

[7]施江,辛莉,郑楷,等.卡瓦胡椒及胡椒的R A PD聚类分析[J].生物技

术,2005,15(6):34-37.

[8]李明芳.荔枝S S R标记的研究及其对部分荔枝种质的遗传多样性分析

[D].儋州:华南热带农业大学热带作物生物技术国家重点实验室,

2003.

[9]N EI M,LI W H.M a the ma ti cal m o del fo r stud y in g gen etic v ari atio n in term s o f re2

s tric ti o n e nd o nu clease s[J].Pro c Natl Acad Sci US A,1979,76:5269-5273. [10]JA RA M IL LO M A,M A NOS PS.P hy lo g en y an d p attern s o f flo ral di v ersity i n t he

gen u s Pip er(Pi peraceae)[J].A m J B o t,2001,88(4):706-716.

7419

35卷24期刘玉瑛等真核生物启动子预测相关数据库资源概述

原核生物基因组和真核生物基因组比较区别

原核生物基因组和真核生物基因组的区别: 1、真核生物基因组指一个物种的单倍体染色体组(1n)所含有的一整套基因。还包括叶绿体、线粒体的基因组。 原核生物一般只有一个环状的DNA分子,其上所含有的基因为一个基因组。 2、原核生物的染色体分子量较小,基因组含有大量单一顺序 (unique-sequences),DNA仅有少量的重复顺序和基因。 真核生物基因组存在大量的非编码序列。包括: .内含子和外显子、.基因家族和假基因、重复DNA序列。真核生物的基因组的重复顺序不但大量,而且存在复杂谱系。 3、原核生物的细胞中除了主染色体以外,还含有各种质粒和转座因子。质粒常为双链环状DNA,可独立复制,有的既可以游离于细胞质中,也可以整合到染色体上。转座因子一般都是整合在基因组中。 真核生物除了核染色体以外,还存在细胞器DNA,如线粒体和叶绿体的DNA,为双链环状,可自主复制。有的真核细胞中也存在质粒,如酵母和植物。 4、原核生物的DNA位于细胞的中央,称为类核(nucleoid)。 真核生物有细胞核,DNA序列压缩为染色体存在于细胞核中。 5、真核基因组都是由DNA序列组成,原核基因组还有可能由RNA组成,如RNA病毒。 原核生物和真核生物区别(从细胞结构、基因组结构和遗传过程分析)主要差别 由真核细胞构成的生物。包括原生生物界、真菌界、植物界和动物界。真核细胞与原核细胞的主要区别是:

【从细胞结构】 1.真核细胞具有由染色体、核仁、核液、双层核膜等构成的细胞核;原核细胞无核膜、核仁,故无真正的细胞核,仅有由核酸集中组成的拟核 2.真核细胞有内质网、高尔基体、溶酶体、液泡等细胞器,原核细胞没有。 真核细胞有发达的微管系统,其鞭毛(纤毛)、中心粒、纺锤体等都与微管有关,原核生物则否。 3.真核细胞有由肌动、肌球蛋白等构成的微纤维系统,后者与胞质环流、吞噬作用等密切相关;而原核生物却没有这种系统,因而也没有胞质环流和吞噬作用。 真核细胞的核糖体为80S型,原核生物的为70S型,两者在化学组成和形态结构上都有明显的区别。 4.原核细胞功能上与线粒体相当的结构是质膜和由质膜内褶形成的结构,但后者既没有自己特有的基因组,也没有自己特有的合成系统。真核生物的植物含有叶绿体,它们亦为双层膜所包裹,也有自己特有的基因组和合成系统。与光合磷 酸化相关的电子传递系统位于由叶绿体的内膜内褶形成的片层上。原核生物中的蓝细菌和光合细菌,虽然也具有进行光合作用的膜结构,称之为类囊体,散布于细胞质中,未被双层膜包裹,不形成叶绿体。 【从基因组结构】 1.真核生物中除某些低等类群(如甲藻等)的细胞以外,染色体上都有5种或4种组蛋白与DNA结合,形成核小体;而在原核生物则无。 2.真核生物中除某些低等类群(如甲藻等)的细胞以外,染色体上都有5种或4种组蛋白与DNA结合,形成核小体;而在原核生物则无。 3.真核细胞含有的线粒体,为双层被膜所包裹,有自己特有的基因组、核酸合成系统与蛋白质合成系统,其内膜上有与氧化磷酸化相关的电子传递链

常见真核启动子及原核启动子特点

真核启动子 EF1a 常规表达用 mRNA 人延长因子1α来源 的强哺乳动物表达启动子 组成型 表达水平十分稳定,与细胞类型无关 PGK1 (人/小鼠) 常规表达用 mRNA 磷酸甘油酸酯激酶 基因来源的哺乳动物启动子 组成型 广泛表达,但可能因细胞类型而异。由于甲基化或脱乙酰作用,倾向于抵抗启动子下调。 human beta actin 常规表达用 mRNA β-肌动蛋白基因来 源的哺乳动物启动子 组成型 无处不在,鸡的启动子常用与启动子杂交 TRE 常规表达用 mRNA 四环素响应元件启动子 被四环素或 者类似物诱导 通常有本底表达 Ac5 常规表达用 mRNA 果蝇Actin 5c 基因 来源的强昆虫启动子 组成型 果蝇表达系统的常用启动子

CaMKIIa 光遗传学 基因表达 mRNA Ca2+/钙调蛋白依赖 的蛋白激酶II 启动 子 特异的 用于中枢神经系统/神经元表达。受到 钙和钙调蛋白调节。 TEF1 常规表达 用 mRNA 酵母转录延伸因子 启动子 组成型与哺乳动物的EF1a 启动子类似 ADH1 常规表达 用 mRNA 乙醇脱氢酶I的酵母 启动子 被乙醇抑制 全长版本很强,促进高表达。截短启 动子是组成型的,表达较低。 Ubi 常规表达 用 mRNA 玉米泛素基因的植 物启动子 组成型在植物中促进高表达 U6 小RNA 表达 shRNA 来源于人U6小核启 动子 组成型小鼠U6也使用,但效率略差。 常用的原核表达系统启动子

T7lac 高水 平基 因表 达 T7噬菌体来 源的启动子 加上lac操 纵子 几乎没有本底表 达,需要T7 RNA 聚合酶,受到lac 操纵子的控制, 可以被IPTG诱 导。 常用与pET载体,受到lac操纵子的严格调控 araBAD 常规 表达 用 阿拉伯糖代 谢操纵子的 启动子 阿拉伯糖诱导 弱,常用与pBAD载体。适合于快速调控和低的本底表达 lac 常规 表达 用 Lac操纵子 来源的启动 子 可以被IPTG或 者乳糖诱导 在常规的大肠杆菌中,lacI阻遏蛋白表达量不高,仅能满足细 胞自身的lac操纵子,无法应付多拷贝的质粒的需求,导致非 诱导条件下较高地表达,为了让表达系统严谨调控产物表达, 能过量表达lacI阻遏蛋白的lacIq 突变菌株常被选为 Lac/Tac/trc表达系统的表达菌株。现在的Lac/Tac/trc载体上 通常还带有lacIq 基因,以表达更多lacI阻遏蛋白实现严谨的 诱导调控。 pL 高水 平基 因表 达 Lambda噬 菌体来源的 启动子 温度调节通常和温度敏感的cI857 抑制子搭配使用

原核生物和真核生物的比较

原核生物和真核生物基因组的比较(我好想比较过了,是不是?) 原核生物和真核生物DNA复制的特点: 原核:一般只有一个复制起点,即一个复制子,复制子较长,复制起始点oriC含有3个13bp 的串联重复保守序列,复制起始之后在OriC上形式两个复制叉沿着整个基因组双向等速移动,并且形成θ形中间产物,两个复制叉在距离起点180°处汇合,在快速生长时,一个复制起点上可以形成多个复制叉,可以连续开始新的DNA复制; 真核:有多处复制起点,复制子相对较小,复制叉的移动速度较慢,由于有多个复制起点,所以后随链是以半不连续的方式复制的,在染色体全部完成复制之前,各个起始点上的DNA 的复制不能再开始。 原核生物和真核生物DNA转录的特点: 相同点:都是以DNA双链中的反义链为模板,在RNA聚合酶催化下,以4种核糖核苷酸为原料,根据碱基互补配对原则,各核苷酸间以磷酸二酯键相连,不需要引物的参与,按5’- 3’方向合成 不同点:真核生物RNA聚合酶必须借助辅助蛋白才能与启动子结合;原核生物中一种RNA 聚合酶几乎负责所有mRNA、rRNA、tRNA的合成,真核生物有3类RNA聚合酶:I负责rRNA 合成,II负责hnRNA(前体mRNA)合成,III负责tRNA合成;原核生物基因启动区范围较小,而真核生物的启动区范围较大。 真核生物和原核生物mRNA的特征比较(这个也总结过了吧) 真核生物和原核生物在基因结构、转录和翻译方面的总体差异: (1)真核细胞中,一条mRNA链只能翻译出一条多肽链,原核生物则以多基因操纵子形式存在; (2)真核细胞DNA与组蛋白和大量非组蛋白结合,只有一小部分DNA是裸露的; (3)高等真核细胞DNA中很大一部分不转录,存在很多重复序列,而且基因内部还存在不被翻译的内含子; (4)真核生物能够有序根据生长发育阶段的需要进行DNA片段重排,还能根据需要改变基因的拷贝数,原核生物中则非常少见; (5)原核生物转录的调节区很小,而真核生物基因转录的调节区则大得多; (6)真核生物RNA在细胞核中合成,需要通过核膜进入细胞质才能被翻译,原核生物中不存在这样严格的空间间隔; (7)真核生物的基因只用经过复杂的成熟和剪接过程才能被顺利翻译为蛋白质。 原核生物和真核生物细胞的比较: 相同点:都有细胞膜,都含有核糖体合成蛋白,都含有细胞质基质作为生理生化反应的场所,都以DNA作为遗传物质,都遵循碱基互补配对原则以半保留复制方式进行DNA复制; 不同点:(1)真核细胞有核膜包被的细胞核,原核细胞只有核区、没有核膜包被的细胞核;(2)真核细胞含有以高尔基体、内质网为代表的细胞内膜系统,原核细胞则没有;(3)真核细胞DNA与组蛋白及非组蛋白结合为染色质,原核细胞DNA则是裸露的DNA分子;(4)原核生物DNA一般边转录边翻译,而真核生物mRNA则需要先转录然后转运至细胞质基质中再进行翻译

常见真核启动子及原核启动子特点

真核启动子 EF1a 常规表 达用 mRNA 人延长因子1α来 源的强哺乳动物表达启动子 组成型 表达水平十分稳定,与细胞类型无关 PGK1 (人/小鼠) 常规表 达用 mRNA 磷酸甘油酸酯激酶 基因来源的哺乳动物启动子 组成型 广泛表达,但可能因细胞类型而异。由于甲基化或脱乙酰作用,倾向于抵抗启动子下调。 human beta actin 常规表 达用 mRNA β-肌动蛋白基因来 源的哺乳动物启动子 组成型 无处不在,鸡的启动子常用与启动子 杂交 TRE 常规表 达用 mRNA 四环素响应元件启 动子 被四环素或 者类似物诱导 通常有本底表达

Ac5 常规表 达用mRNA 果蝇Actin 5c 基因 来源的强昆虫启动 子 组成型果蝇表达系统的常用启动子 CaMKIIa 光遗传 学基因 表达 mRNA Ca2+/钙调蛋白依赖 的蛋白激酶 II 启 动子 特异的 用于中枢神经系统/神经元表达。受 到钙和钙调蛋白调节。 TEF1 常规表 达用mRNA 酵母转录延伸因子 启动子 组成型与哺乳动物的EF1a 启动子类似 ADH1 常规表 达用mRNA 乙醇脱氢酶I的酵 母启动子 被乙醇抑制 全长版本很强,促进高表达。截短启 动子是组成型的,表达较低。 Ubi 常规表 达用mRNA 玉米泛素基因的植 物启动子 组成型在植物中促进高表达

U6 小RNA 表达 shRNA 来源于人U6小核启 动子 组成型 小鼠U6也使用,但效率略差。 常用的原核表达系统启动子 T7lac 高水平基因表达 T7噬菌体来源的启动子加上lac 操纵子 几乎没有本底 表达,需要T7 RNA 聚合酶,受 到lac 操纵子的控制,可以被 IPTG 诱导。 常用与pET 载体,受到lac 操纵子的严格调控 Sp6 体外 转录/ 常规 表达 Sp6噬菌体来源的启动子 组成型, 需要SP6 RNA 聚合 酶 当用于体外转录的时候,专路方向有可能是正向的也可能是 反向的,取决于启动子相对于目的基因的方向 araBAD 常规 表达 用 阿拉伯糖代谢操纵 子的启动子 阿拉伯糖诱导 弱,常用与pBAD 载体。适合于快速调控和低的本底表达

真核生物启动子预测相关数据库资源概述

真核生物启动子预测相关数据库资源概述 刘玉瑛1,张江丽2(1.首都师范大学生命科学学院,北京100037;2.廊坊师范学院生命科学学院,河北廊坊065000) 摘要启动子是基因表达调控的重要元件,深入研究启动子的结构和功能,是理解基因转录调控机制和表达模式的关键。随着生物技术和计算机技术的高速发展,应用生物信息学技术对启动子进行预测和分析的方法得到了很大发展。对目前常用的真核生物启动子预测相关数据库和软件资源作了简单介绍。 关键词真核生物;启动子;数据库;预测 中图分类号Q24文献标识码A文章编号0517-6611(2007)24-07418-02 The Databases o f Eukaryo tic Promoters and Related So ftw are Resources LIU Yu2ying et al(Co lleg e of Life Science,Capital N ormal U niv ersity,B eijin g100037) Abstract Eu kary o tic pro mo ters are i mp ortan t elemen ts in reg ulatio n o f the e xpres si on.T o stud y the structu re and functio n o f a p ro m oter deeply,i t is the key to kno w ho w the gene reg ulates its transcri pti on an d starts its exp ression.With the fast d evelo pmen t o f bio log ical and co m puter techno lo gy,sig nifican t ac hiev ements h av e been made in co mp utatio nal predictio n o n Eu kary o tic pro mo ters.In thi s paper mai nly in tro duces the pro g ress made in the datab ases o f predictin g E ukaryo tic p ro mo ters as w ell as the related so ftw are reso urces w as in tro duced. Key w ords Wikipedia;Pro m oter;D atab ase;Predicti on 作为基因表达所必需的重要序列信号和基因转录水平上一种重要的调控元件,真核生物的启动子一直是现代分子生物学的研究热点。用实验的方法分析和鉴定启动子是多年以来进行启动子研究的主要途径。近年来,随着人类基因组测序的完成和根据实验获得的对启动子的序列特征与结构功能的认识,利用生物信息学的方法,通过计算机模拟和计算来预测基因启动子的相关信息获得越来越多的应用。笔者对目前常用的几个启动子预测数据库和相关软件资源作一简单介绍。 1真核生物启动子的基本结构 真核生物的启动子有3种类型,分别由R NA聚合酶?、ò和ó进行转录。典型的真核生物启动子由核心启动子、上游元件和应答元件构成。 核心启动子包括起始子和基本启动子。其中起始子是DN A解链并起始转录的位点。基本启动子序列为中心在-25~-30的7bp保守区,其碱基频率为:T85A97T93A85A2 63A83A50,通常被称为T A T A框或Goldberg2Ho gne ss框,具有选择正确的起始位点,保证精确起始的功能。同时,T A T A框还能影响转录速率。如兔的珠蛋白基因中T A T A框的保守序列A T AAA A人工突变为A TG T AA时,转录效率会下降80%。 上游元件主要包括C AA T框和GC框两种,均具有增强转录活性的功能。其中,C AA T框的保守序列是GGC T2 C A A TC T,一般位于上游-75紧靠-80,与其相互作用的因子有C TF家族的成员C P1、C P2和核因子NF21等;GC框的保守序列是G TGGGC G GG GC AA T,常以多拷贝形式存在-90处,识别该序列的转录激活因子为Sp1。两种上游元件同时存在或者只存在其中之一,但并非所有真核基因的启动子都存在上游启动子元件,有些植物细胞中几乎不存在C AA T框。 应答元件通常位于基因上游,能被转录因子识别和结合,从而调控基因的专一性表达。如热激应答元件、激素应答元件、c A M P应答元件、金属应答元件、糖皮质激素应答元 作者简介刘玉瑛(1982-),女,北京人,硕士研究生,研究方向:生物化学与分子生物学。 收稿日期2007204223件和血清应答元件等。应答元件含有短重复序列,不同基因中应答元件的拷贝数相近。 2真核生物启动子预测相关数据库资源 2.1EPD(Eukaryotic promote r database)[1]EP D数据库(http://w w w.e pd.isb2sib.ch/或者f tp://f tp.e pd.isb2sib.c h/ pub/da taba se s/epd)是一个针对真核R NA聚合酶II型启动子的非冗余数据库。现有启动子序列数据1500多个,按层次组织。关于启动子的描述信息直接摘自科学文献。该数据库中所有的启动子均经过一系列实验证实,如:是否为真核R NA聚合酶ò型启动子、是否在高等真核生物中有生物学活性、是否与数据库中的其他启动子有同源性等。同时,EPD 与其他的相关数据库如EM B L、S WI S S2P RO T、TRA NS FAC等,实现了数据的交叉链接。在其最新版本(第76版)中,EPD 将收集的启动子分为6大类:植物启动子、线虫启动子、拟南芥启动子、软体动物启动子、棘皮类动物启动子和脊椎动物启动子,共2997个条目,其中人类启动子有1871个,约占总数的62%。EPD数据库是目前唯一一个源自实验数据的真核生物启动子数据库,是常用的预测软件测评的手段之一。 2.2PLAC E(Plant cis2ac ting regulatory DNA elements)[2] P LAC E数据库(http://w ww.dna.af frc.go.jp/htdoc s/PL AC E/, F TP服务器为ftp://ftp.dna.a ff rc.go.jp/)是从已发表文献中搜集植物顺式作用元件资料而建立的模体数据库(mo tif data base),始于1991年。目前服务器位于日本农林渔业部。P LAC E数据库中只囊括维管植物的信息,其他与植物顺式作用元件同源的非植物模体也同时被收录。并且所收录信息根据实验最新进展随时得到更新。同时,PL AC E数据库中还包括了对每个模体的描述和在PubM ed中的相关文献编号,以及在DDB J/E MB L/GenB ank的核酸序列数据库的登录号,点击后可阅读相关文献摘要等信息。登陆PL AC E数据库界面,用户可通过关键词、S RS关键词或者同源序列查询顺式作用元件的信息。关键词可以是模体名称、涉及的诱导子或者植物激素、胁迫类型、该基因表达的组织或者器官、原始文献的作者、模体序列、植物种属等。查询结果显示位点(模体)名称、位置、序列和PL ACE登录号,同时,也可以用F AS T A 格式批量上传序列信息。 安徽农业科学,J ou rnal o f Anh ui Ag ri.Sci.2007,35(24):7418-7419责任编辑孙红忠责任校对李洪

真核生物与原核生物的区别

真核生物的特征 原核细胞功能上与线粒体相当的结构是质膜和由质膜内褶形成的结构,但后者既没有自己特有的基因组,也没有自己特有的合成系统。 真核生物的植物含有叶绿体,它们亦为双层膜所包裹,也有自己特有的基因组和合成系统。与光合磷酸化相关的电子传递系统位于由叶绿体的内膜内褶形成的片层上。原核生物中的蓝细菌和光合细菌,虽然也具有进行光合作用的膜结构,称之为类囊体,散布于细胞质中,未被双层膜包裹,不形成叶绿体。 原核生物的特点 ①核质与细胞质之间无核膜因而无成形的细胞核(拟核或类核); ②遗传物质是一条不与组蛋白结合的环状双螺旋脱氧核糖核酸(DNA)丝,不构成染色体(有的原核生物在其主基因组外还有更小的能进出细胞的质粒DNA); ③以简单二分裂方式繁殖,无有丝分裂或减数分裂; ④没有性行为,有的种类有时有通过接合、转化或转导,将部分基因组从一个细胞传递到另一个细胞的准性行为(见细菌接合); ⑤没有由肌球、肌动蛋白构成的微纤维系统,故细胞质不能流动,也没有形成伪足、吞噬作用等现象; ⑥鞭毛并非由微管构成,更无“9+2”的结构,仅由几条螺旋或平行的蛋白质丝构成; ⑦细胞质内仅有核糖体而没有线粒体、高尔基器、内质网、溶酶体、液泡和质体(植物)、中心粒(低等植物和动物)等细胞器; ⑧细胞内的单位膜系统除蓝细菌另有类囊体外一般都由细胞膜内褶而成,其中有氧化磷酸化的电子传递链(蓝细菌在类囊体内进行光合作用,其他光合细菌在细胞膜内褶的膜系统上进行光合作用;化能营养细菌则在细胞膜系统上进行能量代谢); ⑨在蛋白质合成过程中起重要作用的核糖体散在于细胞质内,核糖体的沉降系数为70S;

⑩大部分原核生物有成分和结构独特的细胞壁等等。总之原核生物的细胞结构要比真核生物的细胞结构简单得多。 真核细胞与原核细胞的区别 真核细胞与原核细胞的主要区别是: ①真核细胞具有由染色体、核仁、核液、双层核膜等构成的细胞核;原核细胞无核膜、核仁,故无真正的细胞核,仅有由核酸集中组成的拟核。 ②真核细胞的转录在细胞核中进行,蛋白质的合成在细胞质中进行,而原核细胞的转录与蛋白质的合成交联在一起进行。 ③真核细胞有内质网、高尔基体、溶酶体、液泡等细胞器,原核细胞没有。 ④真核生物中除某些低等类群(如甲藻等)的细胞以外,染色体上都有5种或4种组蛋白与DNA 结合,形成核小体;而在原核生物则无。 ⑤真核细胞在细胞周期中有专门的DNA复制期(S期);原核细胞则没有,其DNA复制常是连续进行的。 ⑥真核细胞的有丝分裂是原核细胞所没有的。 ⑦真核细胞有发达的微管系统,其鞭毛(纤毛)、中心粒、纺锤体等都与微管有关,原核生物则否。 ⑧真核细胞有由肌动、肌球蛋白等构成的微纤维系统,后者与胞质环流、吞噬作用等密切相关;而原核生物却没有这种系统,因而也没有胞质环流和吞噬作用。 ⑨真核细胞的核糖体为80S型,原核生物的为70S型,两者在化学组成和形态结构上都有明显的区别。 ⑩真核细胞含有的线粒体,为双层被膜所包裹,有自己特有的基因组、核酸合成系统与蛋白质合成系统,其内膜上有与氧化磷酸化相关的电子传递链。 11真核生物细胞较大,一般10~100纳米,原核生物细胞较小,大约1~10纳米。

原核生物和真核生物的主要区别

原核生物和真核生物的主要区别 人教版高一必修一生物 一、协作学习任务设计 1、展示原核生物和真核生物的图片或者视频 生物体可以分为非细胞结构和细胞结构。科学家又根据细胞内有无以核膜为界限的细胞核,将细胞分为两类,原核细胞和真核细胞。 提出问题:原核生物和真核生物的主要区别在哪? 二、教师进行指导,并提供资源 (一)回顾并总结原核生物、真核生物在细胞结构上的特点以及主要类群 (二)原核细胞和真核细胞的结构特点进行比较 (三)在认识和比较的基础上,探讨原核细胞和真核细胞之间的相关性及其发展史。 学习资源 1、教材 2、生物进化史课本 三、开展协作学习 学生之间进行分组,组内进行收集资料,讨论、总结。 四、开展学习活动 五、小组内部进行分工,可以按照老师的指导进行收集资料、进行总结。 原核生物的结构特点: 1、细胞大小:支原体是原核生物中最小的生物体。 2、细胞壁:肽聚糖(糖类与蛋白质结合而成的化合物),不含纤维素。 3、细胞膜:与真核细胞的相似。 4、细胞质:只有核糖体,无其他复杂的细胞器。 5、拟核:有丝状DNA分子,分布于细胞质的一定区域,没有核膜。 原核生物的主要类群: 蓝藻,含有(藻蓝素)和(叶绿素),可进行光合作用。 细菌,(球菌、杆菌、螺旋菌、和乳酸菌) 放线菌,(链霉菌) 支原体,衣原体,立克次氏体 真核生物的结构特点: 1.生物膜结构:以生物膜为基础而形成的膜性结构和细胞器 2.细胞骨架结构:包括细胞质骨架和核骨架 3.细胞质溶胶:为均质半透明液体,是代谢反应进行的场所 4:细胞核:遗传信息储存、表达的部位 真核生物的主要类群: 动物 植物 真菌(青霉菌,酵母菌,蘑菇)

原核真核启动子及BL21相关知识

感受态BL21、BL21(DE3)及BL21(DE3)pLysS BL21没有T7 RNA聚合酶基因, 因此不能表达T7启动子控制的目的基因, 但是可以表达大肠杆菌启动子lac、tac、trc及trp控制的基因。 BL21(DE3)是λDE3溶原菌,带有T7 RNA聚合酶,可用于表达T7启动子控制的目的基因,也可以表达大肠杆菌启动子lac、tac、trc及trp控制的基因。 BL21(DE3)pLysS含有pLysS质粒,一种与pET共存的表达T7裂解酶的质粒,可以减少目的基因的本底表达,提供更严紧的控制。 真核原核启动子 原核: 几个常用的启动子和诱导调控表达系统 1.最早应用于的表达系统的是Lac乳糖操纵子,由启动子lacP + 操纵基因lacO + 结构基因组成。其转录受CAP正调控和lacI负调控。 https://www.wendangku.net/doc/275558631.html,cUV5突变能够在没有CAP的存在下更有效地起始转录,该启动子在转录水平上只受lacI 的调控,因而随后得到了更广泛采用。lacI产物是一种阻遏蛋白,能结合在操纵基因lacO 上从而阻遏转录起始。乳糖的类似物IPTG可以和lacI产物结合,使其构象改变离开lacO,从而激活转录。这种可诱导的转录调控成为了大肠杆菌表达系统载体构建的常用元件。 3.tac启动子是trp启动子和lacUV5的拼接杂合启动子,且转录水平更高,比lacUV5更优越。 4.trc启动子是trp启动子和lac启动子的拼合启动子,同样具有比trp更高的转录效率和受lacI阻遏蛋白调控的强启动子特性。 5.在常规的大肠杆菌中,lacI阻遏蛋白表达量不高,仅能满足细胞自身的lac操纵子,无法应付多拷贝的质粒的需求,导致非诱导条件下较高地表达,为了让表达系统严谨调控产物表达,能过量表达lacI阻遏蛋白的lacIq 突变菌株常被选为Lac/Tac/trc表达系统的表达菌株。现在的Lac/Tac/trc载体上通常还带有lacIq 基因,以表达更多lacI阻遏蛋白实现严谨的诱导调控。 6.IPTG广泛用于诱导表达系统,但是IPTG有一定毒性,有人认为在制备医疗目的的重组蛋白并不合适,因而也有用乳糖代替IPTG作为诱导物的研究。另外一种研究方向是用lacI 的温度敏感突变体,30℃下抑制转录,42℃开始发挥作用。热诱导不用添加外来的诱导物,成本低,但是由于发酵过程中加热升温比较慢而影响诱导效果,而且热诱导本身会导致大肠杆菌的热休克蛋白激活,一些蛋白酶会影响产物的稳定。 7.以λ噬菌体转录启动子PL、PR 构建的载体也为大家所熟悉。这两个强启动子受控于λ噬菌体cI基因产物。cI基因的温度敏感突变体cI857(ts)常常被用于调控PL、PR启动子的转录。同样也是30℃下阻遏启动子转录,42℃下解除抑制开始转录。同样的,PL、PR表达载体需要以cI857(ts)作为表达菌株,现在更常见的做法是在载体上携带cI857(ts)基因,所以可以有更大的宿主选择范围。另外一种思路是通过严谨调控cI产物来间接调控PL、PR 启动子的转录。比如Invitrogen的PL表达系统,就是将受trp启动子严谨调控的cI基因

真核生物和原核生物的异同

从DNA复制、RNA转录、蛋白质翻译3个方面,叙述真核生物和原核生物的异同。 一、真核生物和原核生物的不同点 A、真核生物和原核生物复制的不同点: 1.真核生物DNA的合成只是在细胞周期的S期进行,而原核生物则在整个细胞生长过程中都可进行DNA合成 2.原核生物DNA的复制是单起点的,而真核生物染色体的复制则为多起点的。真核生物中前导链的合成并不像原核生物那样是连续的,而是以半连续的方式,由一个复制起点控制一个复制子的合成,最后由连接酶将其连接成一条完整的新链。 3.真核生物DNA的合成所需的RNA引物及后随链上合成的冈崎片段的长度比原核生物要短。 4.原核生物中有DNA聚合酶Ⅰ、Ⅱ、Ⅲ三种聚合酶,并有DNA聚合酶Ⅲ同时控制两条链的合成。真核生物中有α、β、γ、ε、δ五种聚合酶。聚合酶α、δ是DNA 合成的主要酶,分别控制不连续的后随链以及前导链的生成。聚合酶β可能与DNA修复有关,聚合酶γ则是线粒体中发现的唯一一种DNA聚合酶. 5.染色体端体的复制不同。原核生物的染色体大多数为环状,而真核生物染色体为线状。末端有特殊DNA序列组成的结构成为端体。 B、真核生物和原核生物转录的不同点: 1.真核生物的转录在细胞核内进行,原核生物则在拟核区进行。 2.真核生物mRNA分子一般只编码一个基因,原核生物的一个mRNA分子通常含多个基因。 3.真核生物有三种不同的RNA聚合酶催化RNA合成,而在原核生物中只有一种RNA聚合酶催化所有RNA 的合成。 4.真核生物的RNA聚合酶不能独立转录RNA,三种聚合酶都必须在蛋白质转录因子的协助下才能进行RNA的转录,其RNA聚合酶对转录启动子的识别也比原核生物要复杂得多。原核生物的RNA聚合酶可以直接起始转录合成RNA。 C、真核生物和原核生物翻译的不同点: 1.氨基酸的活化:原核起始氨基酸是甲酰甲硫氨酸,真核是从生成甲硫氨酰-tRNAi开始的。 2.翻译的起始:原核的起始tRNA是fMet-tRNA(fMet上角标),30s小亚基首先与mRNA

[参考实用]常见真核启动子及原核启动子特点

真核启动子 EF1a 常规 表达用 mRNA 人延长因子 1α来源的强哺乳动物表达启动子 组成型 表达水平十分稳定,与细胞类型无关 PGK1(人/小鼠) 常规 表达用 mRNA 磷酸甘油酸 酯激酶基因来源的哺乳动物启动子 组成型 广泛表达,但可能因细胞类型而异。由于甲基化或脱乙酰作用,倾向于抵抗启动子下调。

humanbetaactin 常规 表达 用 mRNA β-肌动蛋白 基因来源的 哺乳动物启 动子 组成型 无处不在,鸡的启动子 常用与启动子杂交 TRE 常规 表达 用 mRNA 四环素响应 元件启动子 被四环 素或者 类似物 诱导 通常有本底表达 Ac5 常规 表达 用 mRNA 果蝇Actin5c 基因来源的 强昆虫启动 子 组成型 果蝇表达系统的常用 启动子

CaMKIIa 光遗 传学 基因 表达 mRNA Ca2+/钙调 蛋白依赖的 蛋白激酶II启 动子 特异的 用于中枢神经系统/神 经元表达。受到钙和钙 调蛋白调节。 TEF1 常规 表达 用 mRNA 酵母转录延 伸因子启动 子 组成型 与哺乳动物的EF1a启 动子类似 ADH1 常规mRNA 乙醇脱氢酶I被乙醇全长版本很强,促进高

表达用 的酵母启动子 抑制 表达。截短启动子是组成型的,表达较低。 Ubi 常规 表达用 mRNA 玉米泛素基 因的植物启 动子 组成型 在植物中促进高表达 U6 小 RNA 表达 shRNA 来源于人U6小核启动子 组成型 小鼠U6也使用,但效率略差。 常用的原核表达系统启动子

T7lac 高 水 平 基 因 表 达 T7噬菌体 来源的启动 子加上lac 操纵子 几乎没有本底表 达,需要T7RNA 聚合酶,受到lac 操纵子的控制, 可以被IPTG诱 导。 常用与pET载体,受到lac操纵子的严 格调控

常见真核启动子及原核启动子特点精编版

常见真核启动子及原核 启动子特点 集团企业公司编码:(LL3698-KKI1269-TM2483-LUI12689-ITT289-

真核 启动子 EF1a 常规 表达用 mRNA 人延长因子 1α来源的强哺乳动物表达启动子 组成型? 表达水平十分稳定, 与细胞类型无关 PGK1(人/小鼠) 常规 表达用 mRNA 磷酸甘油酸 酯激酶基因 来源的哺乳 动物启动子 组成型? 广泛表达,但可能因 细胞类型而异。由于 甲基化或脱乙酰作 用,倾向于抵抗启动 子下调。 humanbetaactin 常规 表达用 mRNA β-肌动蛋白基因来源的哺乳动物启动子 组成型? 无处不在,鸡的启动 子常用与启动子杂交

TRE 常规 表达 用 mRNA 四环素响应 元件启动子 被四环 素或者 类似物 诱导 通常有本底表达 Ac5常规 表达 用 mRNA 果蝇Actin5c 基因来源的 强昆虫启动 子 组成型? 果蝇表达系统的常用 启动子 CaMKIIa 光遗 传学 基因 表达 mRNA? Ca2+/钙调蛋 白依赖的蛋 白激酶II启 动子 特异的 用于中枢神经系统/ 神经元表达。受到钙 和钙调蛋白调节。 GAL1,10常规 表达 用 mRNA 酵母双向启 动子 被半乳 糖诱 导,被 葡萄糖 抑制 可以单独使用或一起 使用。受GAL4和 GAL80调节。 TEF1常规 表达 用 mRNA 酵母转录延 伸因子启动 子 组成型? 与哺乳动物的EF1a 启动子类似

ADH1常规 表达 用 mRNA 乙醇脱氢酶I 的酵母启动 子 被乙醇 抑制 全长版本很强,促进 高表达。截短启动子 是组成型的,表达较 低。 Ubi 常规 表达 用 mRNA 玉米泛素基 因的植物启 动子 组成型?在植物中促进高表达 U6小 RNA 表达 shRNA 来源于人U6 小核启动子 组成型? 小鼠U6也使用,但效 率略差。 常用的原核表达系统启动子 T7lac 高水 平基 因表 达 T7噬菌体 来源的启 动子加上 lac操纵 子 几乎没有本底 表达,需要 T7RNA聚合 酶,受到lac 操纵子的控 制,可以被 常用与pET载体,受到lac操纵子 的严格调控

非编码区和编码区、真核生物的启动子、终止子,真核生物RNA的修饰

基因是由成千上万个核苷酸对组成。组成基因的核苷酸序列可以分为不同区段。在基因表达的过程中,不同区段所起的作用不同。在遗传学上通常将能编码蛋白质的基因称为结构基因。任何一个基因都包括非编码区和编码区。能够转录为相应信使RNA,进而指导蛋白质合成(也就是能编码蛋白质)的区段叫做编码区。不能转录为信使RNA、不能编码蛋白质的区段叫做非编码区。非编码区位于编码区前后,同属于一个基因,控制基因的表达和强弱。 原核生物的基因 非编码区虽然不能编码蛋白质,但对遗传信息的表达是不可缺少的,因为在它上面由调控遗传信息表达的核苷酸序列,该序列中最重要的是位于编码区上游的RNA聚合酶结合位点。启动子、终止子属于非编码区。因为回文序列的特殊排列,大多都位于非编码区。 原核基因的编码区全部编码蛋白质,真核生物的结构基因是断裂的基因。一个断裂基因能够含有若干段编码序列,可以编码蛋白质的序列称为外显子。在两个外显子之间被一段不编码的间隔序列隔开,这些间隔序列称为内含子。非编码区在每个断裂基因的第一个和最后一个外显子的外侧,有人称其为侧翼序列。在侧翼序列上有一系列调控序列。 真核细胞的基因中编码区特点:间隔的、不连续的。包括:外显子和内含子(位于编码区中的非编码序列)。

通常把基因转录起点前面即5’端的序列称为上游(upstream),起点后面即3’端的序列称为下游(downstream)。并把起点的位置记为十1,下游的核苷酸依次记为+2,+3,……,上游方向依次记为-1,-2,-3,……。 非编码区的调控序列主要有以下几种结构: ①在5′端转录起始点上游约20~30个核苷酸的地方,有TATA框(TATA box)。TATA框是一个短的核苷酸序列,其碱基顺序为TATAATAAT。TATA框是启动子(见下)中的一个顺序,它是RNA聚合酶的重要的接触点,能够使酶准确地识别转录的起始点并开始转录。当TATA框中的碱基顺序有所改变时,mRNA 的转录就会从不正常的位置开始。 ②在5′端转录起始点上游约70~80个核苷酸的地方,有CAAT框(CAAT box)。CAAT框是启动子中另一个短的核苷酸序列,其碱基顺序为GGCTCAATCT。CAAT框是RNA聚合酶的另一个结合点,它的作用还不很肯定,但一般认为它控制着转录的起始频率,而不影响转录的起始点。当这段顺序被改变后,mRNA 的形成量会明显减少。 ③在5′端转录起始点上游约100个核苷酸以远的位置,有些顺序可以起到增强转录活性的作用,它能使转录活性增强上百倍,因此被称为增强子。当这些顺序不存在时,可大大降低转录水平。研究表明,增强子通常有组织特异性,这是因为不同细胞核有不同的特异因子与增强子结合,从而对不同组织、器官的基因表达有不同的调控作用。例如,人类胰岛素基因5′末端上游约250个核苷酸处有一组织特异性增强子,在胰岛素β细胞中有一种特异性蛋白因子,可以作用于这个区域以增强胰岛素基因的转录。在其他组织细胞中没有这种蛋白因子,所以也就没有此作用。这就是为什么胰岛素基因只有在胰岛素β细胞中才能很好表达的重要原因。 ④在3′端终止密码的下游有一个核苷酸顺序为AATAAA,这一顺序可能对mRNA的加尾(mRNA尾部添加多聚A)有重要作用。这个顺序的下游是一个反向重复顺序。这个顺序经转录后可形成一个发卡结构。发卡结构阻碍了RNA聚合酶的移动。发卡结构末尾的一串U与转录模板DNA中的一串A之间,因形成的氢键结合力较弱,使mRNA与DNA杂交部分的结合不稳定,mRNA就会从模板上脱落下来,同时,RNA聚合酶也从DNA上解离下来,转录终止。AATAAA顺序和它下游的反向重复顺序合称为终止子(见下),是转录终止的信号。 启动子和终止子: 启动子(promoter)位于编码区上游的非编码区中。真核生物启动子包括下列几种不同顺序,能促进转录过程: (1)帽子位点:转录的起始位点。 (2)TATA框(TATA box):又称Hogness框,类似于原核生物的Pribnow框,决定了转录起点的选择。 其一致顺序为TATAATAAT。约在基因转录起始点上游约-30-50bp处,基本上由A-T碱基对组成,为RNA 聚合酶的结合处之一,RNA聚合酶与TATA框牢固结合之后才能开始转录。 (2)CAAT框(CAAT box):其一致顺序为GGGTCAATCT,是真核生物基因常有的调节区,位于转录起始点上游约-80-100bp处,可能也是RNA聚合酶的一个结合处,控制着转录起始的频率。 (3)GC框(GC box):有两个拷贝,位于CAAT框的两侧,由GGCGGG组成,转录因子Sp1能识别GC框并且与之结合,其N端有激活转录的作用。所以,GC框是一个转录调节区,有激活转录的功能。 (4)增强子(enhancer):又称远上游序列(far upstream sequence)。一般都在-1OO以上。增强子的作用主要是对依赖于TATA框的转录和不依赖TATA框的转录都有增强效应,但对前者增强效应高。增强子是通过启动子来增加转录的。有效的增强子可以位于基因的5’端,也可位于基因的3’端,有的还可位于基因的内含子中。增强子的效应很明显,一般能使基因转录频率增加10~200倍,有的甚至可以高达上千倍。

真核生物和原核生物的异同

从DNA复制、RNA转录、蛋白质翻译3个方面,叙述真核生物与原核生物的异同。 一、真核生物与原核生物的不同点 A、真核生物与原核生物复制的不同点: 1、真核生物DNA的合成只就是在细胞周期的S期进行,而原核生物则在整个细胞生长过程中都可进行DNA合成 2、原核生物DNA的复制就是单起点的,而真核生物染色体的复制则为多起点的。真核生物中前导链的合成并不像原核生物那样就是连续的,而就是以半连续的方式,由一个复制起点控制一个复制子的合成,最后由连接酶将其连接成一条完整的新链。 3、真核生物DNA的合成所需的RNA引物及后随链上合成的冈崎片段的长度比原核生物要短。 4、原核生物中有DNA聚合酶Ⅰ、Ⅱ、Ⅲ三种聚合酶,并有DNA聚合酶Ⅲ同时控制两条链的合成。真核生物中有α、β、γ、ε、δ五种聚合酶。聚合酶α、δ就是DNA 合成的主要酶,分别控制不连续的后随链以及前导链的生成。聚合酶β可能与DNA修复有关,聚合酶γ则就是线粒体中发现的唯一一种DNA聚合酶、 5、染色体端体的复制不同。原核生物的染色体大多数为环状,而真核生物染色体为线状。末端有特殊DNA序列组成的结构成为端体。 B、真核生物与原核生物转录的不同点: 1、真核生物的转录在细胞核内进行,原核生物则在拟核区进行。 2、真核生物mRNA分子一般只编码一个基因,原核生物的一个mRNA分子通常含多个基因。 3、真核生物有三种不同的RNA聚合酶催化RNA合成,而在原核生物中只有一种RNA聚合酶催化所有RNA 的合成。 4、真核生物的RNA聚合酶不能独立转录RNA,三种聚合酶都必须在蛋白质转录因子的协助下才能进行RNA的转录,其RNA聚合酶对转录启动子的识别也比原核生物要复杂得多。原核生物的RNA聚合酶可以直接起始转录合成RNA。 C、真核生物与原核生物翻译的不同点: 1、氨基酸的活化:原核起始氨基酸就是甲酰甲硫氨酸,真核就是从生成甲硫氨酰-tRNAi开始的。 2、翻译的起始:原核的起始tRNA就是fMet-tRNA(fMet上角标),30s小亚基首先与mRNA模板相结合,再与fMet-tRNA(fMet上角标)结合,最后与50s大亚基结合。真核中起始tRNA就是Met-tRNA(Met上角标),40s小亚基首先与Met-tRNA(Met上角标)相结合,再与模板mRNA结合,最后与60s大亚基结合生成起始复合物。

原核生物与真核生物复制的区别

原核生物与真核生物复 制的区别 集团档案编码:[YTTR-YTPT28-YTNTL98-UYTYNN08]

(二)D N A 的复制的必要条件 1、摸板:母链DNA 解链成单链后的两条链均可作为摸板。 2、原料:4种脱氧核苷三磷酸。 3、需要一小段RNA 作为引物,提供3'-OH 末段。 4、需要ATP 和无机离子。 5、需要多种酶和蛋白因子:如引物酶、DNA 聚合酶、拓扑酶、SSB 蛋白等。 以上必要条件中,原核生物和真核生物在DNA 的复制所需要引物、酶和蛋白因子等存在差别。其中DNA 聚合酶种类存在较大的差别。DNA 聚合酶是指以DNA 为摸板,在RNA 引物3'-OH 末段沿5'→3'方向按照碱基互补的原理催化合成DNA 链的酶,也称为依赖DNA 的DNA 聚合酶。原核生物和真核生物DNA 聚合酶的区别主要见下表1 表1 原核生物和真核生物DNA 聚合酶的区别 原核生物三种 DNA 聚合酶都有 5'→3'聚合活性和3'→5'外切酶活性,不同的是DNA-polⅠ还有5'→3'外切酶活性,即外切酶活性有双方向。真核生物五种DNA 聚合酶都有5'→3'外切酶活性,DNA-polα,DNA-polβ无3'→5'外切酶活性,DNA-polβ无5'→3'聚合活性。 原核生物DNA 聚合酶 真核生物DNA 聚合酶 DNA-polⅠ复制过程中的校读,填补缺口,修复。 DNA-polⅡDNA 损伤的应急修复。 DNA-polⅢ延长新链核苷酸的聚合。 DNA-polα起始引发,引物酶活性。 DNA-polβ低保真复制。 DNA-polγ催化线粒体DNA 的复制。 DNA-polδ延长子链的主要酶,解螺旋 酶活性。 DNA-polε填补引物空隙,切除修复,重组。 (三)DNA 复制的过程 原核生物和真核生物DNA 的过程大致可分为:起始+延长+终止三个阶段。 1、起始阶段表2 (1)解链/旋,解链/旋酶催化。 (2)起始点识别。 (3)原核生物形成复制叉。(真核生物形成多个复制单位) (4)引物酶催化引物合成。引发体与引物酶结合到DNA 链上,在引物酶的作用下合成一小段引物。 表2原核生物和真核生物DNA 复制的起始阶段的特点比较 原核生物 真核生物 复制起始点 起始点识别 引物 起始点长度 复制单位 参与的酶和蛋白因子 一个OriC DnaA 长、多 长 一个双向复制 DnaA 识别复制起始点 DnaB 解螺旋酶活性 DnaC 运载和协助DnaB DnaG 引物酶活性 多个 可能有“蛋白质-DNA 复合物 参与” 短、少 短 多个双向复制 DNA-polα起始引发,引物酶 活性 DNA-polδ解螺旋酶活性

真核生物启动子的鉴定方法

真核生物启动子的鉴定方法 启动子是RNA聚合酶识别、结合和开始转录的一段DNA序列。它对基因的表达调控起着至关重要的作用。本文对真核生物启动子的鉴定方法作了简要的总结,并对其优缺点进行了比较。 标签:真核;启动子;表达调控;RNA 在原核生物中,RNA多聚酶结合的位置即为启动子[1]。但在真核生物中,启动子一直没有明确的概念,一般认为启动子是位于基因编码区上游,与RNA 聚合酶相互识别、结合并启动转录的DNA序列,它包括在起始位点附近直接活化或抑制转录的DNA序列元件。启动子的定位是研究转录起始调控模式的前提,能否对其精确定位是后续功能性分析成败的关键[2]。本文对真核启动子的鉴定方法进行了简要的综述,并比较了优缺点。 1S1核酸酶法 S1核酸酶法[3]由Arnold Berk和Philip Sharp于1977年创立,近年来关于该方法的优化有许多报道[4-5]。其基本原理是首先构建噬菌体M13衍生型质粒,该质粒包括含有假定转录起始位点和其下游的部分核苷酸的基因区域、限制性酶切位点。将引物和单链噬菌体DNA进行退火,加入Klenow和dNTPs,其中一种dNTP经放射性标记,以产生放射性标记的探针。利用限制性内切酶将DNA 切割成线形,通过变性凝胶电泳分离放射性探针,再将探针和分离到的mRNA 进行杂交。然后用S1核酸酶进行消化,单链RNA和DNA被消化,生成含有部分核苷酸的双链片段。通过变性聚丙烯酰胺凝胶电泳确定放射性标记的抗S1核酸酶的产物大小,最后进行放射自显影或磷酸成像分析。抗性产物的长度应该与从探针的5′末端到转录起始位点的距离相等。这种方法的缺点是杂交分子易发生瞬间解离,产生相当多的背景条带。 2引物延伸方法 引物延伸方法[6]由P.K.Ghosh和S.M.Weissman于1978年提出。首先根据与起始位点5′末端下游大约50~150个核苷酸的mRNA序列设计合成寡核苷酸引物,并将引物的5′末端用32p标记。在根据经验确定的反应条件下,使过量的放射性标记引物与总RNA中特异的RNA分子或经过寡聚dT纯化的mRNA退火。将反转录酶、脱氧核苷三磷酸和适宜的缓冲液加到引物-mRNA杂交分子体系中,催化引物延伸到mRNA的5′末端。用变性聚丙烯酰胺凝胶电泳分析产生的放射性标记的cDNA产物。通过与旁边的标准分子量比较,在凝胶中检测条带的分子量大小。然后计算从合成的寡核苷酸5′末端到mRNA转录起始位点的距离。如果标记的cDNA产物在凝胶的分辨率范围内,转录起始位点的确定可精确到±1个核苷酸。此方法的缺点是很难找到与新基因有效杂交的引物,而且经常出现背景带,另外,有些mRNA 5’末端富含G/C且产生稳定的二级结构,使得反转录

相关文档
相关文档 最新文档