文档库 最新最全的文档下载
当前位置:文档库 › 棉花UXS基因生物信息学分析与原核表达

棉花UXS基因生物信息学分析与原核表达

棉花UXS基因生物信息学分析与原核表达
棉花UXS基因生物信息学分析与原核表达

第34卷第6期2 0 1 1年1 1月

河北农业大学学报

JOURNAL OF AGRICULTURAL UNIVERSITY OF HEBEI

Vol.34No.6

Nov.2 0 1 1

文章编号:1000-1573(2011)06-0005-05

棉花UXS基因生物信息学分析与原核表达

潘玉欣1,2, 刘恒蔚1, 王省芬1

(1.河北农业大学,河北保定071001;2.河北联合大学,河北唐山063000)

摘 要:通过生物信息学方法对已克隆的3个棉花UXS基因GhUXS1、GhUXS2和GhUXS3编码产物进行亲疏水性,结构域以及功能等多方面预测,同时将产物连接至pET-32a(+)原核表达载体,并转化BL21(DE3)plys菌株,在IPTG诱导下,利用Western blotting方法检测GhUXS1、GhUXS2和GhUXS3在原核细胞中的表达。生物信息学预测发现3个蛋白均含有UXS家族的保守域。GhUXS1和GhUXS2结构类似,N端含有较为明显的疏水区以及跨膜区,GhUXS3N端缺乏明显疏水区及跨膜区。Western blotting结果显示在体外分别成功表达GhUXS1、GhUXS2和GhUXS3和His标签的融合蛋白。

关键词:棉花;尿苷二磷酸葡萄糖醛酸脱羧酶;生物信息学;Western杂交

中图分类号:S562文献标志码:A

Bioinformatic analysis and prokaryotic expression

of three UXS genes in cotton(Gossypium hirsutum)

PAN Yu-xin1,2,LIU Heng-wei 1,WANG Xing-fen1

(1.Agricultural University of Hebei,Baoding,071001,China;

2.Hebei United University,Tangshan 063000,China)

Abstract:Coding products of three cotton UXS(UDP-glucuronate decarboxylase)genes,GhUXS1,GhUXS2and GhUXS3,were predicted with bioinformatics methods,including hydro-philic-hydrophobic property,domains and functions.Then three coding sequences were cloned in-to pET-32a(+)prokaryotic expression vector and transformed into BL21(DE3)plus strain.After corresponding fusion proteins being induced by IPTG,Western blotting was then employedto detect their expressions in prokaryotic cells.The result showed that all three proteins had con-served domain of NAD-binding in UXS family.GhUXS1and GhUXS2had similar structure,forexample,with obvious hydrophobic region and transmembrane region in N-terminal,whileGhUXS3lacked those structures.Western blotting results indicated that all three fusion proteinswere successfully expressed.

Key words:cotton;UDP-glucuronate decarboxylase;bioinformatics;Western blotting

尿苷二磷酸葡萄糖醛酸脱羧酶(UDP-glucur-onate decarboxylase,UXS)可催化UDP-葡萄糖醛酸(UDP-glucuronate,UDP-GlcA)形成UDP-木糖(UDP-xylose,UDP-xyl),目前已从拟南芥、水稻、大麦等多种植物中克隆了该基因,并证实UXS参与细胞壁形成[1-4]。棉纤维是由单细胞发育而来,其细胞壁成分包括纤维素与非纤维素两部分,棉纤维品质特别是纤维强度除与纤维素结晶度相关外,可能还和非纤维素的交联相关[5]。非纤维素成分主要包括木葡聚糖、木聚糖、果胶多糖等。由于木葡聚

*收稿日期:2011-10-09

基金项目:河北省青年自然基金(C2010000919);唐山市科技局项目(1014020C-4);河北理工大学博士自然基金.作者简介:潘玉欣(1979-),女,河北省沧州人,讲师,博士,从事棉花遗传育种研究,E-mail:panyu-xin@163.com.通讯作者:王省芬(1970-),女,河北藁城市人,教授,博士,从事棉花遗传育种与分子生物学研究,E-mail:cotton@hebau.edu.cn.

河北农业大学学报第34卷

糖、木聚糖是棉纤维细胞壁的组成成分,而UDP-Xyl又是构成二者化学结构的主体,因此UXS作为UDP-GlcA向UDP-Xyl转化的催化酶,可能在棉纤维合成过程中起着重要作用。本研究运用生物信息学的方法对前期克隆的3个棉花尿苷二磷酸葡萄糖醛酸脱羧酶基因序列所编码蛋白质的性质、结构进行预测,并利用Western blotting方法检测其在原核细胞中的表达,为进一步研究该基因的结构与非纤维素物质在棉纤维品质中的作用机制奠定基础。

1 材料与方法

1.1 供试材料

本研究所用限制性内切酶和DNA连接酶为Takara公司产品。低分子量蛋白标准品、大肠杆菌菌株BL21(DE3)plys以及PVDF膜,Western blot膜封闭液、一抗(Anti-His antibody)、二抗(HRP酶标羊抗鼠Ig)以及HRP-DAB底物显色试剂盒均购自北京天根生物公司。pET-32a(+)以及3个棉花UXS基因GhUXS1、GhUXS2和GhUXS3由河北农业大学农学院棉花遗传研究室提供。推测的3个GhUXS基因氨基酸序列分别长436AA,442AA和335AA。

1.2 方法

1.2.1 生物信息学预测

(1)在线生物信息学预测。利用因特网上生物信息学相关软件对3个推测的GhUXS蛋白序列进行以下生物信息学分析(表1)

表1 3个GhUXS蛋白生物信息学分析

所运用的在线生物软件

Table 1 The biological software online for 3GhUXS

protein bioinformatics analysis

在线生物软件

Online softwave

网址

Web site

运用ProScale程序进行

亲/疏水性分析

http://expasy.org/tools/

protscale.html

运用简单模块构架搜索

工具SMART进行蛋白

质结构域分析

http://smart.embl-heidel-

berg.de/

利用TMHMM Server

v.2.0进行跨膜结构预

http://www.cbs.dtu.dk/

service/TMHMM.2.0

利用SignalP 3.0信号肽

进行分析

http://www.cbs.dtu.dk/

services/SignalP-3.0/

利用Psort进行蛋白的

亚细胞定位

http://psort.nibb.ac.jp/

form.html

利用Protfun进行蛋白

质的功能预测

http://www.cbs.dtu.dk/

services/protfun

(2)系统发生树构建 利用TIGR及NCBI下载拟南芥、水稻以及大麦UXS基因氨基酸序列(表2),以ClustalW序列联配结果为基础,用MEGA4.0程序建立拟南芥、水稻、大麦和3条已克隆的棉花UXS蛋白系统进化树。进化树生成采用邻接法(NJ method),校验参数为Bootstrap1000次重复,对构建的系统发生树进行评估。

表2 拟南芥、水稻、大麦UXS家族成员

Table 2 UXS family of Arabidopsis,rice and barly

1.2.2 Western blotting检测 根据Pan等方法,构建3个目的蛋白与pET-32a(+)的融合表达载体,并在1mmol IPTG下进行诱导表达[6]。用于Western blot检测的SDS-PAGE胶电泳结束后,利用BIO-RAD半干转膜仪完成转膜过程。将PVDF膜从转膜仪中取出,用0.01mol/L的PBS漂洗后,浸没于封闭液中缓慢摇荡2h,然后用0.01mol/L的PBS漂洗3次,与一抗(Anti-His antibody,用0.01mol/L PBS稀释300倍)混合,4℃过夜,再用0.01mol/L PBS洗膜3次。加入HRP酶标羊抗鼠Ig(1∶2000稀释)室温下轻摇孵育2h,然后用0.01M PBS漂洗3次。用增强型HRP-DAB底物显色试剂盒避光显色,显色至出现条带时放入双蒸水中终止反应。蛋白质Marker转膜后,采用氨基黑方法染色。

2 结果与分析

2.1 GhUXS蛋白的生物信息学分析

2.1.1 GhUXS蛋白的亲疏水性和信号肽的预测分析 在线ProScal软件分析获得3个基因编码蛋

 第6期 潘玉欣等:棉花UXS基因生物信息学分析与原核表达

白的亲/疏水性分布曲线(图1)。GhUXS1、GhUXS2和GhUXS3 3个蛋白均存在较大范围的亲水区,有较强的亲水性。GhUXS1肽链大约在N端50~75AA位的区段是一段明显的疏水区域,GhUXS2在43~62AA位的区段是一段明显的疏水区域。

通过Tmhmm对3个基因编码蛋白进行蛋白跨膜区预测,如图2所示。GhUXS1和GhUXS2跨膜区域中的氨基酸序列期望值为分别为19.915 64和20.439 54,均有一个跨膜区存在,二者可能是一个跨膜蛋白。GhUXS1的氨基酸序列的跨膜区在49~71AA处,GhUXS2的氨基酸序列在43-62AA处,位置与疏水区预测结果比较类似。GhUXS3蛋白跨膜区预测跨膜区域中的氨基酸序列期望值为0.298 87,该蛋白不存在跨膜区。

利用SignalP的神经网络(Neural networks,NN)算法预测3个基因信号肽,结果3个蛋白C、S值均较低。N端氨基酸区域的S、D平均值非常低(图3),因此认为这3个蛋白可能不具备信号肽,编码的是一种非分泌蛋白。

图1 ProScal分析3个GhUXS亲/疏水性分布曲线

Fig.1 Hydrophilic/hydrophobic analysis of three GhUXS proteins by ProScal

图2 TMHMM软件对3个GhUXS的跨膜区分析Fig.2 Transmembrane analysis of three GhUXS proteins by TMHMM

图3 SignalP 3.0软件对3个GhUXS蛋白信号肽分析Fig.3 Signal peptide analysis of three GhUXS proteins by SignalP 3.0

2.1.2 GhUXS蛋白的结构域、亚细胞定位及功能预测 SMART蛋白质结构域功能分析显示:三者都存在UXS基因家族的保守域-3Beta-HSD和NAD-binding,GhUXS1和GhUXS2保守域所处位置比较接近,GhUXS3保守域相对靠近氨基酸序列N端(表3)。

河北农业大学学报第34卷

表3 3个GhUXS蛋白保守域位置

Table 3 Conservative domain location of

three GhUXS proteins

结构域

Protein domain

位置Location

GhUXS1GhUXS2GhUXS3

3Beta-HSD 124~347 121~341 36~251

NAD-binding 155~340 148~335 78~254

用Psort分析编码蛋白的亚细胞定位(表4),GhUXS1和GhUXS2的N基端存在位于细胞质膜上的典型氨基酸序列(GhUXS1 1~49位和GhUXS2 1~42位),二者可能是位于细胞质膜上的类型II膜蛋白,而定位在高尔基体上的可能性均为30%。GhUXS3定位于细胞质中的可能性为45%,定位在微体(过氧化物酶体)上的可能性为30%,定位在叶绿体的类囊体膜上的可能性为20%。

Protfun预测GhUXS1在中间代谢以及能量代谢中起作用,可能性分别为0.282,0.274;GhUXS2和GhUXS3在中间代谢中起作用,可能性分别为0.356和0.371。

表4 3个GhUXS蛋白亚细胞定位

Table 4 Subcellular location of three GhUXS proteins

定位

Location

GhUXS1GhUXS2GhUXS3

质膜0.790 0.790-

微体(过氧物酶体)0.516 0.312 0.300

叶绿体类囊体质膜0.417 0.438 0.200

高尔基体0.300 0.300-

细胞质--0.450

叶绿体基质--0.2002.1.3 UXS系统进化分析 根据进化树结果(图4),19条UXS蛋白家族分为A、B两个亚族,每一亚族中,同一物种基因处于同一分支内部,显示出物种内UXS蛋白结构的保守性较强

图4 UXS蛋白Mega进化树分析

Fig.4 Phylogenetic tree analysis UXS proteins by Mega

3个棉花GhUXS分处于A、B两个亚组内。其中GhUXS1和GhUXS2同源性相对较高,属于同一亚家族。GhUXS3结构与前两者相差较大,属于另一个亚族。

2.2 GhUXS蛋白在大肠杆菌中的Western blotting分析

在IPTG诱导下,蛋白经SDS-PAGE电泳并电转移至PVDF膜上,进行Western blotting检测,原核表达的3个GhUXS重组蛋白可与Anti-His an-tibody发生特异性的结合,显色后各出现单一且特异的条带,条带大小分别为60,66.7和60kDa,而空载体在21kDa出现一条带(图5)。说明3个棉花GhUXS重组蛋白均在原核表达系统内成功表达

1:BL21(DE3)pLysS空菌株;2:pET-32a(+)-GhUXS1;3:pET-32a(+)-GhUXS2;4:pET-32a(+)-GhUXS3;5:pET-32a(+)空载体;6:蛋白质marker。

图5 GhUXS在大肠杆菌中融合表达

蛋白的Weatern blot结果

Fig.5 Expression of GhUXS fusion proteins

using Weatern blotting analysis

3 讨论与结论

UDP-葡糖醛酸脱羧酶广泛存在于单子叶和双子叶植物中,是催化UDP-葡糖醛酸(UDP-GlcA)形成UDP-木糖(UDP-Xyl)的必须酶。棉纤维品质尤其是强度是目前棉纤维品质改良的重点,棉纤维强度除了和纤维素沉积有关外,还和木聚糖、木葡聚糖等非纤维素多糖和纤维素微纤丝的交联有关[7]。木聚糖和木葡聚糖二者特异地结合在细胞次生壁中的分布方式在次生壁形成时明显升高,表明二者和次生壁合成密切相关[8]。而木葡聚糖(Xyloglucan)和木聚糖(Xylan)等棉纤维非纤维素物质均由UDP-Xyl合成。本研究生物信息学SMART分析结果显示3个棉花UXS蛋白均含有UXS基因家族特征结构域,Protfun预测3个棉花GhUXS蛋白主要是在

 第6期 潘玉欣等:棉花UXS基因生物信息学分析与原核表达

中间代谢中起作用。前人研究表明,该蛋白家族与C代谢和糖蛋白、多糖合成等多种代谢过程相关[4],验证了棉花GhUXS蛋白在中间代谢中的功能。因此UDP-葡糖醛酸脱羧酶可能是棉纤维细胞壁形成的一个关键酶,影响棉纤维品质的形成。

不同植物中的UDP-葡糖醛酸脱羧酶家族一般都存在于细胞质或细胞膜上。PSORT分析显示GhUXS1和GhUXS2蛋白均位于细胞膜上。这两个蛋白在N端存在一个明显的疏水区,是跨膜蛋白,这种蛋白通常位于高尔基体上,结合二者30%的高尔基体定位预测结果,进一步推断这两个基因编码的蛋白可能存在于高尔基体上[9]。生物信息学分析结果还显示GhUXS1和GhUXS2在结构和功能上比较相似,而GhUXS3差别较大,这可能和棉花是异源四倍体植物有关,尽管三者属于同一基因家族,但由于来自不同的染色体,因此又存在着多样性。本研究还利用pET-32a(+)载体上的6个组氨酸与3个GhUXS构成融合表达载体,并成功用鼠抗His单克隆抗体,检测His的表达,证明了目的蛋白GhUXS的表达。Western blotting结果为下一步利用免疫学的方法对其功能和分子机制进行研究奠定了基础。

参考文献:

[1] Zhang Q S,Shirley N,Lahnstein J,et al.Characteriza-tion and expression patterns of UDP-D-glucuronate

decarboxylase genes in barley[J].Plant Physiology,

2005,138:131-141.

[2] Maor B P,Griffith C L,Doering T L.Functional clo-ning and characterization of a UDP glucuronic acid de-

carboxylase:The pathogenic fungus Cryptococcus

neoformans elucidates UDP-xylose synthesis[J].Proc

Natl Acad Sci,2001,21:12003-12008.

[3] April D H,Maor B P.Biosynthesis of UDP-xylose.cloning and characterization of a novel Arabidopsis

gene family,UXS,encoding soluble and putative

membrane-bound UDP-glucuronic acid decarboxylase

isoforms[J].Plant Physiol,2002,130:2188-2198.[4] Feingold D S.Aldo(and keto)hexoses and uronicacids[M]//Plant Carbohydrates I.Intracellular Car-

bohydrates,New Series,Encyclopedia of Plant Physi-

ology.Berlin:Springer-Verlag,1982:3-76.

[5] Hsieh Y L.Structural development of cotton fibersand linkages to fiber quality[M]//Basra AS(ed)

Cotton Fibers:Developmental Biology,Quality Im-

provement and Textile Processing.Food Products,

New York,1999:137-144.

[6] Pan Y X,Wang X F,Liu H W,et al.Molecular clo-ning of three UDP-glucuronate decarboxylase genes

that are preferentially expressed in Gossypiumfibers

from elongation to secondary cell wall synthesis[J].J

Plant Biol,2010,53(5):367-373.

[7] 武耀廷,刘进元.棉纤维细胞发育过程中非纤维素多糖的生物合成[J].棉花学报,2004,16(3):189-193.[8] 贺新强,曹克明.植物细胞次生壁形成的研究进展[J].植物学通报,2002,19(5):513-522.

[9] Hayashi T,Koyama T,Matsuda K.Formation ofUDP-xylose and xyloglucan in soybean gogi mem-

branes[J].Plant Physiol,1998,87:341-345.

(编辑:梁 虹)

【高中生物】功能基因的克隆及生物信息学分析

(生物科技行业)功能基因的克隆及生物信息学分析

功能基因的克隆及其生物信息学分析 摘要:随着多种生物全基因组序列的获得,基因组研究正从结构基因组学(structuralgenomics)转向功能基因组学(functionalgenomics)的整体研究。功能基因组学利用结构基因组学研究获得的大量数据与信息评价基因功能(包括生化功能、细胞功能、发育功能、适应功能等),其主要手段结合了高通量的大规模的实验方法、统计和计算机分析技术[1],它代表了基因分析的新阶段,已成为21世纪国际生命科学研究的前沿。功能基因组学是利用基因组测序获得的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使生物学研究从对单一基因或蛋白的研究转向多个基因或蛋白同时进行系统的研究,是在基因组静态的组成序列基础上转入对基因组动态的生物学功能学研究[2]。如何研究功能基因,也成为我们面临的一个课题,本文就克隆和生物信息学分析在研究功能基因方面的应用做一个简要的阐述。 关键词:功能基因、克隆、生物信息学分析。 1.功能基因的克隆 1.1图位克隆方法 图位克隆又称定位克隆,它是根据目标基因在染色体上确切位置,寻找与其紧密连锁的分子标记,筛选BCA克隆,通过染色体步移法逐步逼近目的基因区域,根据测序结果或用BAC、YAC克隆筛选cDNA表达文库寻找候选基因,得到候选基因后再确定目标基因。优点是无需掌握基因产物的任何信息,从突变体开始,逐步找到基因,最后证实该基因就是造成突变的原因。通过图位克隆许多

控制质量性状的单基因得以克隆,最近也有报道某些控制数量性状的主效基因(控制蕃茄果实大小的基因克隆[3]、控制水稻成熟后稻谷脱落基因克隆[4]以及小麦VRN2基因克隆[5]等)也通过图位克隆法获得。 1.2同源序列克隆目的基因 首先根据已知的基因序列设计PCR引物,在已知材料中扩增到该片段,并经克隆测序验证,利用放射性同位素标记或其他非同位素标记该PCR片段作为探针,与待研究材料的cDNA文库杂交,就可以获得该基因cDNA克隆,利用克隆进一步筛选基因组文库,挑选阳性克隆,亚克隆并测序,从中就可以筛选到该基因的完整序列。 1.3结合连锁和连锁不平衡的分析方法 结合连锁和连锁不平衡的分析方法是未知基因克隆研究领域发展的新方向[6]。(Linkagedisequilibrium,LD)。与连锁分析不同,连锁不平衡分析可以利用自然群体中历史发生的重组事件。历史上发生的重组使连锁的标记渐渐分布到不同的同源染色体上,这样就只有相隔很近的标记才能不被重组掉,从而形成大小不同的单倍型片段(Haplotypeblock)。这样经过很多世代的重组,只有相隔很近的基因,才能仍处在相同的原始单倍型片段上,基因间的连锁不平衡才能依然存在。所以基于连锁不平衡分析,可以实现目的基因的精细定位。林木大多为自由授粉的异交物种,所以连锁不平衡程度很低,林木基因组中的LD可能会仅局限于非常小的区域,这就为目的基因的精细定位提供了可能,结合SNP检测技术,科学家甚至可以将效应位点直接与单个的核苷酸突变关联起来,进行数量性状寡核苷酸

JMJD2B基因的生物信息学分析

JMJD2B基因的生物信息学分析 2006级本硕一班谢泽飞 指导老师:吴炳礼,许丽艳,李恩民 一对该基因的初步认识 JMJD2B基因是JMJB2基因家族中的一员,而说到该基因的来龙去脉还得从它的家族谈起。JMJD2家族是通过体外克隆的方式从一个编号为KIAA0867的人脑分粒cDNA文库中获得的,而且通过与JMJD1C基因的比较,更加明确了该基因家族的结构特点。该基因家族主要含有一个JmjN,JmjC,JD2H功能域,两个TUDOR功能域。有趣的是在该基因家族的C端末尾的第二个TUDOR功能域上有一个双向的出核入核定位信号,而这似乎提示了某些问题。现在我们对这整个家族有了一个初步的认识,再来看JMJD2B这个基因: 定位:19p13.3 全长:1096 AA 分子量:121896 Da 等电点:6.79 含有2个锌指结构,均为PHD型: 731-789 MCFTSGGENT EPLPANSYIG DDGTSPLIAC GKCCLQVHAS CYGIRPELVN EGWTCSRCA 851-907 KCVYCRKRMK KVSGACIQCS YEHCSTSFHV TCAHAAGVLM EPDDWPYVVS ITCLKHK 在15-57 处含有JmjN功能域,146-309含有JmjC功能域. 二该基因的主要生物学功能 第一点,通过进化树的分析,显示该基因在马这一动物中高度保守。

通过分析该基因的序列,在数据库中查找其同源序列,进而选取不同物种的代表基因进行进化树分析,我们可以看到,马这个物种的被归到了低等的昆虫中去了,按照进化的理论,应该不会出现这种情况的,于是,我们推断,该基因在马这个物种中特别保守,所以进化中的变异非常的小。再进一步想,该基因对马这个物种可能是很重要的,那么为什么这个基因会如此重要呢?通过查找文献,我得出下面的另一个结论,就是该基因的生物学功能:该基因具有去甲基化作用。当然,由于实验不是在马身上做的,我们也就只能得出一般性的结论。 第二点,参与组蛋白去甲基的作用,主动且有普遍特异性。 很显然,越来越多的研究表明,在真核细胞中组蛋白的甲基化修饰水平是该细胞的表观遗传的活跃程度的一个很重要指标。而JMJD2B的这个功能的意义是重大的,其能够使染色体核周异染色体的核周组蛋白去甲基化,进而对细胞的遗传进行表观遗传的调控。研究人员利用间接荧光免疫法进行追踪发现,在两组对照的雌鼠JMJD2B-GFP底物系统中,JMJD2B基因过度表达的一组,H3K9me3水平明显低于另外正常的那一组,都转变为H3K9me1的构型,这说明了JMJD2B 的特异去甲基作用,而且这一过程是主动的,都发生在细胞染色体复制前的一瞬间,速度非常快。但是,在巨大组蛋白中,该基因有表现出可以同时参与H3K9me3和H3K9me2的去甲基作用。

真核生物基因表达的调控

真核生物基因表达的调控 一、生物基因表达的调控的共性 首先,我们来看看在生物基因表达调控这一过程中体现的共性和一些基本模式。 1、作用范围。生物体内的基因分为管家基因和奢侈基因。管家基因始终表达,奢侈基因只在需要的时候表达,但二者的表达都受到调控。可见,调控是普遍存在的现象。 2、调控方式。基因表达有两种调控方式,即正调控与负调控,原核生物和真核生物都离不开这两种模式。 3、调控水平。一种基因表达的调控可以在多种层面上展开,包括DNA水平、转录水平、转录后加工水平、翻译后加工水平等。然为节省能量起见,转录的起始阶段往往作为最佳调控位点。 二、真核生物基因表达调控的特点 真核生物与原核细胞在结构上就有着诸多不同,这决定了二者在运行方面的迥异途径。真核生物比原核生物复杂,转录与翻译不同时也不同地,基因组与染色体结构复杂,因而有着更为复杂的调控机制。 1、 2、 3、 4、多层次。真核生物的基因表达可发生在染色质水平、转录起始水平、无操纵子和衰减子。 大多数原核生物以负调控为主,而真核生物启动子以正调控为主。 个体发育复杂,而受环境影响较小。真核生物多为多细胞生物,在转录后水平、翻译水平以及翻译后水平。

生长发育过程中,不仅要随细胞内外环境的变化调节基因表达,还要随发育的不同阶段表达不同基因。前者为短期调控,后者属长期调控。 从整体上看,不可逆的长期调控影响更深远。 三、真核生物基因表达调控的机制 介于真核生物表达以多层次性为最主要特点,我们可以分别从它的几个水平着眼,剖析它的调控机制。 1、染色质水平。真核生物基因组DNA以致密的染色质形式存在,发生在染色质水平的调控也称作转录前水平的调控,产生永久性DNA序列和染色质结构的变化,往往伴随细胞分化。染色质水平的调控包括染色质丢失、基因扩增、基因重排、染色体DNA的修饰,等等。a.基因丢失:丢失一段DNA或整条染色体的现象。在细胞分化过程中,可以通过丢失掉某些基因而去除这些基因的活性。某些原生动物、线虫、昆虫和甲壳类动物在个体发育中,许多体细胞常常丢失掉整条或部分的染色体,只有将来分化产生生殖细胞的那些细胞一直保留着整套的染色体。如马蛔虫2n=2,但染色体上有多个着丝粒。第一次卵裂是横裂,产生上下2个子细胞。第二次卵裂时,一个子细胞仍进行横裂,保持完整的基因组,而另一个子细胞却进行纵向分裂,丢失部分染色体。目前,在高等真核生物(包括动物、植物)中尚未发现类似的基因丢失现象。 b.基因扩增:基因扩增是指某些基因的拷贝数专一性增大的现象,它使得细胞在短期内产生大量的基因产物以满足生长发育的需要,是基因活性调控的一种方式。如非洲爪蟾卵母细胞中rDNA的基因扩增是因发育需要而出现的基因扩增现象;基因组拷贝数增加,即多倍性,在植物中是非常普遍的现象。基因组拷贝数增加使可供遗传重组的物质增多,这可能构成了加速基因进化、基因组重组和最终物种形成的一种方式。 c.基因重排:将一个基因从远离启动子的地方移到距它很近的位点从而启动转录,这种方式被称为基因重排。通过基因重排调节基因活性的典型例子是免疫球蛋白结构基因的表达。在人类基因组中,所有抗体的重链和轻链都不是由固定的完整基因编码的,而是由不同基因片段经重排后形成的完整基因编码的。

真核生物的基因表达调控机制

一、真核基因组的复杂性 与原核生物比较,真核生物的基因组更为复杂,可列举如下。 1. 真核基因组比原核基因组大得多,大肠杆菌基因组约4×106bp,哺乳类基因组在 109bp数量级,比细菌大千倍;大肠杆菌约有4000个基因,人则约有10万个基因。 2. 真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传 成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性。 3. 原核生物的基因组基本上是单倍体,而真核基因组是二倍体。 4. 如前所述,细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的单元, 共同开启或关闭,转录出多顺反子(polycistron)的mRNA;真核生物则是一个结构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),基本上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多。 5. 原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组中 仅约10%的序列为蛋白质、rRNA、tRNA等编码,其余约90%的序列功能至今还不清楚。 6. 原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码 的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),转录后需经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节。 7. 原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。哺乳动物基因组 中则存在大量重复序列(repetitive sequences)。用复性动力学等实验表明有三类重复序列:1)高度重复序列(highly repetitive sequences),这类序列一般较短,长10-300bp,在哺乳类基因组中重复106次左右,占基因组DNA序列总量的10-60%,人的基因组中这类序列约占20%,功能还不明了。2)中度重复序列(moderately repetitive sequences),这类序列多数长100-500bp,重复101-105次,占基因组10-40%。例如哺乳类中含量最多的一种称为Alu的序列,长约300bp,在哺乳类不同种属间相似,在基因组中重复3×105次,在人的基因组中约占7%,功能也还不很清楚。在人的基因组中18S/28SrRNA基因重复280次,5SrRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成簇重复30-40次,这些基因都可归入中度重复序列范围。3)单拷贝序列(single copy sequences)。这类序列基本上不重复,占哺乳类基因组的50-80%,在人基因组中约占65%。绝大多数真核生物为蛋白质编码的基因在单倍体基因组中都不重复,是单拷贝的基因。 从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还很有限,使现在国际上制订的人基因组研究计划(human gene project)完成,绘出人全部基因的染色体定位图,测出人基因组109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互关系,特别是要明了基因表达调控的全部规律,还需要经历很长期艰巨的研究过程。 二、真核基因表达调控的特点 尽管我们现在对真核基因表达调控知道还不多,但与原核生物比较它具有一些明显的特点。

真核生物基因表达调控

真核生物基因表达的调控远比原核生物复杂,可以发生在DNA水平、转录水平、转录后的修饰、翻译水平和翻译后的修饰等多种不同层次。但是,最经济、最主要的调控环节仍然是在转录水平上。 DNA水平的调控 DNA水平上的调控主要指通过染色体DNA的断裂,删除,扩增,重排,修饰(如甲基化与去甲基化,乙酰化与去乙酰化等)和染色质结构变化等改变基因的数量、结构顺序和活性而控制基因的表达。 转录水平的调控 转录水平的调控包括染色质的活化和基因的活化。通过染色质改型,组蛋白乙酰化,染色质变得疏松化及DNA去甲基化以便被酶和调节蛋白作用,基因的表达受顺式作用元件包括启动子及应答元件,转座元件,增强子,抑制子的调控,同时受反式作用因子包括基本转录因子,上游转录因子和转录调节因子等的调控。 转录后调控 转录后调控包括hnRNA的选择性加工运输和RNA编辑 在真核生物中,蛋白质基因的转录产物统称为hn RNA,必须经过加工才能成为成熟的mRNA分子。加工过程包括三个方面:加帽、加尾和去掉内含子。同一初级转录产物在不同细胞中可以用不同方式剪接加工,形成不同的成熟mRNA分子,使翻译成的蛋白质都可能不同。转录后的RNA在编码区发生碱基插入,缺失或转换的现象。

翻译水平的调控 阻遏蛋白与mRNA结合,可以阻止蛋白质的翻译并使成熟的mRNA变为失活状态贮存起来。一些调控作用的micRNAh和siRNA 还可以与mRNA作用降解mRNA,阻止其翻译 此外,还可以控制mRNA的稳定性和有选择的进行翻译。 翻译后调控 直接来自核糖体的线状多肽链是没有功能的,必须经过加工才具有活性。在蛋白质翻译后的加工过程中,还有一系列的调控机制。 1.蛋白质折叠 线性多肽链必须折叠成一定的空间结构,才具有生物学功能。在细胞中,蛋白质的折叠必须有分子伴侣的作用下才能完成折叠。 2.蛋白酶切割 末端切割 有些膜蛋白、分泌蛋白,在氨基端具有一段疏水性强的氨基酸序列,称为信号肽,用于前体蛋白质在细胞中的定位。信号肽必须切除多肽链才具有功能。 多聚蛋白质的切割 有些新合成的多肽链含有几个蛋白质分子的序列,切割以后产生具有不同功能的蛋白质分子。

生物信息学分析

4、生物信息学分析 通过核苷酸序列数据库和基因序列同源性在线分析途径初步对Rv2029c基因进行分类整理。由于结核分枝杆菌耐利福平野生株与核苷酸序列数据库KEGG GENES中的结核分枝杆菌标准株H37Rv的匹配率为100%,以下对基因的分析按照结核分枝杆菌标准株H37Rv的数据库信息进行,即完全匹配的1020bp长度序列(本次提取基因中包含上下游引物等序列,较长,1346bp)。 4.1基本信息 表1 基因基本信息 4.2基因组信息 表2 基因组信息

5、PLN02341(PfkB型碳水化合物激酶家族蛋白),位点208-294 6、PTZ0029(核糖激酶),位点205-301 药物靶点1、同源基因没有药物靶点 2、非同源但序列相似基因没有药物靶点 图3 蛋白结构域 4.3蛋白表达 4.3.1 二级结构分析 预测结果显示,PfkB蛋白的二级结构中β转角占46.61%,α螺旋占33.63%,β折叠占19.76%。转角结构和螺旋结构构成了结核分枝杆菌PfkB蛋白二级结构的骨架。

图4 蛋白二级结构 4.3.2 跨膜区分析 Tuberculist跨膜蛋白预测结果表明:蛋白长度339aa,预测跨膜蛋白数0。 图5 蛋白跨膜区分析 4.3.3 信号肽预测 Predict Protein分析表明PfkB蛋白氨基酸残基没有信号肽,由此推断此蛋白不包含信号肽,不是分泌型蛋白质。

图6 蛋白信号肽预测 4.3.4 疏水性分析 分析结果显示,蛋白最大疏水指数为2.411,最小疏水指数为-2.372。

图7 蛋白疏水性分析 4.3.5 DNA同源性分析 表3 基因同源性分析 菌株序列覆盖 率 E值一致性 Mycobacterium tuberculosis strain Beijing-like, complete genome 100% 0.0 100% Mycobacterium bovis subsp. bovis AF2122/97 complete genome 100% 0.0 100% Mycobacterium tuberculosis 18b genome 100% 0.0 100% Mycobacterium tuberculosis H37RvSiena, complete genome 100% 0.0 100% Mycobacterium tuberculosis str. Kurono DNA, complete genome 100% 0.0 100% Mycobacterium tuberculosis 49-02 complete 100% 0.0 100%

真核生物基因表达调控

第十章作业 1. 简述真核生物基因表达调控的7个层次。 ①染色体和染色质水平上的结构变化与基因活化 ②转录水平上的调控,包括基因的开与关,转录效率的高与低 ③RNA加工水平的调控,包括对出事转录产物的特异性剪接、修饰、编辑等。 ④转录后加工产物在从细胞核向细胞质转运过程中所受到的调控 ⑤在翻译水平上的控制,即对哪一种mRNA结合核糖体进行翻译的选择以及蛋白质成量的控制 ⑥对蛋白质合成后选择性地被激活的控制,蛋白质和酶分子水平上的剪接等的控制 ⑦对mRNA选择性降解的调控 2. 真核基因表达调控与原核生物相比有何异同? 相同点:①与原核基因的调控一样,真核基因表达调控也有转录水平调控和转录后水平的调控,并且也以转录水平调控为最重要; ②在真核结构基因的上游和下游(甚至内部)也存在着许多特异的调控成分,并依靠特异蛋白因子与这些调控成分的结合与否调控基因的转录。 不同点:①原核细胞的染色质是裸露的DNA,而真核细胞染色质则是由DNA与组蛋白紧密结合形成的核小体。 ②在原核基因转录的调控中,既有激活物参与的正调控,也有阻遏物参与的负调控,二者同等重要。 ③原核基因的转录和翻译通常是相互偶联的,即在转录尚未完成之前翻译便已开始。 ④真核生物大都为多细胞生物,在个体发育过程中发生细胞分化后,不同细胞的功能不同,基因表达的情况也就不一样,某些基因仅特异地在某种细胞中表达,称为细胞特异性或组织特异性表达,因而具有调控这种特异性表达的机制。 3. DNA 甲基化对基因表达的调控机制。 甲基化抑制基因转录的机制:DNA甲基化会导致某些区域DNA构象改变,包括甲基化后染色质对于核酸酶或限制性内切酶的敏感度下降,更容易与组蛋白H1相结合,DNaseⅠ超敏感位点丢失,使染色质高度螺旋化, 凝缩成团, 直接影响了转录因子与启动区DNA的结合效率的结合活性,不能启始基因转录。DNA的甲基化不利于模板与RNA聚合酶的结合,降低了转录活性。 4. 转录因子结合DNA的结构基序(结构域)有哪几类? ①螺旋-转折-螺旋 ②锌指结构 ③碱性-亮氨酸拉链 ④碱性-螺旋-环-螺旋 5. 真核基因转调控中有几种方式能够置换核小体? ①占先模式:可以解释转录时染色质结构的变化。该模型认为基因能否转录取决于特定位置上组蛋白和转录因子之间的不可逆竞争性结合。 ②动态模式该模型认为转录因子与组蛋白处于动态竞争之中,基因转录前染色质必须经历结构上的改变,即转换核小体中的全部或部分成分并重新组装,这个耗能的基因活化过程称为染色质重构 6. 简述真核生物转录水平调控过程。 真核生物在转录水平的调控主要是通过反式作用因子、顺式作用元件和RNA聚合酶的相互作用来完成的,主要是反式作用因子结合顺式作用元件后影响转录起始复合物的形成过程:①转录起始复合物的形成:真核生物RNA聚合酶识别的是由通用转录因子与DNA形成的

13 生物化学习题与解析--基因表达调控

基因表达调控 一、选择题 (一) A 型选择题 1 .基因表达调控的最基本环节是 A .染色质活化 B .基因转录起始 C .转录后的加工 D .翻译 E .翻译后的加工 2 .将大肠杆菌的碳源由葡萄糖转变为乳糖时,细菌细胞内不发生 A .乳糖→ 半乳糖 B . cAMP 浓度升高 C .半乳糖与阻遏蛋白结合 D . RNA 聚合酶与启动序列结合 E .阻遏蛋白与操纵序列结合 3 .增强子的特点是 A .增强子单独存在可以启动转录 B .增强子的方向对其发挥功能有较大的影响 C .增强子不能远离转录起始点 D .增强子增加启动子的转录活性 E .增强子不能位于启动子内 4 .下列那个不属于顺式作用元件 A . UAS B . TATA 盒 C . CAAT 盒 D . Pribnow 盒 E . GC 盒 5 .关于铁反应元件( IRE )错误的是 A .位于运铁蛋白受体 (TfR) 的 mRNA 上 B . IRE 构成重复序列 C .铁浓度高时 IRE 促进 TfR mRNA 降解 D .每个 IR E 可形成柄环节构 E . IRE 结合蛋白与 IRE 结合促进 TfR mRNA 降解 6 .启动子是指 A . DNA 分子中能转录的序列 B .转录启动时 RNA 聚合酶识别与结合的 DNA 序列 C .与阻遏蛋白结合的 DNA 序列 D .含有转录终止信号的 DNA 序列 E .与反式作用因子结合的 RNA 序列 7 .关于管家基因叙述错误的是 A .在同种生物所有个体的全生命过程中几乎所有组织细胞都表达 B .在同种生物所有个体的几乎所有细胞中持续表达 C .在同种生物几乎所有个体中持续表达 D .在同种生物所有个体中持续表达、表达量一成不变 E .在同种生物所有个体的各个生长阶段持续表达 8 .转录调节因子是 A .大肠杆菌的操纵子 B . mRNA 的特殊序列 C .一类特殊的蛋白质 D .成群的操纵子组成的凋控网络 E .产生阻遏蛋白的调节基因 9 .对大多数基因来说, CpG 序列高度甲基化 A .抑制基因转录 B .促进基因转录 C .与基因转录无关 D .对基因转录影响不大 E .既可抑制也可促进基因转录 10 . HIV 的 Tat 蛋白的功能是 A .促进 RNA po l Ⅱ 与 DNA 结合 B .提高转录的频率

用于新基因的生物信息学分析

用于新基因的生物信息 学分析 ★★★★★ reasonspare(金币+5,VIP+0):谢谢分享,欢迎常来! lwf991229(金币+0,VIP+0):置为资源帖~~ 2-9 16:12 lwf991229(金币+0,VIP+0):高亮~ 2-9 16:13 核酸序列的基本分析 运用DNAMAN软件分析核酸序列的分子质量、碱基组成和碱基分布。同时运用BioEdit(版本7.0.5.3)软件对基因做酶切谱分析。 碱基同源性分析 运用NCBI信息库的BLAST程序对基因进行碱基同源性分析(Translated query vs.protien database(blastx))网站如下:https://www.wendangku.net/doc/3f10110972.html,/BLAST/ 参数选择:Translated query-protein database [blastx];nr;stander1 开放性阅读框(ORF)分析 利用NCBI的ORF Finder程序对基因做开放性阅读框分析,网址如下: https://www.wendangku.net/doc/3f10110972.html,/projects/gorf/orfig.cgi 参数选择:Genetic Codes:1 Standard 对蛋白质序列的结构功能域分析 运用简单模块构架搜索工具(Simple Modular Architecture Research Tool,SMART)对基因的ORF出的蛋白质序列进行蛋白质结构功能域分析。该数据库由EMBL建立,其中集成了大部分目前已知的蛋白质结构功能域的数据。 网址如下:http://smart.embl-heidelberg.de/ 运用NCBI的BLAST程序再对此蛋白质序列进行rpsBlast分析 参数选择:Search Database:CDD v2.07-11937PSSM

真核生物与原核生物基因表达调控的区别

原核生物和真核生物基因表达调控特点的比较1.相同点:转录起始是基因表达调控的关键环节2.不同点:A.原核基因的表达调控主要包括转录和翻译水平 真核基因的表达调 控主要包括染色质活化、转录、转录后加工、翻译、翻译后加工多个层次B.原核基因表达调控主要为负调控,真核主要为正调控C.原核转录不需要转录因子,RNA聚合酶直接结合启 动子,由sita因子决定基因表的的特异性 真核基因转录起始需要基础特异两类转录因子 依赖DNA-蛋白质、蛋白质-蛋白质相互作用 调控转录激活D.原核基因表达调控主要采用操纵子模型 转录出多顺反子RNA 实现协调调节 真核基因转录产物为单顺反子RNA 功能相关蛋白的协调表达机制更为复杂。真核生物基因表达调控的环节主要在转录水平 其次是翻译水平。原核生物基因以操纵子的形式存在。转录水平调控涉及到启动子、sita因子 与RNA聚合酶结合 、阻遏蛋白 负调控 、正调控蛋白、倒位蛋白、RNA聚合酶抑制物、衰减子等。翻译水平的调控涉及SD序列、mRNA的稳定性 不稳定(5’端和3’端的发夹结构可保护不被酶水解mRNA的5’端与核糖体结合 可明显提高稳定性)、翻译产物及小分子RNA的调控作用。真核生物基因表达的调控环节较多 在DNA水平上可以通过染色体 丢失、基因扩增、基因重排、DNA甲基化、染色体结构改变影响基因表达。在转录水平主要通过反式作用因子调控转录因子与TATA盒的结合、RNA聚合酶与转录因子-DNA复合物的结合及转录起始复合物的形成。在转录后水平主要通过RNA修饰、剪接及mRNA运输的控制来影响基因表达。在翻译水平有影响起始翻译的阻遏蛋白、5’AUG、5’端非编码区长度、mRNA 的稳定性调节及小分子RNA。真核基因调控中最重要的环节是基因转录 真核生物基因表达需要转录因子、启动子、沉默子和增强子。葡萄糖存在 乳糖不存在 此时无诱导剂

生物信息学分析方法

核酸和蛋白质序列分析 蛋白质, 核酸, 序列 关键词:核酸序列蛋白质序列分析软 件 在获得一个基因序列后,需要对其进行生物信息学分析,从中尽量发掘信息,从而指导进一步的实验研究。通过染色体定位分析、内含子/外显子分析、ORF分析、表达谱分析等,能够阐明基因的基本信息。通过启动子预测、CpG岛分析和转录因子分析等,识别调控区的顺式作用元件,可以为基因的调控研究提供基础。通过蛋白质基本性质分析,疏水性分析,跨膜区预测,信号肽预测,亚细胞定位预测,抗原性位点预测,可以对基因编码蛋白的性质作出初步判断和预测。尤其通过疏水性分析和跨膜区预测可以预测基因是否为膜蛋白,这对确定实验研究方向有重要的参考意义。此外,通过相似性搜索、功能位点分析、结构分析、查询基因表达谱聚簇数据库、基因敲除数据库、基因组上下游邻居等,尽量挖掘网络数据库中的信息,可以对基因功能作出推论。上述技术路线可为其它类似分子的生物信息学分析提供借鉴。本路线图及推荐网址已建立超级链接,放在北京大学人类疾病基因研究中心网站(https://www.wendangku.net/doc/3f10110972.html,/science/bioinfomatics.htm),可以直接点击进入检索网站。 下面介绍其中一些基本分析。值得注意的是,在对序列进行分析时,首先应当明确序列的性质,是mRNA序列还是基因组序列?是计算机拼接得到还是经过PCR扩增测序得到?是原核生物还是真核生物?这些决定了分析方法的选择和分析结果的解释。 (一)核酸序列分析 1、双序列比对(pairwise alignment) 双序列比对是指比较两条序列的相似性和寻找相似碱基及氨基酸的对应位置,它是用计算机进行序列分析的强大工具,分为全局比对和局部比对两类,各以Needleman-Wunsch 算法和Smith-Waterman算法为代表。由于这些算法都是启发式(heuristic)的算法,因此并没有最优值。根据比对的需要,选用适当的比对工具,在比对时适当调整空格罚分(gap penalty)和空格延伸罚分(gap extension penalty),以获得更优的比对。 除了利用BLAST、FASTA等局部比对工具进行序列对数据库的搜索外,我们还推荐使用EMBOSS软件包中的Needle软件(http://bioinfo.pbi.nrc.ca:8090/EMBOSS/),和Pairwise BLAST (https://www.wendangku.net/doc/3f10110972.html,/BLAST/)。以上介绍的这些双序列比对工具的使用都比较简单,一般输入所比较的序列即可。 (1)BLAST和FASTA FASTA(https://www.wendangku.net/doc/3f10110972.html,/fasta33/)和BLAST (https://www.wendangku.net/doc/3f10110972.html,/BLAST/)是目前运用较为广泛的相似性搜索工具。这两

原核生物基因表达调控概述

原核生物基因表达调控概述 基因表达调控是生物体内基因表达调节控制机制,使细胞中基因表达的过程在时间,空间上处于有序状态,并对环境条件的变化做出适当的反应复杂过程。 1.基因表达调控意义 在生命活动中并不是所有的基因都同时表达,代谢过程中所需各种酶和蛋白质基因以及构成细胞化学成分的各种编码基因,正常情况下是经常表达的,而与生物发育过程有关的基因则需在特定的时空才表达,还有许多基因被暂时的或永久的关闭而不来表达。 2.原核基因表达调控特点 原核生物基因表达调控存在于转录和翻译的起始、延伸和终止的每一步骤中。这种调控多以操纵子为单位进行,将功能相关的基因组织在一起,同时开启或关闭基因表达即经济又有效,保证其生命活动的需要。调控主要发生在转录水平,有正、负调控两种机制在转录水平上对基因表达的调控决定于DNA的结构,RNA 聚合酶的功能、蛋白质因子及其他小分子配基的相互作用。细菌的转录和翻译过程几乎在同一时间内相互偶联。 细胞要控制各种蛋白质在不同时期的表达水平,有两条途径:(1)细胞控制从其DNA模板上转录其特异的mRNA的速度,这是一条经济的途径,可减少从mRNA合成蛋白质的小分子物质消耗,这是生物长期进化过程中自然选择的结果,这种控制称为转录水平调控。(2)在mRNA合成后,控制从mRNA翻译肽链速度,包括一些与翻译有关的酶及其复合体分子缔合的装配速度等过程。这种蛋白质合成及其基因表达的控制称为翻译水平的调控。 二.原核生物表达调控的概念 (1)细菌细胞对营养的适应

细菌必须能够广泛适应变化的环境条件。这些条件包括营养、水分、溶液浓度、温度,pH等。而这些条件须通过细胞内的各种生化反应途径,为细胞生长 的繁荣提供能量和构建细胞组分所需的小分子化合物。 (2)顺式作用元件和反式作用元件 基因活性的调节主要通过反式作用因子与顺式作用元件的相互作用而实现。反式作用因子的编码基因与其识别或结合的靶核苷酸序列在同一个DNA分子上。RNA聚合酶是典型的反式作用因子。 顺式作用元件是指对基因表达有调节活性的DNA序列,其活性只影响与其 自身同处于一个DNA分子上的基因;这种基因DNA序列通常不编码蛋白质, 多位于基因旁侧或内含子中。位于转录单位开始和结束位置上启动子和终止子,都是典型的顺式作用元件。 (3)结构基因和调节基因 结构基因是编码蛋白或RNA基因。细菌的结构基因一般成簇排列,多个结 构基因受单一启动子共同控制,使整套基因或者都不表达。结构基因编码大量功能各异的蛋白质,其中有组成细胞核组织器官基本成分的结构蛋白,有催化活性的酶和各种调节蛋白等。调节基因是编码合成那些参与基因表达调控的RNA和蛋白质的特异性DNA序列。调节基因编码的调节物通过与DNA上的特定位点 结合控制转录是调控关键。 (4)操纵基因和阻遏蛋白 操纵基因是操纵子中的控制基因,在操纵子上一般与启动子相邻,通常处于开放状态,使RNA聚合酶能够通过并作用于启动子启动转录,阻遏蛋白是负调控系统中由调节基因编码的调节蛋白,它本身或与辅阻遏蛋白物一起合成于操纵基因,阻遏蛋白操纵因子结构基因的转变,阻遏蛋白可被诱导物变构失活,从而导致不可阻遏或去阻遏。

原核生物和真核生物基因表达调控复制、转录、翻译特点的比较

原核生物和真核生物基因表达调控、复制、转录、翻译特点的比较 1.相同点:转录起始是基因表达调控的关键环节 ①结构基因均有调控序列; ②表达过程都具有复杂性,表现为多环节; ③表达的时空性,表现为不同发育阶段和不同组织器官上的表达的复杂性; 2.不同点: ①原核基因的表达调控主要包括转录和翻译水平。真核基因的表达调控主要包括染色质活化、转录、转录后加工、翻译、翻译后加工多个层次。 ②原核基因表达调控主要为负调控,真核主要为正调控。 ③原核转录不需要转录因子,RNA聚合酶直接结合启动子,由sita因子决定基因表的的特异性,真核基因转录起始需要基础特异两类转录因子,依赖DNA-蛋白质、蛋白质-蛋白质相互作用调控转录激活。 ④原核基因表达调控主要采用操纵子模型,转录出多顺反子RNA,实现协调调节;真核基因转录产物为单顺反子RNA,功能相关蛋白的协调表达机制更为复杂。 ⑤真核生物基因表达调控的环节主要在转录水平,其次是翻译水平。原核生物基因以操纵子的形式存在。转录水平调控涉及到启动子、sita因子与RNA聚合酶结合、阻遏蛋白、负调控、正调控蛋白、倒位蛋白、RNA聚合酶抑制物、衰减子等。翻译水平的调控涉及SD序列、mRNA的稳定性不稳定(5’端和3’端的发夹结构可保护不被酶水解mRNA的5’端与核糖体结合可明显提高稳定性)、翻译产物及小分子RNA的调控作用。 真核生物基因表达的调控环节较多: 在DNA水平上可以通过染色体丢失、基因扩增、基因重排、DNA甲基化、染色体结构改变影响基因表达。 在转录水平主要通过反式作用因子调控转录因子与TA TA盒的结合、RNA聚合酶与转录因子-DNA复合物的结合及转录起始复合物的形成。 在转录后水平主要通过RNA修饰、剪接及mRNA运输的控制来影响基因表达。 在翻译水平有影响起始翻译的阻遏蛋白、5’AUG、5’端非编码区长度、mRNA的稳定性调节及小分子RNA。 真核基因调控中最重要的环节是基因转录,真核生物基因表达需要转录因子、启动子、沉默子和增强子。 真核生物和原核生物复制的不同点: ①真核生物DNA的合成只是在细胞周期的S期进行,而原核生物则在整个细胞生长过程中都可进行DNA合成 ②原核生物DNA的复制是单起点的,而真核生物染色体的复制则为多起点的。真核生物中前导链的合成并不像原核生物那样是连续的,而是以半连续的方式,由一个复制起点控制一个复制子的合成,最后由连接酶将其连接成一条完整的新链。 ③真核生物DNA的合成所需的RNA引物及后随链上合成的冈崎片段的长度比原

真核生物基因表达调控

真核生物基因表达的调控 河南大学民生学院王磊生物技术 一、生物基因表达的调控的共性 首先,我们来看看在生物基因表达调控这一过程中体现的共性和一些基本模式。 1、作用范围。生物体内的基因分为管家基因和奢侈基因。管家基因始终表达,奢侈基因只在需要的时候表达,但二者的表达都受到调控。可见,调控是普遍存在的现象。 2、调控方式。基因表达有两种调控方式,即正调控与负调控,原核生物和真核生物都离不开这两种模式。 3、调控水平。一种基因表达的调控可以在多种层面上展开,包括DNA水平、转录水平、转录后加工水平、翻译后加工水平等。然为节省能量起见,转录的起始阶段往往作为最佳调控位点。 二、真核生物基因表达调控的特点 真核生物与原核细胞在结构上就有着诸多不同,这决定了二者在运行方面的迥异途径。真核生物比原核生物复杂,转录与翻译不同时也不同地,基因组与染色体结构复杂,因而有着更为复杂的调控机制。 1、多层次。真核生物的基因表达可发生在染色质水平、转录起始水平、转录后水平、翻译水平以及翻译后水平。 2、无操纵子和衰减子。 3、大多数原核生物以负调控为主,而真核生物启动子以正调控为主。 4、个体发育复杂,而受环境影响较小。真核生物多为多细胞生物,在生长发育过程中,不仅要随细胞内外环境的变化调节基因表达,还要随发育的不同阶段表达不同基因。前者为短期调控,后者属长期调控。从整体上看,不可逆的长期调控影响更深远。 三、真核生物基因表达调控的机制 介于真核生物表达以多层次性为最主要特点,我们可以分别从它的几个水平着眼,剖析它的调控机制。 1、染色质水平。真核生物基因组DNA以致密的染色质形式存在,发生在染色质水平的调控也称作转录前水平的调控,产生永久性DNA序列和染色质结构的变化,往往伴随细胞分化。染色质水平的调控包括染色质丢失、基因扩增、基因重排、染色体DNA的修饰,等等。 a.基因丢失:丢失一段DNA或整条染色体的现象。在细胞分化过程中,可以通过丢失掉某些基因而去除这些基因的活性。某些原生动物、线虫、昆虫和甲壳类动物在个体发育中,许多体细胞常常丢失掉整条或部分的染色体,只有将来分化产生生殖细胞的那些细胞一直保留着整套的染色体。如马蛔虫2n=2,但染色体上有多个着丝粒。第一次卵裂是横裂,产生上下2个子细胞。第二次卵裂时,一个子细胞仍进行横裂,保持完整的基因组,而另一个子细胞却进行纵向分裂,丢失部分染色体。目前,在高等真核生物(包括动物、植物)中尚未发现类似的基因丢失现象。 b.基因扩增:基因扩增是指某些基因的拷贝数专一性增大的现象,它使得细胞在短期内产生大量的基因产物以满足生长发育的需要,是基因活性调控的一种方式。如非洲爪蟾卵母细胞中rDNA的基因扩增是因发育需要而出现的基因扩增现象;基因组拷贝数增加,即多

真核基因表达

(二)真核基因表达调控 细胞中一种蛋白质含量的变化至少可在7个水平上调控: 真核基因多水平表达调控 ①DNA和染色体水平的调控: 基因扩增、基因丢失、基因 重排、基因修饰、基因封闭等。 ②转录水平的调控: 转录的起始、延伸和终止等。 ③转录后RNA前体加工: 基因在核中转录而在胞浆中翻译, 转录后需经剪切、拼接、编辑和修饰 转运等过程。 ④RNA转运的调控 ⑤翻译水平的调控。 ⑥mRNA降解的调控:细胞内有控制mRNA寿命的机制。 ⑦翻译后水平的调控:翻译产物剪切、修饰、构象形成、 转运和装配等。 真核基因表达调控特点 (1)RNA聚合酶 真核生物RNA聚合酶有三种,即RNA Pol I、II和III,分别负责三种RNA转录。真核生物RNA聚合酶识别的不单是DNA顺序,而是转录因子蛋白质复合物。细菌RNA聚合酶只有一种。 (2)活性染色体结构变化 (3)正性调节占主导(DNA形成染色质结构) (4)转录与翻译分隔进行 (5)转录后修饰、加工 根据其性质可分为两大类: 一是瞬时调控或称为可逆性调控,它相当于原核细胞对环境条件变化所做出的反应。瞬时调控包括某种底物或激素水平升降时,及细胞周期不同阶段中酶活性和浓度的调节。 二是发育调控或称不可逆调控,是真核基因调控的精髓部分,它决定了真核细胞生长、分化、发育的全部进程。 真核生物基因的表达调控A 1. 转录前水平的调控 通过改变: (1)DNA序列: 通常低等生物的细胞决定和分化是通过基因组水平加工和改造实现。 (2)染色质结构:高等生物多采取异染色质化关闭基因的表达,虽然也会有类似低等生物的加工方式。上述影响基因表达的过程均属于转录前水平的调节。 (3)染色质丢失:在细胞分化过程中,丢掉某些基因而去除其活性。例如马蛔虫,一部分细胞总是保留完整的基因组,将来发育为生殖细胞;丢失了部分染色体的细胞分化为体细胞。(4)基因扩增:即基因组中的特定段落在某些情况会复制产生许多拷贝。(两栖动物蟾蜍的卵母细胞rDNA) (5)基因重排:如免疫球蛋白基因重排,多样性 (6)染色质DNA的修饰和异染色质化:如甲基化(位点多在胞嘧啶和腺嘌呤)。雌性胎生

真核生物的基因表达调控概述

真核生物的基因表达调控概述 真核生物基因在染色质活性、DNA水平、转录水平和翻译水平的表达调控特点。答:真核基因组结构具有基因组结构庞大、单顺反子、含有大量重复序列、基因不连续性、非编码区较多等特点。 (1)染色质结构水平对基因表达调控:①常染色质或异染色质;②染色质的状态(活性或阻遏),紧密结构会抑制基因表达,解凝集结构利于基因表达;③可以通过对组蛋白结构的修饰来实现,有组蛋白翻译后的乙酰化、甲基化、磷酸化、泛素化等;④DNA水平的调控包括基因丢失、扩增、重排和移位等方式。 (2)转录水平的调控:①RNA聚合酶、转录因子等反式作用因子和顺式作用元件(启动子强弱、增强子、沉默子)相互作用对基因转录的调控;②同一基因转录起始位点的不同,导致在不同组织细胞中的基因表达差异。 (3)转录后的加工:转录后加工的多样性,包括①加尾和剪接;②多个5′端转录起始位点或剪接位点;③多个加多聚(A)位点和不同的剪接方式;④虽无剪接,但有多个转录起始位点或加多聚(A)位点等多种方式调控基因的表达。(4)翻译水平的调控:①翻译起始因子eIF-4F 的磷酸化激活蛋白质的合成,eIF-2α 的磷酸化引起翻译起始受阻,降低蛋白质的生物合成水平;② mRNA 结构与翻译控制:mRNA5′端m7G 帽有增强翻译水平的作用,上游AUG 密码子的存在往往抑制下游开放读框的翻译效率;③起始AUG 上游序列对翻译效率的影响,如Kozak序列;④poly(A)尾增加翻译效率;⑤poly(A)尾中富含UA 序列抑制翻译。 (5)翻译后加工水平的调控:翻译的蛋白质还需要加工、修饰、折叠和分选后才具有功能。综上所述,真核生物基因表达调控是一个十分复杂的过程。

FGF5基因及其产物的生物信息学分析

FGF基因及其产物的生物信息学分析 作者:王晓灿 辅导老师:焦传珍 (韶关学院,生物科学系,广东韶关512005) 摘要:成纤维细胞内生长因子5(fibroblast growthfactor 5,FGF5)作为一种重要的毛发生长调节因子,已经得到广泛研究. 利用ProtParam、TargetP 1.1和PSORT 1I prediction 等生物信息学在线分析程序,结合SignalP 3.0和DNAMAN 等生物信息学软件,分析、预测FGF5蛋白的理化性质、可溶性、信号肽序列、蛋白细胞定位区域、等。通用应用这些软件对FGF5的分析,增加对FGF5的认识,并加强生物信息学的学习。 Abstract: fibroblast growth factor 5 hair growth regulation as an important factor that has been widely studied. Using ProtParam, PSORT and TargetP 1.1 line 1I prediction bioinformatic analysis program, combination of SignalP 3 and DNAMAN, bioinformatics software, analysis, forecast FGF5 physico-chemical properties of the protein, soluble, Cellular localization signal peptide sequences, protein regions, and so on. Analysis of General FGF5 using these software, increase awareness of FGF5, and to strengthen learning bioinformatics. 关键词:FGF5,绵羊,蛋白质结构,生物信息学 在鼠中,有7O多种基因突变影响被毛形态,许多突变对被毛的长度无影响,有些使被毛变短,到目前为止只有一种突变即angora鼠(最初命名为go基因突变)引起被毛变长[1]。这一突变现象引起了众多学者的兴趣,研究证明安哥拉鼠是由FGF5突变引起的。随着这些基因功能性研究的不断深入,这就需要进一步了解FGF5基因在机体细胞内对毛发的调控机制和蛋白质在不同条件下的表达水平,然而,目前关于FGF5蛋白结构和功能性的研究鲜有报道,因此对其蛋白结构的分析和功能性的研究显得越来越迫切。有研究发现FGF纯合子后代出生时健康、正常,但出生后21 d时突变纯合鼠被毛明显比杂合子FGF+和野生型长,在试验期的一年中这种表型一直保持。[2] 高爱琴等[3]对不同绵羊和山羊品种的FGF5基因外显子1和3的多态性进行了研究,发现绵羊和山羊FGF5基因外显子1均存在2处单碱基变异,而外显子3并没有发现多态。Housley等[4]对狗FGF5基因进行了序列分析,发现了两处突变,通过相关分析发现其中的一处错义突变与毛发长度有相关性。 利用生物信息学分析基因和蛋白质的序列模式,不仅可以对基因的分子进化和相似性进行研究,也可以进一步研究基因编码蛋白的结构与功能之间的关系。 本次将一用绵羊FGF5基因,借助生物信息学手段,对其编码蛋白进行了蛋白理化特性、氨基酸序列以及二级结构预测,以期为进一步研究FGF5基因的结构、表达与调控及生物学功能奠定基础。 一,材料 1.利用Vector NTI Suite 8中ORF finder确定绵羊FGF5的完整编码区(CDS)获得其正确氨基酸编码序列。 二,方法 1.采用ProtParam(http://au.expasy.org/cgi—bin/protparam)程序,预测FGF5蛋白分子质量、等电点等理化性质; 2.采用DNAMAN 软件,分析FGF5蛋白的亲(疏)水性,并预测其亲水性高的

相关文档