文档库 最新最全的文档下载
当前位置:文档库 › 转录因子数据库使用方法RegulomeDB-HaploReg_Exercises

转录因子数据库使用方法RegulomeDB-HaploReg_Exercises

转录因子数据库使用方法RegulomeDB-HaploReg_Exercises
转录因子数据库使用方法RegulomeDB-HaploReg_Exercises

RegulomeDB and HaploReg Exercises

Exercise #1

rs2816316 has been associated with Celiac Disease in the European population by two studies (Hunt, …, van Heel (2008) Nature Genetics and Dubois, …, van Heel (2010) Nature Genetics). rs2816316 lies thousands of base pairs upstream of protein coding gene RGS1 in an intergenic region of the genome.

You decide to further investigate this SNP using RegulomeDB and HaploReg.

1. What score does RegulomeDB assign to rs2816316? Is this SNP likely to affect

transcription factor binding?

2. Using HaploReg, determine if there are there any SNPs in high LD with

rs2816316. Are any of these SNPs more likely to be causal?

3. Using RegulomeDB, determine the scores for each of the SNPs in LD with

rs2816316 that you think may be casual. Is there a SNP that is likely to affect

transcription factor binding? Which SNP(s) would you further investigate? Exercise #2

You are interested in studying genetics variants associated with Amyotrophic lateral sclerosis (ALS), which causes muscle atrophy due to the degeneration of motor neurons. Eleven studies have reported 66 SNPs associated with ALS. Since little is known about the disease, you decided to investigate these genetic variants.

1. Using HaploReg, determine if there are enrichments for enhancers in any

ENCODE cell types for these ALS SNPs. Are there enrichments in DNase

regions?

2. Perform the same analysis using Roadmap epigenomes. Are disease relevant

tissue and cell types enriched?

Exercise #3

rs6774494 has been associated with Nasopharyngeal carcinoma in the Chinese population (Bei, …, Zeng (2010) Nature Genetics)

1. What score does RegulomeDB assign to rs6774494? Is this SNP likely to affect

transcription factor binding?

2. Using HaploReg, determine if there are there any SNPs in high LD with

rs2816316. Are any of these SNPs more likely to be causal?

3. How would your results change if you used the default settings for HaploReg (i.e.

European LD?)

SOLUTIONS

Exercise #1

rs2816316 has been associated with Celiac Disease in the European population by two studies (Hunt, …, van Heel (2008) Nature Genetics and Dubois, …, van Heel (2010) Nature Genetics). rs2816316 lies thousands of base pairs up stream of protein coding gene RGS1 in an intergenic region of the genome.

You decide to further investigate this SNP using RegulomeDB and HaploReg.

1. What score does RegulomeDB assign to rs2816316? Is this SNP likely to affect

transcription factor binding?

RegulomeDB assigns rs2816316 a score of 5, which means that there is minimal binding evidence. This SNP is not likely to affect TF binding

2. Using HaploReg, determine if there are there any SNPs in high LD with

rs2816316. Are any of these SNPs more likely to be causal?

There are 25 SNPs in LD (r2>0.8) with rs2816316. There are three SNPs that

overlap TF binding sites: rs2816305, rs2984920 and rs7535818. These SNPs

also overlap DHSs, promoter marks, and enhancer marks for several cells lines.

rs2984920 is a strong candidate as it overlaps regulatory marks in the most cell lines. It also disrupts a PU.1 motif (Log odds drop from 14.5 to 2.9) and overlaps

a PU.1 binding site. It is also in the promoter of RGS1.

rs7535818 primarily overlaps POL2 binding sites which suggests it would not affect regulation but is instead in an actively transcribed region. It is also in the

promoter/first intron of RGS1.

rs2816305 also overlaps regulatory regions and TFs. It overlaps some motifs but not those corresponding to TFs with overlapping binding sites. However, it is important to remember that not all TFs are surveyed by ENCODE.

3. Using RegulomeDB, determine the scores for each of the SNPs in LD with

rs2816316 that you think may be casual. Is there a SNP that is likely to affect transcription factor binding? Which SNP(s) would you further investigate?

rs2816305 = 1d

rs2984920 = 2a

rs7535818 = 3a

It would be worthwhile to further investigate both rs2984920 and rs2816305.

rs2816305 has the lowest RegulomeDB score since it was reported to be a eQTL for RGS1. It does not overlap a motif corresponding to a bound TF but is in a

regulatory region. rs2984920 lies in the promoter of RGS1 and overlaps motifs

for several bound TFs including PU.1 and NFKB (discovered by RegulomeDB).

rs2984920 and rs2816305 are also in LD, so the eQTL signal from rs2816305

could be due to rs2984920. Both SNPs would be worth investigating further to

determine the casual variant.

Exercise #2

You are interested in studying genetics variants associated with Amyotrophic lateral sclerosis (ALS), which causes muscle atrophy due to degeneration of motor neurons. Eleven studies have reported 66 SNPs associated with ALS. Since little is known about the disease, you decided to investigate these genetic variants.

1. Using HaploReg, determine if there are enrichments for enhancers in any

ENCODE cell types for these ALS SNPs. Are there enrichments in DNase

regions?

HepG2 – Strong Enhancers, HMEC – Strong Enhancers, GM12878 – All

Enhancers & Strong Enhancers

DNase: HFF-Myc, HA-sp, Th2, and GM18507

2. Perform the same analysis using Roadmap epigenomes. Are these disease

relevant tissue and cell types enriched?

Colon: All Enhancers, Penis Foreskin: Strong Enhancers, Brain Substantia Nigra: All Enhancers, Brain Inferior Temporal lobe: All Enhancers, Brain Cingulate

Gyrus: All Enhancers, Skeletal Muscle: Strong Enhancers

Exercise #3

rs6774494 has been associated with Nasopharyngeal carcinoma in the Chinese population (Bei, …, Zeng (2010) Nature Genetics)

1. What score does RegulomeDB assign to rs6774494? Is this SNP likely to affect

transcription factor binding?

There is no data for rs6774494 in RegulomeDB so no score is assigned. This

SNP is unlikely to affect TF binding.

2. Using HaploReg, determine if there are there any SNPs in high LD with

rs2816316. Are any of these SNPs more likely to be causal?

There are ten SNPs in LD with rs2816316. rs9869781 and rs13322424 overlap enhancer marks, promoter marks, DNase peaks and TF binding sites and would be worth investigating further.

3. How would your results change if you used the default settings for HaploReg (i.e.

European LD?)

If you use European LD, there are only two SNPs in LD with rs6774494 and

neither are as likely to affect TF binding as rs9869781 and rs1332242.

WRKY转录因子表达谱的研究进展

基因组学与应用生物学,2009年,第28卷,第4期,第803-808页Genomics and Applied Biology,2009,Vol.28,No.4,803-808 专题介绍Review WRKY 转录因子表达谱的研究进展 张颖蒋卫杰* 凌键 余宏军 王明 中国农科院蔬菜花卉研究所,北京,100081*通讯作者,jiangwj@https://www.wendangku.net/doc/4f1589406.html, 摘 要环境胁迫对植物的生长发育造成重大影响,因此,提高植物的抗逆性是农业面临的重要问题。自然 界中存在多种抗逆基因,如抗盐基因、 抗旱基因、抗寒基因等。利用植物基因工程和分子生物学技术提高植物对逆境的适应性及其抗逆分子机制的研究已成为当今热点。WRKY 转录因子是一类参与多种胁迫反应的诱导型转录因子,本文综述了WRKY 转录因子家族的结构特点、WRKY 转录因子在非生物胁迫(高温、低温、 干旱、盐)、外源物质(激素及O 3)处理及生物胁迫下的表达模式。各种胁迫下的表达谱均呈现不同特点,这些差异表达可能与它们所行使的不同生物学功能有关。 关键词 WRKY 转录因子,表达谱,非生物胁迫,RT-PCR Advance on Expression Profile of Transcription Factor WRKY Zhang Ying Jiang Weijie * Ling Jian Yu Hongjun Wang Ming Institue of Vegetable and Flower,Chinese Academy of Agricultural Sciences,Beijing,100081*Corresponding author,jiangwj@https://www.wendangku.net/doc/4f1589406.html, DOI:10.3969/gab.028.000803 Abstract Environmental stress has an adverse effect on the growth of plants and the productivity of crops,so it is very important for agriculture to improve plant resistance to stress.Expression of a variety of genes is induced by these stresses in various plants,such as salt-resistant,drought-resistant,chilling-resistant genes and so on.It has become a hotspot to enhance plant adaptability to stress and study its molecular mechanism by plant genetic engi-neering and molecular biological technology.WRKY transcription factor is an inducible transcription factor which is involved in a variety of stress responses.In this paper,the structural characteristics of WRKY transcription factor family,and the expression profile of WRKY transcription factors in abiotic stresses (heat,cold,drought and salt),in exogenous substances (hormones and O 3)and in biotic stresses are reviewed.The expression profile in different stressshowed different characteristics,which may be related to the different biological functions of WRKY tran-scription factors. Keywords WRKY transcription factor,Expression profile,Abiotic stress,RT-PCR https://www.wendangku.net/doc/4f1589406.html,/doi/10.3969/gab.028.000803 基金项目:本研究由国家973计划项目(2009CB119001)资助 植物对胁迫的响应是一种积极主动的应激过程。植物接受胁迫信号后,通过一系列的信号传递途径,最终诱导相关基因的表达。转录因子在基因表达的调控过程中起着重要作用,它们与靶基因上游的各种特定DNA 元件结合,激活或抑制靶基因的转录活性,以调控其时空特异性表达。WRKY 类转录因子是一类研究较多的转录因子,它广泛的参与生物、非生物胁迫应答反应、信号分子传递、植物衰老和器官 发育等一系列生理活动(刘戈宇等,2006)。WRKY 转 录因子最早是在甜薯中发现(Ishiguro and Nakamura,1994),随后在多种植物中陆续发现了大量的WRKY 转录因子。WRKY 基因家族通常具有一个或者两个WRKY 域,WRKY 域能特异的与靶基因启动子区的W-box 结合,从而调控靶基因的表达(Rushton et al.,1995)。近年来,基于传统的分子生物学方法研究WRKY 基因功能的基础上,利用各种物种基因组数

植物MYB类转录因子研究进展

综 述R evie w 2002201215收到,2002201228接受。 国家重点基础研究发展规划项目(973项目G 1999011604)资助。3联系人,E 2mail :zywang @https://www.wendangku.net/doc/4f1589406.html, ,Tel :02126404209024423。 植物MYB 类转录因子研究进展 陈 俊 王宗阳3 (中国科学院上海植物生理研究所,上海200032) 摘要:植物M Y B 转录因子以含有保守的M Y B 结构域为共同特征,广泛参与植物发育和代谢的调节。含单一M Y B 结构域的M Y B 转录因子在维持染色体结构和转录调节上发挥着重要作用,是M Y B 转录因子家族中较为特殊的一类。含两个M Y B 结构域的 M Y B 转录因子成员众多,在植物体内主要参与次生代 谢的调节和控制细胞的形态发生。含3个M Y B 结构域的M Y B 蛋白与c 2M Y B 蛋白高度同源,可能在调节细胞周期中起作用。 关键词:M Y B 结构域,M Y B 转录因子,组合调控学科分类号:Q74 随着多种模式生物基因组计划的完成,如何 从这些浩如烟海的DNA 序列中揭示基因的功能以及它们有序的时空表达,已成为后基因组时代的重要课题。人类基因组计划的完成显示人类只有30000~50000个基因,生命体是如何以如此少的 基因完成如此复杂的生命活动的呢?很重要的一点在于基因的表达调控,使得每一个基因能适时、适地、适量地表达,并且使得某些基因可以产生多种功能各异的蛋白质。真核基因的表达随细胞内外环境的改变而在不同层次上受到精确调控,如染色体DNA 水平、转录水平及转录后水平的调控等。而转录水平的调控发生在基因表达的初期阶段,是很多基因表达调控的主要方式。转录水平的调控指一类称为转录因子(有时又称反式作用因子)的蛋白质特异结合到靶基因调控区的顺式作用元件上,或调节基因表达的强度,或应答激素刺激和外界环境胁迫,或控制靶基因的时空特异性表达。 转录因子通常是一种模块化的蛋白,一般由几个独立的功能域组成,包括DNA 结合功能域,转录激活功能域,蛋白2蛋白相互作用功能域,信号分子结合功能域,核定位信号区等。根据DNA 结合功能域的结构,转录因子可分为以下几类:bHL H (碱性螺旋2环2螺旋)、bZIP (碱性亮氨酸拉链)、homeodomain 蛋白、MADS 2box 蛋白、zinc 2finger 蛋 白、Myb 蛋白、Ap2/EREBP 蛋白、HSF 蛋白、HM G 蛋白和A T hook 蛋白等(Schwechheimer 和Bevan 1998)。 本文试以植物中数量最多、功能最多样化的M Y B 类转录因子为例,对该类转录因子的研究历 史和现状作一简单介绍。阐述了M Y B 转录因子的结构、功能和进化,并举例说明M Y B 类转录因子如何与其它转录因子家族成员相互作用,通过组合调控(combinatorial control )的方式实现对靶基因的精密调控。 1 MYB 类转录因子 M Y B 类转录因子家族是指含有M Y B 结构域 的一类转录因子。M Y B 结构域是一段约51~52个氨基酸的肽段,包含一系列高度保守的氨基酸残基和间隔序列(图1)。首先是每隔约18个氨基酸规则间隔的色氨酸(W )残基,它们参与空间结构中疏水核心的形成。有时色氨酸残基会被某个芳香族氨基酸或疏水氨基酸所取代,尤其是在植物R2R32M Y B 转录因子中,R3M Y B 结构域的第一 个色氨酸经常被亮氨酸、异亮氨酸或苯丙氨酸所取 代。其次,在每个保守的色氨酸前后都存在一些高度保守的氨基酸,例如在第一个色氨酸的C 2末端通常是一簇酸性氨基酸(图1)。正是上述这些保守的氨基酸残基使M Y B 结构域折叠成螺旋2螺旋2转角2螺旋(helix 2helix 2turn 2helix )结构。 1982年K lempnauer 等在禽成髓细胞瘤病毒(avian myeloblastosis virus )中鉴定出一个能直接导致急性成髓细胞白血病(acute myeloblastic leukemia )的癌基因,称为v 2myb ,不久发现在正常动物细胞中也存在相应的原癌基因c 2myb ,随后研究结果表明v 2M Y B ,c 2M Y B 蛋白都定位在细胞核中,与核基质和染色质紧密相连,而且都具有DNA 1 8植物生理与分子生物学学报,J ournal of Plant Physiology and Molecular Biology 2002,28(2):81-88

跟踪:转录因子激活与靶基因

跟踪:转录因子激活与靶基因 转录因子上游信号通路,以及靶基因专题讨论。 转录因子靶点的鉴定 鉴定转录因子的靶点的第一步通常是将所研究对像敲除掉或超量表达,然后考察基因表达的变化,通常的方法有RT-PCR,消减杂交(subtractive hybridization),差异显示(differential display)和SAGE(analysis of gene expression)等。芯片技术的发展使这种分析变得更加简便。它能一次分析很多的基因。但上面的技术都不能让我们知道所找到的靶基因是否直接的靶基因,可能有大量的基因都是间接被调控的。另外一些技术的发展使我们能够找到直接的靶点,如染色质免疫沉淀(chromatin immunoprecipitation,ChIP)和Dam甲基化酶鉴定法(Dam methylase identification,DamID)。这种技术和芯片技术联合起来可以帮助我们分析在基因组范围内转录因子的结合位点,称作基因组范围的定位分析(Genome-wide location analysis)。另外,基于算法和数据库的生物信息学方法也得到了一定的发展,这表现在从单纯保守位点分析到比较基因组方法的应用,这种方法基于以下事实,在种间高度保守的非编码序列有更大的可能性参与基因调控。 > 1、许多转录因子需要跟一些配体因子结合才能发挥功能。转录因子的蛋白结构一般分三个区:DNA结合区(DBD),铰链区(hinge domain),和配体结合区(LBD),这个区域同时是转录激活/抑制功能区。这样的因子有PPAR, LXR(肝x受体)。 2、有些转录因子的转录激活/抑制功能区不需要配体结合也能发挥功能,比如p53 3、而像NFkB这样的转录因子在细胞内以非活性的形式存在。静息时NF-kB二聚体与I-kB 蛋白家族构成三聚体而存留于胞浆,当细胞受到外界因素,如细菌或病毒感染、炎症细胞因子、TNF、LPS、紫外线照射、电离辐射等刺激后,I-kB将发生磷酸化并迅速降解,NF-kB 被释放,、激活并进入细胞核,结合于特异性DNA位点,从而启动一系列基因的转录,发挥其重要的生物学作用[4]。 转录因子的分类有很多种。从转录的过程来看,如TFIIB, TFIID 等与RNA polymerase II 直接BIND 的称general transcription factor,其他位于启动子上游需要信号激活的转录因子也有一些分类方法。如楼上所说,有需要与配体相互作用以后转核的,如steriod hormone receptor,也有在细胞质内通过细胞膜的第二信使作用激活的蛋白因子,还有一些house keeping gene 的产物,同样也有transcription factor 的作用。与转录密切相关的co-factor,enhancer,也都对转录起重要作用。同时启动子上的一些cis 作用元件。。。对于不同基因激活的方式各异,含盖的方面也比较广。 看大家发了很多了,我就来个比较基础的东西,泛泛的谈谈转录因子是如何激活转录的吧,资料来源于Watson《MBOG》2004版,同时参考了杨克恭(协和的XX老师)讲课所编。

转录因子Oct-4的研究进展

第6期农垦医学第31卷 转录因子Oct-4的研究进展 符毓豪王菊谢松松周宗瑶+ (石河子大学医学院组织胚胎学教研室/石河子大学医学院新疆地方 与民族高发病教育部重点实验室,新疆石河子,832002) 【摘要】oct4是维持干细胞多能性和自我更新的转录因子,它通过结合靶基因调控区,选择性地抑制分化基因表达或促进多能性基因表达。通常只在多能干细胞中表达,在分化细胞中不表达;它最终决定干细胞是保持多能性还是分化,以及向哪个方向分化。此外。Oct-4在生殖细胞肿瘤研究中也发挥重要作用。 【关键词】0ct4;多能性干细胞;研究进展 中图分类号:Q754文献标识码:A TheresearchdevelopmentoftranscriptionalfactorOct-4 FUYu-hao,WANGJu,XIESong—song,ZHOUZong—yao术 (DepartmentofHistologyandEmbryology,ShiheziUniversityschoolofmedicine,shiheziXinjiang,832002) 【Abstract】OctMisacriticaltranscriptionalfactomtokeeppluripotencyandself-renewalofstemceilsinvivoandinvitm,anditusuallyexpressasonlyinpluripotentcells.Itbindstotheregulatoryregionsoftargetedgene.Itfinallydeter-minesthecellsdestiny:keepingpluripotencyorturningtodifferentiation.Also,itplaysanimportantpartintheGermcelltumor. 【Keywords】Oct4;pluripotent;development Oct-4是具有较强特异性的胚胎干细胞标志物,它参与胚胎发育过程中多向性分化的调节。胚胎干细胞自我更新分子机制是干细胞研究的前沿及热点课题。除外源性信号如LIF、BMP、Wnt能维持干细胞的未分化状态外,转录因子Oct-4特异性表达于全能胚胎干细胞,并与其它转录因子如Sox2一起构成调控网络,共同调控与胚胎干细胞多能性相关的一系列重要分子,是保持胚胎干细胞自我更新和多潜能性的关键分子。 1Oct-4的结构 Oct-4是由Pou5F1基因编码产生的,是含POU(Pit.Oct—Unc)结构域的转录因子家族中的一员。Oct-4基因定位于人类染色体6p21.3,其编码的蛋白Oct-4(也叫Oct-3)是一种POU转录因子,属于V类POU蛋白。POU转录因子是DNA结合蛋白,由POU特异域(POUS)和POU同源域(POUH)的双枝结构构成。POU特异域位于N端,由富含脯氨酸和酸性残基的75个氨基酸组成;POU同源域位于c端,由富含脯氨酸、丝氨酸和苏氨酸的60个氨基酸组成。这两个亚区间通过含有15—56个氨基酸组成的易变区相连接,经螺旋一转角一螺旋结构与DNA结合位点发生联系,激活启动子或增强子区域内带有顺式反应元件基因的转录。后者的特征性结构为ATGCAAAT八聚体结构域,又称为Oct结构。它通过结合含ATGCAAAT的八聚体结构域而活化相应靶基因,激活或抑制干细胞分化过程中基因表型的转变。 2Oct-4的上游调控机制 Oct-4的表达由定位于其基因上游的顺式作用元件在转录水平进行调控。①增强子:Oct-4基因有两个增强子DE和PE。发育中Oct-4的表达依次由DE(桑椹胚、ICM)_÷PE(上胚层)一DE(PGCs)控 基金项目:兵团科技攻关计划项目项目编号:2006GG33 t通讯作者:周宗瑶,组织胚胎学教授,从事生殖与发育方面研究。?542?

转录调节位点和转录因子数据库介绍_张光亚

10生物学通报2005年第40卷第11期 2003年即Watson和Crick发表DNA双螺旋结构50周年,宣布了人类基因组计划的完成,与此同时,其他许多生物的基因组计划已完成或在进行中,在此过程中产生的大量数据库对科学研究的深远影响是以前任何人未曾预料到的。然而遗憾的是,许多生物学家、化学家和物理学家对这些数据库的使用甚至去何处寻找这些数据库都只有一个比较模糊的概念。 基因转录是遗传信息传递过程中第一个具有高度选择性的环节,近20年来对基因转录调节的研究一直是基因分子生物学的研究中心和热点,因此亦产生了大量很有价值的数据库资源,对这些数据库的了解将为进一步研究带来极大便利,本文对其中一些数据库进行简要介绍。 1DBTSS DBTSS(DataBaseofTranscriptionalStartSites)由东京大学人类基因组中心维护,网址:http://dbtss.hgc.jp。最初该数据库收集用实验方法得到的人类基因的TSS(TranscriptionalStartSites,转录起始位点)数据。对转录起始位点(TSS)的确切了解具有非常重要的意义,可更准确的预测翻译起始位点;可用于搜索决定TSS的核苷酸序列,而且可更精确地分析上游调控区域(启动子)。自2002年发布第一版以来已作了多次更新。目前包含的克隆数为190964个,含盖了11234个基因,在SNP数据库中显示了人类基因中的SNP位点,而且现在含包含了鼠等其他生物的相关数据。DBTSS最新的版本为3.0。 在该最新的版本中,还新增了人和鼠可能同源的启动子,目前可以显示3324个基因的启动子,通过本地的比对软件LALIGN可以图的形式显示相似的序列元件。另一个新的功能是可进行与已知转录因子结合位点相似的部位的定位,这些存贮在TRANSFAC(http://transfac.gbf.de/TRANSFAC/index.html)数据库中,免费用于研究,但TRANSFAC专业版是商业版本。 DBTSS对匿名登录的用户是免费的,该网站要求用户在使用前注册,用户注册后即可使用。主页分为2个区域,一个介绍网站的部分信息和用户注册,另一区域为用户操作区,该区约分为10个部分,可分别进行物种和数据库的选择、BLAST、SNP以及TF(转录因子)结合部位搜索等部分。后者的使用可以见网页中的Help部分,里面有比较详细的介绍。DBTSS还提供了丰富的与其他相关网站的链接,如上文提到的TRANSFAC数据库、真核生物启动子数据库(Eukaryot-icPromoterDatabase,http://www.epd.isb-sib.ch/)以及人类和其他生物cDNA全长数据库等。 2JASPAR JASPAR是有注释的、高质量的多细胞真核生物转录因子结合部位的开放数据库。网址http://jaspar.cgb.ki.se。所有序列均来源于通过实验方法证实能结合转录因子,而且通过严格的筛选,通过筛选后的序列再通过模体(motif)识别软件ANN-Spec进行联配。ANN-Spec利用人工神经网络和吉布斯(Gibbs)取样算法寻找特征序列模式。联配后的序列再利用生物学知识进行注释。 目前该数据库收录了111个序列模式(profiles),目前仅限于多细胞真核生物。通过主页界面,用户可进行下列操作:1)浏览转录因子(TF)结合的序列模式;2)通过标识符(identifier)和注解(annotation)搜索序列模式;3)将用户提交的序列模式与数据库中的进行比较;4)利用选定的转录因子搜索特定的核苷酸序列,用户可到ConSite服务器(http://www.phylofoot.org/consite)进行更复杂的查询。JASPAR数据库所有内容可到主页下载。 与相似领域数据库相比,JASPAR具有很明显优势:1)它是一个非冗余可靠的转录因子结合部位序列模式;2)数据的获取不受限制;3)功能强大且有相关的软件工具使用。JASPAR与TRANSFAC(一流的TF数据库)有较明显的差异,后者收录的数据更广泛,但包含不少冗余信息且序列模式的质量参差不齐,是商业数据库,只有一部分是可以免费使用。用户在使用过程中会发现二者的差异,这主要是由于二者对数据的收集是相互独立的。另外该数据库还提供了相关的链接:如MatInspector检测转录因子结合部位,网址http://transfac.gbf.de/programs/matinspector/;TESS转录元件搜索系统,网址http://www.cbil.upenn.edu/tess/。 转录调节位点和转录因子数据库介绍! 张光亚!!方柏山 (华侨大学生物工程与技术系福建泉州362021) 摘要转录水平的调控是基因表达最重要的调控水平之一,对转录调节位点和转录因子的研究具有重要意义。介绍了DBTSS、JASPAR、PRODORIC和TRRD等相关数据库及其特征、内容和使用。 关键词转录调节位点转录因子数据库生物信息学 !基金项目:国务院侨办科研基金资助项目(05QZR06) !!通讯作者

ChIP-Seq技术在转录因子结合位点分析的应用

ChIP-Seq技术在转录因子结合位点分析的应用 摘要:染色质免疫沉淀(Chromatin immunoprecipitaion, ChIP)技术是用来研究细胞 内特定基因组区域特定位点与结合蛋白相互作用的技术。将ChIP与第二代高通量测序技术相结合的染色质免疫沉淀测序(chromatin immunoprecipitation followed by sequencing,ChIP-Seq)技术能在短时间内获得大量研究数据,高效地在全基因组范围内检测与组蛋白、转录因子等相互作用的DNA区段,在细胞的基因表达调控网络研究中发挥重要作用。本文 简要介绍了ChIP-Seq技术的基本原理、实验设计和后续数据分析,以及ChIP-Seq技术在 研究转录因子结合位点中的。 关键词:ChIP-Seq;转录因子; 引言 染色质是真核生物基因组DNA主要存在形式,为了阐明真核生物基因表达调控机制,对于蛋白质与DNA在染色质环境下的相互作用的研究是基本途径。转录因子是参与基因表达调控的一类重要的细胞核蛋白质,基因的转录调控是生物基因表达调控层次中最关键的一层,转录因子通过特异性结合调控区域的DNA序列来调控基因转录过程。转录因子由基础转录因子和调控性转录因子两类组成,其中基础转录因子在转录起始位点附近的启动子区,与RNA聚合酶相互作用实现基因的转录;而调控性转录因子一般与位置多样的增强子序列结合,再通过形成增强体在组织发育、细胞分化等基因表达水平调控中发挥极其重要的作用[1]。 ChIP-Seq是近年来新兴的将ChIP与新一代测序技术相结合,在全基因s组范围内分析转录因子结合位点(transcription factor binding sites,TFBS)、组蛋白修饰(histone modification)、核小体定位(nucleosome positioning)和DNA 甲基化(DNA methylation)的高通量方法[2-4]。其中ChIP是全基因组范围内识别DNA与蛋白质体内相互作用的标准方法[5],最初用于组蛋白修饰研究[6],后来用于转录因子[7]。同时,新一代测序技术的迅猛发展也将基因组学水平的研究带入了一个新的阶段,使得许多基于全基因组的研究成为可能。相对于传统的基于芯片的ChIP-chip (chromatin immunoprecipitation combined with DNA tiling arrays),ChIP-seq 提供了一种高分辨率、低噪音、高覆盖率的研究蛋白质-DNA 相互作用的手段[8],可以应用到任何基因组序列已知的物种,可以研究任何一种DNA 相关蛋白与其靶定DNA 之间的相互作用,并能确切得到每一个片段的序列信息.随着测序成本的降低,ChIP-seq 逐步成为研究基因调控和表观遗传机制的一种常用手段。此外,为了达到更好的检测效果和更为完整的信息,近年来,将ChIP-Seq和ChIP-chip两者融合的研究具有很好的应用前景[9,10]。 转录因子在器官发生过程中起至关重要的作用,在全基因组水平将转录因子定位于靶基因DNA是认识转录调控网络的有效方法之一,了解基因转录调控的关键是识别蛋白质与DNA的相互作用。ChIP-Seq技术能够揭示转录因子的结合位点和确定直接的靶基因序列,可在体内分析特定启动子的分子调控机制,因此被广泛应用于转录调控机制的研究。本文主要就这一技术在转录因子结合位点研究中的基本原理、实验设计和数据分析等技术层面、以及实际应用层面进行讨论。 1 ChIP-seq基本原理及实验设计 1.1 ChIP技术 蛋白质与DNA相互识别是基因转录调控的关键,也是启动基因转录的前提。ChIP是在全基因组范围内检测DNA与蛋白质体内相互作用的标准方法[11],该技术由Orlando等[12]于1997年创立,最初用于组蛋白修饰的研究,后来广泛应用到转录因子作用位点的研究中[13]。ChIP的基本原理为:活细胞采用甲醛交联后裂解,染色体分离成为一定大小的片段,然后用特异性抗体免疫沉淀目标蛋白与DNA交联的复合物,对特定靶蛋白与DNA片段进行

植物bHLH转录因子研究进展_刘文文

生物技术进展 2013年第3卷第1期7 11 Current Biotechnology ISSN 2095-櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅殯 殯 殯 殯 2341 进展评述 Reviews 收稿日期:2012-12-12;接受日期:2012-12-31基金项目:国家自然科学基因项目(30970221)资助。 作者简介:刘文文,硕士研究生,研究方向为玉米氮利用效率生理学及拟南芥抗逆作用机制。*通讯作者:李文学,研究员,博士,主要 从事小RNA 功能及植物抗逆机制研究。E- mail :liwenxue@caas.cn 植物bHLH 转录因子研究进展 刘文文,李文学 * 中国农业科学院作物科学研究所,北京100081摘 要:bHLH (basic helix-loop-helix protein )是真核生物中存在最广泛的一大类转录因子,其通过特定的氨基酸残基与 靶基因相互作用,进而调节相关基因的表达。系统发育分析表明植物的bHLH 转录因子为单源进化。bHLH 转录因子不仅对于植物的正常生长和发育必不可缺,同时参与植物适应多种逆境胁迫的反应过程。然而,由于植物bHLH 家族成员众多、 参与的生物过程复杂,对于其了解还不是十分清楚。本文针对植物bHLH 的进化、结构特点、生物功能,尤其是在适应逆境胁迫中作用等的最新研究结果进行综述,以期为进一步深入了解植物bHLH 转录因子的功能提供理论参考。关键词:bHLH ;结构特点;生物学功能DOI :10.3969/j.issn.2095-2341.2013.01.02 Progress of Plant bHLH Transcription Factor LIU Wen-wen ,LI Wen-xue * Institute of Crop Science ,Chinese Academy of Agricultural Sciences ,Beijing 100081,China Abstract :Basic helix-loop-helix proteins (bHLHs )are found throughout the eukaryotic kingdom ,and constitute one of the largest families of plant transcription factors.They can regulate gene expression through interaction with specific motif in target genes.Phylogenetic analysis indicates that plant bHLHs are monophyletic.bHLHs are necessary for plant normal growth and development ,and play important roles in abiotic-stress responses.However ,we know little about their origins ,structures ,and functions due to the large quantities and complexity of plant bHLH family.This paper reviews on the evolution ,structure characteristics ,biological function of plant bHLHs ,especially their functions in adapting to abiotic-stress tolerance ,so as to provide a theoretical reference for further research on the function of plant bHLH transcription factors.Key words :bHLHs ;structural features ;biological function bHLH 转录因子广泛存在于真核生物。自 bHLH 发现以来,越来越多的研究表明该转录因子对于真核生物的正常生长及发育必不可缺。在酵母等单细胞真核生物中,bHLH 参与染色体的分离、新陈代谢调节等过程[1] ;在动物中,bHLH 主要与感知外界环境、调节细胞周期、组织分化等 相关 [2 4] 。植物中bHLH 家族成员数量众多,仅 次于MYB 类转录因子,譬如在拟南芥中有超过140个bHLH 转录因子,水稻中则超过160个。家族的庞大不可避免的造成功能冗余,使研究单个bHLH 转录因子的功能相对困难。本文拟对有限的植物bHLH 家族研究结果,尤其是参与植物 适应逆境胁迫过程中的作用进行综述,以期为进 一步深入了解植物bHLH 转录因子的功能的提供理论参考。 1 植物bHLH 的结构特点、家族分类及 进化 1.1 bHLH 的基本结构 bHLH 转录因子因含有bHLH 结构域而得名。bHLH 结构域由50 60个氨基酸组成,可分为长度为10 15个氨基酸的碱性氨基酸区和40个氨基酸左右的α-螺旋-环-α-螺旋区(HLH 区)。

植物转录因子及转录调控数据与分析平台

植物转录因子及转录调控数据与分析平台 PlantTFDB:植物转录因子数据库 URL: https://www.wendangku.net/doc/4f1589406.html, 包含资源:植物转录因子的家族分类规则、基因组转录因子全谱、丰富的注释、转录因子结合图谱(binding motifs)、转录因子预测、系统发生树等 涉及物种:包含拟南芥、水稻、杨树、大豆、玉米、小麦等165个物种。 PlantRegMap:植物转录调控数据与分析平台 URL: https://www.wendangku.net/doc/4f1589406.html, 包含资源:植物转录调控元件、植物转录调控网络、转录因子结合位点预测、转录调控预测与富集分析、GO富集分析、上游调控因子富集分析等。 涉及物种:包含拟南芥、水稻、杨树、大豆、玉米、小麦等156个物种。 ATRM: 拟南芥转录调控网络及其结构和演化分析 URL: https://www.wendangku.net/doc/4f1589406.html, 包含资源:基于文本挖掘和人工校验的拟南芥转录调控网络、植物转录调控网络的结构和演化特征 涉及物种:拟南芥 植物转录因子及转录调控数据与分析平台(导航页) 我们致力于为广大科研人员提供一个关于植物转录因子和转录调控、集数据和分析于一体的高质量平台,为研究和理解植物转录调控系统保驾护航。 植物转录因子数据库(PlantTFDB) 一套完整的植物转录因子分类规则 覆盖绿色植物各大分支的转录因子全谱 丰富的功能和演化注释 基因组范围的高质量转录因子结合矩阵(156个物种) 在线转录因子预测平台 植物转录调控数据与分析平台(PlantRegMap) 基于高通量实验(ChIP-seq和DNase-seq)和比较基因组方法鉴定的多种转录调控元件 基于转录因子结合矩阵和转录调控元件推测的转录调控网络 涉及165物种的GO注释 一套植物转录调控预测与分析工具,包括转录因子结合位点预测、转录调控预测与富集分析、GO富集分析及上游调控因子富集分析等 拟南芥转录调控网络及其结构和演化特征(ATRM) 基于文本挖掘和人工校验的拟南芥转录调控网络 植物转录调控网络的结构和演化特征

转录因子功能预测新方法

TF-coEx:一种基于基因共表达网络的转录因子功能预测新方法 TF-coEx: Transcription Factor Function Prediction based on Gene Co-e xpression Network收藏本页导出题录 分享 作者:陈靖祺[1] 柳靓婧[1,2] 田卫东[1] CHEN Jing-qi,LIU Jing-jing,TIAN Wei-dong (1.Institute of Biostatistics,Fudan University,Shanghai 200433,China ; 2.Institute of Plant Biology,Fudan University,Shanghai 200433,China)机构地区:[1]复旦大学生物统计研究所,上海200433 [2]复旦大学植物科学研究所,上海200433 出处:《复旦学报:自然科学版》 SCI CAS CSCD 2012年第51卷第6期 803-812页,共10页《Journal of Fudan University (Natural Science)》 摘要:转录因子在细胞内的各种生物通路中起着重要的调控作用.在人基因组中有1000多个注释为DNA结合蛋白的编码基因,其中部分基因已被证明为转录因子,对它们调控的生物通路也相对比较清楚.其余的大多数DNA结合蛋白可能是潜在的转录因子,但它们的功能并不明确.鉴于转录因子与其所调控的靶基因在基因表达水平上密切关联,本文从基因共表达网络出发建立了]。个预测转录因子功能的新方法——co-expression-based transcription factor function prediction(TF-coEx).首先,利用大规模高通量表达芯片数据建立了不同条件下人全基因组的基因共表达网络,并通过网络划分获得包含转录因子的一系列基因共表达模块.之后,通过对模块内基因的功能富集分析,并整合不同网络的模块功能富集结果,对所有潜在的转录因子编码基因进行了功能预测.通过与已知功能的对比,我们证明TF-coEx的预测效果显著好于随机.此外,对预测分值最大的50个结果的文献验证显示,54%的预测有实验证据支持.方法的预测结果为进一步设计具体的实验来验证潜在转录因子的功能提供了方向.

bHLH转录因子家族研究进展

HEREDITAS (Beijing) 2008年7月, 30(7): 821―830 ISSN 0253-9772 https://www.wendangku.net/doc/4f1589406.html, 综 述 收稿日期: 2007?12?04; 修回日期: 2008?02?15 基金项目:国家自然科学基金项目(编号: 30370773)资助[Supported by the National Natural Science Foundation of China (No. 30370773)] 作者简介:王勇(1965?), 男, 浙江人, 副研究员, 博士研究生, 研究方向: 昆虫生物信息学。E-mail: ywang@https://www.wendangku.net/doc/4f1589406.html, 姚勤(1961?), 女, 安徽人, 研究员, 研究方向: 昆虫病毒分子生物学。E-mail: yaoqin@https://www.wendangku.net/doc/4f1589406.html, 王勇、姚勤同为第一作者。 通讯作者:陈克平(1962?), 男, 安徽人, 博士, 研究员, 博士生导师, 研究方向: 昆虫分子生物学、昆虫生物信息学。E-mail: kpchen@https://www.wendangku.net/doc/4f1589406.html, DOI: 10.3724/SP.J.1005.2008.00821 bHLH 转录因子家族研究进展 王勇1, 陈克平2, 姚勤2 1 江苏大学食品与生物工程学院, 镇江 212013; 2 江苏大学生命科学研究院, 镇江 212013 摘要: bHLH 转录因子在真核生物生长发育调控中具有重要作用, 它们组成了转录因子的一个大家族。已经有20种生物基因组中bHLH 家族的成员得到鉴定, 其中动物17种、植物2种、酵母1种。动物bHLH 因其调控基因表达的功能不同而被分成45个家族; 此外, 根据它们所作用DNA 元件和自身结构特点又被分成6个组。A 组包含22个家族, 主要调控神经细胞生成、肌细胞生成和中胚层形成; B 组包含12个家族, 主要调控细胞增殖与分化、固醇代谢与脂肪细胞形成以及葡萄糖响应基因的表达; C 组包含7个家族, 主要负责调控中线与气管发育和昼夜节律、激活环境毒素响应基因的转录; D 组只有1个家族, 它与A 组bHLH 蛋白形成无活性的异源二聚体; E 组有2个家族, 调控胚胎分节、体节形成与器官发生等; F 组也只有1个家族, 调控头部发育、嗅觉神经元生成等。文章综述了bHLH 转录因子家族分类、起源、功能方面的研究进展情况。 关键词: bHLH; 转录因子; 家族 Progress of studies on bHLH transcription factor families WANG Yong 1, CHEN Ke-Ping 2, YAO Qin 2 1 School of Food and Biological Engineering , Jiangsu University , Zhenjiang 212013, China ; 2 Institute of Life Sciences , Jiangsu University , Zhenjiang 212013, China Abstract: bHLH transcription factors are important players in various developmental processes of eukaryotes. They consti-tute a large family of transcription factors. bHLH family members have been identified in genomes of 20 organisms inclu- ding 17 animals, two plants, and one yeast. Animal bHLHs are classified into 45 families based on their different functions in the regulation of gene expression. In addition, they are divided into 6 groups according to target DNA elements they bind and their own structural characteristics. Group A consists of 22 families. They mainly regulate neurogenesis, myogenesis and mesoderm formation. Group B consists of 12 families. They mainly regulate cell proliferation and differentiation, sterol metabolism and adipocyte formation, and expression of glucose-responsive genes. Group C has seven families. They are responsible for the regulation of midline and tracheal development, circadian rhythms, and for the activation of gene tran-scription in response to environmental toxins. Group D has only one family. It forms inactive heterodimers with group A bHLH proteins. Group E has two families, which regulate embryonic segmentation, somitogenesis and organogenesis etc. Group F also has one family. It regulates head development and formation of olfactory sensory neurons etc. This article presents a brief review on progress achieved in studies related to the classification, origination and functions of bHLH tran-scription factor families.

启动子分析-----------转录因子结合位点

启动子分析-----------转录因子结合位点 启动子分析-----------转录因子结合位点 启动子是DNA分子可以与RNA聚合酶特异结合的部位,也就是使转录开始的部位。在基因表达的调控中,转录的起始是个关键。常常某个基因是否应当表达决定于在特定的启动子起始过程。启动子一般可分为两类: (1)一类是RNA聚合酶可以直接识别的启动子。这类启动子应当总是能被转录。但实际上也不都如此,外来蛋白质可对其有影响,即该蛋白质可直接阻断启动子,也可间接作用于邻近的DNA结构,使聚合酶不能和启动子结合。 (2)另一类启动子在和聚合酶结和时需要有蛋白质辅助因子 的存在。这种蛋白质因子能够识别与该启动子顺序相邻或甚至重叠的DNA顺序。 因此,RNA聚合酶能否与启动子相互作用是起始转录的关键问题,似乎是蛋白质分子如何能识别DNA链上特异序列。例如,RNA聚合酶分子上是否有一个活性中心能够识别出DNA双螺旋上某特异序列的化学结构?不同启动子对RNA 聚合酶的亲和力各不同。这就可能对调控转录起始的频率,亦即对基因表达的程度有重要不同。DNA链上从启动子直到

终止子为止的长度称为一个转录单位。一个转录单位可以包括一个基因,也可以包括几个基因。启动子预测软件大体分为三类,第一类是启发式的方法,它利用模型描述几种转录因子结合部位定向及其侧翼结构特点,它具有挺高的特异性,但未提供通用的启动子预测方法;第二类是根据启动子与转录因子结合的特性,从转录因子结合部位的密度推测出启动子区域,这方法存在较高的假阳性;另一类是根据启动子区自身的特征来进行测定,这种方法的准确性比较高。同时,还可以结合是否存在CpG岛,而对启动子预测的准确性做出辅助性的推测。 启动子预测软件有:PromoterScan ; Promoter 2.0 ; NNPP ;EMBOSS Cpgplot ; CpG Prediction 启动子及转录因子结合位点数据库及预测工具 冷泉港启动子分析程序介绍 https://www.wendangku.net/doc/4f1589406.html,/links/ch_09_t_6.html 在线预测和分析基因启动子(promoter) 一般在公共数据库中,如NCBI、UCSC、Ensembl给出的人类基因序列都没有对基因进行详细的标注。不过,有

相关文档
相关文档 最新文档