文档库 最新最全的文档下载
当前位置:文档库 › DNA 甲基化与基因组印迹的研究进展

DNA 甲基化与基因组印迹的研究进展

DNA 甲基化与基因组印迹的研究进展
DNA 甲基化与基因组印迹的研究进展

基因组印迹的研究进展

[摘要]基因组印迹(g e n o m i c i m p r i n t i n g)是指在配子或合子发生期间,来自亲本的等位基因或染色体发育过程中产生专一性的加工修饰,导致后代体细胞中两个亲本来源的等位基因有不同的表达活性。为一种后生论修饰。目前在人类和小鼠中坚定的印迹基因已超过25个,它们具有一些共同的特点,如印迹基因分布的群集性,复制的不同步性,表达的时空特异性,遗传的保守性及编码R N A s等。基因组印迹的分子机理与印迹基因的甲基化尤其是C p G岛甲基化密切相关,特异性甲基化区域在印迹基因的表达中具有重要作用。基因组印迹基因与胎儿和胎盘的生长发育及细胞增值有关,正常印迹的改变可引起包括肿瘤在内的多种遗传性疾病。

[关键词]基因组印迹印迹基因甲基化C p G岛

基因组印迹是一种非孟德尔遗传现象,经典孟德尔遗传学认为所有父系及母系等位基因有同等表达,但随着对遗传学研究的深入,人们发现了一种被称为基因组印迹的非孟德尔遗传现象,它是指在配子和合子发生期间,来自亲本的等位基因或染色体在发育过程中产生专一性的加工修饰,导致后代体细胞中的两个亲本来源的基因有不同的表达活性,又称遗传印迹或亲代印迹或配子印迹。它是一种伴有基因组改变的非孟德尔遗传形式,可遗传给子代细胞,但并不包括D N A序列的改变,至今,在人类和小鼠中鉴定的印迹基因已超过25个,它们具有一些共同的特征,印迹基因的甲基化可能是基因组印迹的分子机制,特异性甲基化区(D M R s)是控制印迹表达得的重要因素[1]。印迹基因中大多数在生长和分化中起重要作用,而且可引起一些人类遗传性疾病和肿瘤发生。我想从基因印迹的发现,印迹基因的特征及其生物学意义上谈一下我的认识。

1基因组印迹基因的发现

基因组印迹基因的发现最初开始于对全基因组的研究,接着是对个别染色体和染色体区域的研究,最终到鉴定特异的印迹基因。1989年,S w a i n和L e n d e等人发现了一个特异的印迹基因,但它并不是一

个内源性基因。他们发现融合了免疫球蛋白增强子的C-m y c转基因如来自父本,则在一些组织中表达,如果来自母本则表现为转录沉默,而且这些母源拷贝被甲基化。目前还发现了一些父源转基因甲基化的现象,但转录沉默现象比较少

D e C h i a r a

E f s t r a d i a t i s等人通过基因剔除技术破坏小鼠胰岛素样生长因子(I g f2)基因发现了第一个内源性印迹基因,若被剔除的等位基因源于父本,则动物表现为侏儒,相反如为母源则无特殊表型,这些本身剔除了等位基因的雌鼠,其子代大小正常,原位杂交及R N a s e 保护试验均证明剔除了父本等位基因的小鼠其组织中不表达I g f2,这些实验表明I g f2被印迹而且仅父源等位基因正常表达。这是一个里程性的研究,因为它们不仅表明基因组印迹可影响正常内源性基因,而且表明印迹具有组织特异性调节作用

在I g f2基因发现的同时,人们发现小鼠甘露糖6一磷酸/胰岛素样生长因子2型受体(M6p/I g f2r)基因也为印迹基因,其母源基因表达[2]。有趣的是,l g f2和M6p/I g f2r在生化水平上相互作用,当小鼠M6p/I I g f2r基因突变后,母源杂合子或纯合子胎鼠生长增加约30%,这些表明,I g F2和M6p/I g f2r印迹基因在胚胎发育和胎儿生长中都有重要作用[3]。目前在人类和小鼠中已鉴定了25个印迹基因,而且新的印迹基因仍在不断的鉴定,如最近又发现了I A C/p l a g l1和T i h1等新基因

2印迹基因的特点

2.1印迹基因分布的群集性

目前已知的一些印迹基因在基因组中的分布不是单一基因分散分布,而具有一定的群集性倾向,在这些群集区,父源和母源印迹基因均可找到。最大的印迹基因群集区之一位于小鼠7号染色体末端和人类11p15.5处,在约1 .5M b的群集区内有6个印迹基因,在群集区的末端有3个母源表达基因:p57K l p2,K v l q t l和M a s h2,中间为两个父源表达基因I n s u l i n-2 ( I n s-2)和I g f2,在下游90 k b处为一母源表达基因H19[4,5]。

另1个研究较多的印迹基因群集区位于人类15号染色体,由于该

区与P W S和A S两种人类遗传疾病有关,因此人们对这一群集区很感兴趣,目前已发现在此群集区至少包括Z N F127,V B E3A,S N R P N,PA R-S N、PA R5、PA R1、N D N(n e c d i n)、I P W、G A B R G3、G A B R B3 , G A B R A5和F N Z I 27等12个印迹基因,小鼠2号染色体远端G n a s位点处也有一印迹群,包括4个印迹基因:N e s p, N e s p a s,G n a s x l,G n a s,它们可形成一个印迹转录单位[6,7]。

最大的印迹基因群集区为X染色体本身,在真兽亚纲哺乳动物中雄性动物所有体细胞中两条染色体中的一条失活形成X连锁基因的剂量互补效应[8]。虽然X染色体失活可在胚胎细胞中父源和母源X染色体间自由选择,但在胚胎发生时胚外细胞的胎盘滋养层和卵黄囊内胚层细胞中,这种选择由父系决定,也就是说父系X染色体优先失活,且父源基因沉

默。以下几个群集区有以下几个共同特点:在一个很大的区域中群集分布着印迹基因,这些基因包含父源和母源表达基因,并且无编码R N A。这些共同特点表明印迹可能不是一个或几个印迹基因。

2.2印迹基因D N A复制的不同步性

印迹基因的第2个特点是复制的不同步性。复制的不同步性首先做为X染色体失活的标记而发现,在细胞周期中失活X染色体的复制比有活性X染色体复制晚。K i t s b e r g等人首先发现印迹基因复制的不同步性,他们用F I S H技术通过对含有一个或两个杂交斑细胞所占的比例来分析复制的不同步性,结果发现I g f2r,I g f2、H19和S n r p n的两个亲源等位基因的复制不同步,它们的父源等位基因复制较早。细胞周期中的复制时间常与基因表达水平有

关,一旱复制的基因有活性,但印迹基因不遵循这一原则,H19和I g f2r 基因为母源表达基因,但其父源基因复制早。还有少数基因不管哪个等位基因表达,其父源基因总是一早复制。K a w a m e等人用5-溴脱氧尿核苷直接脉冲标记细胞的方法来测定D N A复制的不同步性,结果发现,在人类淋巴细胞和原始淋巴细胞系中I g f2和H19的两个等位基因复制均晚,而这此细胞中不表达I g f2或和H19。

2.3基因组印迹基因表达的时空特异性

人们已发现了很多印迹基因表达的空间特异性的例子。如小鼠I n s-2基因仅在小鼠胚胎的胚外组织中印迹,但在胰岛细胞中双等位基因均表达[9,10,11];人类K v L Q T 1基因在大多数组织中为母源表达,但在心脏中无印迹,这可能是与该基因有关的长Q T综合征无亲本遗传倾向的原因。印迹基因表达的时间特异性的例子也很多:例如小鼠胚胎中的I g f2和M a s h2开始为双等位基因表达,但在胚胎形成的后期则表现为母源等位基因表达。人类印迹基因中I g f2基因的表达电有时间改变,在个体发育期,I g f2基因由3个独立的启动子启动父源染色体上的等位基因表达,出生后,肝脏中I g f2基因远端的启动子在两条染色体上均有活性,结果导致成人中双等位基因的表达。与上述例子相反,小鼠H19和S n r p n基因在发育的全过程中均印迹;人类H19基因仅在发育早期胎盘滋养层的少数细胞中无印迹,但在后期阶段完全印迹[12]。

2.4真兽亚纲哺乳动物中印迹基因的保守性

人们对小鼠和人类基因组印迹基因研究发现人类和小鼠的印迹基因既有相似又有不同点,例如,小鼠印迹基因H19,I g f2,P57K L P2在人类也存在[13];相反,在小鼠中印迹的I g F2r基因在人类大部分为双等位基因表达,与此相同,拼接因子相关蛋白V2a f b p-r s基因在小鼠中印迹而在人类中不印迹。至今还没有发现真兽亚纲以外的动物有基因组印迹现象的报道,但有袋类动物的X染色体上有印迹现象,它的失活不是随机的,在胚胎和胚外组织中均为父源X染色体优先失活[14]。2.5印迹基因编码R N A s

人们发现很多印迹基因根本不编码蛋白质,但编码R N A s。H19基因是第一个被发现的该类基因在比较人类和小鼠H19基因时发现,小鼠和人H19基因有保守的一级结构和部阅读框,因此认为H19尽编码R N A而不编码蛋白质。在胎儿发育期来自中胚层和内胚层的组织中聚积厂大量的H19R N A,很难使这种不重要的转录假基因消失:第二个发现的编码R N A的印迹基因为小鼠的X i s t和人的X I S T基因,定位于X染色体的失活中心,该区域为X染色体失活所需的顺式作用区,表明这些R N A s在印迹形成中有一定作用。上述两个编码R N A的基因

具有一些共同特点:这些基因的第一个和最后一个外显子均大,中间含有多个小的外显子;在真兽亚纲动物中两个基因编码的R N A一级结构均很保守,虽然那此保守的核苷分布并不完全一致,但在每个基因中其出现具有周期性[15]。根据潜在的基一环结构上互补碱基变化方式推测出R N A的二级结构其保守性更加显著。这些特点表明印迹基因编码的R N A在进化选择中有一定的生物学功能

在人类染色体P W区发现了第3个编码R N A的I P W印迹基因,其父源等位基因表达,在小鼠中该基因与S n r p n基因连锁,也为父本等位基因表达。与H19和X i s t所不同的是,I P W的基因结构及一级顺序在小鼠和人类之间几乎无前述的保守性,人和小鼠之间仅有一500b p的同源区,在人类为一段外显子区域,在小鼠为外显子与内含子的连接区。

3表观遗传修饰与基因组印迹

表遗传修饰(e p i g e n e t i c r e p r o g r a m m i n g)是一种不改变D N A 序列的可逆性化学修饰,且具有可遗传性。表遗传修饰的方式主要有D N A 甲基化(d e n o v o m e t h y l a t i o n)/去甲基化(d e m e t h y l a t i o n)、组蛋白乙酰化和R N A 干扰(R N A i)等。在很多情况下,表遗传改变可以调控细胞之间或者亲代和子代之间的基因表达。目前,被最广泛研究的表遗传学现象是D N A 甲基化。D N A 甲基化是一种发生在C p G二核苷酸的胞嘧啶上的共价修饰,甲基化受D N A-5-甲酰基转移酶催化,能导致染色质结构的变化,并且通常与基因的沉默表达有关[16]。甲基化是新发甲基化和去甲基化作用之间复杂的相互作用的结果。基因组印迹是一种表遗传现象,即一个基因的表达由其亲代来源决定。印迹基因中,只有一个等位基因被表达。D N A 甲基化是一种具有遗传性且可逆的表遗传标记,并可以在D N A 复制后稳定地增殖和影响基因表达。印迹由D N A 甲基化控制,一对分别来自父方和母方的等位基因由于其不同的甲基化改变,则会产生不同的表达。印迹基因的功能和性别特异性的差异解释了单亲胚胎发育衰竭的现象,并证明,来自双亲的基因在正常发育过程中都起着不可缺少的作用。小鼠的雄性单性生殖模型是通过激活敲除母系遗传物质后的两个由雄原核组成的受精卵而

建立的,在这个模型中,胚胎外组织快速增长,但胚胎组织却增长不足。相反,如果单亲生殖激活卵母细胞将引起在早期体节形成阶段相应正常的胚胎组织存活而胚胎外结构却形成不完全。这些现象表明,父系基因的表达将通过影响胚胎外组织来促进胚胎的生长,而母系基因的表达则可以直接促进胚胎的发育。基因组印迹与配子形成和胚胎早期发育小鼠实验表明,亲代来源的基因组印迹在每一次生殖循环中都首先被消除,然后在早期胚胎细胞中重新建立,并且在植入前期和植入后的生长过程中得到维持。配子成熟至受精是父系基因组和母系基因组分离的惟一阶段,该阶段很可能是印迹的发生阶段。母系H19基因表达,而父系H19基因被印迹是一种较为典型的印迹现象。在距离H19基因的复制起始点上游约2-4k b的区域存在一个2k b跨度的差异甲基化区(D M D),这个区域在成熟雄性的生殖细胞中发生甲基化,甲基化是在前精原细胞时期获得,并且在减数分裂的粗线期完成。而在卵母细胞中该区域却不发生甲基化。一些研究表明在雌性生殖系中,印迹获得发生在出生后,此时期卵母细胞停止在第一次减数分裂前期的双线期。父系表达基因S n r p n的甲基化印迹的获得就在这个时期,而I g f2,P e g1和P e g3基因上的母系甲基化的建立则是在卵母细胞第二次分裂中期。在胚胎早期发育过程中,配子中已经建立的印迹必须维持,而未被印迹基因的甲基化状态则经历了动态变化。小鼠实验中,受精4h的雄性原核细胞经历了迅速的主动去甲基化改变。而母系基因组却未参与此过程,并可能发生被动去甲基化。新发甲基化发生之后,囊胚阶段的非印迹基因的甲基化达到最低水平。在植入前胚胎的基因组广泛去甲基化时期,印迹基因维持了来自配子的遗传标记。

4基因组印迹与人类疾病

20世纪50年代后,就有报道两种不同的病症A n g e l m a n综合征(A S)和P r a d e r-w i l l i综合征(P W S)。后来认为这两种疾病都与15q11-13区域的缺失有关。这个区域存在一个包括S N R P N,U B E3A, Z N F127,I P W和N D N基因的印迹基因簇。与其相似的基因组在小鼠体内则位于7号染色体。A S是由母系等位基因功能缺失或者父系等

位基因的U B E3A 发生重叠而引起的。是以共济失调,张力减弱,严重的智力障碍,癫痫发作和语言障碍为特征的一类疾病。与A S相关的甲基化缺陷包括S N R P N印迹中心的甲基化丢失,及随后表现出的父系(甲基化不足)表型。P W S与父系等位基因功能缺失或母系等位基因S N R P N重叠有关。其位置也是15q11-13区域。P W S患者通常表现出肥胖,轻度智力障碍,身材矮小,肌肉张力减退,生殖腺功能低下和特征性的胎动减少。另外一种与印迹有关的疾病是B e c k w i t h-W i e d e m a n n综合征(B W S),B W S的发生与母系等位基因在11p15部位发生功能丧失有关。B W S是一种过度生长性疾病,其主要特征包括:脐疝,巨舌,内脏肥大,新生儿时期低血糖,脐和腹壁异常及耳部的特殊纹理。B W S的儿童具有高度的发生胚胎性和儿童期肿瘤的风险。S i l v e r-R u s s e l l综合征(S R S)是以低出生体质量、侏儒症和各种畸形为特征的一类疾病。可能与一类还未明确的印迹基因簇中的某个(些)基因的缺陷有关。

【参考文献】

[1]D e C h i a r a T M,R o b e r t s o n E J,E f s t r a t i a d i s A.P a r e n t a l i m p r i n t i n g

o f t h e m o u s e i n s u l i n-l i k e g r o w t h f a c t o r-2g e n e.C e l l,1991, 64:849-859 .

[2]B a r l o w D P,S t g e r R,H e r r m a n n B G e t a l.T h e m o u s e i n s u l i n-l i k e

g r o w t h f a c t o r t y p e-2 r e c e p t o r i s i m p r i n t e d a n d c l o s e l y l i n k e d t o t h e

T m e l o u c s .N a t u r e,1991,349:84-87 .

[3]I,e e M P,H u R,J o h n s o n L A.H u m a n K v L Q T l g e n e s h o w s

t i s s u e-s p e c i f i c i m p r i n t i n g a n d e n c o m p a s s e s B e c k w r t h-Wr e d e m a m s y n d r o m e c h r o m o s o m a l r e a r r a n g e m e n t s.N a t.G e n e t,1997, 15:181-185 .

[4]T h o r v a l d s e n J L.D e l e t i o n o f t h e H19d i f f e r e t i a l l y m e t h y l a t e d

d o m a i n r

e s u l t s i n l o s s o

f i m p r i n t e d e x p r e s s i o n o f H19a n d

I g f2 .G e n e s.D e v,1998,12:3693-3702 .

[5]K i t s b e r g D,S e l i g S,B r a n d e i s M e t a l.A l l e l e-s p e c i f i c r e p l i c a t i o n

t i m i n g o f i m p r i n e d g e n e r e g i o n s .N a t u r e,1993,364:459-463 .

[6]M a n n e n s M,A l d e r s M.G e n o m i c i m p r i n t i n g:c o n c e p t a n d c l i n i c a l

c o n s e q u e n c e s .A n n.M e d,1999,31:4-11 .

[7]We v r i c k R,K e r n s J A,F r a n c k e U.I d e n t i f i c a t i o n o f a n o v e l

p a t e r n a l l y e x p r e s s e d g e n e i n t h e P a r a d e r-W i l l i s y n d r o m e r e g i o n .H u m.M o l.G e n e t,1997,6:325-332 .

[8]K a w a m e H,G a r t l e r S M,H a n s e n R S.A l l e l e-s p e c i f i c r e p l i c a t i o n

t i m i n g i n i m p r i n t e d d o m a i n s:a b s e n c e o f a s y n c h r o n y a t s e v e r a l l o c i .H u m.M o l.G e n e t,1995,4:2287-2293 .

[9]M a h e r F,R a n d R e i k W.B e c k w i t h-Wi e d e m a n n s y n d r o m e:

i m p r i n t i n g i n c l u s t e r s r e v i s i t e d.J.C l i n.I n v e s t,2000,

105:247-252 .

[10] K a r n i y a M,J u d s o n H,O k a z a k i Y e t a l.T h e c e l l c y c l e c o n t r o l g e n e

I A C/P L A G L1i s i m p r i n t e d-a s t r o n g c a n d i d a t e g e n e f o r t r a n s i e n t

n e o n a t a l d i a b e t e s .H u m.M o l.G e n e t,2000,9:453-460 .

[11] B r o w n C J, B a l l a b o i o A , R u p e r t J L e t a l.A g e n e f r o m t h e r e g i o n o f

t h e h u m a n X c h r o m o s o m e i n a c t i v e c e n t r e i s e x p r e s s e d e x c l u s i v e l y

f r o m t h e i n a c t i v e X c h r o m o s o m e .N a t u r e,1991,349:38-44 .

[12] S t o g e r R,K u b i c k a P,L i u C G e t a l.M a t e r n a l-s p e c i f i c m e t h y l a t i o n

o f t h e i m p r i n t e d m o u s e I g f2r l o c u s i d e n t i f i e s t h e e x p r e s s e d l o c u s

a s c a r r y i n g t h e i m p r i n t i n g s i g n a l .C e l l,1993,73:61-71 .

[13]R a z i n A,C e d a r H.D N A m e t h y l a t i o n a n d g e n o m i c

i m p r i n t i n g .C e l l,1994,77:473-476 .

[14] Ty c k o B,A s h k e n a s J.E p i g e n e t i c s a n d i t s r o l e i n d i s e a s e .J.C l i n.

I n v e s t,2000,105:245-246 .

[15] F e i l R,K h o s l a S.G e n o m i c i m p r i n t i n g i n m a m m a l s:a n i n t e r p a l y

b e t w e e n

c h r o m a t i n a n

d D N A m

e t h y l a t i o n .T I G,1999,15:431-435 .

[16] T i l g h m a n S M.T h e s i n s o f t h e f a t h e r s a n g m o t h e r s:g e n o m i c

i m p r i n t i n g i n m a m m a l i a n d e v e l o p m e n t .C e l l,1999,96:185-193 .

DNA甲基化功能汇总

Functions of DNA methylation: islands, start sites, gene bodies and beyond DNA甲基化功能:岛,起始位点,基因体和其他 peter a. jones 摘要 DNA甲基化通常被描述为一个“沉默”的表观遗传标记,的确,5-甲基胞嘧啶的功能最初是在20世纪70年代提出。现在,归功于甲基化绘图的基因组规模的改良,我们可以评估在不同的基因组背景下的DNA甲基化:在基因体上,在调控元件和重复序列上,转录起始位点有或者没有CpG岛。新出现的图片是DNA甲基化功能似乎随背景而改变,DNA甲基化和转录的关系比我们最先认识到的更为微妙。有必要提高我们对DNA甲基化的功能的理解,为了解释这个疾病标记中观察到的变化,比如癌症。 两篇重要的文章在1975年分别表示胞嘧啶残基的甲基化在CpG二核苷酸背景中能作为表观遗传标记。这些文章提出序列可以被重新甲基化,即甲基化通过一种机制的体细胞分裂能够被遗传,包括一种能识别半甲基化CpG回文的酶,甲基基团的存在,可以由DNA结合蛋白和DNA甲基化直接沉默基因解释。虽然这些关键原则中的几个被证明是正确的,解开DNA甲基化与基因沉默的关系已被证明是具有挑战性的。 在CpG序列背景下,在动物身上的大部分工作都集中在5-甲基胞嘧啶(5mC)。据报道,在哺乳动物的其他序列的甲基化广泛分布在植物和一些真菌中。在哺乳动物中,非CpG甲基化的功能目前未知。在这里我主要集中在哺乳动物基因组中的CpG甲基化,包括在其他动物和植物中观察到的差异的讨论。 理解DNA甲基化的功能需要通过基因组考虑甲基化的分布。超过一半的基因脊椎动物的基因组包含短(约1 kb)CpG丰富的区域称为CpG岛(CGIS),其余的基因组因为CpGs而耗尽。当5mC通过自发或酶胸腺嘧啶脱氨基作用被转换成胸腺嘧啶,认为基因组的损失是由于甲基化的序列在种族中的脱氨基;认为CGI存在是因为他们可能是从来没有或只有瞬时甲基化。然而,有很多关于准确定义CGI是什么的讨论,虽然在

【免费下载】真菌基因组学研究进展

真菌基因组学研究进展 真菌为低等真核生物,种类庞大而多样。据估计,全世界约有真菌150万种,已被描述的约8万种。真菌在自然界分布广泛,存在于土壤、水、空气和生物体内外,与人类生产和生活有着非常密切的关系。许多真菌在自然界的碳素和氮素循环中起主要作用,参与淀粉、纤维素、木质素等有机含碳化合物及蛋白质等含氮化合物的分解。有些真菌如蘑菇、草菇、木耳、麦角、虫草、茯苓等可直接供作食用和药用,或在发酵工业、食品加工业、抗生素生产中具有重要作用。然而,也有些种类引起许多植物特别是重要农作物的病害,如水稻稻瘟病、小麦锈病、玉米腥黑穗病、果树病害等。少数真菌甚至是人类和动物的致病菌,如白色假丝酵母Candida albicans等。因此,合理利用有益真菌,控制和预防有害 真菌具有重要意义。 本文整理了已完成基因组序列测定的真菌的信息,并对真菌染色体组的历史、测序策略及其基因组学的研究进展进行了评述。 1真菌染色体组的研究历史和资源 1986年美国科学家Thomas Rodefick提出基因组学概念,人类基因组计划带动了模式生物和其它重要生物体基因组学研究。阐明各种生物基因组DNA中碱基对的序列信息及破译相关遗传信息的基因组学已经成为与生物学和医学研究不可分割的学科。由欧洲、美国、加拿大和日本等近百个实验室六百多位科学家通力合作,1996年完成第一个真核生物酿酒酵母Saccharomyces cerevisiae的基因组测序,这 对于酵母菌类群来说是一个革命性的里程碑,并且激起了真核基因功能和表达的第一次全球性研究(Goffeau etal,1996)。随后粟酒裂殖酵母Schizosaccharomyces pombe(Wood etal.2002)和粗糙脉孢 霉Neurospora crassa(Galagan etal.2003)染色体组的完成显露出酿酒酵母作为真菌模式生物的局限性。尽管如此,真菌染色体组测序的进展最初是缓慢的。为加快真菌染色体组研究的步伐,2000年由 美国Broad研究所与真菌学研究团体发起真菌基因组行动(fungal genome initiative,FGI),目的是 促进在医药、农业和工业上具有重要作用的真菌代表性物种的基因组测序。2002年2月FGI发表了第 一份关于测定15种真菌基因组计划的白皮书。2003年6月,真菌基因组行动发表了第二份白皮书,列 出了44种真菌作为测序的目标,强调对其中10个属即青霉属Penicillium、曲霉属Aspergillus、组 织胞浆菌属Histoplasma、球孢子菌Coccidioides、镰刀菌属Fusarium、脉孢菌属Neurospora、假丝 酵母属Candida、裂殖酵母属Schizosaccharomyces、隐球酵母属Cryptococcus和柄锈病菌属Puccin& 的物种优先进行测序。之后,经过FGI、法国基因组学研究项目联(G6nolevures Consortium)、美国能 源部联合基因组研究所(The DOE Joint Genome Institute,JGI)DOE联合基因组研究所、基因组研究 院(The Institute for Genomic Research,TIGR)、英国The Wellcome Trust Sanger InstimteSanger和华盛顿大学基因组测序中心等共同努力;得到包括美国国家人类染色体研究所、国 家科学基金会、美国农业部和能源部等的资助,也有来自学术界和产业集团如著名的 Monsanto、Syngenta、Biozentrum、Bayer Crop Science AG和Exelixis等公司的持续合作,在最近 的几年里,真菌基因组学研究取得重大突破。至2008年6月1日,共有3734种生物的全基因组序列测定工作已经完成或正在进行,公开发表812个完整的基因组,其中,70余种真菌基因组测序工作已经 组装完成或正在组装,分别属于子囊菌门、担子菌门、接合菌门、壶菌门和微孢子虫(Microsporidia) 的代表。此外,还有Ajellomyces dermatitidis和Antonospora locustae等20余种真菌基因组序列 正在测定中(Bemal etal.2001)。这些真菌都是重要的人类病原菌、植物病原菌、腐生菌或者模式生物,基因组大小为2.5—81.5Mb,包含酵母或产生假菌丝的酵母、丝状真菌,或者具有二型性(或多型性) 生活史的真菌,拥有与动物和植物细胞一样的的细胞生理学和遗传学特征,包括多细胞性、细胞骨架结

DNA测序技术的发展和其最新进展

DNA测序技术的发展及其最新进展 摘要:自从诺贝尔奖得主桑格于1977年发明了第一代DN测序技术以来,DNA测序技术已经作为重要的实验技术广泛的应用于现代生物学研究当中。经过了几十年的发展,DNA测序技术日臻成熟,并且以单分子测序为特点的第三代测序技术也已经诞生。本文主要就每一代测序技术原理和特点及其最新进展做简要介绍。 关键词:DNA测序技术;第三代DNA测序技术;最新进展 The Development and New Progress of DNA Sequencing Technology Abstract: Since Nobel Prize Winner Sanger have founded the first generation of DNA Sequence technology in 1977, DNA sequencing technology has been widely used in modern biological researches as an important experimental. Over decades of year’s development, DNA sequence technology mature gradually and the third generation sequencing technologies characterized by single-molecule sequencing have also emerged. The mechanisms and features of each generation of sequencing technology and their latest progress will be discussed here. Key Words: DNA Sequence technology ; third generation DNA sequencing ;latest development 1.引言 DNA测序技术是分子生物学研究中最常用的技术,它的出现极大地推动了生物学的发展。自从1953年Watson和Crick发现DNA双螺旋结构后[1],人类就开始了对DNA序列的探索,在世界各地掀起了DNA测序技术的热潮。1977年Maxam和Gilbert报道了通过化学降解测定DNA序列的方法[2]。同一时期,Sanger发明了双脱氧链终止法[3]。20世纪90年代初出现的荧光自动测序技术将DNA测序带入自动化测序的时代。这些技术统称为第一代DNA测序技术。最近几年发展起来的第二代DNA测序技术则使得DNA测序进入了高通量、低成本的时代。目前,基于单分子读取技术的第三代测序技术已经出现,该技术测定DNA序列更快,并有望进一步降低测序成本,推进相关领域生物学研究。本文主要介绍DNA测序技术的发展历史及不同发展阶段各种主要测序技术的特点,并针对目前新一代DNA测序技术及目前国际DNA测序最新进展做简要综述。

DNA甲基化和肿瘤的关系

DNA 甲基化与肿瘤 一、DNA甲基化与基因表达 5-甲基胞嘧啶是天然存在的修饰碱基,甲基化的 mCpG ,在DNA 双链中对称出现。哺乳类动物基因组约60 %的表达基因5′端启动子存在未被甲基化的CpG岛,而启动子区域外的CpG岛大都为 mCpG。正常情况下,非活化的X染色体、印迹基因等的启动子区域的CpG岛为甲基化状态,而看家基因的 CpG岛则是去甲基化状态。 DNA 甲基化状态与基因表达呈负相关。其调控作用主要在转录水平抑制基因表达。 DNA甲基化的检测方法 经过亚硫酸盐处理后的DNA中胞嘧啶(C)转变为胸腺嘧啶(T),但是甲基化的中的CpG二核苷酸C 未转变为T,而无甲基化的CpG二核苷酸则发生这种转变,由此可以推断DNA是否发生甲基化。TATAGGGCGAATTGGGCCCTCTAGATGCATGCTCGAGCGG CCGCCAGTGTGATGGATATCTGCAGAATTGCCCTTTAGTAT TGTTTGGTGAAATGGTACGTGTTTATAATTTTAGTTATTTAG GAGGTTGAGGTAGGAGGATTTTTTGAGTTTAGGAGTTTAA GTTTAGTTTGGGTAATATAGTTTAGTGGTTATATTAAAAAA AGTAAAATAGTCGGGCGCGGTGGTTTACGTTTGTAATTTTA GTATTTTGGGAGGTCGAGGCGGGTGGATTACGAGGTTAGG AGGTTGAGATTATTTTAAGGGCAAT

DNA 甲基化抑制基因转录的分子机制 ①DNA 双螺旋结构的大沟为DNA 与多种转录因子的作用部位,mCpG的甲基化胞嘧啶突入大沟,抑制转录因子的结合而抑制转录。②mCpG 激活阻遏蛋白因子,如DMAP1、TSG101、 Mi2等,通过阻遏蛋白因子的作用抑制转录。③DNA甲基化与组蛋白乙酰化的研究发现,组蛋白H3、H4 的赖氨酸去乙酰化后带负电荷,与带正电荷的DNA 结合更紧密,不利于转录过程中的聚合物解聚,从而抑制基因转录。甲基化的CpG 结合蛋白(MeCPs) 与DNA 的mCpG结合,并与组氨酸去乙酰化酶(HDAC) 形成复合物共同抑制转录。 二、DNA甲基化与肿瘤 以往的研究认为癌基因激活、抑癌基因失活主要是基因突变、缺失导致的DNA 序列改变。在肿瘤研究中,检测到许多肿瘤的重要基因并未发生突变、缺失,基因表达的异常主要通过DNA 甲基化实现。癌基因的去甲基化和抑癌基因的甲基化状态,可导致癌基因激活、抑癌基因的失活。癌基因的低甲基化和抑癌基因的高甲基化改变是肿瘤细胞的一个重要特征。 DNA 甲基化状态的改变导致基因结构和功能的异常,与肿瘤发生的关系是近年来研究的热点。 DNA甲基化的异常与基因突变、缺失等基因组异常也有密切的关系

DNA甲基化

DNA甲基化概述 在哺乳动物基因组中,甲基化是一种表观遗传机制,包括将甲基转移到胞嘧啶的C5位置形成5-甲基胞嘧啶。DNA甲基化通过招募参与基因抑制的蛋白或通过抑制转录因子与DNA的结合来调节基因表达。在发育过程中,DNA甲基化的模式在基因组中发生变化,这是DNA从头甲基化和去甲基化的动态过程的结果。 DNA甲基化是被一个甲基转移酶家族所催化,转移S腺苷甲硫氨酸(SAM)的一个甲基到第五个碳胞嘧啶残基形成5mc , Dnmt3a和Dnmt3b可以建立一个新的DNA甲基化模式来去修饰DNA,被称为从头甲基化。另一方面,Dnmt1在DNA复制过程中起作用,将亲代DNA链上的甲基化模式复制到新合成的子链上。这三种DNA都广泛参与胚胎的发育。这三种DNA都广泛参与胚胎的发育。当细胞到达终末分化时,Dnmt的表达大大降低。这似乎表明有丝分裂后细胞的DNA甲基化模式是稳定的。 大部分DNA的甲基化发生在鸟嘌呤核苷酸或CpG位点之前的胞嘧啶上。总的来说,哺乳动物基因组中CpG位点的减少可能是由于5 - mc可脱氨成胸腺嘧啶的诱变潜力。剩余的CpG位点分布在整个基因组中,除了CpG岛外,它们都被严重甲基化。DNA甲基化对沉默逆转录病毒分子、调节组织特异性基因表达、基因印记和X染色体失活至关重要。不同基因组区域的DNA甲基化可能根据潜在的遗传序列对基因活动产生不同的影响。 一、DNA甲基化的位置 1.1 基因间区 大约45%的哺乳动物基因组由转座因子和病毒因子组成,这些因子被大量甲基化而沉默。这些元素中的绝大多数是通过DNA甲基化或随着时间的推移由于5mC的破坏而产生的突变而失活的。如果表达,这些元素是潜在的有害的,因为它们的复制和插入可以导致基因损坏和DNA突变。胞内颗粒(IAP)是小鼠基因组中最具侵袭性的逆转录病毒之一。在整个生命过程中,IAP在配子形成、发育和成年阶段都被高度甲基化。甚至在胚胎内部,当基因组其余部分相对低甲基化时,Dnmtl维持对IAP元件的抑制。当Dnmtl被基因突变耗尽,导致广泛的低甲基化时,IAP元素被表达。这表明,在基因间区,DNA甲基化的主要作用之一是抑制潜在有害基因元素的表达。 1.2 CpG岛 CpG岛是大约1000个碱基对长度的DNA延伸,它们的CpG密度比基因组的其他部分高,但通常不会甲基化。大多数基因启动子,大约70%,在CpG岛。特别是,管家基因的启动子常常嵌入到CpG岛。CpG岛,尤其是那些与启动子相关的基因在小鼠和人类之间高度保守。在整个进化过程中,CpG岛屿的位置和保存意味着这些区域具有重要的功能。 CpG岛通过调控染色质结构和转录因子的结合来促进基因表达。DNA有规律地包裹在组蛋白周围,形成被称为核小体的小段。DNA与组蛋白的联系越紧密,对基因表达的宽容程度就越低。CpG岛的一个共同特征是,它们比其他DNA片段包含更少的核团。与CpG 岛相关的少数核小体常含有组蛋白,其修饰涉及增强基因表达。尽管约50%的CpG岛包含已知的转录起始位点,但CpG岛往往缺乏常见的启动子元件,如TATA boxes 。由于许多转录因子结合位点富含GC, CpG岛可能会增强对转录起始位点的结合。CpG岛虽然缺乏共同的启动子元件,但却能增强DNA的可达性,促进转录因子的结合。 CpG岛的甲基化导致了稳定的基因表达沉默。在配子发生和胚胎早期发育期间,CpG 岛经历了差异甲基化。通过CpG岛调控基因表达的甲基化能力对建立很重要。印迹基因仅由两个遗传亲本染色体中的一个表达,它们的表达由遗传亲本决定。除了印迹基因外,CpG

进化基因组学研究进展

研究进化基因组学进展 摘要:进化基因组学是利用基因组数据研究差异基因功能、生物系统演化、从基因在水平探索生物进化的学科。随着近年来基因组数据的不断增加,进化基因组学得到了长足的发展。进化基因组学主要包括从基因组水平理解和诠释生物进化和新基因分析研究探索两方面的内容。本文介绍了进化基因组学研究的主要内容和较为常用的方法,以及近年来在细菌、酵母、果蝇进化基因组学方面的研究进展。 关键词:进化基因组学系统进化比较基因组学新基因 正文 随着基因测序技术的不断进步以及基因组学的飞速的发展,人们积累了大量的基因组学数据,利用所得的大量的基因组数据与进化生物学相结合,在基因组水平研究生物进化机制,随即产生了进化基因组学。 近年来进化基因组学取得了长足的进展,在研究差异基因功能、生物系统演化、从基因在水平探索生物进化的终极方式等方面有重大突破,对人类理解生命现象和过程有重要作用。 研究系统进化学通常包括两个关键步骤:一方面,在不同物种中鉴定同源性特佂,另一方面利用构建系统进化树的方法比较这些特征,进而重新构建这些物种的进化历史[1]。针对这两个关键步骤,传统系统进化学,常采用基于形态学数据和单个基因研究的同源性状鉴定和重建系统进化树(常包括距离法、最大简约法、概率法)[1]的方法来研究。在目前拥有丰富基因组数据的条件下,我们可以分析基因组数据,利用进化基因组学研究系统进化。 一、目前进化基因组学的研究内容主要集中于两个方面:(1)在比较不同生物的基因数据的基础上,从基因组水平理解和诠释生物进化;(2)通过对新基因的分析研究探索基因进化过程的规律两个方面。在进行全基因组进化分析方面,进化基因组学主要集中于构建系统进化树、研究基因组进化策略、研究生物功能变化和进化机制、进化和生态功能基因组学、基因注释的等方面;在新基因方面

微生物基因组研究进展及意义

微生物基因组研究进展及其意义 近年来,病原微生物的基因组研究取得了飞速的进展。所谓基因组研究是指对微生物的全基因进行核苷酸测序,在了解全基因的结构基础上,研究各个基因单独或数个基因间相互作用的功能。由于过去人们大多从表型分析入手,寻找已知功能的编码基因,实际只了解微生物中极少数的基因,如链球菌的链激酶基因、结核杆菌编码的热休克蛋白基因等。还有大量未知基因未被发现。通过基因组研究,则从根本上揭示了微生物的全部基因,不仅可发现新的基因,还可发现新的基因间相互作用、新的调控因子等。这一研究将使人类从更高层次上掌握病原微生物的致病机制及其规律,从而得以发展新的诊断、预防及治疗微生物感染的制剂、疫苗及药品。此外,新发现的微生物酶及蛋白还可能有在工农业生产上的应用价值。因此,全球除已完成了70余株覆盖重要病毒科的病毒代表株全基因组研究外,据美国基因组研究所(The Institute for Genomic Research, TIGR)报道,目前已完成了19种微生物基因组测序,其中11种与人类及疾病相关(嗜血流感杆菌,生殖道支原体,肺炎支原体,幽门螺杆菌,枯草杆菌,伯氏疏螺旋体,结核杆菌,梅毒螺旋体,沙眼衣原体,普氏立克次体)。另外,还有40余种微生物已被登记正在进行测序,预计在1999~2000年完成〔1〕。 病毒基因组研究进展 病毒因其基因组小,是进行基因组研究最早的生物体。早在1977 年已完成了噬菌体DNA的全基因测序。存在于脊髓灰质炎疫苗中的SV40,是最早完成全基因测序的与疾病相关的病毒;此后,许多病毒均已完成了全基因测序,并根据序列的开放阅读框架(ORF)对编码蛋白进行了推导。已对相当一些病毒蛋白进行了重组表达,还对一些病毒基因编码的调控序列进行了研究。除一般大小的病毒已完成了基因组测序,对大基因组病毒,疱疹病毒科,如水痘病毒基因组为0.125Mb(Mega-basepair,兆碱基对)〔2〕。巨细胞病毒,基因组为0.229Mb〔3〕。我国已对痘苗病毒天坛株(约0.2Mb)进行了全基因测序,发现与国外的痘苗毒株序列有明显的差异〔4〕。我国还对甲、乙、丙、丁、戊、庚型肝炎病毒进行了国内毒株的全基因测序。近来还对国内2株发现的虫媒病毒毒株完成了全基因测序。我国从不同来源的标本中发现了不少乙肝病毒变异株,有的具有特殊的生物学特性〔5〕。对病毒基因中调控因子的分析,发现了与乙肝病毒增强子作用的新细胞核因子〔6〕。 因此,目前对病毒的基因组研究已进入了后基因组阶段,即从全基因水平研究病毒的生物学功能,同时发现新的基因功能。对于医学病毒学当前主要方向是研究病毒基因组中与致病及诱生免疫应答相关的基因,从而揭示和解决迄今尚未解决的问题,以达到控制或消灭一些重要病毒感染的目的。 建议目前可进行后基因组研究的领域为: 1.病毒持续性感染:基因组中与持续性感染相关的基因,基因变异或调控因子研究。已报道的乙肝病毒的前核心基因出现终止密码突变,

基因组学研究的应用前景

基因组学研究的应用前景摘要:基因组学是一门研究基因组的结构,功能及表达产物的学科,基因组的结构不仅是蛋白质,还有许多复杂功能的RNA,包括三个不同的亚领域,及结构基因组学,功能基因组学和比较基因组学。近几年,基因组学在微生物药物,细菌,病毒基因,营养基因方面都有进展,其前景是光明的。 关键词:基因研究未来结构 一、微生物药物产生菌功能基因组学研究进展 微生物药物是一类化学结构和生物活性多样的次级代谢产物,近年来多个产生菌基因组序列已经被测定完成,在此基础上开展的功能基因组研究方兴未艾,并在抗生素生物合成,形态分化,调控,发育与进化及此生代谢产物挖掘等方面有着新的发现,展现出广阔的研究前景,青霉素及其衍生的《》内酰胺类抗生素极大地改善了人类的卫生保健和生活质量,并促进研究人员不断对其工业生产菌株类黄青霉进行遗传改良和提高其产量,从而降低生产成本。经过60年的随机诱变筛选,当前青霉素产量至少提高了三个数量级,同时,青霉素的生物合成机理也得到了较为清晰的阐述,其pcbAB编码的非核糖体肽合酶ACVS~DPcbc编码的异青霉素N合成酶IPNS位于细胞质中,而苯乙酸COA连接酶PenDE编码的IPN酰基转移酶位于特殊细胞器一微体中。 研究发现,青霉素合成基因区域串联扩增,产黄青细霉胞中微体含量增加都可显著提高青霉素产量。然而随机诱变筛选得到的黄青霉工业菌株高产的分子机制尚不明确。为此,2008年荷兰研究人员联合国美国venter基因组研究所对黄青霉wisconsin54—1225进行了基因组测试和分析,并进一步利用DNA芯片技术研究了wisconsin54—1255及其高产菌株DS17690在培养基中是否添加侧链前体苯乙酸情况下的转录组变化,四组数据的比较分析发现,有2470个基因至少在其中一个条件下是差异表达的,根据更为严格的筛选标准,在PPA存在的条件下,高产菌相比测序菌株有307个基因转录是上调的,和生长代谢,青霉素前体合成及其初级代谢和转运等功能相关,另有271个基因显著下调,主要是与生长代谢及发育分化相关的功能基因。 二、乳酸菌基因组学的研究进展

狂犬病病毒的基因分型及其分子流行病学研究进展

文章编号:1002-2694(2006)03-0271-03 狂犬病病毒的基因分型及其分子流行病学研究进展 张建明1,2,严延生2 中图分类号:R37319 文献标识码:A 狂犬病(Rabies)是由狂犬病病毒(rabies virus,RV)引起的人和所有哺乳动物的急性致死性中枢神经系统的自然疫源性疾病。人狂犬病的临床特征是恐水、怕风、咽肌痉挛和进行性麻痹等,尤以恐水症状为突出,一旦发病,死亡率几乎达100%〔1〕。狂犬病是全球性的严重公共卫生问题,近些年来,随着宠物增多又缺乏相对有效的管理控制措施,狂犬病的发病又呈现上升趋势,在分子水平上进行狂犬病病毒流行病学研究对于阐明病毒的毒力变异和抗原飘移、了解病毒的宿主特异性和病毒系统发育的时空进程,以便更好地控制狂犬病都具有重要意义,本文就狂犬病病毒的基因分型及其分子流行病学研究进展作一综述。 1 狂犬病病毒的基因组结构和分型 111 基因结构 狂犬病病毒的基因组为单股负链不分节段的RNA,全长约12kb(11215kb)。由基因组的3’端至5’端依次排列着N、NS、M、G、L5个结构基因,各基因的序列长度分别为1424、991、805、1675和6475个核苷酸,它们分别编码核蛋白(N)、磷蛋白(P)、基质蛋白(M)、糖蛋白(G)和大蛋白(P或RNA依赖的RNA转录酶蛋白)。每个基因均由3’端非编码区、编码区和5’端非编码区三部分组成。在N 基因前有1个50个核苷酸的先导序列,在L基因后有约70个核苷酸的非翻译区。在N2NS、NS2M、M2G和G2L基因间分别有2、5、5和423个核苷酸的间隔序列,G2L基因间的423核苷酸间隔序列是一个伪基因。 112 基因分型 狂犬病病毒的N蛋白基因相对恒定,点突变较少,而且与病毒的型别有关,可以作为群变异的指标〔2〕。1993年Bourhy等〔3〕通过测定狂犬病病毒属中具有代表性的病毒分离物N基因的序列,将狂犬病原区分为6个基因型:基因型1(狂犬病病毒,RABV)、基因型2(拉各斯蝙蝠病毒,LBV)、基因型3(莫科拉病毒,MO KV)、基因型4(杜文海洛病毒,DUVV)、基因型5(欧洲蝙蝠狂犬病病毒1,EBLV2 2)、基因型6(欧洲蝙蝠狂犬病病毒2,EBLV22)。1998年Skerratt等〔4〕从澳大利亚的蝙蝠中分离出狂犬病病毒的基因型7(澳大利亚蝙蝠狂犬病病毒,ABLV)。2001年de Mattos 等〔5〕对狂犬病病毒基因分型进行比较研究,根据N基因核苷酸序列的同源性绘制了狂犬病病毒属成员间的种系发生关系图,属内成员N蛋白序列的同源性由78%(MO KV和EBLV22)至93%(DUVV和EBLV21),基因型和早先根据抗原性划分的血清型基本一致。7个基因型又可分为2个进化组:第一组包括基因型1、4、5、6和7;第二组含基因型2和3。同组内1种病毒的抗体与其他病毒可产生交叉反应,不同组的病毒之间不能产生交叉免疫保护。非洲的DUVV和EBLV21亲缘关系较近,而LBV和MO KV在系统发育上则和RABV亲缘关系较远。ABLV与古典的RABV亲缘关系最密切。在基因型内还可分辨出各个不同的病毒聚簇,这些聚簇反映了病毒间历史的地理的或宿主种别的关系。 2 狂犬病的分子流行病学研究 211 流行现状 狂犬病呈全球性分布,只有南极洲和少数岛国(日本、挪威、冰岛、芬兰、瑞典、英国、马来西亚、新加坡、新西兰等)无狂犬病发生。亚洲是狂犬病高发地区,估计每年有近40000人死于狂犬病,约占全球因犬伤死亡的90%〔6〕。亚洲狂犬病发病率以印度为最高,中国、菲律宾、孟加拉、巴斯基坦、越南、泰国等也相当高〔7〕。非洲普遍存在狂犬病且大面积流行,病原型别复杂,感染来源更复杂,最早发现的狂犬病病毒的4个血清型中有3个存在于非洲,除家犬、猫外,非洲南部至少有30种属于5个科的肉食动物被确诊患狂犬病。欧洲由于实行针对狐狸的口服免疫策略〔8〕,近10年来,动物狂犬病已明显下降,其流行病学也发生了改变,西欧国家采取了对犬进行免疫,同时对犬进行严格管理,已基本上控制或消灭了人、畜狂犬病。狂犬病在中、南美洲长期以来一直是严重的公共卫生和经济问题,其中阿根廷、玻利维亚、巴西、哥伦比亚、厄瓜多尔、危地马拉、洪都拉斯等国疫情较重。北美洲狂犬病呈地区性流行,以野生动物为主,自1996年以来,狂犬病发病率一直保持下降趋势,但蝙蝠作为传染源引起的人狂犬病无下降趋势〔9〕。澳大利亚原本是一个无狂犬病的国家,1998年Skerratt等〔4〕从果蝠中分离出澳大利亚蝙蝠狂犬病病毒,引起了公众的注意。 212 分子流行病研究方法 Rupprecht C等〔10〕通过单克隆抗体检测狂犬病病毒的抗原变异,证明了来自世界各地不同病毒分离物间存在许多差异。但是,单纯血清型或抗原型并不能鉴定狂犬病病毒的来源和迁移,在分子流行病学的研究中受到一定的限制。Ermine A等〔11〕把放射性标记的核酸探针杂交方法用于检测狂犬病病毒基因组,但此法只能用于检测受严重感染的组织中的狂犬病病毒基因组。近年来狂犬病的分子流行病学研究方法不断完善,Bourhy HB等〔12〕证实利用RT2PCR及基因测序的分子流行病研究在病毒的分类及病毒株来源的鉴别上是一个很有用的工具。许多学者是根据N基因的特点———高度保守和高效表达,先用RT2 PCR方法扩增N基因片段,然后再进行基因序列测定,对狂犬病病毒进行病毒检测、基因分型和系统发育分析,从而进 通讯作者:严延生 作者单位:1.福建医科大学,福州 350004; 21福建省疾病预防控制中心,福州 350001

人全基因组甲基化测序项目结题报告

人全基因组甲基化测序项目 结题报告 成都生命基线科技有限公司

目录 一、分析方法 (3) 1.1 全基因组甲基化测序 (3) 1.2 生物信息分析概述 (3) 1.3 数据过滤 (3) 1.4 序列比对 (3) 1.5 甲基化水平 (3) 1.6 DMR检测 (4) 1.7 甲基化水平程度差异 (4) 1.8 GO注释 (4) 1.9 KEGG通路富集 (4) 二、项目流程 (5) 2.1 实验流程 (5) 2.2 信息分析流程 (5) 三、项目结果报告 (6) 3.1 数据基本处理与质控 (6) 3.2 全基因组甲基化水平分析 (8) 3.3 甲基化C碱基中CG, CHG 与CHH的分布比例 (9) 3.4 甲基化CG、CHG和CHH的甲基化水平分布 (10) 3.5 甲基化的CG,CHG,CHH附近碱基的序列特征分析 (10) 3.6 染色体水平的甲基化C碱基密度分布 (11) 3.7 基因组的不同区域的甲基化分布特征 (11) 3.8 基因组不同转录元件中的DNA平均甲基化水平 (12) 3.9 DMR的检测 (12) 3.10 DMR相关基因的GO和Pathway分析 (14) 四、参考文献 (15)

一、分析方法 1.1 全基因组甲基化测序 首先采用Covaris聚焦超声仪对合格的DNA样品进行打断。加入End Repair Mix置于20℃ 30分钟进行末端修复后,用QIA quick PCR Purification Kit(Qiagen)纯化DNA片段。使用A-Tailing Mix置于37℃ 30分钟在3’末端加A碱基,然后在DNA片段两端连接上测序接头。采用EZ DNA Methylation-Gold kit(ZYMO)进行Bisulfite处理,使用2%琼脂糖凝胶进行片段选择,并使用QIA quick Gel Extraction kit (QIAGEN)回收目标片段。最后使用Agilent 2100 Bioanaylzer和ABI StepOnePlus Real-Time PCR System对样品文库进行质控与定量。合格文库采用Illumina平台进行测序。 1.2 生物信息分析概述 得到下机数据后,首先进行数据过滤,去掉低质量数据,得到可用数据。完成数据过滤后,需检测可用数据量是否符合合同要求。检测合格后,将可用数据与参考基因组进行比对,得到比对结果。在确认比对质量合格后,使用唯一比对数据计算得到全基因组C碱基甲基化信息,进行信息分析处理,得到标准信息分析结果和个性化分析结果。 1.3 数据过滤 数据过滤包括去、污染以及低质量序列。数据过滤分析使用华自主的分析软件,低质量的reads包括以下两类,符合任意一条的都会被剔除: 1) N > 10%; 2) 质量值小于20的碱基>10%。 完成过滤后的reads称为clean reads,这些数据存储为FASTQ格式(参见帮助页中的FASTQ格式)。 1.4 序列比对 过滤完成后,clean data与参考基因组进行比对(BSMAP),并计算每个样品的比对率和bisulfite转化率等统计信息。 1.5 甲基化水平 甲基化水平是支持甲基化的reads数占所有覆盖该位点的reads数的比例[3]。计算公式如下: Nm为改为点是甲基化C的reads数,Nnm为该位点是非甲基化C的reads数。

进化基因组学研究进展

进化基因组学研究进展 刘超 (山东大学生命科学学院济南250100) 摘要:进化基因组学是利用基因组数据研究差异基因功能、生物系统演化、从基因在水平探索生物进化的学科。随着近年来基因组数据的不断增加,进化基因组学得到了长足的发展。进化基因组学主要包括从基因组水平理解和诠释生物进化和新基因分析研究探索两方面的内容。本文介绍了进化基因组学研究的主要内容和较为常用的方法,以及近年来在细菌、酵母、果蝇进化基因组学方面的研究进展。 关键词:进化基因组学系统进化比较基因组学新基因 前言 随着基因测序技术的不断进步以及基因组学的飞速的发展,人们积累了大量的基因组学数据,利用所得的大量的基因组数据与进化生物学相结合,在基因组水平研究生物进化机制,随即产生了进化基因组学(Evolutional Genomics)。 近年来进化基因组学取得了长足的进展,在研究差异基因功能、生物系统演化、从基因在水平探索生物进化的终极方式等方面有重大突破,对人类理解生命现象和过程有重要作用。 1进化基因组学研究内容 研究系统进化学通常包括两个关键步骤:一方面,在不同物种中鉴定同源性特佂,另一方面利用构建系统进化树的方法比较这些特征,进而重新构建这些物种的进化历史[1]。针对这两个关键步骤,传统系统进化学,常采用基于形态学数据和单个基因研究的同源性状鉴定和重建系统进化树(常包括距离法、最大简约法、概率法)[1]的方法来研究。在目前拥有丰富基因组数据的条件下,我们可以分析基因组数据,利用进化基因组学研究系统进化。

目前进化基因组学的研究内容主要集中于两个方面:(1)在比较不同生物的基因数据的基础上,从基因组水平理解和诠释生物进化;(2)通过对新基因的分析研究探索基因进化过程的规律两个方面[2](如图1)。在进行全基因组进化分析方面,进化基因组学主要集中于构建系统进化树、研究基因组进化策略、研究生物功能变化和进化机制、进化和生态功能基因组学[2]、基因注释的等方面;在新基因方面主要分析基因产生机制和新基因固定及其动力学研究。 图1 进化基因组学主要研究内容 目前进化基因组学的研究有力的解决了一些基础性的进化问题,但也出现了一些未来需要急需解决的挑战。例如生物进化的本质和目前重建系统进化树方法的限制[1]。 2研究进化基因组学的方法 研究进化基因组学的方法主要包括利用基因组数据分析和研究新基因的产生和演化两种。 2.1利用基因组数据进行系统进化分析 利用基因组数据进行系统进化分析,常有基于基因序列的方法和基于全基因特征的方法。(如图2)

下一代DNA测序技术研究进展综述

深度DNA测序技术在基因组测序中的研究策略和进展 摘要:回顾了经典DNA测序技术原理,重点阐述了深度测序技术在基因组测序中的研究策略,并结合目前比较常见的二代测序仪来分析比较相互之间的特点和优势,最后,对即将到来的三代测序法的研究进展给予了简单的介绍。 关键词:深度DNA测序基因组测序仪 DNA测序技术的发展过程漫长而艰辛,然而,我们现在获取的大部分DNA序列信息还是依靠基于Sanger在1977年建立的“DNA双脱氧链末端终止测序法”的DNA测序技术获得的。另外就是Maxam和Gilbert建立的“化学降解测序法”。在过去的七年当中,DNA测序技术的发展至少受到来自四个方面的影响:首先是人类基因组计划的出现,这项计划的实施过程中,科学家们面临了巨大的经费问题,因为传统的Sanger测序法无论怎么优化,都无法大幅度降低测序的成本,这很大程度促进了人们对在测序过程中如何降低成本的技术方面的研究。第二,人类以及其他主要模式生物参考序列数据库的建立使得短片段阅读(short-read)成为可能,这极大的促进了短片段测序技术的发展。第三,新型分子生物学技术的不断涌现导致了越来越多的诸如RNA表达染色体构象等生物现象的出现,这就需要有高通量DNA测序手段去解释这些问题,这也极大的促进了新型测序技术的发展。第四,其他学科领域的技术的发展,例如计算机技术,数据存储及分析技术,聚合酶工程技术等,极大地支持了DNA测序技术的应用。本文主要是对目前新一代DNA测序(也叫深度测序)技术(Next-generation DNA sequencing technologies)的研究策略及目前国际DNA测序最新进展做一简要的综述。 1.Sanger测序法 先来回顾一下经典的DNA测序法,从上世纪九十年代早期开始,几乎所有的DNA测序都是利用半自动化的毛细管电泳Sanger测序技术完成的(图1-a)。后来出现了高通量测序法,这种方法首先要对DNA预处理,获取大量的待测序模板即质粒或PCR产物。然后在测序一种发生测序生化反应,这个过程会产生大量长短不一(因为终止位点不一样),末端被荧光标记的延伸产物。再用分辨率高的毛细管凝胶电泳分离这些延伸产物,通过对延伸产物末端四种不同荧光颜色的区分,利用计算机软件自动“读

基因甲基化检测

基因甲基化检测 甲基化是在DNA甲基转移酶(DNA Methyltransferase, DNMT)催化作用下, 利用S-腺苷甲硫氨酸(S-adenosylmethionine, SAM)提供甲基,在CpG二核苷酸中胞嘧啶嘧啶环的五号碳原子上加上甲基的共价修饰过程. DNA甲基化是表观遗传修饰的主要方式,它不改变DNA的一级结构,却在细胞的发育、基因的表达、及基因组的稳定性中起着重要的作用。 CpG岛的高甲基化是肿瘤中存在的普遍现象,而启动子CpG 岛的高甲基化是除突变和缺失外肿瘤中抑癌基因失活的第三种机制。 因此,基因启动子甲基化检测在临床诊断(如甲基化检测与低剂量CT相结合)、药物敏感性检测等方面具有很高的应用价值。 目前甲基化特异性PCR(Methylmion Specific PCR,MSP)及其改进方法是检测基因甲基化的经典方法.MSP法的原理是首先用亚硫酸氢钠修饰处理基因组DNA,所有未发生甲基化的胞嘧啶都被转化为尿嘧啶,而甲基化的胞嘧啶则不变。然后设计针对甲基化和非甲基化序列的引物并进行聚合酶链反应(PCR)扩增,最后通过琼脂糖凝胶电泳分析,确定与引物互补的DNA 序列的甲基化状态。MSP法灵敏度较高,应用范围广。 一. MSP实验流程: 1.基因组抽提; 2.基因组DNA定量; 3.重亚硫酸盐转化(C转化为U),本步实验至关重要,转化效率高低直接影响实验结果,所以, 需要实验者在实验过程中不断摸索合适的实验条件以确保较高的转化效率; 4.引物设计(每个基因设计两对引物,分别为:甲基化引物M,非基因化引物U,对应扩增甲 基化和非甲基化的目的片段),有时需设计巢式引物; 5.PCR扩增:对甲基化和非甲基化的目的片段分别扩增,此时尽可能使用梯度PCR仪,可以同 时使用不同的退火温度,以筛选合适的退火温度; 6.PCR产物电泳; 7.电泳结果分析(定性即有无甲基化,半定量即甲基化程度高低)。 图1:MSP PCR产物电泳图

DNA甲基化的总结

DNA甲基化是指在DNA甲基转移酶(DNMTs)的催化下,将甲基基团转移到胞嘧啶碱基上的一种修饰方式。它主要发生在富含双核苷酸CpG岛的区域,在人类基因组中有近5万个CpG岛[5]。正常情况下CpG岛是以非甲基化形式(活跃形式)存在的,DNA甲基化可导致基因表达沉默。DNMTs的活性异常与疾病有密切的关系,例如位于染色体上的DNMT3B基因突变可导致ICF综合征。有报道[6]表明,重度女性侵袭性牙周炎的发生与2条X染色体上TMP1基因去甲基化比例增高有关。DNMT基因的过量表达与精神分裂症和情绪障碍等精神疾病的发生也密切相关。风湿性疾病等自身免疫性疾病特别是系统性红斑狼疮(SLE)与DNA甲基化之间关系已经确定[7],在SLE病人的T细胞发现DNMTs活性降低导致的异常低甲基化。启动子区的CpG岛过度甲基化使抑癌基因沉默,基因组总体甲基化水平降低导致一些在正常情况下受到抑制的基因如癌基因被激活[8],都会导致细胞癌变。 甲基化作用是转录水平上表达调控的基本方式之一。由于宿主细胞基因组DNA中不 同位点的甲基化程度存在某种平衡,并形成一定的空间结构特点。一旦转基因的整合破坏了这种平衡及空间特征,破坏后的结构便成为宿主基因组防御系统识别的信号,使新整合的DNA 序列发生不同程度的甲基化,甲基化基因序列则通过抑制甲基化DNA结合蛋白(MeCP2)的结合而抑制转录的顺利进行Ⅲo。在拟南芥中发现了DNA甲基化可以导致基因沉默汹埘]。在基因沉默过程中,外源或内源性信号引起部分DNA序列中CpG的甲基化,甲基化CpG结合域蛋白2(MeCP2)结合到甲基化的胞嘧啶上聚集HDACs使组蛋白去乙酰化,该蛋白与去乙酰化的组蛋白通过聚集更多的DNA 甲基转移酶来加强沉默信号,从而引起基因沉默H?。 ?。DNA甲基化对染色质结构和基因表达的作用很可能是通过一组蛋白介导的,这些蛋白可能含有共同的高度保守的甲基化的CpG结合结构域(MBD)L45 J。DNA甲基化在基因印记、x染色体失活、某些疾病的发生发展中发挥重要作用。其直接作用机制可能是CpG岛甲基化干扰了一些转录因子(transcription factor,TF)与基因调控区的结合,使甲基从DNA分子大沟中突出,从而阻止转录 因子与基因相互作用。间接机制可能是由于甲基化DNA与甲基化DNA结合蛋白结合或DNA甲基化改变染色质结构,这2种情况都间接阻碍TF与DNA结合从而抑制转录m1。DNA甲基化一般是通过转录抑制机制来调节特定基因的,具体的机制可能有:5一MeC伸入DNA双螺旋大沟,影响转录因子的结合;序列特异的甲基化DNA结合蛋白(MDBP一1,MDBP一2)与甲基化的启动子序列特异性结合而抑制转录因子与靶序列的结合;甲基化CpG结合蛋白(MeCPl,MeCP2)与甲基化的二核苷酸CpG结合,发挥类似转录抑制蛋白的作用H“。一般DNA甲基化会通过干扰转录因子与识别位点结合和招募组蛋白乙酰转移酶(histon acefltransfeI"SeS,HATs)、组蛋白去乙酰化酶(histone deacetylases,HDACs)形成辅助阻遏复合体,使基因沉默而抑制其表达,而去甲基化则使沉默的基因重新激活Ⅲ卜 DNA甲基化尤其是基因启动子区CpG岛的高甲基化,会导致基因表达的下降或沉默。甲基化抑制基因的表达目前认为要有两个方面,一方面甲基化引起的基因结构改变可直接阻碍一些转录因子与其结合位的结合;另一方面可能与一些甲基化

DNA甲基化详解

提到遗传,我们都已经习惯于这样的概念,即基因组的编码信息存在于ACGT 这四种碱基的排列顺序中。然而,诸如胞嘧啶的甲基化修饰及其分布,组蛋白的乙酰化等,同样影响着表型。这就构成了表观遗传学(epigenetics)的主要研究内容。其实,早在1942年,C.H.Waddinton就提出了表观遗传学的概念,他指出,表观遗传与遗传相对,主要研究基因型和表型的关系。而现在,对于表观遗传学,比较统一的认识是,其研究在没有细胞核DNA序列改变的情况时,基因功能的可逆的可遗传的改变。也就是说,在不改变基因组序列的前提下,通过DNA 和组蛋白的修饰等来调控基因表达,其中又以DNA甲基化(DNA methylation)最为常见,成为表观遗传学的重要组成部分。随着人类基因组计划的开展,科学家们开始在基因组水平来研究表观遗传学,逐步形成表观基因组学(epigenomics)。表观基因组学就是要在整个基因组水平来研究表观遗传过程以及与这些过程密切相关的特定基因组区域的识别与鉴定。2000年10月,人类表观基因组协会(Human Epigenome Consortium)由欧盟赞助,启动了旨在于人类6号染色体MHC 区域首先做出DNA的甲基化图谱的先导计划(Pilot Project)。该计划顺利完成,引导启动了2003年的人类表观基因组计划(Human Epigenome Project,HEP)。2005年,美国国家卫生院(NIH)下属的国立癌症研究所启动了癌症基因组先导计划。2006年,该所与国立人类基因组研究所一起共同启动癌症基因组计划(Cancer Genome Project)。表观基因组学和DNA甲基化与癌症的研究成为新的热点。本文将简要介绍DNA甲基化与CpG岛,癌症与DNA甲基化,和DNA甲基化的重要检测方法。DNA甲基化与CpG岛:在人类表观遗传学研究中,最常见的就是CpG二核苷酸中胞嘧啶的甲基化修饰。其主要过程是,在CpG甲基化结合蛋白(Methyl-CpG Binding Proteins,MBDs) 和DNA甲基化转移酶(DNA methyltransferases, DNMTs)的作用下,使CpG二核苷酸5’端的胞嘧啶转变成为5’甲基胞嘧啶。在正常人类的DNA中,约有3-6%的胞嘧啶被甲基化。在哺乳动物中,约有50,000,000个CpG二核苷酸,其中70%的被甲基化。而那些可被甲基化的CpG 二核苷酸并非随机的分布于基因组序列中,相反,在基因组的某些区域中,通常是基因的启动子区域,5’端非翻译区和第一个外显子区,CpG 序列密度非常高,超过均值5倍以上,成为鸟嘌呤和胞嘧啶的富集区,称之为CpG岛(CpG Islands, CGIs)。CpG岛的概念最早由Adrian Bird提出,他称之为

相关文档