文档库 最新最全的文档下载
当前位置:文档库 › DNA序列测定

DNA序列测定

DNA序列测定
DNA序列测定

第四节DNA序列测定

目前应用的两种快速序列测定技术是Sanger等(1977)提出的酶法(双脱氧链终止法)和Maxam(1977)提出的化学降解法。虽然其原理大相径庭,但这两种方法都同样生成相互独立的若干组带放射性标记的寡核苷酸,每组核苷酸都有共同的起点,却随机终止于一种(或多种)特定的残基,形成一系列以某一特定核苷酸为末端的长度各不相同的寡核苷酸混合物,这些寡核苷酸的长度由这个特定碱基在待测DNA片段上的位置所决定。然后通过高分辨率的变性聚丙烯酰胺凝胶电泳,经放射自显影后,从放射自显影胶片上直接读出待测DNA上的核苷酸顺序。

高分辨率变性聚丙烯酰胺凝胶电泳亦是DNA序列测定技术的重要基础,可分离仅差一个核苷酸、长度达300~500个核苷酸的单链DNA分子。DNA序列测定的简便方法为详细分析大量基因组的结构和功能奠定了基础,时至今日,绝大多数蛋白质氨基酸序列都是根据基因或cDNA的核苷酸序列推导出来的。

除传统的双脱氧链终止法和化学降解法外,自动化测序实际上已成为当今DNA序列分析的主流。此外,新的测序方法亦在不断出现,如上世纪90年代提出的杂交测序法(sequencing by hybridization,SBH)等。

一、双脱氧末端终止法测序

㈠原理

双脱氧末端终止法是Sanger等在加减法测序的基础上发展而来的。

1980年他又因设计出一种测定DNA(脱氧核糖核酸)内核苷酸排列顺序的方法而与W·吉尔伯特、P·伯格共获1980年诺贝尔化学奖。桑格是第四位两次获此殊荣的科学家。

其原理是:利用大肠杆菌DNA聚合酶Ⅰ,以单链DNA为模板,并以与模板事先结合的寡聚核苷酸为引物,根据碱基配对原则将脱氧核苷三磷酸(dNTP)底物的5′-磷酸基团与引物的3′-OH末端生成3′,5′-磷酸二酯键。通过这种磷酸二酯键的不断形成,新的互补DNA得以从5′→3′延伸。Sanger引入了双脱氧核苷三磷酸(ddTNP)作为链终止剂。ddTNP比普通的dNTP在3′位置缺

少一个羟基(2′,3′-ddNTP )(图7-4-1),可以通过其5′三磷酸基团掺入到正在增长的DNA 链中,但由于缺少3′-OH ,不能同后续的dNTP 形成3′,5′-磷酸二酯键。因此,正在增长的DNA 链不再延伸,使这条链的延伸终止于这个异常的核苷酸处。这样,在4组独立的酶反应体系中,在4种dNTP 混合底物中分别加入4种ddNTP 中的一种后,链的持续延伸将与随机发生却十分特异的链终止展开竞争,在掺入ddTNP 的位置链延伸终止。结果产生4组分别终止于模板链的每一个A 、每一个C 、每个G 和每一个T 位置上的一系列长度的核苷酸链。通过高分辨率变性聚丙烯酰胺凝胶电泳,从放射自显影胶片上直接读出DNA 上的核苷酸顺序。双脱氧链终止法测序原理如图7-4-2所示。

P O P O O

O

H O

O

P 1'

α

β

γ

P O P O O

O

H O

O

P 1'

α

β

γ

dNTP

ddNTP

图7-4-1 脱氧核苷三磷酸和双脱氧核苷三磷酸分子结构

5′GAGTCACACTTGAC —— 3′待测单链DNA

3′CTG — 5′引物、Klenow 酶、 dA TP 、dGTP 、dCTP 、dTTP 和少量α-32P-dA TP

加ddA TP 反应 3'ACTG — 5' 3'AACTG — 5'

3'AGTGTGAACTG — 5'

加ddCTP 反应

3'CAGTGTGAACTG — 5' 3'CTCAGTGTGAACTG — 5'

加ddTTP 反应 3'TGAACTG — 5' 3'TGTGAACTG — 5'

3'TCAGTGTGAACTG — 5'

加ddGTP 反应 3'GAACTG — 5' 3'GTGAACTG — 5' 3'GTGTGAACTG — 5'

图7-4-2 双脱氧链终止法测序原理

㈡ 模板

有两种类型的DNA 模板可以作为Sanger 法测序的模板,即纯化的单链DNA 和经热变性或碱变性的双链DNA 。

1.单链DNA 模板 在一般情况下,可将靶DNA 片段克隆于M13mp 载体,从重组克隆M13mp 系列噬菌体颗粒中分离得到的单链DNA 模板。这种单链模板效果最佳,只要细心掌握模板与引物的最佳比例,有经验的测序人员通过一次末端终止反应,能读取500个以上的核苷酸序列。

2.经热变性或碱变性的双链DNA 模板 尽管采用变性双链DNA 作测序模板显然简单且方便,但实际上很难获得单链模板那样的满意结果。利用双链质粒模板测序,其中有两个至关重要的因素,即模板的质量和聚合酶的种类。用小量制备的质粒DNA 来测定未知序列的DNA 克隆往往因为有污染而并不可取,高

G A G T C A C A C T T 测序图谱识读

变性凝胶电泳、 放射自显影

A T C G 5′

3′

纯度的质粒最好采用氯化铯-溴乙锭梯度平衡超速离心法制备。其次是应采用高质量的聚合酶。一次末端终止反应亦可能读出300核苷酸序列。应该注意的是,适合做双链模板的质粒,最好具有较高的拷贝数并有插入失活的选择标志,有配套的通用引物结合区。最常用的载体系统是pUC系列、pGEM系列及Bluescript 系列等。双链模板测序最大的优势是对已知序列DNA的亚克隆进行鉴定,可省略再经M13载体亚克隆获取单链模板过程。

㈢引物

酶法测序反应中都有一个与模板链特定序列互补的合成的寡核苷酸作为DNA合成的引物。不管是将靶DNA片段克隆于M13mp载体获取的单链DNA 作模板,还是采用变性双链DNA(如变性质粒DNA)模板,都有可以与位于靶DNA侧翼的载体序列相退火的通用引物(universal primer)可用,而不必另行设计与未知DNA序列互补的引物。适合于M13mp系列载体的通用引物一般长15~29个核苷酸,当然这些引物也同样适用于那些克隆于pUC系列质粒的DNA 进行双链测序。这些测序用的通用质粒及其通用引物可直接从许多厂商购买到。

㈣DNA聚合酶

如前所述,选用合适的DNA聚合酶进行测序反应也是保证测序质量的重要因素之一。常用于双脱氧末端终止法测序的有几种不同的酶:

1.大肠杆菌DNA聚合酶Ⅰ大片段(Klenow片段)此酶是最早用于建立Sanger测序的酶。但通常会有两个问题:①Klenow片段的持续合成能力较低,通常只能得到约250~350个核苷酸的序列,而且由于聚合酶随机从模板上解离而终止链延伸,通常会产生较高的本底和假带;②对同聚核苷酸段或其他含牢固二级结构的区域复制效能低下。但此酶价格便宜,对已知序列的亚克隆进行鉴定仍有应用价值。

2.测序酶(sequenase)该酶是一种经过化学修饰的T7噬菌体DNA聚合酶,其原来很强的3′→5′外切酶活性,经化学修饰后大部分被消除。目前常用的测序酶大都是基因工程产品,完全缺失3′→5′外切酶活性,具有活性非常稳定可靠、持续合成能力强和聚合速度高等优点,是测定较长DNA的首选酶。市售的各种以该酶为基础的测序试剂盒,效果甚佳。

3.耐热DNA聚合酶PCR技术的应用正在不断扩大,耐热DNA聚合酶应

用于以Sanger双脱氧链终止法为基础的DNA测序方案,已发展成为被称为“循环测序”或“线性扩增测序”方法。在该类测序方法中,由于使用了耐热DNA 聚合酶,与其他DNA聚合酶相比较具有二大优点。其一,由于采用热循环方法线性扩增模板DNA,获得清晰可辨的序列梯带所需要的模板DNA量少;其二,由于,耐热DNA聚合酶可在95℃高温下保持稳定,测序反应可以在高温(70~80℃)下进行。因而能克服富含GC序列的模板形成自身二级结构对测序的影响。因此,循环法可以方便地对PCR产物、质粒DNA、λDNA和粘粒DNA 等双链模板进行序列测定,特别有利于对高GC碱基含量的模板测序。

循环测序法利用了热循环仪的自动循环的高效能力。循环测序反应与普通PCR反应有所不同。只需一条引物,通过单引物进行热循环,模板DNA以线性方式被扩增,而不是标准PCR的指数方式扩增;反应底物除四种脱氧核苷三磷酸(dNTP)外,还加入了双脱氧核苷三磷酸(ddNTP),进行扩增时,链的延伸终止于掺入ddNTP的位置,产生分别终止于不同核苷酸的一系列不同长度的扩增片段。

㈤放射性标记

传统的DNA测序方法都采用α-32P-dNTP作为放射性标记物,但由于32P发射的高能β射线,常会引起二个问题。首先是导致放射自显影图谱条带扩散、分辨率低,限制了识读序列的数量和准确性。其次是32P衰变会导致DNA样品分解,通常都应在测序反应后24h内进行电泳,否则无法获得好的结果。

近年来α-35S-dNTP被广泛采用,是由于35S产生较弱的β射线,克服了32P 的二大缺点。放射自显影图谱具有较高的分辨率和较低的本底,测序反应产物可在-20℃保存一周,而分辨率并不下降。

㈥关于DNA序列的识读

DNA序列的识读是一个熟能生巧的过程。注意几点技巧:①在显影前后一定要注意标明模板名称、日期和测序人等,并标明各套反应位置;②识读时从显而易见的特征序列开始,如连续的同聚核苷酸(如TTTTT、AAAAA)或交替出现的嘌呤和嘧啶(如GTGTGTGT),一旦找到这种序列,便可较快地确定目的序列的位置。

二、Maxam-Gilbert 化学降解法测序

几乎在双脱氧法发展的同时,1977年Maxam-Gilbert 等提出了化学降解法。自Maxam-Gilbert 初次提出以来,其实验方案基本上没有变化。

㈠ 原理

化学降解法与包括合成反应的链终止法不同,需要对原DNA 进行化学降解。其基本原理是,首先对待测DNA 末端进行放射性标记,再通过5组(也可以是4组)相互独立的化学反应分别得到部分降解产物,其中每一组反应特异性地针对某一种或某一类碱基进行切割。因此,产生5 组(或4组)不同长度的放射性标记的DNA 片段,每组中的每个片段都有放射性标记的共同起点,但长度取决于该组反应针对的碱基在原样品DNA 分子上的位置。此后各组反应物通过聚丙烯酰胺凝胶电泳进行分离,通过放射自显影检测末端标记的分子,并直接读取待测DNA 片段的核苷酸序列。测序原理如图7-4-3所示。

图7-4-3 化学裂解法测序原理

㈡待测DNA的末端标记

化学降解法测序首先要制备单侧末端标记的待测DNA片段。DNA片段的核素标记有三种方法:

1.利用T4噬菌体多核苷酸激酶和γ-32P-ATP标记DNA的5ˊ-末端对于去5′-磷酸化的DNA片段,T4噬菌体多核苷酸激酶可以通过正向反应将γ-32P-ATP的γ-磷酸基转移至DNA的5ˊ-末端;对于5′-磷酸化的DNA片段,在过量ATP条件下,该酶可以通过交换反应将γ-32P-ATP的γ-磷酸基与DNA 的5ˊ-末端磷酸基发生交换反应而标记。但对于双链DNA片段,由于DNA的两侧均被标记,不能直接用于测序反应。需要经限制性内切酶切割,电泳分离二种不同大小的标记片段,或者直接用变性聚丙烯酰胺凝胶电泳分离二条单链,但这种分离方法比较困难,较少使用。

2.利用末端转移酶和α-32P-ddNTP标记DNA的3ˊ-末端在二价阳离子存在下,末端转移酶催化dNTP加入DNA分子的3ˊ-羟基末端,如果作为底物的核苷酸经过修饰(如ddNTP),则可以在DNA的3ˊ-OH上仅加入一个核苷酸。对于双链DNA片段,亦存在DNA的两侧均被标记问题,可通过上述同样的方法分离。

图7-4-4 对双链DNA进行不对称标记的常用方法

3.利用Klenow片段和α-32P-dNTP对限制性内切酶产生的3ˊ-凹进末端进行标记这种方法能直接制备单侧末端标记的DNA,但要求待测DNA能满足下列条件之一:①DNA两端的一侧为3ˊ-凹进末端,而另一侧为平端或3ˊ-凸出末端;②两端虽均为3ˊ-凹进末端但末端单链结构不同,这时可选择不同的γ-32P-NTP来实现末端标记。这是对双链DNA进行不对称标记的常用方法,如图7-4-4所示。

CS载体系列(CS是chemical sequecing的缩写)是专门为化学降解法测序进行末端标记而构建的一类克隆载体,如pSP64CS和pSP65CS。这类载体最重要的特点是,在待测DNA克隆片段的附近有两个可被限制性酶Tth111识别的典型位点(GACN↓NNGTC,不对称),能在克隆DNA片段两侧不同的3ˊ-凹进末端,从而方便地实现对待测DNA的单侧标记。

值得特别注意的是,化学降解法对标记的待测DNA纯度有较高的要求,因为盐浓度会干扰肼对胸腺嘧啶的修饰,也会抑制A+G反应中的去嘌呤过程。因此,标记的DNA一般要经酚/氯仿抽提、70%乙醇洗涤除盐,并用去离子水溶解而不用TE缓冲液。

㈢碱基特异的化学切割反应

在化学降解法中,专门用来对核苷酸作化学修饰并打开碱基环的化学试剂主要有肼(hydrazine)和二硫酸甲酯(dimethylsulphate)。

肼又叫联氨(NH2-NH2),在碱性条件下,能作用于T/C的C4和/或C6原子位置,并同C4-C5-C6环化形成一种新的五元环。肼进一步作用释放出吡唑啉酮环。在六氢吡啶的作用下,通过β消除反应,该碱基两端的磷酸基团便会以磷酸分子形式从糖环上释放出来,从而导致在这个核苷酸位置上发生DNA断裂如果在此反应体系中加入1mol/L浓度的盐,则肼同T的反应速率会下降,便可发生C特异的化学切割反应。因此,可以根据这一特点来区别C和C+T这2种化学切割反应。化学反应过程如图7-4-5所示。

二硫酸甲酯[(CH3O)2SO2],能使DNA碱基环中的氮原子发生甲基化反应。在DNA测序分析中所涉及的甲基化位点是G的N7原子和A的N3原子。在中性pH环境中,这2种碱基的甲基化作用,都足以导致其糖苷键发生水解作用,

而留下失去碱基的糖-磷酸骨架。再通过碱催化的β-消除反应水解无碱基糖环两端的磷酸二酯键,造成DNA 在此位点发生断裂。同时,已知DNA 中G 的N7原子甲基化速率比A 的N3原子快4~10倍,故在中性条件下水解速率G 位置也比A 位置要快得多(差4~6倍),这是早期Maxam-Gilbert 化学降解法测序辨别DNA 中G 和A 的基本依据。现行的化学裂解反应,都采用六氢吡啶与DNA 中的甲基化碱基反应,且这种反应对甲基化的G 是特异的,因此这种DNA 链的断裂也仅发生在G 残基位点。化学反应过程如图7-4-6所示。

化学反应设有5组独立的反应:G 反应(在G 残基上的裂解)、A+G 反应(在嘌呤残基上的裂解)、C+T 反应(在嘧啶残基上的裂解)、C 反应(在C 残基上的裂解)和A >C 反应(在A 和C 残基上的裂解),A >C 反应也可以不做。

—O

OH

O

P 3

5'

5'

O NH 25'

5'

3'

—O

O P NH 2P O

+

—O OH

O

P

H

N H

CH

CH CH C N

+

C H 2OH

P O

OH

O H P —O

H O P O

OH

OH

—O

+

5'

3'

图7-4-5 联氨和六氢吡啶在胸腺嘧啶残基位点切割DNA 的化学过程

O

—O

O P P O

H O

H 25'

3'O

—O

OH

O P P O

H O

O—

H 25'

3'

O

O P P O

H O

O—

N

H 233'

NH 2

N

N

H N

N

H 2O

CH 3CHO

O —O

O P P O

H O

N

+

+

OH —

N

+

CH CH CH

C

C

H 2OH +

P O

OH O

H 5'

3'

P O OH OH —O

+

5'

3'图7-4-6 硫酸二甲酯和六氢吡啶在鸟嘌呤残基位点切割DNA 的化学过程

㈣ 测序图谱的识读

对于测序电泳图谱的识读,化学降解法测序要比末端终止法较为复杂,因为化学裂解反应并非是完全绝对碱基特异的。每组测序图谱为5条或4条(A >C 反应可以不做)泳道。需要通过从C+T 泳道出现的条带中扣除C 泳道的条带而推断T 残基的存在。类似地,A 残基的位置也要通过从A+G 泳道中扣除G 泳道的条带推断出来。同时,如果A >C 泳道中出现较强的条带,则可确证A 残基的存在。

实际读片时从胶片底部一个个地向顶部读取。从下至上,一个一个地从G+A 泳道和C+T 泳道二个列中确定只相差一个碱基的条带。如果在G+A 泳道中出现一条带,就看G 泳道中是否有相同大小的带,如果有即为G 碱基,如果没有则为A 碱基;同样,在C+T 泳道中出现的条带,就检查C 泳道中有无同样大小的条带,如果有即为C ,无则为T 。如果做了A >C 反应,在该列中出现较强的条带时,可帮助A 的确定。

㈤ 化学降解法测序的优点

在化学降解法与链终止法问世之初,利用化学降解法进行测序不仅重复性更高,而且由于只需要简单的化学试剂和一般的实验条件,易为普通实验室和研究人员所掌握。而链终止法需要单链模板、特异的寡核苷酸引物和高质量的大肠杆

菌DNA聚合酶Ⅰ大片段(Klenow片段),这在二十世纪八十年代一般的实验室很难做到。但随着M13mp载体的发展、DNA合成技术的进步及Sanger法测序反应的不断完善,至今DNA测序已大都采用Sanger法进行。然而,Maxam-Gilbert 法可对合成的寡核苷酸进行测序,可以分析DNA甲基化修饰情况,还可以通过化学保护及修饰等干扰实验来研究DNA的二级结构和DNA与蛋白质的相互作用,这些仍然是Maxam-Gilbert法所独具的鲜明特点。

当然,如同双脱氧终止法一样,化学降解法测序的主要限制因素也是测序凝胶的分辨能力。化学测序法一般都用32P标记,所以与用32S标记作标记的末端终止法相比,它显示的条带较宽且有扩散现象,这限制了化学降解法在对较大DNA片段测序时的分辨能力。一般一块电泳胶上最多能读出200~250核苷酸序列。然而,如果按2个相反的取向分别从DNA片段的两端进行测序,则可克服这一不足。

三、DNA序列分析的自动化

双脱氧终止法和化学降解法自1997年提出并的逐渐完善,无疑是目前公认的二种最通用、最有效的DNA序列分析方法,Sanger、Maxam和Gilbert等人也因此分享了1979年度诺贝尔化学奖。但实际操作中都存在一些共同的问题,如放射性核素的污染,操作步骤繁琐、效率低和速度慢等缺点,特别是结果判断的读片过程实在是费时又乏味的工作。随着计算机软件技术、仪器制造和分子生物学研究的迅速发展,DNA自动化测序技术取得了突破性进展,以其简单(自动化)、安全(非同位素)、精确(计算机控制)和快速等优点,已成为今天DNA 序列分析的主流。

DNA序列分析的自动化包括两个方面的内容,一是指“分析反应”的自动化,更重要的一方面则是指反应产物(标记DNA片段)分析的自动化。虽然各种DNA自动测序系统差别很大,但Sanger法所采用的DNA聚合酶和双脱氧核苷酸链终止的原理,亦是现今自动化测序的最佳选择方案。即大都沿用Sanger 的双脱氧核苷酸链终止法原理进行测序反应,主要的差别在于非放射性标记物和反应产物(标记DNA片段)分析系统。仅举例简介其基本原理:㈠ALF全自动激光荧光DNA测序系统

ALF自动DNA测序系统,是由德国海德堡欧洲分子生物学实验室(EMBL)等提出和设计的。该系统采用非放射性的单一Cy5荧光素标记测序引物。沿用双脱氧链终止法进行反应,分别生成4组终止于不同种类碱基、带有Cy5荧光素标记的DNA片段。A、G、C和T四组反应物在变性凝胶上电泳,每个泳道都有一个由激光枪和探测器组成的检测装置,当Cy5荧光素标记的DNA条带迁移至探测区并遇上激光时,荧光标记被激活并释放出光信号,光信号由光探测器接收;最后电脑将收集到的信号(原始数据)进行处理,获得样品DNA的最终序列。

ALF系统包括电源、电泳系统、探测系统、驱控系统(计算机)和输出设备(绘图仪)等。与传统的手工操作测序相比,ALF系统能直接获取原始数据并及时加以处理。该系统在仪器硬件和驱动软件的设计上都进行了不断的改进,近年推出了ALF express TM全自动激光荧光DNA测序仪。该仪器设计独特,可提供快速可靠的核酸测序、片段分析和突变检测。目前广泛应用于人类基因组计划,在此种大规模序列测定中,该仪器起到了重要的初筛作用。

㈡ABI型全自动DNA测序仪

ABI测序仪是由Perkin Elmer(PE公司)推出的DNA自动化测序仪。其特点是采用专利的4种荧光染料分别标记终止物ddNTP或引物,经Sanger测序反应后,反应产物3′端(标记终止物法)或5′端(标记引物法)带有不同的荧光标记。一个样品的4个测序反应产物可在同一泳道内电泳,从而降低测序泳道间迁移率差异对精确性的影响。通过电泳将各个荧光标记片段分开,同时激光检测器同步扫描,激发的荧光经光栅分光,以区分代表不同碱基信息的不同颜色的荧光,并在CCD(charge-coupled device)摄影机上同步成像。电脑可在电泳过程中对仪器运行情况进行同步检测,结果能以电泳图谱、荧光吸收峰图或碱基排列顺序等多种方式输出。

ABI测序仪包括电泳系统、激光检测装置、power Macintosh型苹果电脑、HP1600CM型彩色打印机、DNA序列分析软件以及DNA片段大小和定量分析软件(Gene Scan TM)。该系统采用电脑单点控制整个DNA测序仪,包括电泳参数设置、数据收集、数据分析及结果输出等。目前PE公司已生产出377,373,310和3700型DNA测序仪。377型全自动DNA测序仪为最新产品,具有可一次测

定多个样品(64个以上)、测序精确度高和每个样品判读序列长(约700bp)等优点。测序速度高达200bp/h,比373型效率提高了许多。

ABI测序仪在人类基因组测序和cDNA测序研究中应用最为广泛。此外,亦可以使用各种辅助软件进行DNA定量分析和大小分析,故可广泛应用于基因突变分析(SSCP)、DNA指纹图谱分析、基因连锁图谱分析及基因表达水平分析等。

四、测序策略

尽管核酸序列测定方法越来越成熟、简便并且可以自动化,但事实上,对于一个片段较长、序列未知的待测核酸而言,仍然是一件耗时且繁琐的工作。对于一个待测DNA分子,要制定一个能够简捷准确的测定方案,一般可以从以下几个方面考虑:

⑴DNA片段大小。

⑵背景资料:是否清楚DNA限制性酶切图谱,是否有一段已知序列,是否具有重复序列等。

⑶测序目的:①测定未知序列;②确定重组DNA的方向与结构;③对突变(如点突变)进行定位和鉴定;④比较性研究,如比较同种病毒不同株系之间的基因差异。后3种测序目的称为确证性测序。

⑷实验条件:如手工测序还是自动化测序,合成引物费用等。

由于单套测序反应所能准确测定的DNA序列最长一般仅400~500bp。因此,在进行序列测定之前,必须首先考虑待测DNA分子的大小,其次是所要测定的序列范围以及要求的序列精确程度等,再结合实验室的条件选择切实可行的克隆及测序方案。

㈠确证性测序策略

多数情况下,测序是对已知序列的次级克隆进行鉴定和证实(即确证性测序),如次级克隆DNA的插入方向、定点突变的检测、删切产物的鉴定和待表达基因阅读框架的调整等。这类DNA片段通常较小,只需了解两端的部分序列即可。所以只需直接克隆到M13mp或者质粒载体中,进行单链或双链模板测序。对于一个稍大的DNA片段的确证性测序,可以利用通用引物分别从两端开始双向测序,再通过中间重迭部分拼出全序列。对于更大的的DNA序列,可以在序

列适当区段增加一个或数个测序引物,分别测序再拼出全序列。

㈡未知DNA序列的测定策略

未知DNA序列的测定是指确定一个未知序列的准确长度及核苷酸排列顺序。未知DNA序列的测定,复杂而费时。目前已发展了一些可行的策略。

对于较小的目的DNA片段(如小于400bp),可以利用直接利用M13mp或质粒系统(如pUC18等)克隆、测序。随着质粒DNA序列测定技术的改进,目前其测序水平基本上已达到M13mp单链DNA测序水平,利用质粒载体系统具有显著的优势。因此,除非有特殊用途,如体外定点突变,都可以用pUC系统代替M13mp系统进行克隆测序。

如果是数千个碱基的大片段未知序列DNA,且要求精确测定其整个序列,就必需将其切割成适当大小的各个片段(300~400bp)分别进行次级克隆再进行测序,最后拼出全序列。可以考虑以下几种方法:

1.随机克隆法或称鸟枪法这是一种传统的方法,即利用DNaseⅠ或超声波,将目的DNA大片段随机切割成小片段,并分别进行亚克隆,然后再测定亚克隆的序列,通过排列分析,可获得目的DNA的全序列。但由于用于测序的克隆是随机挑选出来的,因此某些区段往往被重复测定,有时需要很长时间才能确定最后几个亚克隆的序列而拼出全序列。

2.限制性酶切片段亚克隆法首先需要对目的DNA进行酶切分析确定其酶切图谱。再选择合适的限制性酶消化以制备各种不同长度的限制性酶切片段,并亚克隆到测序载体上建立亚克隆库。然后分别测定各个亚克隆的核苷酸序列,通过排列分析,即可获取目的DNA的全序列。但实际上应用此法相当不易,仅当目的DNA片段上限制性酶切位点分布较均匀、且片段不大情况下,可考虑用此策略。

3.定向连续次级克隆大片段未知DNA序列片段的定向连续次级克隆法,亦称嵌套系列缺失突变体法,是目前常用的一种策略,此法具有节省工作量、便于拼读等优点。这些次级克隆具有其同的缺失起点(通常在目的DNA的一端),并逐步延伸到目的序列不同距离。从而使目的DNA中较远距离的序列逐渐地进入了通用引物的测序范围之内。目前,利用核酸外切酶Ⅲ和核酸酶BAL31构建连续次级克隆的方法比较成熟。

全基因组重测序数据分析

全基因组重测序数据分析 1. 简介(Introduction) 通过高通量测序识别发现de novo的somatic和germ line 突变,结构变异-SNV,包括重排 突变(deletioin, duplication 以及copy number variation)以及SNP的座位;针对重排突变和SNP的功能性进行综合分析;我们将分析基因功能(包括miRNA),重组率(Recombination)情况,杂合性缺失(LOH)以及进化选择与mutation之间的关系;以及这些关系将怎样使 得在disease(cancer)genome中的mutation产生对应的易感机制和功能。我们将在基因组 学以及比较基因组学,群体遗传学综合层面上深入探索疾病基因组和癌症基因组。 实验设计与样本 (1)Case-Control 对照组设计; (2)家庭成员组设计:父母-子女组(4人、3人组或多人); 初级数据分析 1.数据量产出:总碱基数量、Total Mapping Reads、Uniquely Mapping Reads统计,测序深度分析。 2.一致性序列组装:与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列。3.SNP检测及在基因组中的分布:提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基 因组信息对检测到的变异进行注释。 4.InDel检测及在基因组的分布: 在进行mapping的过程中,进行容gap的比对并检测可信的short InDel。在检测过程中,gap的长度为1~5个碱基。对于每个InDel的检测,至少需 要3个Paired-End序列的支持。 5.Structure Variation检测及在基因组中的分布: 能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进行注释。

全基因组从头测序(de novo测序)

全基因组从头测序(de novo测序) https://www.wendangku.net/doc/c0413770.html,/view/351686f19e3143323968936a.html 从头测序即de novo 测序,不需要任何参考序列资料即可对某个物种进行测序,用生物信息学分析方法进行拼接、组装,从而获得该物种的基因组序列图谱。利用全基因组从头测序技术,可以获得动物、植物、细菌、真菌的全基因组序列,从而推进该物种的研究。一个物种基因组序列图谱的完成,意味着这个物种学科和产业的新开端!这也将带动这个物种下游一系列研究的开展。全基因组序列图谱完成后,可以构建该物种的基因组数据库,为该物种的后基因组学研究搭建一个高效的平台;为后续的基因挖掘、功能验证提供DNA序列信息。华大科技利用新一代高通量测序技术,可以高效、低成本地完成所有物种的基因组序列图谱。包括研究内容、案例、技术流程、技术参数等,摘自深圳华大科技网站 https://www.wendangku.net/doc/c0413770.html,/service-solutions/ngs/genomics/de-novo-sequencing/ 技术优势: 高通量测序:效率高,成本低;高深度测序:准确率高;全球领先的基因组组装软件:采用华大基因研究院自主研发的SOAPdenovo软件;经验丰富:华大科技已经成功完成上百个物种的全基因组从头测序。 研究内容: 基因组组装■K-mer分析以及基因组大小估计;■基因组杂合模拟(出现杂合时使用); ■初步组装;■GC-Depth分布分析;■测序深 度分析。基因组注释■Repeat注释; ■基因预测;■基因功能注释;■ ncRNA 注释。动植物进化分析■基因家族鉴定(动物TreeFam;植物OrthoMCL);■物种系统发育树构建; ■物种分歧时间估算(需要标定时间信息);■基因组共线性分析; ■全基因组复制分析(动物WGAC;植物WGD)。微生物高级分析 ■基因组圈图;■共线性分析;■基因家族分析; ■CRISPR预测;■基因岛预测(毒力岛); ■前噬菌体预测;■分泌蛋白预测。 熊猫基因组图谱Nature. 2010.463:311-317. 案例描述 大熊猫有21对染色体,基因组大小2.4 Gb,重复序列含量36%,基因2万多个。熊猫基因组图谱是世界上第一个完全采用新一代测序技术完成的基因组图谱,样品取自北京奥运会吉祥物大熊猫“晶晶”。部分研究成果测序分析结果表明,大熊猫不喜欢吃肉主要是因为T1R1基因失活,无法感觉到肉的鲜味。大熊猫基因组仍然具备很高的杂合率,从而推断具有较高的遗传多态性,不会濒于灭绝。研究人员全面掌握了大熊猫的基因资源,对其在分子水平上的保护具有重要意义。 黄瓜基因组图谱黄三文, 李瑞强, 王俊等. Nature Genetics. 2009. 案例描述国际黄瓜基因组计划是由中国农业科学院蔬菜花卉研究所于2007年初发起并组织,并由深圳华大基因研究院承担基因组测序和组装等技术工作。部分研究成果黄瓜基因组是世界上第一个蔬菜作物的基因组图谱。该项目首次将传

放射性同位素标记的DNA序列测定分析(精)

放射性同位素标记的DNA序列测定分析 测定DNA的核苷酸序列是分析基因结构与功能关系的前提。从小片段重叠法到加减法、双脱氧链终止法、化学降解法、自动测序,DNA测序技术发展很快。目前在实验室手工测序常用Sanger双脱氧链终止法。Sanger法就是使用DNA聚合酶和双脱氧链终止物测定DNA核苷酸序列的方法。它要求使用一种单链的DNA模板或经变性的双链DNA模板和一种恰当的DNA合成引物。其基本原理是DNA聚合酶利用单链的DNA模板,合成出准确互补链,在合成时,某种dNTP换成了ddNTP,这时,DNA聚合酶利用2’,3’-双脱氧核苷三磷酸作底物,使之掺入到寡核苷酸链的3’末端,导致3’末端无3'-OH,从而终止DNA链的生长,双脱氧核苷酸的种类不同,掺入的位置不同就造成了在不同的专一位置终止的长度不同的互补链。通过掺入放射性核苷酸和聚丙烯酰胺凝胶电泳,即可读出模板DNA的互补链序列。一、试剂准备 1.硅化液:四氯化碳 250ml,二氯二甲基硅烷 25ml。 2.6%变性PAGE胶的配制:丙烯酰胺 28.5g,N,N’-亚甲基双丙烯酰胺1.5g,10×TBE 50ml,尿素210g,加ddH2O至500ml搅拌溶解,0.22μm滤膜过滤,4℃贮存于棕色瓶中。使用时取50ml加入催化剂过硫酸铵(25%)50μl,TEMED 50μl,轻摇混匀,立即灌胶。 3.质粒DNA碱变性液:NaOH 2M,NaAc 3M(pH 4.8),无水乙醇,70%乙醇。 4.T7测序试剂盒。 二、操作步骤 1.测序板硅化,流水、ddH2O洗,无水乙醇洗,晾干。 2.灌胶:装好测序板,玻璃板以15-30°角度倾斜放置,用50ml注射器将凝胶灌到两块玻璃之间,将鲨鱼齿梳子的平端插入胶的上缘,深约0.5-1cm。夹好,将测序板放水平。聚合约3hr后预电泳。 3.预电泳:按照说明要求安装好电泳装置,在上槽和下槽注入1×TBE。设置温度50℃,功率100W,时间约30min。 (同时准备测序反应)

(整理)DNA序列测定

第四节DNA序列测定 目前应用的两种快速序列测定技术是Sanger等(1977)提出的酶法(双脱氧链终止法)和Maxam(1977)提出的化学降解法。虽然其原理大相径庭,但这两种方法都同样生成相互独立的若干组带放射性标记的寡核苷酸,每组核苷酸都有共同的起点,却随机终止于一种(或多种)特定的残基,形成一系列以某一特定核苷酸为末端的长度各不相同的寡核苷酸混合物,这些寡核苷酸的长度由这个特定碱基在待测DNA片段上的位置所决定。然后通过高分辨率的变性聚丙烯酰胺凝胶电泳,经放射自显影后,从放射自显影胶片上直接读出待测DNA上的核苷酸顺序。 高分辨率变性聚丙烯酰胺凝胶电泳亦是DNA序列测定技术的重要基础,可分离仅差一个核苷酸、长度达300~500个核苷酸的单链DNA分子。DNA序列测定的简便方法为详细分析大量基因组的结构和功能奠定了基础,时至今日,绝大多数蛋白质氨基酸序列都是根据基因或cDNA的核苷酸序列推导出来的。 除传统的双脱氧链终止法和化学降解法外,自动化测序实际上已成为当今DNA序列分析的主流。此外,新的测序方法亦在不断出现,如上世纪90年代提出的杂交测序法(sequencing by hybridization,SBH)等。 一、双脱氧末端终止法测序 ㈠原理 双脱氧末端终止法是Sanger等在加减法测序的基础上发展而来的。 1980年他又因设计出一种测定DNA(脱氧核糖核酸)内核苷酸排列顺序的方法而与W·吉尔伯特、P·伯格共获1980年诺贝尔化学奖。桑格是第四位两次获此殊荣的科学家。 其原理是:利用大肠杆菌DNA聚合酶Ⅰ,以单链DNA为模板,并以与模板事先结合的寡聚核苷酸为引物,根据碱基配对原则将脱氧核苷三磷酸(dNTP)底物的5′-磷酸基团与引物的3′-OH末端生成3′,5′-磷酸二酯键。通过这种磷酸二酯键的不断形成,新的互补DNA得以从5′→3′延伸。Sanger引入了双脱氧核苷三磷酸(ddTNP)作为链终止剂。ddTNP比普通的dNTP在3′位置缺

第九章 DNA序列分析

第9章 DNA序列分析
o o o o Maxam—Gilbert化学降解法 Sanger双脱氧链终止法 DNA片段序列测定的策略※ 核苷酸序列的生物信息分析※
9.1 Maxam—Gilbert化学降解法
9.1.1 基本原理
o 1977年,A.M.Maxam和W.Gilbert首先建立了DNA片段 序列的测定方法 o 原理:将待测DNA片段的5‘端磷酸基团作放射性标记, 再分别采用不同的化学方法对特定碱基进行化学修饰并 在该位置打断核酸链,从而产生一系列长度不一且分别 以不同碱基结尾的DNA片段,这些以特定碱基结尾的片 段群通过并列点样(lane-by-lane)的方式用凝胶电泳 进行分离,再经放射自显影,即可读出目的DNA的碱基 序列。 o 核心原理:特定化学试剂可对不同碱基进行特异性修饰 并在被修饰的碱基处(5′或3′)打断磷酸二酯键,从 而达到识别不同碱基种类的目的。
1

9.1.2 化学降解测序法的基本步骤
o 化学降解测序法的基本步骤包括: (1)对待测DNA片段的5′端磷酸基团作放射性标记; (2)用化学修饰剂修饰特定碱基; (3)凝胶电泳分离和放射自显影显示出各片段的长度 (4)读序,由于在同一反应体系中,各DNA片段的标 记端相同、起始位点相同,所以,根据断裂部位至 标记端起始部位之间的距离(片段长度),即可得 出碱基顺序。
9.1.3 化学修饰试剂
碱基体系 G A+G C+T C A>C 化学修饰试剂 硫酸二甲酯 哌啶甲酸 肼 肼+NaCl 化学反应 甲基化 脱嘌呤 打开嘧啶环 打开胞嘧啶环
断裂部位 G G和A C和T C
90℃, 断裂反应 A和C NaOH(1.2mol/L) 哌啶(90℃,1mol/L)在修饰位点两端使DNA的糖-磷酸链断裂
2

DNA序列分析技术

DNA 序列分析技术 物种的遗传多样性在本质上是DNA 一级序列的多样性。近年来,随着DNA 测序技术的迅速发展和日益普及,DNA 测序在遗传多样性的研究中正在起着越来越大的作用。本章将介绍目前在遗传多样性研究中常用的一种手动和一种全自动双链DNA 测序方法。 1 DNA 模板的制备 在遗传多样性的研究中,由于样本量一般都较庞大,因而DNA 测序的速度就成了很关键的因素。因此,这类研究中常常直接测定纯化的PCR 双链产物而不大采用克隆技术。本节介绍本实验室常用的从PCR 产物制备测序模板的方法,即低熔点胶回收法。 (1)制备1.5%~2.0%的琼脂糖凝胶,待其充分凝固后,在离点样线5cm 左右处切下宽约1cm 的胶条,在切出的槽中倒入预先煮沸的低熔点琼脂糖胶。 (2)低熔点胶凝固后,将待纯化的PCR 反应液全部点样,恒压100V 左右进行电泳,直至扩增片段进入到低熔点胶中部。在360nm 紫外光下,将已进入低熔点胶的条带切下,放入1.5ml离心管中。 (3)离心,将胶块压缩到管底,然后补加TE 至500μl。于68℃水浴,将低熔点胶熔化,再迅速加入等体积的水饱和酚并混匀。 (4)室温下振荡抽提10 分钟,再12 000r/min 离心10 分钟。取上清液再用氯仿-异戊醇(24:1)抽提5 分钟。 (5)12 000r/min 离心10 分钟,取上清液,在其中加入1/10 体积的10 mol/ dm3NH4Ac和2 倍体积的无水乙醇,置—70℃下沉淀半小时以上。 (6)再12 000r/min 离心10 分钟,沉淀用70%的冷乙醇洗涤;再次短暂离心后小心地倒去乙醇液。沉淀干燥后,加入20~50μlTE 缓冲液或无菌去离子水中溶解,即为制好的DNA模板。 目前还有一些非常有效的商售试剂盒可用于纯化PCR 产物,如Oiagen PCR 产物纯化试剂盒等,但成本较高。 2 手动DNA 序列分析技术 2.1 测序胶的制备 按以下配方制备测序电泳胶: 6%胶工作液70ml

重测序-全基因组选择(GS)

首页 科技服务 测序指南 基因课堂 市场活动与进展 文章成果 关于我们 全基因组选择1. Meuwissen T H, Hayes B J, Goddard M E.Prediction of total genetic value using genome-wide dense marker maps[J]. Genetics, 2001, 157(4): 1819 1829. 阅读原文>> 2. Haberland A M, Pimentel E C G, Ytournel F, et al. Interplay between heritability, genetic correlation and economic weighting in a selection index with and without genomic information[J]. Journal of Animal Breeding and Genetics, 2013, 130(6): 456-467. 阅读原文>> 3. Wu X, Lund M S, Sun D, et al. Impact of relationships between test and training animals and among training animals on reliability of genomic prediction[J]. Journal of Animal Breeding and Genetics, 2015, 132(5): 366-375. 阅读原文>> 4. Goddard M E ,Hayes BJ. Genomic selection [J]. Journal of Animal Breeding and Genetics,2007,124:323:330. 阅读原文>> 5. Heffner E L, Sorrells M E, Jannink J L. Genomic selection for crop improvement [J]. Crop Science, 2009, 49(1): 1-12. 阅读原文>> 参考文献 全基因组选择简介 Meuwissen等[1]在2001年首次提出了基因组选择理论(Genomic selection , GS),即利用具有表型和基因型的个体来预测只具有基因型不具有表型值动植物的基因组育种值(GEBV)。 例如,提高奶牛的产奶量一直是奶牛研究者的研究重点,传统育种的方法需要牛生长至成年后,才能进行产奶量的测定,再进行后续的育种进程。如果在犊牛刚出生时就可以通过某种技术预测出其产奶量,就可以大大的减少育种时间,节省大量的育种成本。 全基因组选择(GS)利用覆盖全基因组的高密度分子遗传标记进行标记辅助选择,可以在奶牛的幼年时期就预测出其生产性状和营养性状,快速筛选出具有优良性状的奶牛或者种公牛,加速育种的进程。 全基因组选择技术参数 提供领先的基因组学解决方案 Leading Edge Genomic Services & Solutions 动植物重测序变异检测BSA性状定位遗传图谱群体进化全基因组关联分析Hi-C测序 人类基因组测序全基因组测序外显子测序目标区域测序单细胞基因组测序 动植物基因组测序全基因组survey 全基因组 de novo 测序泛基因组测序组装变异检测 微生物基因组测序16S/18S/ITS等扩增子测序细菌基因组 de novo 测序真菌基因组 de novo 测序微生物重测序宏基因组测序 建库测序建库测序 诺禾致源微信文章精彩阅读 >> 版权所有:北京诺禾致源科技股份有限公司 转录调控测序 真核有参转录组测序医学转录组测序真核无参转录组测序比较转录组与泛转录组测序原核转录组测序宏转录组测序单细胞转录组测序LncRNA测序circRNA测序small RNA测序ChiP-seq RIP-seq 全基因组甲基化测序 GS 重测序新产品发布 群体大小 参考群体的选择十分重要,表型信息及固定效应信息记录需要准确完整。此外,选择出 的参考群体要满足内部亲缘关系比较远,数量达到1000个以上[2]。候选群体最好与参考群体的亲缘关系较近,这样可以保证育种值预测的准确性[3]。 测序策略 测序深度:平均每个样本≥10×;测序平台:Illumina HiSeq PE150测序; 全基因组选择技术优势 全基因组选择与传统的分子标记辅助选择相比,具有很多优势[5]: 能够在得到物种个体DNA的时候即对其进行育种值评估,可以缩短世代间隔,加快遗传进展并且降低经济投入。 全基因组范围内的标记能够解释尽可能多的遗传变异,可以对遗传效应进行较为准确的检测和估计。 能够较准确的评估遗传力较低、难测定的性状或测定费用较高的性状。 通过基因组选择的方式,即使单个标记的效应很微小,导致遗传变异的所有遗传效应也都能够被SNP标记捕获, 所以比传统的基于系谱和表型数据的最佳线性无偏模型得到更高的可靠性。 a b c d

全基因组重测序数据分析

全基 1. 简 通过变(d 的功况,dise 比较 实验 (1)(2) 基因组重测序简介(Introduc 过高通量测序识deletioin, du 功能性进行综合杂合性缺失ease (cance 较基因组学,群验设计与样本 Case-Contr )家庭成员组序数据分析 ction) 识别发现de plication 以及合分析;我们(LOH )以及r )genome 中群体遗传学综ol 对照组设计 组设计:父母novo 的som 及copy numb 们将分析基因及进化选择与中的mutation 综合层面上深计 ; -子女组(4 人matic 和germ ber variation 因功能(包括与mutation 之n 产生对应的深入探索疾病基人、3 人组或m line 突变,)以及SNP miRNA ),重之间的关系;以的易感机制和基因组和癌症多人); 结构变异-SN 的座位;针对重组率(Rec 以及这些关系功能。我们将症基因组。 NV ,包括重排对重排突变和combination )系将怎样使得 将在基因组学排突 SNP )情在 学以及

初级数据分析 1.数据量产出:总碱基数量、Total Mapping Reads、Uniquely Mapping Reads统计,测序深度分析。 2.一致性序列组装:与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列。3.SNP检测及在基因组中的分布:提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基因组信息对检测到的变异进行注释。 4.InDel检测及在基因组的分布: 在进行mapping的过程中,进行容gap的比对并检测可信的short InDel。在检测过程中,gap的长度为1~5个碱基。对于每个InDel的检测,至少需要3个Paired-End序列的支持。 5.Structure Variation检测及在基因组中的分布: 能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进行注释。 高级数据分析 1.测序短序列匹配(Read Mapping) (1)屏蔽掉Y染色体上假体染色体区域(pseudo-autosomal region), 将Read与参考序列NCBI36进行匹配(包括所有染色体,未定位的contig,以及线粒体序列mtDNA(将用校正的剑桥参考序列做替代))。采用标准序列匹配处理对原始序列文件进行基因组匹配, 将Read与参考基因组进行初始匹配;给出匹配的平均质量得分分布; (2)碱基质量得分的校准。我们采用碱基质量校准算法对每个Read中每个碱基的质量进行评分,并校准一些显著性误差,包括来自测序循环和双核苷酸结构导致的误差。 (3)测序误差率估计。 pseudoautosomal contigs,short repeat regions(包括segmental duplication,simple repeat sequence-通过tandem repeat识别算法识别)将被过滤; 2. SNP Calling 计算(SNP Calling) 我们可以采用整合多种SNP探测算法的结果,综合地,更准确地识别出SNP。通过对多种算法各自识别的SNP进行一致性分析,保留具有高度一致性的SNP作为最终SNP结果。这些具有高度一致性的SNP同时具有非常高的可信度。在分析中使用到的SNP识别算法包括基于贝叶斯和基因型似然值计算的方法,以及使用连锁不平衡LD或推断技术用于优化SNP识别检出的准确性。 统计SNV的等位基因频率在全基因组上的分布

DNA序列测定(精)

DNA序列测定 DNA序列测定是在高分辨率变性聚丙烯酰胺凝胶电泳技术的基础上建立起来的。可分离相差仅1个碱基的300~500bp的核酸分子。 常用测序方法: 1. 双脱氧末端终止法 1.1.1 测序原理 四个反应管中,在DNA聚合酶催化下,以单链DNA为模板,加入单引物、四种dNTP,以及每管中加入双脱氧核糖核苷酸ddA、ddT、ddG、ddC。双脱氧核苷酸(ddNTP)的5`端-OH 是正常的,而其3`端-OH则没有,因此能与引物延伸链的3`端连接,而不能连接其后继核苷酸,于是引物链的延伸至此结束,经过变性聚丙烯酰胺凝胶电泳后,根据电泳图谱即可拼出所测DNA序列。 1.1.2 测序步骤 A 测序DNA模板制备 测序可分为单链测序与双链测序,对于未知序列可采用单链测序,而对于已知DNA序列可采用双链测序。但不管单链测序还是双链测序,其测序反应都一样。其中单链模板可通过将待测DNA片段克隆到噬菌体M13中或通过不对称PCR制备;双链模板可通过将待测DNA片段克隆到质粒DNA中或通过PCR扩增制备。所得模板DNA应通过纯化处理才能用于后继测序反应。 B 测序引物的设计 测序所用引物一般采用通用引物,也可根据已有序列设计引物,引物一般有15~30个碱基,应遵循一般引物设计原则 a、G+C含量为45~55%。 b、3端最好以A或C结尾,不要以T结尾。 c、引物长度以15~30bp为宜。 d、引物本身不能形成二级结构。 C 四种测序反应液的制备 测序反应液组成:反应缓冲液、DNA聚合酶、Mgcl2、引物、纯水、四种dNTP,分别在四个反应管中加入一种相应ddNTP。 标记物:测序反应的标记物有核素和荧光染料。标记载体有引物、dNTP、ddNTP。 现在应用较多的是将荧光染料标记于引物或ddNTP上,因核素对环境的污染而逐渐应用得比较少。但也可以不进行标记而采用银染系统检测。 D 延伸反应 引物在DNA聚合酶的催化下,按碱基互补原则逐步在引物的3’端加上四种脱氧核糖核苷酸,四个反应管中的ddNTP随机地与dNTP竟争结合位点,于是引物延伸链随机终止在各个可能位点,在电泳图谱上形成一系列相差一个核苷酸的单链DNA梯带。 E 电泳与读序 反应产物与甲酰胺混和,并高温加热变性后,于变性聚丙烯酰胺凝胶电泳。 注:对于没有标记的测序反应,电泳完成后可用银染将DNA标记、拍照、读序。 对于用核素标记的测序反应,按核素操作规程拍照。 对于用荧光染料标记的测序反应,现有一些商业生物技术公司开发的测序仪可在电泳过程中进行检测。 1.1.3 末端终止法图示

DNA自动序列测定

DNA自动序列测定试验 [实验原理] DNA 测序(DNA sequencing)是对DNA 分子的一级结构的分析。其基本原理是DNA 的复制反应体系中需要存在DNA 聚合酶、DNA 模板、寡核苷酸引物和dNTP,引物和模板退火形成双链后,DNA 聚合酶在引物的引导下在模板链上沿3’→5’的方向移动,dNTP 按照碱基配对原则,逐个连接在引物的3’-OH 末端。然而,如果在DNA 合成体系中加入双脱氧核苷三磷酸(2’,3’-ddNTP),后者与dNTP 的区别在于脱氧核糖的C3 位置缺少-OH,这样,一旦2’,3’-ddNTP 掺入到DNA 链中,由于没有3’-OH,不能同后续的dNTP 形成磷酸二酯键,从而使正在延伸的引物链在此终止。 DNA 自动测序技术也采用了这一基本原理。即在反应体系中除了加入正常反应所必需的4 种dNTP 外,还加入了一定比例的4 种荧光染料基团标记的2’,3’-ddNTP,链合成过程中,dNTP 和荧光染料基团标记的2’,3’-ddNTP 处于一种竞争状态,结果DNA 合成反应的产物是一系列长度不等的具有荧光信号的多核苷酸片段,借助计算机自动数据处理最终得到DNA 碱基的排列顺序。 [试剂与仪器]

试剂:1. BigDye Terminator v3.1 Cycle Sequencing Kit: ⑴Ready Reaction Mix; ⑵阳性对照模板和引物; ⑶BigDye Terminator v3.1Sequencing Buffer (5×)。 2. 目的基因测序引物。 3. 100%乙醇;125mM 的EDTA;3M 醋酸钠(pH 5.2);70%乙醇。 4. Hi-Di 甲酰胺 仪器:1. MicroAmp? 96-Well Reaction Plate; 2. PCR 扩增仪(GeneAmp PCR System 9700); 3. 低温高速离心机; 4. DNA 序列分析仪(ABI 公司3130 基因分析仪)。 [操作方法] 1. 模板的准备(PCR 扩增产物) ⑴目的基因的扩增与纯化: 一般来说,任何可以去除dNTPs 和引物的方法都是可行的。这里推荐使用Microcon-PCR单个样品PCR 产物纯化柱(Millipore, #1045062)。 ⑵确定PCR 扩增并纯化后的目的基因的质量:

DNA序列测定技术

DNA序列测定技术 序列测定的技术和策略 Sanger双脱氧链终止法 Maxam-Gilbert DNA化学降解法 测序策略 目前应用的两种快速序列测定技术是Sanger等(1977)提出的酶法及Ma xam和Gilbert(1977)提出的化学降解法。虽然其原理大相径庭,但这两种方法都是同样生成互相独立的若干组带放射性标记的寡核苷酸,每组寡核苷酸都有固定的起点,但却随机终止于特定的一种或者多种残基上。由于DNA上的每一个碱基出现在可变终止端的机会均等,因些上述每一组产物都是一些寡核苷酸混合物,这些寡核苷酸的长度由某一种特定碱基在原DNA全片段上的位置所决定。然后在可以区分长度仅差一个核苷酸的不同DNA分子的条件下,对各组寡核苷酸进行电泳分析,只要把几组寡核苷酸加样于测序凝胶中若干个相邻的泳道这上,即可从凝胶的放射自影片上直接读出DNA上的核苷酸顺序。 一Sanger双脱氧链终止法 Sanger法DNA测序的试剂 引物 模板 DNA聚合酶 放射性标记的dNTP dNTP类似物 现行的逻终止法人加减法序列测定技术(Sacger和Coulson,1975)发展而来的。加减法首次引入了使用特异引物在DNA聚合酶作用下进行延伸反应、碱基特异性的链终止,以及采用聚丙烯酰胺凝胶区分长度差一个核苷酸的单链D AN等3种方法。尽管有了这些进展,但加减法仍然太不精确,也太不得法,因此难以广为接受。直至引入双氧核苷三磷酸(ddTBP)作为链终止剂(Sanger 等,1977),酶法DNA序列测定技术才得到广泛应用。2',3'ddNTP与普通d NTP不同之处在同它们在脱氧核糖的3'位置缺少一个羟基。它们可以在DNA 聚合酶作用下通过其5'三磷酸基团掺入到正在增长的DNA链中,但由于没有3 '羟基,它们不能同后续的dNTP形成磷酸二酯链,因此,正在增长的DNA链不可能继续延伸。这样,在DNA合成反应混合物的4种普通dNTP中加入少量的

基因组测序原理

基因组测序原理 自1977年,桑格测定了第一个基因组序列(噬菌体X174的,全长5375个碱基)开始,基因测序技术已经发展到了第三代,转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,主要包括mRNA和非编码RNA 。支撑基因组测序的共有一下几大技术:Sanger双脱氧末端终止法、PCR技术,这里主要介绍一下第一种技术。 Sanger双脱氧末端终止法:其基本原理即双脱氧核苷三磷酸(ddNTP) 缺乏PCR 延伸所需的3'-OH,因此每当DNA 链加入分子ddNTP,延伸便终止。每一次DNA 测序是由4个独立的反应组成,将模板、引物和4 种含有不同的放射性同位素标记的核苷酸的ddNTP 分别与DNA 聚合酶混合形成长短不一的片段,大量起始点相同、终止点不同的DNA 片段存在于反应体系中,具有单个碱基差别的DNA 序列可以被聚丙烯酰胺变性凝胶电泳分离出来,得到放射性同位素自显影条带。依据电泳条带读取DNA 双链的碱基序列,如下图。 另外,大规模基因组测序有两种方法:逐步克隆法与全基因组霰弹法。

定位克隆原理 定位克隆(positoinal cloning),又称图位克隆(map-basedclonig),1986年首先由剑桥大学的AlanCoulson提出。用该方法分离基因是根据功能基因在基因组中都有相对较稳定的基因座,在利用分离群体的遗传连锁分析或染色体异常将基因伫到染色体的1个具体位置的基础上,通过构建高密度的分子连锁图,找到与目的基因紧密连锁的分子标记,不断缩小候选区域进而克隆该基因,并单明其功能和疾病的生化机制。 人类基因组计划已确定了一系列分布于全基因组24条染色体上的分子标记。根据这些分子标记的序列和定位信息,结合杂交或PCR的方法可以快速检测染色体上与肿瘤或遗传性疾病相关的热点位置,进而从中克隆疾病相关基因。定位候选克隆克服了经典的定位克隆纯粹依靠连锁分析进行染色体定位的繁冗而缓慢的弊端,大大加快了克隆工作的进程,而且它也不仅仅局限于遗传病,现在已更多地运用于肿瘤易感基因的克隆工作。 定位克隆技术主要包括以下6个步骤: 1.筛选与目标基因连锁的分子标记。利用目标基因的近等基因系或分离群体分组分析法(BSA)进行连锁分析,筛选出目标基因所在局部区域的分子标记。 2.构建并筛选含有大插入片段的基因组文库。常用的载体有柯斯质粒(cosmid),酵母人工染色体(YAC)以及P1,BAC,PAC等几种以细菌为寄主的载体系统。用与目标基因连锁的分子标记为探针筛选基因组文库,得到阳性克隆。 3.构建目的基因区域跨叠克隆群(contig)。以阳性克隆的末端作为探针基因组文库,并进行染色体步行,直到获得具有目标基因两侧分子标记的大片段跨叠群。 4.目的基因区域的精细作图。通过整合已有的遗传图谱和寻找新的分子标记,提高目的基因区域遗传图谱和物理图谱的密谱的密度。 5.目的基因的精细定位和染色体登陆。利用侧翼分子标记分析和混合样品作图精确定位目的基因。接着以目标基因两侧的分子标记为探针通过染色体登陆获得含目标基因的阳性克隆。 6.外显子的分离、鉴定。阳性克隆中可能含有多个候选基因。用筛选cDNA文库,外是子捕捉和cDNA直选法等技术找到这些候选基因,再进行共分离,时空表达特点,同源性比较等分析确定目标基因。 qRT-PCR原理 qRT-PCR即实时荧光定量PCR,是指在PCR反应体系中加入荧光基团,利用荧光信号累积实现了实时监测整个PCR进程,对起始模板进行定量分析的方法。qRT-PCR在RT-PCR体系中同时加入内参标基因的引物,使目的基因和内参基因在同一条件下同时扩增。在扩增反映结束之后,可以通过凝胶电泳的方法对扩增产物进行半定量分析,但分析的是PCR终产物,不能准确分析未经PCR信号放大之前的起始模板量。 普通PCR技术主要是在PCR结束后对终点产物进行定量分析而qRT-PCR技术是实时检测PCR扩增,在扩增的指数期对起始模板进行定量。 qRT-PCR涉及到一个关键词Ct值,是指扩增产物的荧光信号达到设定的阈值时所经过的扩增循环数。此时扩增是呈对数期增长。如下图所示。

第六章 DNA序列分析

第六章DNA序列分析 [本章摘要] DNA 的序列分析有两种基本方法, Maxam-Gilbert 化学降解法和 Sanger 氏酶学法。因为测序每个反应读取的序列是有限的,做长片段 DNA 或基因组测序时,需要选用一定的策略。测序的策略有 primer walking ,随机测序,定向测序等。现在全自动测序仍然沿用 Sanger 氏酶学法,但是在标记上作了改进。 DNA 测序结果通过生物信息学分析,获取需要的信息。 第一节Maxam-Gilbert 化学降解法 1977年, A.M. Maxam 和 W. Gilbert 首先建立了 DNA 片段序列的测定方法,其原理为:将一个 DNA 片段的 5' 端磷酸基作放射性标记,再分别采用不同的化学方法修饰和裂解特定碱基(表 6-1),从而产生一系列长度不一而 5' 端被标记的 DNA 片段,这些以特定碱基结尾的片段群通过凝胶电泳分离,再经放射线自显影,确定各片段末端碱基,从而得出目的 DNA 的碱基序列。 Maxam-Gilbert 化学降解法测序原理如图 6-1 :

表6-1:Maxam-Gilbert化学降解法测序的常用化学试剂: 碱基体 系 化学修饰试剂化学反应断裂部位 G A + G C + T C A > C dimethyl sulphate(硫酸二甲酯) Piperidine formate(哌啶甲酸), pH2.0 hydrazine(肼,联氨NH2.NH2) hydrazine + NaCl(1.5M) 90 C, NaOH(1.2M) 甲基化 脱嘌呤 打开嘧啶环 打开胞嘧啶 环 断裂反应 G G和A C和T C A和C 硫酸二甲酯[dimethyl sulphate ,DMS ,(CH3O)2SO2]是一种碱性化学试剂,可以使 DNA 链上的腺嘌呤 A 的 N2和鸟嘌呤 G 的 N7甲基化,但是鸟嘌呤 G 的 N7甲基化速度比腺嘌呤 A 的 N2甲基化速度要快 4-10 倍,并且在中性 pH 环境中, DMS 主要作用于鸟嘌呤 G ,使之甲基化,导致糖苷键断裂。 哌啶甲酸可以使 DNA 链上的嘌呤在酸的作用下发生糖苷水解,导致 DNA 链在脱嘌呤位点(G 和A)发生断裂。 肼,又称联氨 NH2.NH2,在碱性环境中作用于胞嘧啶 C 和胸腺嘧啶 T 的 C4和 C6位置,导致糖苷键断裂。如果加入高浓度的盐(1.2M NaOH),肼则主要作用于胞嘧啶 C ,使之断裂。 作为标记用的放射性同位素主要有γ-32P([γ-32P]ATP,[γ-32P]GTP. [γ-32P]TTP ,或[γ-32P]CTP),或γ-33NTP , S-35NTP 。 Maxam-Gilbert 化学降解测序法不需要进行酶催化反应,因此不会产生由于酶催化反应而带来的误差;对未经克隆的 DNA 片段可以直接测序;化学降解测序法特别适用于测定含有如 5-甲基腺嘌呤 A 或者 G , C 含量较高的 DNA 片段,以及短链的寡核苷酸片段的序列。 化学降解测序法既可以标记 5'-末端,也可以标记 3'-末端。如果从两端分别测定同一条DNA 链的核苷酸序列,相互参照测定结果,可以得到准确的 DNA 链序列。

基于质谱的DNA序列测定进展

基于质谱的DNA序列测定进展 许崇峰杨芃原岳贵花卞利萍 摘要对质谱DNA序列测定的各种技术的原理、进展、面临的困难以及发展的前景作了评述。 关键词质谱DNA序列测定评述 Abstract This article gives a review on DNA sequencing by mass spectrometry,including the principles of MS techniques,and their progress, difficulties and perspective. Key words Mass spectrometry;DNA sequencing;Review 1引言 DNA序列分析在生物基因学以及遗传病和病毒性疾病的诊断和治疗上具有重要的作用。用质谱化学方法进行DNA序列分析是一种新兴的技术。Sanger 双脱氧链终止序列测定方法[1]是常规的DNA序列分析方法,Sanger产物需要通过凝胶分离和显色来得到DNA的序列信息。而当采用质谱(MS)时,Sanger 产物可不需分离而直接测定,因而质谱方法具有快速性的优点。80年代中后期相继出现的质谱离子化新技术电喷雾(ESI)和基体辅助激光解析电离(MALDI)使得用质谱进行DNA序列测定成为可能。但是由于技术尚不成熟,目前使用质谱方法仅能测定含几十个碱基的寡聚核苷酸。要使质谱在人类基因工程(HGP)和临床分析中得到广泛的应用,质谱技术和质谱方法必须得到显著改善。 2 生物质谱方法 生物质谱,有别于传统质谱,测定的对象是分子量可高达几万至几十万的生物分子,这使得传统的电子轰击(EI)、化学电离(CI)等电离技术的应用受到了极大的限制。随着快原子轰击(FAB)、MALDI、ESI、离喷雾(IS)、大气压下碰撞电离(APCI)等电离技术的出现,大大提高了质谱的测定范围。特别是ESI-MS和M ALDI-MS显示了在生物大分子分析(如蛋白质和核酸)上的巨大潜力。 2.1ESI-MS 电喷雾是一种软电离方法。通常认为电喷雾可以用两种机制来解释:1)离子蒸发机制,在喷针针头与施加电压的电极之间形成了强电场,该电场使液体带电,带电的溶液在电场的作用下向带相反电荷的电极运动,并形成带电的液珠(液滴)。由于小雾滴的分散,比表面增大,在电场中迅速蒸发,结果使带电雾滴表面单位面积的场强高达108V/cm2,从而产生液滴的“爆裂”。重复此过程,最终产生分子离子;2)带电残基(分子)机制,首先也是电场使溶液形成带电雾滴,带电雾滴在电场作用下运动并迅速溶去,溶液中分子所带电荷在去溶时被保留在分子上,结果形成离子化的分子。一般来讲,电喷雾方法适合使溶液中的分子带电而离子化。离子蒸发机制是主要的电喷雾过程,但对质量数大的分子化合物,带电残基的机制也会起相当重要的作用。 电喷雾所形成的离子是多电荷离子,由于质谱测定的是质荷比,这就拓宽了它所能测定的质量范围,使得它适合于生物大分子的测定。 2.2MALDI-MS MALDI也是一种软电离方法,它利用激光束照射分散于基体(又称基质、底物)中的样品,由于样品被包裹在基体中,因而大部分激光能量被基体所吸收,

相关文档