文档库 最新最全的文档下载
当前位置:文档库 › DNA自动序列测定

DNA自动序列测定

DNA自动序列测定
DNA自动序列测定

DNA自动序列测定试验

[实验原理]

DNA 测序(DNA sequencing)是对DNA 分子的一级结构的分析。其基本原理是DNA 的复制反应体系中需要存在DNA 聚合酶、DNA 模板、寡核苷酸引物和dNTP,引物和模板退火形成双链后,DNA 聚合酶在引物的引导下在模板链上沿3’→5’的方向移动,dNTP 按照碱基配对原则,逐个连接在引物的3’-OH 末端。然而,如果在DNA 合成体系中加入双脱氧核苷三磷酸(2’,3’-ddNTP),后者与dNTP 的区别在于脱氧核糖的C3 位置缺少-OH,这样,一旦2’,3’-ddNTP 掺入到DNA 链中,由于没有3’-OH,不能同后续的dNTP 形成磷酸二酯键,从而使正在延伸的引物链在此终止。

DNA 自动测序技术也采用了这一基本原理。即在反应体系中除了加入正常反应所必需的4 种dNTP 外,还加入了一定比例的4 种荧光染料基团标记的2’,3’-ddNTP,链合成过程中,dNTP 和荧光染料基团标记的2’,3’-ddNTP 处于一种竞争状态,结果DNA 合成反应的产物是一系列长度不等的具有荧光信号的多核苷酸片段,借助计算机自动数据处理最终得到DNA 碱基的排列顺序。

[试剂与仪器]

试剂:1. BigDye Terminator v3.1 Cycle Sequencing Kit:

⑴Ready Reaction Mix; ⑵阳性对照模板和引物; ⑶BigDye Terminator v3.1Sequencing Buffer (5×)。

2. 目的基因测序引物。

3. 100%乙醇;125mM 的EDTA;3M 醋酸钠(pH 5.2);70%乙醇。

4. Hi-Di 甲酰胺

仪器:1. MicroAmp? 96-Well Reaction Plate;

2. PCR 扩增仪(GeneAmp PCR System 9700);

3. 低温高速离心机;

4. DNA 序列分析仪(ABI 公司3130 基因分析仪)。

[操作方法]

1. 模板的准备(PCR 扩增产物)

⑴目的基因的扩增与纯化:

一般来说,任何可以去除dNTPs 和引物的方法都是可行的。这里推荐使用Microcon-PCR单个样品PCR 产物纯化柱(Millipore, #1045062)。

⑵确定PCR 扩增并纯化后的目的基因的质量:

应用琼脂糖凝胶电泳法检测纯化后目的基因的质和量。对测序用PCR 产物的量的要求见下表。

PCR 产物应用量

100–200 bp 1-3 ng

200–500 bp 3-10 ng

500-1000 bp 5-20 ng

1000-2000 bp 10-40 ng

>2000 bp 20-50 ng

2. 测序反应

⑴测序反应混合物的准备:按下列比例配制。

Ready Reaction Premix (2.5×) 2μl

BigDye Sequencing Buffer (5×) 1μl

引物3.2 pmol

模板见PCR 产物应用量

去离子水至10μl

总体积10μl

⑵测序反应的条件:

96℃1min→(96℃10sec→50℃5sec→60℃4min)×25 循环→4℃保温

3. 测序反应后产物的纯化

应用乙醇/EDTA/醋酸钠法对测序反应后产物进行纯化。具体方法为:

⑴按顺序直接向每个测序反应体系中加入1μl 的125mM 的EDTA,1μl 的3M 醋酸钠和25μl的100%的乙醇,充分混匀;

⑵室温孵育15min 后,4℃条件下,14000rpm,离心15min;

⑶小心去除液体部分后,向每个测序反应体系中加入70μl 的70%的乙醇;

⑷4℃条件下,14000rpm,离心8min;

⑸小心去除液体部分,干燥后备检。

4. 制备3130 测序电泳样品

直接向纯化后的样品管中加入10μl 的Hi-Di 甲酰胺,95℃变性3min→迅速冰冷3min。

然后将样品放入3130 样品载样盘上,备检。

5. 3130 电泳操作:见如下所列电泳参数。

6. Data Collection v2.0 软件操作:

①新建Instrument Protocol:在Data Collection v2.0 软件的树形浏览窗依次点击GAInstruments > ga3100 / ga3100-Avant > Protocol Manager;在Instrument Protocol 窗口点New 打开Protocol Editor 对话框;完成编辑:输入一个名字;在Type 下拉菜单选择REGULAR;在Run Module 下拉菜单选择HIDFragmentAnalysis36_POP4_1;在Dye Set下拉菜单选择G5。OK。

②新建Results Group:在Data Collection v2.0 软件的树形浏览窗依次点击GA Instruments> Results Group;点New 打开Results Group Editor 对话框;在General tab 输入名字;在Analysis tab 设置自动分析;在Destination tab 设置数据保存路径;在Naming tab 设置数据文件和文件夹名称;在Automated Processing tab 设置数据自动处理方式。OK。

③新建GeneMapper ID Software Plate Record 用于自动分析:在Data Collection v2.0 软件的树形浏览窗依次点击GA Instruments > ga3100 / ga3100-Avant > Plate Manager;完成New Plate 对话设置:名称,在Application 下拉菜单选择GeneMapper-Generic(手工分析)或者GeneMapper-(自动分析),输入板型、操作者名称等,OK,打开编辑窗口,完成样品表(Plate Record)。将样品板组装好,放到3100 上;找到Plate Record并选中它,然后点击对应样品板的plate position indicator,点击RUN 按钮开始电泳。

[结果判断]

全自动DNA测序工作站会自动地完成对样品DNA的碱基序列分析,然后把分析完成后的结果数据以样品文件的形式保存于计算机的硬盘中。分析好的样品文件可以用序列分析软件来打开查看结果。电

泳信号图的X轴表示时间,Y轴表示相对荧光强度,图上不同颜色的信号代表了四种不同的碱基,图中的每个峰代表一个DNA片段。

全基因组重测序数据分析

全基因组重测序数据分析 1. 简介(Introduction) 通过高通量测序识别发现de novo的somatic和germ line 突变,结构变异-SNV,包括重排 突变(deletioin, duplication 以及copy number variation)以及SNP的座位;针对重排突变和SNP的功能性进行综合分析;我们将分析基因功能(包括miRNA),重组率(Recombination)情况,杂合性缺失(LOH)以及进化选择与mutation之间的关系;以及这些关系将怎样使 得在disease(cancer)genome中的mutation产生对应的易感机制和功能。我们将在基因组 学以及比较基因组学,群体遗传学综合层面上深入探索疾病基因组和癌症基因组。 实验设计与样本 (1)Case-Control 对照组设计; (2)家庭成员组设计:父母-子女组(4人、3人组或多人); 初级数据分析 1.数据量产出:总碱基数量、Total Mapping Reads、Uniquely Mapping Reads统计,测序深度分析。 2.一致性序列组装:与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列。3.SNP检测及在基因组中的分布:提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基 因组信息对检测到的变异进行注释。 4.InDel检测及在基因组的分布: 在进行mapping的过程中,进行容gap的比对并检测可信的short InDel。在检测过程中,gap的长度为1~5个碱基。对于每个InDel的检测,至少需 要3个Paired-End序列的支持。 5.Structure Variation检测及在基因组中的分布: 能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进行注释。

全基因组从头测序(de novo测序)

全基因组从头测序(de novo测序) https://www.wendangku.net/doc/c517015558.html,/view/351686f19e3143323968936a.html 从头测序即de novo 测序,不需要任何参考序列资料即可对某个物种进行测序,用生物信息学分析方法进行拼接、组装,从而获得该物种的基因组序列图谱。利用全基因组从头测序技术,可以获得动物、植物、细菌、真菌的全基因组序列,从而推进该物种的研究。一个物种基因组序列图谱的完成,意味着这个物种学科和产业的新开端!这也将带动这个物种下游一系列研究的开展。全基因组序列图谱完成后,可以构建该物种的基因组数据库,为该物种的后基因组学研究搭建一个高效的平台;为后续的基因挖掘、功能验证提供DNA序列信息。华大科技利用新一代高通量测序技术,可以高效、低成本地完成所有物种的基因组序列图谱。包括研究内容、案例、技术流程、技术参数等,摘自深圳华大科技网站 https://www.wendangku.net/doc/c517015558.html,/service-solutions/ngs/genomics/de-novo-sequencing/ 技术优势: 高通量测序:效率高,成本低;高深度测序:准确率高;全球领先的基因组组装软件:采用华大基因研究院自主研发的SOAPdenovo软件;经验丰富:华大科技已经成功完成上百个物种的全基因组从头测序。 研究内容: 基因组组装■K-mer分析以及基因组大小估计;■基因组杂合模拟(出现杂合时使用); ■初步组装;■GC-Depth分布分析;■测序深 度分析。基因组注释■Repeat注释; ■基因预测;■基因功能注释;■ ncRNA 注释。动植物进化分析■基因家族鉴定(动物TreeFam;植物OrthoMCL);■物种系统发育树构建; ■物种分歧时间估算(需要标定时间信息);■基因组共线性分析; ■全基因组复制分析(动物WGAC;植物WGD)。微生物高级分析 ■基因组圈图;■共线性分析;■基因家族分析; ■CRISPR预测;■基因岛预测(毒力岛); ■前噬菌体预测;■分泌蛋白预测。 熊猫基因组图谱Nature. 2010.463:311-317. 案例描述 大熊猫有21对染色体,基因组大小2.4 Gb,重复序列含量36%,基因2万多个。熊猫基因组图谱是世界上第一个完全采用新一代测序技术完成的基因组图谱,样品取自北京奥运会吉祥物大熊猫“晶晶”。部分研究成果测序分析结果表明,大熊猫不喜欢吃肉主要是因为T1R1基因失活,无法感觉到肉的鲜味。大熊猫基因组仍然具备很高的杂合率,从而推断具有较高的遗传多态性,不会濒于灭绝。研究人员全面掌握了大熊猫的基因资源,对其在分子水平上的保护具有重要意义。 黄瓜基因组图谱黄三文, 李瑞强, 王俊等. Nature Genetics. 2009. 案例描述国际黄瓜基因组计划是由中国农业科学院蔬菜花卉研究所于2007年初发起并组织,并由深圳华大基因研究院承担基因组测序和组装等技术工作。部分研究成果黄瓜基因组是世界上第一个蔬菜作物的基因组图谱。该项目首次将传

放射性同位素标记的DNA序列测定分析(精)

放射性同位素标记的DNA序列测定分析 测定DNA的核苷酸序列是分析基因结构与功能关系的前提。从小片段重叠法到加减法、双脱氧链终止法、化学降解法、自动测序,DNA测序技术发展很快。目前在实验室手工测序常用Sanger双脱氧链终止法。Sanger法就是使用DNA聚合酶和双脱氧链终止物测定DNA核苷酸序列的方法。它要求使用一种单链的DNA模板或经变性的双链DNA模板和一种恰当的DNA合成引物。其基本原理是DNA聚合酶利用单链的DNA模板,合成出准确互补链,在合成时,某种dNTP换成了ddNTP,这时,DNA聚合酶利用2’,3’-双脱氧核苷三磷酸作底物,使之掺入到寡核苷酸链的3’末端,导致3’末端无3'-OH,从而终止DNA链的生长,双脱氧核苷酸的种类不同,掺入的位置不同就造成了在不同的专一位置终止的长度不同的互补链。通过掺入放射性核苷酸和聚丙烯酰胺凝胶电泳,即可读出模板DNA的互补链序列。一、试剂准备 1.硅化液:四氯化碳 250ml,二氯二甲基硅烷 25ml。 2.6%变性PAGE胶的配制:丙烯酰胺 28.5g,N,N’-亚甲基双丙烯酰胺1.5g,10×TBE 50ml,尿素210g,加ddH2O至500ml搅拌溶解,0.22μm滤膜过滤,4℃贮存于棕色瓶中。使用时取50ml加入催化剂过硫酸铵(25%)50μl,TEMED 50μl,轻摇混匀,立即灌胶。 3.质粒DNA碱变性液:NaOH 2M,NaAc 3M(pH 4.8),无水乙醇,70%乙醇。 4.T7测序试剂盒。 二、操作步骤 1.测序板硅化,流水、ddH2O洗,无水乙醇洗,晾干。 2.灌胶:装好测序板,玻璃板以15-30°角度倾斜放置,用50ml注射器将凝胶灌到两块玻璃之间,将鲨鱼齿梳子的平端插入胶的上缘,深约0.5-1cm。夹好,将测序板放水平。聚合约3hr后预电泳。 3.预电泳:按照说明要求安装好电泳装置,在上槽和下槽注入1×TBE。设置温度50℃,功率100W,时间约30min。 (同时准备测序反应)

(整理)DNA序列测定

第四节DNA序列测定 目前应用的两种快速序列测定技术是Sanger等(1977)提出的酶法(双脱氧链终止法)和Maxam(1977)提出的化学降解法。虽然其原理大相径庭,但这两种方法都同样生成相互独立的若干组带放射性标记的寡核苷酸,每组核苷酸都有共同的起点,却随机终止于一种(或多种)特定的残基,形成一系列以某一特定核苷酸为末端的长度各不相同的寡核苷酸混合物,这些寡核苷酸的长度由这个特定碱基在待测DNA片段上的位置所决定。然后通过高分辨率的变性聚丙烯酰胺凝胶电泳,经放射自显影后,从放射自显影胶片上直接读出待测DNA上的核苷酸顺序。 高分辨率变性聚丙烯酰胺凝胶电泳亦是DNA序列测定技术的重要基础,可分离仅差一个核苷酸、长度达300~500个核苷酸的单链DNA分子。DNA序列测定的简便方法为详细分析大量基因组的结构和功能奠定了基础,时至今日,绝大多数蛋白质氨基酸序列都是根据基因或cDNA的核苷酸序列推导出来的。 除传统的双脱氧链终止法和化学降解法外,自动化测序实际上已成为当今DNA序列分析的主流。此外,新的测序方法亦在不断出现,如上世纪90年代提出的杂交测序法(sequencing by hybridization,SBH)等。 一、双脱氧末端终止法测序 ㈠原理 双脱氧末端终止法是Sanger等在加减法测序的基础上发展而来的。 1980年他又因设计出一种测定DNA(脱氧核糖核酸)内核苷酸排列顺序的方法而与W·吉尔伯特、P·伯格共获1980年诺贝尔化学奖。桑格是第四位两次获此殊荣的科学家。 其原理是:利用大肠杆菌DNA聚合酶Ⅰ,以单链DNA为模板,并以与模板事先结合的寡聚核苷酸为引物,根据碱基配对原则将脱氧核苷三磷酸(dNTP)底物的5′-磷酸基团与引物的3′-OH末端生成3′,5′-磷酸二酯键。通过这种磷酸二酯键的不断形成,新的互补DNA得以从5′→3′延伸。Sanger引入了双脱氧核苷三磷酸(ddTNP)作为链终止剂。ddTNP比普通的dNTP在3′位置缺

第九章 DNA序列分析

第9章 DNA序列分析
o o o o Maxam—Gilbert化学降解法 Sanger双脱氧链终止法 DNA片段序列测定的策略※ 核苷酸序列的生物信息分析※
9.1 Maxam—Gilbert化学降解法
9.1.1 基本原理
o 1977年,A.M.Maxam和W.Gilbert首先建立了DNA片段 序列的测定方法 o 原理:将待测DNA片段的5‘端磷酸基团作放射性标记, 再分别采用不同的化学方法对特定碱基进行化学修饰并 在该位置打断核酸链,从而产生一系列长度不一且分别 以不同碱基结尾的DNA片段,这些以特定碱基结尾的片 段群通过并列点样(lane-by-lane)的方式用凝胶电泳 进行分离,再经放射自显影,即可读出目的DNA的碱基 序列。 o 核心原理:特定化学试剂可对不同碱基进行特异性修饰 并在被修饰的碱基处(5′或3′)打断磷酸二酯键,从 而达到识别不同碱基种类的目的。
1

9.1.2 化学降解测序法的基本步骤
o 化学降解测序法的基本步骤包括: (1)对待测DNA片段的5′端磷酸基团作放射性标记; (2)用化学修饰剂修饰特定碱基; (3)凝胶电泳分离和放射自显影显示出各片段的长度 (4)读序,由于在同一反应体系中,各DNA片段的标 记端相同、起始位点相同,所以,根据断裂部位至 标记端起始部位之间的距离(片段长度),即可得 出碱基顺序。
9.1.3 化学修饰试剂
碱基体系 G A+G C+T C A>C 化学修饰试剂 硫酸二甲酯 哌啶甲酸 肼 肼+NaCl 化学反应 甲基化 脱嘌呤 打开嘧啶环 打开胞嘧啶环
断裂部位 G G和A C和T C
90℃, 断裂反应 A和C NaOH(1.2mol/L) 哌啶(90℃,1mol/L)在修饰位点两端使DNA的糖-磷酸链断裂
2

DNA序列分析技术

DNA 序列分析技术 物种的遗传多样性在本质上是DNA 一级序列的多样性。近年来,随着DNA 测序技术的迅速发展和日益普及,DNA 测序在遗传多样性的研究中正在起着越来越大的作用。本章将介绍目前在遗传多样性研究中常用的一种手动和一种全自动双链DNA 测序方法。 1 DNA 模板的制备 在遗传多样性的研究中,由于样本量一般都较庞大,因而DNA 测序的速度就成了很关键的因素。因此,这类研究中常常直接测定纯化的PCR 双链产物而不大采用克隆技术。本节介绍本实验室常用的从PCR 产物制备测序模板的方法,即低熔点胶回收法。 (1)制备1.5%~2.0%的琼脂糖凝胶,待其充分凝固后,在离点样线5cm 左右处切下宽约1cm 的胶条,在切出的槽中倒入预先煮沸的低熔点琼脂糖胶。 (2)低熔点胶凝固后,将待纯化的PCR 反应液全部点样,恒压100V 左右进行电泳,直至扩增片段进入到低熔点胶中部。在360nm 紫外光下,将已进入低熔点胶的条带切下,放入1.5ml离心管中。 (3)离心,将胶块压缩到管底,然后补加TE 至500μl。于68℃水浴,将低熔点胶熔化,再迅速加入等体积的水饱和酚并混匀。 (4)室温下振荡抽提10 分钟,再12 000r/min 离心10 分钟。取上清液再用氯仿-异戊醇(24:1)抽提5 分钟。 (5)12 000r/min 离心10 分钟,取上清液,在其中加入1/10 体积的10 mol/ dm3NH4Ac和2 倍体积的无水乙醇,置—70℃下沉淀半小时以上。 (6)再12 000r/min 离心10 分钟,沉淀用70%的冷乙醇洗涤;再次短暂离心后小心地倒去乙醇液。沉淀干燥后,加入20~50μlTE 缓冲液或无菌去离子水中溶解,即为制好的DNA模板。 目前还有一些非常有效的商售试剂盒可用于纯化PCR 产物,如Oiagen PCR 产物纯化试剂盒等,但成本较高。 2 手动DNA 序列分析技术 2.1 测序胶的制备 按以下配方制备测序电泳胶: 6%胶工作液70ml

重测序-全基因组选择(GS)

首页 科技服务 测序指南 基因课堂 市场活动与进展 文章成果 关于我们 全基因组选择1. Meuwissen T H, Hayes B J, Goddard M E.Prediction of total genetic value using genome-wide dense marker maps[J]. Genetics, 2001, 157(4): 1819 1829. 阅读原文>> 2. Haberland A M, Pimentel E C G, Ytournel F, et al. Interplay between heritability, genetic correlation and economic weighting in a selection index with and without genomic information[J]. Journal of Animal Breeding and Genetics, 2013, 130(6): 456-467. 阅读原文>> 3. Wu X, Lund M S, Sun D, et al. Impact of relationships between test and training animals and among training animals on reliability of genomic prediction[J]. Journal of Animal Breeding and Genetics, 2015, 132(5): 366-375. 阅读原文>> 4. Goddard M E ,Hayes BJ. Genomic selection [J]. Journal of Animal Breeding and Genetics,2007,124:323:330. 阅读原文>> 5. Heffner E L, Sorrells M E, Jannink J L. Genomic selection for crop improvement [J]. Crop Science, 2009, 49(1): 1-12. 阅读原文>> 参考文献 全基因组选择简介 Meuwissen等[1]在2001年首次提出了基因组选择理论(Genomic selection , GS),即利用具有表型和基因型的个体来预测只具有基因型不具有表型值动植物的基因组育种值(GEBV)。 例如,提高奶牛的产奶量一直是奶牛研究者的研究重点,传统育种的方法需要牛生长至成年后,才能进行产奶量的测定,再进行后续的育种进程。如果在犊牛刚出生时就可以通过某种技术预测出其产奶量,就可以大大的减少育种时间,节省大量的育种成本。 全基因组选择(GS)利用覆盖全基因组的高密度分子遗传标记进行标记辅助选择,可以在奶牛的幼年时期就预测出其生产性状和营养性状,快速筛选出具有优良性状的奶牛或者种公牛,加速育种的进程。 全基因组选择技术参数 提供领先的基因组学解决方案 Leading Edge Genomic Services & Solutions 动植物重测序变异检测BSA性状定位遗传图谱群体进化全基因组关联分析Hi-C测序 人类基因组测序全基因组测序外显子测序目标区域测序单细胞基因组测序 动植物基因组测序全基因组survey 全基因组 de novo 测序泛基因组测序组装变异检测 微生物基因组测序16S/18S/ITS等扩增子测序细菌基因组 de novo 测序真菌基因组 de novo 测序微生物重测序宏基因组测序 建库测序建库测序 诺禾致源微信文章精彩阅读 >> 版权所有:北京诺禾致源科技股份有限公司 转录调控测序 真核有参转录组测序医学转录组测序真核无参转录组测序比较转录组与泛转录组测序原核转录组测序宏转录组测序单细胞转录组测序LncRNA测序circRNA测序small RNA测序ChiP-seq RIP-seq 全基因组甲基化测序 GS 重测序新产品发布 群体大小 参考群体的选择十分重要,表型信息及固定效应信息记录需要准确完整。此外,选择出 的参考群体要满足内部亲缘关系比较远,数量达到1000个以上[2]。候选群体最好与参考群体的亲缘关系较近,这样可以保证育种值预测的准确性[3]。 测序策略 测序深度:平均每个样本≥10×;测序平台:Illumina HiSeq PE150测序; 全基因组选择技术优势 全基因组选择与传统的分子标记辅助选择相比,具有很多优势[5]: 能够在得到物种个体DNA的时候即对其进行育种值评估,可以缩短世代间隔,加快遗传进展并且降低经济投入。 全基因组范围内的标记能够解释尽可能多的遗传变异,可以对遗传效应进行较为准确的检测和估计。 能够较准确的评估遗传力较低、难测定的性状或测定费用较高的性状。 通过基因组选择的方式,即使单个标记的效应很微小,导致遗传变异的所有遗传效应也都能够被SNP标记捕获, 所以比传统的基于系谱和表型数据的最佳线性无偏模型得到更高的可靠性。 a b c d

全基因组重测序数据分析

全基 1. 简 通过变(d 的功况,dise 比较 实验 (1)(2) 基因组重测序简介(Introduc 过高通量测序识deletioin, du 功能性进行综合杂合性缺失ease (cance 较基因组学,群验设计与样本 Case-Contr )家庭成员组序数据分析 ction) 识别发现de plication 以及合分析;我们(LOH )以及r )genome 中群体遗传学综ol 对照组设计 组设计:父母novo 的som 及copy numb 们将分析基因及进化选择与中的mutation 综合层面上深计 ; -子女组(4 人matic 和germ ber variation 因功能(包括与mutation 之n 产生对应的深入探索疾病基人、3 人组或m line 突变,)以及SNP miRNA ),重之间的关系;以的易感机制和基因组和癌症多人); 结构变异-SN 的座位;针对重组率(Rec 以及这些关系功能。我们将症基因组。 NV ,包括重排对重排突变和combination )系将怎样使得 将在基因组学排突 SNP )情在 学以及

初级数据分析 1.数据量产出:总碱基数量、Total Mapping Reads、Uniquely Mapping Reads统计,测序深度分析。 2.一致性序列组装:与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列。3.SNP检测及在基因组中的分布:提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基因组信息对检测到的变异进行注释。 4.InDel检测及在基因组的分布: 在进行mapping的过程中,进行容gap的比对并检测可信的short InDel。在检测过程中,gap的长度为1~5个碱基。对于每个InDel的检测,至少需要3个Paired-End序列的支持。 5.Structure Variation检测及在基因组中的分布: 能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进行注释。 高级数据分析 1.测序短序列匹配(Read Mapping) (1)屏蔽掉Y染色体上假体染色体区域(pseudo-autosomal region), 将Read与参考序列NCBI36进行匹配(包括所有染色体,未定位的contig,以及线粒体序列mtDNA(将用校正的剑桥参考序列做替代))。采用标准序列匹配处理对原始序列文件进行基因组匹配, 将Read与参考基因组进行初始匹配;给出匹配的平均质量得分分布; (2)碱基质量得分的校准。我们采用碱基质量校准算法对每个Read中每个碱基的质量进行评分,并校准一些显著性误差,包括来自测序循环和双核苷酸结构导致的误差。 (3)测序误差率估计。 pseudoautosomal contigs,short repeat regions(包括segmental duplication,simple repeat sequence-通过tandem repeat识别算法识别)将被过滤; 2. SNP Calling 计算(SNP Calling) 我们可以采用整合多种SNP探测算法的结果,综合地,更准确地识别出SNP。通过对多种算法各自识别的SNP进行一致性分析,保留具有高度一致性的SNP作为最终SNP结果。这些具有高度一致性的SNP同时具有非常高的可信度。在分析中使用到的SNP识别算法包括基于贝叶斯和基因型似然值计算的方法,以及使用连锁不平衡LD或推断技术用于优化SNP识别检出的准确性。 统计SNV的等位基因频率在全基因组上的分布

DNA序列测定(精)

DNA序列测定 DNA序列测定是在高分辨率变性聚丙烯酰胺凝胶电泳技术的基础上建立起来的。可分离相差仅1个碱基的300~500bp的核酸分子。 常用测序方法: 1. 双脱氧末端终止法 1.1.1 测序原理 四个反应管中,在DNA聚合酶催化下,以单链DNA为模板,加入单引物、四种dNTP,以及每管中加入双脱氧核糖核苷酸ddA、ddT、ddG、ddC。双脱氧核苷酸(ddNTP)的5`端-OH 是正常的,而其3`端-OH则没有,因此能与引物延伸链的3`端连接,而不能连接其后继核苷酸,于是引物链的延伸至此结束,经过变性聚丙烯酰胺凝胶电泳后,根据电泳图谱即可拼出所测DNA序列。 1.1.2 测序步骤 A 测序DNA模板制备 测序可分为单链测序与双链测序,对于未知序列可采用单链测序,而对于已知DNA序列可采用双链测序。但不管单链测序还是双链测序,其测序反应都一样。其中单链模板可通过将待测DNA片段克隆到噬菌体M13中或通过不对称PCR制备;双链模板可通过将待测DNA片段克隆到质粒DNA中或通过PCR扩增制备。所得模板DNA应通过纯化处理才能用于后继测序反应。 B 测序引物的设计 测序所用引物一般采用通用引物,也可根据已有序列设计引物,引物一般有15~30个碱基,应遵循一般引物设计原则 a、G+C含量为45~55%。 b、3端最好以A或C结尾,不要以T结尾。 c、引物长度以15~30bp为宜。 d、引物本身不能形成二级结构。 C 四种测序反应液的制备 测序反应液组成:反应缓冲液、DNA聚合酶、Mgcl2、引物、纯水、四种dNTP,分别在四个反应管中加入一种相应ddNTP。 标记物:测序反应的标记物有核素和荧光染料。标记载体有引物、dNTP、ddNTP。 现在应用较多的是将荧光染料标记于引物或ddNTP上,因核素对环境的污染而逐渐应用得比较少。但也可以不进行标记而采用银染系统检测。 D 延伸反应 引物在DNA聚合酶的催化下,按碱基互补原则逐步在引物的3’端加上四种脱氧核糖核苷酸,四个反应管中的ddNTP随机地与dNTP竟争结合位点,于是引物延伸链随机终止在各个可能位点,在电泳图谱上形成一系列相差一个核苷酸的单链DNA梯带。 E 电泳与读序 反应产物与甲酰胺混和,并高温加热变性后,于变性聚丙烯酰胺凝胶电泳。 注:对于没有标记的测序反应,电泳完成后可用银染将DNA标记、拍照、读序。 对于用核素标记的测序反应,按核素操作规程拍照。 对于用荧光染料标记的测序反应,现有一些商业生物技术公司开发的测序仪可在电泳过程中进行检测。 1.1.3 末端终止法图示

DNA自动序列测定

DNA自动序列测定试验 [实验原理] DNA 测序(DNA sequencing)是对DNA 分子的一级结构的分析。其基本原理是DNA 的复制反应体系中需要存在DNA 聚合酶、DNA 模板、寡核苷酸引物和dNTP,引物和模板退火形成双链后,DNA 聚合酶在引物的引导下在模板链上沿3’→5’的方向移动,dNTP 按照碱基配对原则,逐个连接在引物的3’-OH 末端。然而,如果在DNA 合成体系中加入双脱氧核苷三磷酸(2’,3’-ddNTP),后者与dNTP 的区别在于脱氧核糖的C3 位置缺少-OH,这样,一旦2’,3’-ddNTP 掺入到DNA 链中,由于没有3’-OH,不能同后续的dNTP 形成磷酸二酯键,从而使正在延伸的引物链在此终止。 DNA 自动测序技术也采用了这一基本原理。即在反应体系中除了加入正常反应所必需的4 种dNTP 外,还加入了一定比例的4 种荧光染料基团标记的2’,3’-ddNTP,链合成过程中,dNTP 和荧光染料基团标记的2’,3’-ddNTP 处于一种竞争状态,结果DNA 合成反应的产物是一系列长度不等的具有荧光信号的多核苷酸片段,借助计算机自动数据处理最终得到DNA 碱基的排列顺序。 [试剂与仪器]

试剂:1. BigDye Terminator v3.1 Cycle Sequencing Kit: ⑴Ready Reaction Mix; ⑵阳性对照模板和引物; ⑶BigDye Terminator v3.1Sequencing Buffer (5×)。 2. 目的基因测序引物。 3. 100%乙醇;125mM 的EDTA;3M 醋酸钠(pH 5.2);70%乙醇。 4. Hi-Di 甲酰胺 仪器:1. MicroAmp? 96-Well Reaction Plate; 2. PCR 扩增仪(GeneAmp PCR System 9700); 3. 低温高速离心机; 4. DNA 序列分析仪(ABI 公司3130 基因分析仪)。 [操作方法] 1. 模板的准备(PCR 扩增产物) ⑴目的基因的扩增与纯化: 一般来说,任何可以去除dNTPs 和引物的方法都是可行的。这里推荐使用Microcon-PCR单个样品PCR 产物纯化柱(Millipore, #1045062)。 ⑵确定PCR 扩增并纯化后的目的基因的质量:

DNA序列测定技术

DNA序列测定技术 序列测定的技术和策略 Sanger双脱氧链终止法 Maxam-Gilbert DNA化学降解法 测序策略 目前应用的两种快速序列测定技术是Sanger等(1977)提出的酶法及Ma xam和Gilbert(1977)提出的化学降解法。虽然其原理大相径庭,但这两种方法都是同样生成互相独立的若干组带放射性标记的寡核苷酸,每组寡核苷酸都有固定的起点,但却随机终止于特定的一种或者多种残基上。由于DNA上的每一个碱基出现在可变终止端的机会均等,因些上述每一组产物都是一些寡核苷酸混合物,这些寡核苷酸的长度由某一种特定碱基在原DNA全片段上的位置所决定。然后在可以区分长度仅差一个核苷酸的不同DNA分子的条件下,对各组寡核苷酸进行电泳分析,只要把几组寡核苷酸加样于测序凝胶中若干个相邻的泳道这上,即可从凝胶的放射自影片上直接读出DNA上的核苷酸顺序。 一Sanger双脱氧链终止法 Sanger法DNA测序的试剂 引物 模板 DNA聚合酶 放射性标记的dNTP dNTP类似物 现行的逻终止法人加减法序列测定技术(Sacger和Coulson,1975)发展而来的。加减法首次引入了使用特异引物在DNA聚合酶作用下进行延伸反应、碱基特异性的链终止,以及采用聚丙烯酰胺凝胶区分长度差一个核苷酸的单链D AN等3种方法。尽管有了这些进展,但加减法仍然太不精确,也太不得法,因此难以广为接受。直至引入双氧核苷三磷酸(ddTBP)作为链终止剂(Sanger 等,1977),酶法DNA序列测定技术才得到广泛应用。2',3'ddNTP与普通d NTP不同之处在同它们在脱氧核糖的3'位置缺少一个羟基。它们可以在DNA 聚合酶作用下通过其5'三磷酸基团掺入到正在增长的DNA链中,但由于没有3 '羟基,它们不能同后续的dNTP形成磷酸二酯链,因此,正在增长的DNA链不可能继续延伸。这样,在DNA合成反应混合物的4种普通dNTP中加入少量的

基因组测序原理

基因组测序原理 自1977年,桑格测定了第一个基因组序列(噬菌体X174的,全长5375个碱基)开始,基因测序技术已经发展到了第三代,转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,主要包括mRNA和非编码RNA 。支撑基因组测序的共有一下几大技术:Sanger双脱氧末端终止法、PCR技术,这里主要介绍一下第一种技术。 Sanger双脱氧末端终止法:其基本原理即双脱氧核苷三磷酸(ddNTP) 缺乏PCR 延伸所需的3'-OH,因此每当DNA 链加入分子ddNTP,延伸便终止。每一次DNA 测序是由4个独立的反应组成,将模板、引物和4 种含有不同的放射性同位素标记的核苷酸的ddNTP 分别与DNA 聚合酶混合形成长短不一的片段,大量起始点相同、终止点不同的DNA 片段存在于反应体系中,具有单个碱基差别的DNA 序列可以被聚丙烯酰胺变性凝胶电泳分离出来,得到放射性同位素自显影条带。依据电泳条带读取DNA 双链的碱基序列,如下图。 另外,大规模基因组测序有两种方法:逐步克隆法与全基因组霰弹法。

定位克隆原理 定位克隆(positoinal cloning),又称图位克隆(map-basedclonig),1986年首先由剑桥大学的AlanCoulson提出。用该方法分离基因是根据功能基因在基因组中都有相对较稳定的基因座,在利用分离群体的遗传连锁分析或染色体异常将基因伫到染色体的1个具体位置的基础上,通过构建高密度的分子连锁图,找到与目的基因紧密连锁的分子标记,不断缩小候选区域进而克隆该基因,并单明其功能和疾病的生化机制。 人类基因组计划已确定了一系列分布于全基因组24条染色体上的分子标记。根据这些分子标记的序列和定位信息,结合杂交或PCR的方法可以快速检测染色体上与肿瘤或遗传性疾病相关的热点位置,进而从中克隆疾病相关基因。定位候选克隆克服了经典的定位克隆纯粹依靠连锁分析进行染色体定位的繁冗而缓慢的弊端,大大加快了克隆工作的进程,而且它也不仅仅局限于遗传病,现在已更多地运用于肿瘤易感基因的克隆工作。 定位克隆技术主要包括以下6个步骤: 1.筛选与目标基因连锁的分子标记。利用目标基因的近等基因系或分离群体分组分析法(BSA)进行连锁分析,筛选出目标基因所在局部区域的分子标记。 2.构建并筛选含有大插入片段的基因组文库。常用的载体有柯斯质粒(cosmid),酵母人工染色体(YAC)以及P1,BAC,PAC等几种以细菌为寄主的载体系统。用与目标基因连锁的分子标记为探针筛选基因组文库,得到阳性克隆。 3.构建目的基因区域跨叠克隆群(contig)。以阳性克隆的末端作为探针基因组文库,并进行染色体步行,直到获得具有目标基因两侧分子标记的大片段跨叠群。 4.目的基因区域的精细作图。通过整合已有的遗传图谱和寻找新的分子标记,提高目的基因区域遗传图谱和物理图谱的密谱的密度。 5.目的基因的精细定位和染色体登陆。利用侧翼分子标记分析和混合样品作图精确定位目的基因。接着以目标基因两侧的分子标记为探针通过染色体登陆获得含目标基因的阳性克隆。 6.外显子的分离、鉴定。阳性克隆中可能含有多个候选基因。用筛选cDNA文库,外是子捕捉和cDNA直选法等技术找到这些候选基因,再进行共分离,时空表达特点,同源性比较等分析确定目标基因。 qRT-PCR原理 qRT-PCR即实时荧光定量PCR,是指在PCR反应体系中加入荧光基团,利用荧光信号累积实现了实时监测整个PCR进程,对起始模板进行定量分析的方法。qRT-PCR在RT-PCR体系中同时加入内参标基因的引物,使目的基因和内参基因在同一条件下同时扩增。在扩增反映结束之后,可以通过凝胶电泳的方法对扩增产物进行半定量分析,但分析的是PCR终产物,不能准确分析未经PCR信号放大之前的起始模板量。 普通PCR技术主要是在PCR结束后对终点产物进行定量分析而qRT-PCR技术是实时检测PCR扩增,在扩增的指数期对起始模板进行定量。 qRT-PCR涉及到一个关键词Ct值,是指扩增产物的荧光信号达到设定的阈值时所经过的扩增循环数。此时扩增是呈对数期增长。如下图所示。

第六章 DNA序列分析

第六章DNA序列分析 [本章摘要] DNA 的序列分析有两种基本方法, Maxam-Gilbert 化学降解法和 Sanger 氏酶学法。因为测序每个反应读取的序列是有限的,做长片段 DNA 或基因组测序时,需要选用一定的策略。测序的策略有 primer walking ,随机测序,定向测序等。现在全自动测序仍然沿用 Sanger 氏酶学法,但是在标记上作了改进。 DNA 测序结果通过生物信息学分析,获取需要的信息。 第一节Maxam-Gilbert 化学降解法 1977年, A.M. Maxam 和 W. Gilbert 首先建立了 DNA 片段序列的测定方法,其原理为:将一个 DNA 片段的 5' 端磷酸基作放射性标记,再分别采用不同的化学方法修饰和裂解特定碱基(表 6-1),从而产生一系列长度不一而 5' 端被标记的 DNA 片段,这些以特定碱基结尾的片段群通过凝胶电泳分离,再经放射线自显影,确定各片段末端碱基,从而得出目的 DNA 的碱基序列。 Maxam-Gilbert 化学降解法测序原理如图 6-1 :

表6-1:Maxam-Gilbert化学降解法测序的常用化学试剂: 碱基体 系 化学修饰试剂化学反应断裂部位 G A + G C + T C A > C dimethyl sulphate(硫酸二甲酯) Piperidine formate(哌啶甲酸), pH2.0 hydrazine(肼,联氨NH2.NH2) hydrazine + NaCl(1.5M) 90 C, NaOH(1.2M) 甲基化 脱嘌呤 打开嘧啶环 打开胞嘧啶 环 断裂反应 G G和A C和T C A和C 硫酸二甲酯[dimethyl sulphate ,DMS ,(CH3O)2SO2]是一种碱性化学试剂,可以使 DNA 链上的腺嘌呤 A 的 N2和鸟嘌呤 G 的 N7甲基化,但是鸟嘌呤 G 的 N7甲基化速度比腺嘌呤 A 的 N2甲基化速度要快 4-10 倍,并且在中性 pH 环境中, DMS 主要作用于鸟嘌呤 G ,使之甲基化,导致糖苷键断裂。 哌啶甲酸可以使 DNA 链上的嘌呤在酸的作用下发生糖苷水解,导致 DNA 链在脱嘌呤位点(G 和A)发生断裂。 肼,又称联氨 NH2.NH2,在碱性环境中作用于胞嘧啶 C 和胸腺嘧啶 T 的 C4和 C6位置,导致糖苷键断裂。如果加入高浓度的盐(1.2M NaOH),肼则主要作用于胞嘧啶 C ,使之断裂。 作为标记用的放射性同位素主要有γ-32P([γ-32P]ATP,[γ-32P]GTP. [γ-32P]TTP ,或[γ-32P]CTP),或γ-33NTP , S-35NTP 。 Maxam-Gilbert 化学降解测序法不需要进行酶催化反应,因此不会产生由于酶催化反应而带来的误差;对未经克隆的 DNA 片段可以直接测序;化学降解测序法特别适用于测定含有如 5-甲基腺嘌呤 A 或者 G , C 含量较高的 DNA 片段,以及短链的寡核苷酸片段的序列。 化学降解测序法既可以标记 5'-末端,也可以标记 3'-末端。如果从两端分别测定同一条DNA 链的核苷酸序列,相互参照测定结果,可以得到准确的 DNA 链序列。

基于质谱的DNA序列测定进展

基于质谱的DNA序列测定进展 许崇峰杨芃原岳贵花卞利萍 摘要对质谱DNA序列测定的各种技术的原理、进展、面临的困难以及发展的前景作了评述。 关键词质谱DNA序列测定评述 Abstract This article gives a review on DNA sequencing by mass spectrometry,including the principles of MS techniques,and their progress, difficulties and perspective. Key words Mass spectrometry;DNA sequencing;Review 1引言 DNA序列分析在生物基因学以及遗传病和病毒性疾病的诊断和治疗上具有重要的作用。用质谱化学方法进行DNA序列分析是一种新兴的技术。Sanger 双脱氧链终止序列测定方法[1]是常规的DNA序列分析方法,Sanger产物需要通过凝胶分离和显色来得到DNA的序列信息。而当采用质谱(MS)时,Sanger 产物可不需分离而直接测定,因而质谱方法具有快速性的优点。80年代中后期相继出现的质谱离子化新技术电喷雾(ESI)和基体辅助激光解析电离(MALDI)使得用质谱进行DNA序列测定成为可能。但是由于技术尚不成熟,目前使用质谱方法仅能测定含几十个碱基的寡聚核苷酸。要使质谱在人类基因工程(HGP)和临床分析中得到广泛的应用,质谱技术和质谱方法必须得到显著改善。 2 生物质谱方法 生物质谱,有别于传统质谱,测定的对象是分子量可高达几万至几十万的生物分子,这使得传统的电子轰击(EI)、化学电离(CI)等电离技术的应用受到了极大的限制。随着快原子轰击(FAB)、MALDI、ESI、离喷雾(IS)、大气压下碰撞电离(APCI)等电离技术的出现,大大提高了质谱的测定范围。特别是ESI-MS和M ALDI-MS显示了在生物大分子分析(如蛋白质和核酸)上的巨大潜力。 2.1ESI-MS 电喷雾是一种软电离方法。通常认为电喷雾可以用两种机制来解释:1)离子蒸发机制,在喷针针头与施加电压的电极之间形成了强电场,该电场使液体带电,带电的溶液在电场的作用下向带相反电荷的电极运动,并形成带电的液珠(液滴)。由于小雾滴的分散,比表面增大,在电场中迅速蒸发,结果使带电雾滴表面单位面积的场强高达108V/cm2,从而产生液滴的“爆裂”。重复此过程,最终产生分子离子;2)带电残基(分子)机制,首先也是电场使溶液形成带电雾滴,带电雾滴在电场作用下运动并迅速溶去,溶液中分子所带电荷在去溶时被保留在分子上,结果形成离子化的分子。一般来讲,电喷雾方法适合使溶液中的分子带电而离子化。离子蒸发机制是主要的电喷雾过程,但对质量数大的分子化合物,带电残基的机制也会起相当重要的作用。 电喷雾所形成的离子是多电荷离子,由于质谱测定的是质荷比,这就拓宽了它所能测定的质量范围,使得它适合于生物大分子的测定。 2.2MALDI-MS MALDI也是一种软电离方法,它利用激光束照射分散于基体(又称基质、底物)中的样品,由于样品被包裹在基体中,因而大部分激光能量被基体所吸收,

相关文档