文档库

最新最全的文档下载
当前位置:文档库 > DNA芯片的发展和意义

DNA芯片的发展和意义

DNA芯片的发展和意义

中国医科大学医学遗传学教研室 (沈阳 110001) 孙开来 吴东宁综述

提要 D NA芯片是近年来迅速发展起来的高新生物技术,它对人类基因组计划的实现,对人类认识自身、防治疾病与健康发展,促进21世纪人类进入基因工业时代均有十分重要意义。本文就D NA芯片的基本原理,它在基因表达、测序、制图和环境基因组计划等方面的主要应用,以及DN A芯片技术开辟基因工业的新兴产业作一简要介绍和叙述。

今年3月27日的“Science”杂志的编者指出:下一个伟大时代的基因组革命可与工业革命和计算机革命所带来的变化相比,这就是“第三次技术革命”[1]。这场革命的开展对人类认识自身,防治疾病乃至人类的生存与发展有着极为重要的意义。近年来发展起来的基因芯片(DNA Chip)技术,不仅使基因组计划的实现缩短了多年,同时促进了实用基因组学时代的到来,使基因组学从理论研究跨入社会实践。

分子遗传学的中心问题是认识遗传变异和其表型之间的关系。要充分理解基因组研究对人类健康具有的重要意义,人们必须在大量的细胞、组织、个体和群体中进行遗传变异的检测。现在遗传学和基因组的研究正在进行以下诸方面的重要工作:人类基因组的制图与测序;群体中多态性的鉴定;致病基因表达模式的鉴定;环境基因组计划研究;多基因的复杂疾病的遗传制图和基因组的结构分析与功能研究等。人们面对着认识人类基因组中100000个基因的复杂表达方式,确定细胞生命中错综复杂的发育信号的艰巨任务[2]。但长期以来,人们一次只能有限地研究一个基因或mRNA,因而需要新的有效的手段能一次检测大于100000数据(data points),而要处理和比较如此大的数据,目前常用的凝胶电泳测序分析是达不到的,需要技术革新以设计新的数据分析软件。基因芯片技术就这样应运而生了。

一、DNA Chip的基本原理

DNA序列的分析需要分辨单个核苷,将分子识别的规则用于生物系统的阅读、储存和修饰。Chip技术的分子识别与Southern和Northern的分子杂交同出一理,即DNA的碱基配对和序列互补原理[2]。

芯片和芯阵是将一叠叠七英寸大小的玻璃薄片,分割成大约半英寸(1.28cm)的小片,在片上排列着约64000小方格,小格边长约为头发丝的一半。在此片上制备千百万个DNA探针,按顺序列阵,对大量的标本进行检测[3]。其方法学基础是以下两个关键技术的结合。

1.光电化学

这里应用的是成熟的照像平板印刷术(pho to lithog raphy)和固相合成(solid-phase sy nthesis)。在玻片的精确部位合成千百万个高分辨的不同化合物制成探针,即在玻片涂上光敏化学材料,由于光化学作用可除去化学材料的保护基团,并使修饰的合成连接子贴附于玻片上;光线直透照像平板上的罩(mask),射向片上的特定区,局部产生光去防护作用;每个探针都由A、T、C、G的不同组合构成,用这四种核苷液依次冲洗芯片,这些分子即粘于被冲去化学基团的地方,进行化学偶合,光线透射到片上的不同区时,加上不同的核苷,换上不同的新罩,如加A核苷时用A罩、加C核苷时换C罩,如此重复这一过程;由4个核苷组成的任一套探针,可由4N(N=探针长度)循环来合成。如全长20个核苷的探针只需80次化学循环合成。合成的探针与既定的参考序列互补对应。研究者可按参数设计无限高密度互补的DNA 阵[2]。

2.激光共焦荧光扫描

?

281

?

即在DNA阵上检测分子的相互作用。用不同荧光(红和绿)标记探针和靶序列,由共焦显微镜或电光倍增管进行激光诱导荧光扫描,从空间输出信号呈现不同辉度的荧光图像,由数据分析软件进行处理和定量分析。此技术只需很少的化学材料和生物标本。

此外,也有人用改进的喷墨印刷机探头技术(mo dified injet printer head),与前者不同的是固相合成的每一阶段的化学试剂是喷射到玻片的特定区点。

这样的DNA高密度寡核苷酸芯阵可用来鉴定靶序列、测试其量变和相应表达水平、检测靶序列与参考序列的差异等。其特点为:建于玻片(硅片、尼龙膜)上进行杂交,而不是传统的凝胶电泳杂交;片上单个探针密度为107~108分子/片;1.28cm2芯片上具有不同序列的高密度层(titing),在50L m、20L m、5L m的片(tile)上,分别含有65536、409000和1400000数据;荧光标记杂交检测;共焦显微镜进行激光扫描;数据荧光图像由计算机处理分析。

二、DNA Chip的主要应用

1.基因表达

遗传学只有完全了解基因表达和水平及其精细的调控才能解译细胞通路的动力学变化,包括表达瞬息的量变,不了解基因表达及水平就不可能理解基因型和表型间的相互关系[2]。Lockhart等[4]提取人乳腺癌及正常乳腺细胞的RNA,在芯片上测定编码基因的mRNA的表达量变,用T7多聚酶合成荧光标记的cDNA 探针,每个基因20个探针,可测定1∶300000 RNAs。近年已发展一种Chip含酵母基因组的完全阅读框架,一套具有千万个全长的基因和片段的Chip,含有6500个基因的标准Chip[2]。1997年发展了具有50000多表达序列标签的表达Chip。Eisent和Chen[5]报道了大量基因和多时点(multiple tim e points)基因表达数据的基本图像加工机制,其实验和对照标本分别用红、绿荧光标记,依据表达图像的相似性通过K 值计算。绿色、黄色和红色表示比率小于1、等于1和大于1,分别说明在实验条件下,表达降低、相等和增加。

2.基因测序

大规模基因组测序正是人类基因组急待完成的任务。这涉及到多态性、插入、缺失的检测。Chee等[6]以单杂交实验进行人类完整线粒体基因组测序。以135000个寡核苷酸探针检测了m t基因组约16.6kb序列,并检测对照标本179/180多态。现在可在1.28cm2Chip上,以足够的探针扫描32kb至几百kb区域中任何区段。通过设计不同的Chip,Cronin等检测了CFT R基因的多点突变,Kozal等检测了HIV, Hacia等检测了BRCA1基因,Fodo r和Collins[2]用高密度Chip阵检测BRCA1基因的杂合性突变。他们用96000多核苷酸探针(长20nt)组成DNA阵检测该基因的11外显子的3.45kb,在14/15个患者标本中精确诊断了已知突变,在20个对照标本中鉴定了无假阳性突变,还迅速鉴定了8个单核苷酸多态。还有其它Chip检测p53、细胞色素p450和鉴定微生物的Chip。在每个含有50kb的1000Chips上易于快速进行序列比较分析。Hacia和Collins等[7]还设计高密度寡核苷酸阵用于进化序列的比较研究。对与人进化相近的猩猩、大猩猩和黑猩猩的同源基因BRCA1的11外显子序列比较分析,证明在3.4kb中83.5%~98.2%核苷酸相同,与杂交法和双脱氧测序分析一致,这说明芯片技术可加速人类基因组计划的实现,对扫描进化保守序列特别有力。

3.基因制图

虽然人类基因组制图工作基本完成,但大量基因精细定位工作仍有待进行。Lander,Chee 和Lipshutz等[2]首先用单核苷酸多态(SNPs)进行制图工作,直接鉴定收集在White head研究所标签位点库中的共同多态。SNPs是最新第三代DNA遗传标记,人群中有很大的遗传多样性,在大多数基因座位都有成千的等位型,就每个单核苷酸来说,在每代人群中具有一定的突变率,由此产生的单碱基突变就形成许多双等位基因标记(biallelic m arker),因为其数量多,覆盖密度大,优于目前其它标记物,这就构

?

282?

成DNA芯片的重要技术基础。双等位基因标记可由基因组DNA扩增,用于探针阵。Krugly ak等[8]将Chip用于双等位基因标记遗传图的连锁研究,即以此标记能快速并高度自动化鉴定基因型,从而获得大量信息。与成套微卫星标记基因组扫描相比其最大的特点是可确切地检测标本的纯合性和杂合性,极大地节省时间和劳动。现已生产含有约500标记的原型图芯片,1997年底生产有大约2000标记的芯片用于人类基因制图,具有2cM~4cM(2×10-6~4×10-6bps)分辨率。

遗传学者经常试图比较基因组,现今最新的方法是点与点的等量比较(equivalent of po int-by-point com parison),即用大的遗传标记扫描每个基因组,这好比将看似相同的两幅画紧贴在一起,就能发现在画面上一些位点的差异。今年Cheung等[9]用基因组错配扫描(ge-no mic m ismatch scanning,GMS)法,不用定基因型进行连锁不平衡基因定位。鉴定两个患者的IBD(同一祖先)区可能存在易感基因而进行定位克隆。应用GM S对成对无亲缘关系的Ashkenazi犹太人的先天性高胰岛素血症(Hy-perinsulinism-11号染色体上SURI基因突变的单基因病)患者进行基因定位,即将GM S产物直接与11号染色体分离的96个片段刻印于DNA微阵上进行杂交,他们发现SURI基因区就是这些成对个体的IBD。Kruglyak等[10]认为用GM S制作遗传图不需要了解致病基因位置有关知识,这将是基因定位的下一个里程碑:即能真正重复扫描全基因组试验;确立信号—噪音问题技术;发展一种将杂交数据翻译为基因位置的统计学。

4.环境基因组计划

1997年10月在Bethesda举行的EGP学术会议上提出基因组的方法能用于促进人类健康[5]。因为环境因素与遗传因素间的相互作用对人类健康十分重要。分子遗传学方法提供了系统分析和比较分析的有力手段。遗传学认为遗传变异的易感性是人类多数常见病的特征,多数疾病的遗传易感性与一个或若干个基因的相应等位基因有关。而遗传流行病学已表明特异基因的特定等位基因是某些疾病的易感原因。现在有两个不同而互补的基因组方法:1“基因型”(g enotype)法:研究基因型变异如何产生表型的变异,这取决于物理图,遗传图及DNA多态已有的产物。o“表达”(ex pr ession)法:这取决于部分序列的cDNA克隆和基因组编码的更多的蛋白,进行整套基因表达方式的比较和这些产物功能特征的研究。目前我们尚未识别所有重要序列,未能获得大群体中足够的信息,要在人类10万个基因中只靠几百个基因的信息是难以鉴定大部分基因对有害环境因素的易感性。

新方法就是利用许多分散在人类基因组中已可用的多态位点—单序列重复多态。这要鉴定更大、更密集的一套大于2000位点的SNPs,就需要设计对应性强而有价值的手段,即DNA芯片,这样一套多态标记是大尺度的群体相关性研究的基本需要。Brow n等[11]报道了用DNA微阵杂交进行基因表达变异和环境有害因素的研究。他们就正常人和病人的T细胞标本对表达的变异与数千个遗传、遗传流行病和环境条件的图像进行比较,以确定与二氧化物和汞接触的关系。这样用表达方法补充基因型方法,就是系统测试基因组中10万个基因的每一个表达变异。他们认为若干年后提高DNA微阵技术,最终能在几千个不同遗传、环境和疾病影响的人类大多数基因和在多种类型的细胞中获得表达水平的确切信息。这种机体对有害环境因素的基因表达反应的系统研究将提供环境公害敏感的原位生物检测的策略路线。

由此可见:1DN A芯片技术将序列的变异和生物学功能结合起来。芯片扫描将建立大量多态的数据库,而SNPs芯片将揭示与疾病的关系。oDNA芯片将遗传的序列分析由常规的系列凝胶方法转移到大规模矩阵对应扫描方式。?DNA芯片作为一种范例必将转移到千万个蛋白质、化学信息子和其它生命的分子上来。所以Collions和Hacia说:“我们已经进入人类

?

283

?

生物学的基因组方法的新时代”[2]。

三、DNA Chip技术开辟了基因工业的新时代

DNA芯片技术的迅速发展并已开始商品化。这在科技界、政界和企业界均引起广泛的关注和重视。美国总统Clinton于1998年1月在美国州联邦会议上说:“Microarray分析是一有力的技术,也是政治技术,它之所以强有力是因为它是许多人所渴望的但又尚未控制的技术”,他还说:“Gene Chip将提供整个生命期中预防疾病的一个路标图”[5]。今年6月29日美国已宣布正式启动“生物芯片”计划。美能源部专称该计划“对所有美国人都十分重要”。并与人类基因组计划一起提供资金。

许多研究基因组学和遗传学权威均热衷于此技术并用于实践。美国NIH的Paul M eltzer 说:“我们像孩子走进糖果店,对芯片越来越着迷”。Colions说:“老实说,我对它们已到了狂热的地步”,“使我激动的是分析引起疾病的各种基因芯片可以制造出来,你要研究精神分裂症或心脏病无需一切从头开始”。

DNA芯片促进基因组学从理论研究发展为实用基因组学,使人类21世纪进入基因工业时代。美国几家主要基因组学公司为Affyma-tr ix、Sy nteni、Incyte等。它们与80年代初出现的遗传技术公司有两点明显的不同:1那些公司均未出现奇迹,而新DNA Chip公司如In-cy te于1993年开始在此领域发售股票,8家基因组学公司平均每年股票上涨75%。o基因组学公司一开始就与制药工业结缘。越来越多的制药公司也竞相投资基因组学。正如Incy te公司总经理Scott所说:“今后5年我们将实现制药业的所有目标,……因为药物通过与我们的分子结合而起作用”。DNA芯片计划将导致相当规模市场的新兴产业。据基因学公司估计,到2005年基因芯片价值可达50亿美元,到2010年可达400亿美元[3]。

越来越多的科学家包括诺贝尔奖得主Berg和硅谷奇才Pease等学者正在与这些企业家密切合作、研制各种用途的基因芯片,各显神通,竞相吐艳,以加速21世纪基因工业时代的到来。

芯片技术尚存在如何与临床应用结合起来等问题,相信在科学家和企业家的共同努力下,加强信息交流和进一步研制开发,必将促进这一新技术更加完善而造福人类健康并促进人类社会发展。

参考文献

1 Editorial.Science,1998;279(27):2019

2 Fodor S PA.Science,1997;277:393

3 Stipp D.Fortune(Chinese).1997;3:64

4 Lock har t DL et al.Nature Biotech nol,1996;14:1675

5 Editorial.Natu re Genet,1998;18:195

6 Chee M S.Science,1996;274:610

7 Hacia JG et al.Nature Genet,1998;18:155

8 Kruglyak L.Nature Genet,1997;17:21

9 Cheung VG et al.Natu re Genet,1998;18:225

10 Kruglyak L et al.Nature Genet,1998;18:200

11 Brow n PO et al.N ature Genet,1998;18:91

DNA芯片技术原理及在遗传学研究中的应用哈尔滨医科大学 (哈尔滨 150086) 吕 嵩 黄晓琳综述 李 璞 张贵寅审校

提要 人类基因计划的提出促进了许多新的分子生物学技术的产生和发展,DN A芯片技术是在固相支持物上寡核苷酸联合合成、照相平版印刷样模具制造、共聚焦显微镜的荧光自动扫描等技术基础之上发展起来的,能够在基因组水平进行基因表达研究、突变和多态性分析以及遗传制图和序列测定等,现已应用于基因组研究和人类疾病的诊断中。本文对DN A芯片的概念、分类、技术原理、应用、存在的问题、现状以及前景等作一简要综述。

?

284

?