文档库 最新最全的文档下载
当前位置:文档库 › 拷贝数变异及其研究进展

拷贝数变异及其研究进展

拷贝数变异及其研究进展
拷贝数变异及其研究进展

拷贝数变异及其研究进展

摘要:拷贝数变异(Copy number variations, CNVs)主要指1kb-1Mb的DNA片段的缺失、插入、重复等。文章主要介绍了CNVs的基本知识及其机理,着重介绍了其各种检测技术,并进一步阐明CNVs对人类疾病及哺乳动物疾病的影响。此外,对其研究发展进行可行性展望。

关键词:拷贝数变异机理检测技术疾病

2004年,两个独立实验小组几乎同时报道,在人类基因组中广泛存在DNA片段大小从

1 kb到几个Mb范围内的拷贝数变异(CNVs)现象。在2006 年的《Nature》杂志上,来自英国Wellcome Sanger研究所以及美国Affymetrk公司等多国研究人员组成的研究小组公布了第1张人类基因组的第1代CNV图谱,后续又有3篇文章陆续发表在《Nature Genetics》和《Genome Research》杂志上,聚焦这一重大发现。受到检测手段的限制,这类遗传变异直到最近2年才为研究者所重视,并迅速成为当前人类遗传学研究的热点。CNVs 最初在患者的基因组中发现,但后来发现CNVs也大量存在于正常个体的基因组内,主要引起基因(或部分基因)的缺失或增多。拷贝数的变异过程既与疾病相关,也与基因组自身的进化有关。

针对CNVs的发现,美国遗传学家JamesR.Lupski提出“我们不能再将人与人之间的差异想当然地认为仅是单碱基突变的结果,因为还存在更复杂的来自于CNVs的结构性差异”。Lupski认为,CNVs的发现将改变人类对遗传学领域的认知,并将影响19世纪被誉为“遗传学之父”的孟德尔及 1953年发现“DNA双螺旋”的弗兰西斯?克里克与吉姆?沃特森所确立的人类遗传学基准

1 CNV概述

1.1 CNV的概念

基因组变异包括多种形式,包括SNPs,数目可变串联重复位点VNTRs (微卫星等),转座元件 (Alu序列等),结构变异(重复、缺失、插入等)。CNVs指大小从1kb到1Mb 范围内亚微观片段拷贝数突变,这些拷贝片段的缺失、复制、倒置等的变异都统称为CNVs,但不包括由转座子的插人和缺失引起的基因变异(如0-6kb Kpn I重复)[1]。由于多态是用于描述在一定人群中某个等位基因的频率不低于1%,但到目前为止,多数人类的CNVs 频率还未知[2]。目前发现的CNVs 都收录在人类基因组变异数据库中,CNVs平均大小为118 kb。全世界范围内的CNVs研究目标是:建立人类基因组的CNVs地图集,以及建立CNVs与表型、CNVs与SNPs等方面的关系。

1.2 CNV产生机理

美国学者Redon等认为,CNV可以被认为是简单的DNA结构变化(如单一片段的扩增、缺失、插入),或者可能是复杂的染色体扩增、缺失和插入的各种组合形式。在人类基因组的研究中发现,CNV在基因组中的分布似乎是有一定规律的,它常发生在同源重复序列或DNA重复片段之内或之间的区域,且CNV和基因组的DNA重复序列(SD)呈极显著正相关。由此,学者们认为,CNV的发生或者说绝大多数CNV的发生是非等位基因同源重组(NAHR)的结果[3]。

NAHR机制认为在一条染色体上的基因片段重复有利于通过DNA序列的插入,使复制区重复片段的拷贝数目发生改变。在正常个体CNV的形成过程中,通过NAHR机制基因组发生大片段基因结构变异和染色体重排,这就导致了基因组的不稳定和一些疾病的早发。CNV的形成除了由DNA片段重复外,还有一些是由非同源突变造成的。一些亚型的CNVs DNA为非p的结构,与经典的右手双螺旋不同,它包括Z型DNA和环形DNA 等。这种类型的结构被认为更有利于染色体的重排和CNVs的形成。除此外,转座和反转座也被认为可以产生CNVs。并且CNV片段的大小与机制相关,大片段的CNVs相对于小片段而言,更多与DNA重复片段相关,而小片段CNVs起主要作用的是非同源突变机制。

2 CNV的检测方法

2.1比较基因组杂交(aCGH)

aCGH也称为分子核型技术,是一种高分辨率的在全基因组范围内扫描CNVs的方法。传统的G带分析无法检测小于4 Mb的染色体重排;荧光原位杂交(FISH)虽然可以检测细微的染色体重排,却无法实现包括未知区域的全基因组扫描。1992年,出现了一种崭新的研究染色体CNVS的分子细胞遗传学方法,称为比较基因组杂交。随着技术的发展,近年来出现了基于比较基因组杂交的芯片技术,即aCGH[4]。

aCGH是在全基因组范围内筛査节段性CNVs的高分辨率检测技术,是一种重要的基因诊断工具,有逐渐取代传统细胞遗传学方法的趋势。aCGH的检测步骤如下:①提取待测组织的DNA作为样本,aCGH试剂盒中的基因组DNA 作为对照;②荧光标记待测和对照基因组DNA,制备探针;③将已经标记好的待测和对照基因组DNA共同杂交于特制的芯片上;④扫描荧光信号,分析图像,寻找待测基因组中的CNVs及其在染色体中的位置。

与其他细胞遗传学技术比较,aCGH具有高分辨率、高通量、自动化、简便、重复性高等优点,可以检测出传统细胞遗传学方法所无法发现的染色体异常。aCGH只需要微量的待测基因组DNA样本,而且不需要进行细胞培养,从而节省了检测时间。此外,优于位点特异性分析技术的是, aCGH还可以检测出散布在人类基因组中许多功能不明确的CNVs。

然而,aCGH也有一些局限性。目前,大多数的aCGH平台是为非整倍体、微缺失/微重复综合征、亚端粒或其他不平衡染色体重排的检测而设计的;但是,aCGH无法检测平衡的染色体重排,例如易位、倒位以及某些倍性异常。此外,其分辨率仍然受限于固化在芯片上的DNA探针的大小和密度(1探针/6 kb)0此外,aCGH的价格也比较昂贵。

2.2多重连接探针扩增(aMLPA)

aMLPA多重连接探针扩增是于2002年建立的一种快速、可靠的基因组CNVs检测方法。在MLPA 技术中,并不是样本DNA而是与样本DNA结合的探针被扩增和定量分析,探针的扩增依赖于样本中与探针结合的目标序列的存在。MLPA通过变性、杂交、连接、PCR扩增和毛细管电泳等步骤,同时检测多个位点,但是还存在检测能力不足的缺陷。随后出现的aMLPA技术是将MLPA与芯片技术相结合,从而增加了MLPA的检测能力,并使检测更为简单快速[5]。

aMLPA是基于芯片技术的一种新型、高效的DNA拷贝数检测平台。该技术所使用的芯片是一种高效、低密度的检测系统,采用新型氧化铝三维底板材料,这种多孔微流系统增加了杂交效率,使杂交时间明显缩短。aMLPA具有高通量的检测能力,是简便、快速、可靠的新一代分子诊断技术,在染色体微小变化的检测中具有优势。

然而,aMLPA技术是一项建立在PCR技术上的分子检测方法,仅反映检测位点的数量信息,并不反映其位置信息。因此,aMLPA无法检测不存在染色体量变的平衡易位。此外,

由于一个位点探针只检测几十个碱基,位点设计的数目也有限,所以可能遗漏某些染色体片段。aMLPA目前尚不能完全替代传统的细胞遗传学技术而用于染色体的筛查。

2.3多重可扩增探针杂交(aMAPH)

2000年,Armour等报道了一种可用于基因组已知或未知位点CNVs定量分析的多重可扩增探针杂交方法。该方法把特定的PCR产物与固定在尼龙膜上的基因组DNA杂交,通过PCR和电泳技术检测杂交回收探针的量,从而实现基因组中对应的DNA拷贝数的检测。这是一种实用的基因拷贝数检测技术;但是,该方法对与基因组DNA杂交的PCR产物探针组的定量回收效率偏低,且在多重扩增后通过比较电泳条带的相对强度而提供基因组DNA 拷贝数信息的方法仍存在检测通量的限制。近年来,基于芯片技术的aMAPH则可以实现快速准确的高通量基因组CNVs检测[6]。

aMAPH的优点如下:(1)特异性:aMAPH探针未包含多态或其他重复序列,使“探针-目标序列”100%相符;(2)灵活性:aMAPH探针可以为各种各样的位点设计,例如整个基因组、整条染色体、端粒、着丝粒旁区、特异性的染色体区域或外显子,包括基因组中复杂的、不稳定的区域;(3)高分辨率:aMAPH探针的大小仅400 -600 bp,可以高密度地覆盖待测基因组区域,为微缺失、微重复等CNVs提供了一个高分辨率的检测方法;(4)敏感性:aMAPH 探针虽小,却比寡聚核苷酸长,因此产生的信号也较强;(5)简便:aMAPH技术不依赖于BAC、PAC或其他文库的克隆。

然而,aMAPH也有一些局限性。aMAPH所需待测DNA的量较多,至少需要2 mg基因组DNA(基于凝胶的多重可扩增探针杂交技术仅需0.5 -1 mg,aCGH技术仅需0.5 mg, 单核苷酸多态性芯片技术仅需0. 25 mg),且所需待测DNA的浓度要求较高,至少需要0.2 mg/ml。

2.4其他

目前,单核苷酸多态性(SNPs)芯片、髙密度寡聚核苷酸芯片、嵌合芯片等高分辨率的生物芯片技术均可用于检测CNVs。由于CNVs的研究刚刚起步,上述技术方法的价值仍有待于进一步评价。在CNVs的研究中,采用上述技术、并结合验证方法(定量PCR、直接测序法、FISH等),可提高CNVs检测的准确性。

3CNV的研究进展

3.1CNV与人类疾病

CNVs影响基因活性的最简单方式是敲除一个基因或基因的一个部分。其次,CNVs通过破坏基因编码蛋白的活性部分,改变一个基因的表达量此外,CNVs可以通过破坏基因的调控区域影响基因的活性。研究人员发现,CNVs可以引起至少 10%-20%的基因活性的变异。

2006年,研究结果显示,超过人类基因组10%的近2900个基因存在两条染色体 DNA片段配对数量上的差异;将近16%的与已知疾病相关基因都存在于这些CNVRs中,包括罕见的遗传性疾病,如DiGeorge综合征、Angelman 综合征、Prader-Will综合征、Pick-Wick综合征,以及其他普通疾病,如精神分裂、帕金森症、阿尔茨海默症和AIDS的易感性等。研究者们推测拷贝数变化导致基因的表达水平改变主要是通过影响基因组中的基因调节区域,进一步影响结构基因表达水平,最终影响生物体的机能,导致疾病的发生或者对疾病具有不同易感性。CNVs是人类基因组变异的主要原因这一重大发现,为重新探索人类基因变异与指导疾病临床提供了好的方向[7]。

近15年来,基因组研究主要集中在寻找一般疾病的主要致病因素方面,但结果令人失望。直到最近,由于髙通量SNP芯片的引入,全基因组关联研究才得以开展。但是,检测到的大多数致病因素只能解释所有遗传疾病的小部分,临床诊断价值不高。我们有理由

相信多基因疾病的复杂性主要是遗传异质性所致,即不同的基因缺陷导致同一种疾病。我们同时认识到拷贝数变异也是导致包括智力低下在内的众多复杂疾病的主要原因之一,这些变异在研究复杂疾病的病源中曾经被忽略,推测机能与拷贝数量的改变所引起的剂量效应有关。

早在2003年,Ibanez等就发现Alpka-Synuckin基因拷贝数 2-3倍的增加能够导致遗传性帕金森综合征这表明基因的拷贝数和疾病有着直接关联。同样,Rovelet-Lecrux等发现淀粉样前体蛋白的加倍复制能够导致具有大脑淀粉样血管疾病的显性早期开始的早老性痴呆症。研究儿童孤独症的Sebat等也发现了导致患孤独症风险增加的拷贝数变异。他们的一项研究显示孤独症障碍症候群患者比正常人更可能有某些DNA序列的额外拷贝,自发产生的基因拷贝数变异提高了人类罹患孤独症的风险。这意味着,尽管不同的孤独症患者拥有近似的症状,但在背后起作用的可能是不同的遗传缺陷[8]。

综上所述,CNV导致的表型改变和复杂疾病主要是通过改变具有CNV变异结构基因的转录和翻译水平,这个推测已经在包括以上研究等众多研究中得到验证。

3.2 CNV在动物中的研究

病毒性传染病是现代畜牧生产的一大天敌,严重威胁着动物的健康。采用遗传学方法从遗传本质上提高家畜对病原的抗性,开展抗病育种具有治本的功效是条有效途径[9]。

家畜对病原菌的易感染性及对疾病的抗性涉及到许多复杂的基因网络,一直是研究的难点和热点。检测家畜疾病易感性及抗病性与CNVs的关系,将为家畜抗病育种提供重要的信息。例如对于口蹄疫病而言,我们可以用比较基因组杂交(CGH)芯片的方法来检测口蹄疫患病奶牛个体及抗病个体的基因组CNVs差异。如果患病牛与抗病牛相比存在着CNVs的扩增或缺失,那么就可以初步判断在这些CNVs区段内的基因能与蹄疫的易感性或抗病性有关。同样,我们也可以将此方法应用于奶牛抗乳房炎及肢蹄病、猪抗蓝耳病及呼吸综合征、鸡抗白血病及马立克病等研究中。CNVs与疾病抗性及易感性的研究对培育优质、高产、高抗病性的畜禽品种具有深远的意义。此外,CNVs的早期鉴定还可以使育种者尽早了解畜禽对病毒和疾病的易感情况,为种畜禽的早期选育提供重要的遗传背景信息。

4展望

早在20 多年前就发现了基因组的结构变异,近年这些结构变异与疾病的相关性越来越被人们重视.现有的CNV 全基因组关联分析初步展示了CNVs 在复杂疾病易感性中的重要作用.相信随着高通量全基因组CNVs扫描平台和新的统计推算方法的不断发展,基于CNVs 这一新的遗传易感标志的GW AS 将和基于SNPs 及其单体型的传统GW AS 一样,成为研究疾病遗传易感性的有力工具.联合使用SNPs 和CNVs这两个具有互补性的遗传标志,将为深入理解复杂疾病的分子机制和鉴定易感基因,对遗传变异和疾病表型关系的认识具有重要意义。

参考文献

[1]刘欣,王立刚,王立贤等.拷贝数变异及其研究进展[J].畜牧兽医学报,2010,41(8):927-931.

[2]孙玉琳,刘飞,赵晓航等.拷贝数变异的全基因组关联分析[J].生物化学与生物物理进展,2009,36(8):968-977.DOI:10.3724/SP.J.1206.2008.00881.

[3]钱源,褚嘉祐.拷贝数目变异研究进展[J].国际遗传学杂志,2008,31(3):187-189,222.

[4]吴志俊,金玮.拷贝数变异:基因组多样性的新形式[J].遗传,2009,31(4):339-347.DOI:10.3724/SP.J.1005.2009.00339.

[5]刘维强,陈晓林,何文智等.多重连接探针扩增及全基因组芯片分析孤独症患者SHANK3及UBE3A等热点基因拷贝数变异初步研究[J].现代检验医学杂志,2011,26(3):35-38.DOI:10.3969/j.issn.1671-7414.2011.03.013.

[6]饶友生,张细权.拷贝数目变异:基因组遗传变异的新诠释[J].生物多样性,2008,16(4):399-406.

[7]崔英霞.拷贝数变异与遗传病[J].医学研究生学报,2010,(10):1009-1012.

[8]谭琪,曾凡一.遗传变异的又一来源:拷贝数变异[J].生物技术通讯,2009,20(3):396-398.DOI:10.3969/j.issn.1009-0002.2009.03.027.

[9]何阳花,俞英,张沅等.拷贝数变异与疾病的关系及其在动物抗病育种中的应用前景[J].遗传,2008,30(11):1385-1391.

拷贝数变异及其研究进展

拷贝数变异及其研究进展 摘要:拷贝数变异(Copy number variations, CNVs)主要指1kb-1Mb的DNA片段的缺失、插入、重复等。文章主要介绍了CNVs的基本知识及其机理,着重介绍了其各种检测技术,并进一步阐明CNVs对人类疾病及哺乳动物疾病的影响。此外,对其研究发展进行可行性展望。 关键词:拷贝数变异机理检测技术疾病 2004年,两个独立实验小组几乎同时报道,在人类基因组中广泛存在DNA片段大小从 1 kb到几个Mb范围内的拷贝数变异(CNVs)现象。在2006 年的《Nature》杂志上,来自英国Wellcome Sanger研究所以及美国Affymetrk公司等多国研究人员组成的研究小组公布了第1张人类基因组的第1代CNV图谱,后续又有3篇文章陆续发表在《Nature Genetics》和《Genome Research》杂志上,聚焦这一重大发现。受到检测手段的限制,这类遗传变异直到最近2年才为研究者所重视,并迅速成为当前人类遗传学研究的热点。CNVs 最初在患者的基因组中发现,但后来发现CNVs也大量存在于正常个体的基因组内,主要引起基因(或部分基因)的缺失或增多。拷贝数的变异过程既与疾病相关,也与基因组自身的进化有关。 针对CNVs的发现,美国遗传学家JamesR.Lupski提出“我们不能再将人与人之间的差异想当然地认为仅是单碱基突变的结果,因为还存在更复杂的来自于CNVs的结构性差异”。Lupski认为,CNVs的发现将改变人类对遗传学领域的认知,并将影响19世纪被誉为“遗传学之父”的孟德尔及 1953年发现“DNA双螺旋”的弗兰西斯?克里克与吉姆?沃特森所确立的人类遗传学基准 1 CNV概述 1.1 CNV的概念 基因组变异包括多种形式,包括SNPs,数目可变串联重复位点VNTRs (微卫星等),转座元件 (Alu序列等),结构变异(重复、缺失、插入等)。CNVs指大小从1kb到1Mb 范围内亚微观片段拷贝数突变,这些拷贝片段的缺失、复制、倒置等的变异都统称为CNVs,但不包括由转座子的插人和缺失引起的基因变异(如0-6kb Kpn I重复)[1]。由于多态是用于描述在一定人群中某个等位基因的频率不低于1%,但到目前为止,多数人类的CNVs 频率还未知[2]。目前发现的CNVs 都收录在人类基因组变异数据库中,CNVs平均大小为118 kb。全世界范围内的CNVs研究目标是:建立人类基因组的CNVs地图集,以及建立CNVs与表型、CNVs与SNPs等方面的关系。 1.2 CNV产生机理 美国学者Redon等认为,CNV可以被认为是简单的DNA结构变化(如单一片段的扩增、缺失、插入),或者可能是复杂的染色体扩增、缺失和插入的各种组合形式。在人类基因组的研究中发现,CNV在基因组中的分布似乎是有一定规律的,它常发生在同源重复序列或DNA重复片段之内或之间的区域,且CNV和基因组的DNA重复序列(SD)呈极显著正相关。由此,学者们认为,CNV的发生或者说绝大多数CNV的发生是非等位基因同源重组(NAHR)的结果[3]。

基因组拷贝数变异及其突变机理与人类疾病

HEREDITAS (Beijing) 2011年8月, 33(8): 857―869 ISSN 0253-9772 https://www.wendangku.net/doc/006892492.html, 综 述 收稿日期: 2011?04?07; 修回日期: 2011?06?03 基金项目:国家自然科学基金项目(编号: 30890034, 31000552), 教育部新世纪优秀人才支持计划项目(编号: NCET-09-0322)和上海市浦江人才 计划项目(编号: 10PJ1400300)资助 作者简介:杜仁骞, 在读博士研究生, 研究方向: 基因组拷贝数变异。E-mail: renqian.du@https://www.wendangku.net/doc/006892492.html, 通讯作者:张锋, 博士, 副教授, 博士生导师, 研究方向: 人类遗传学和医学遗传学。E-mail: feng.fudan@https://www.wendangku.net/doc/006892492.html, DOI: 10.3724/SP.J.1005.2011.00857 基因组拷贝数变异及其突变机理与人类疾病 杜仁骞1,2, 金力1,2,3, 张锋1,2 1. 复旦大学生命科学学院现代人类学教育部重点实验室, 上海200433; 2. 复旦大学生命科学学院遗传工程国家重点实验室, 上海200433; 3. 复旦大学生物医学研究院, 上海200032 摘要: 拷贝数变异(Copy number variation, CNV)是由基因组发生重排而导致的, 一般指长度为1 kb 以上的基因 组大片段的拷贝数增加或者减少, 主要表现为亚显微水平的缺失和重复。CNV 是基因组结构变异(Structural variation, SV)的重要组成部分。CNV 位点的突变率远高于SNP(Single nucleotide polymorphism), 是人类疾病的重要致病因素之一。目前, 用来进行全基因组范围的CNV 研究的方法有: 基于芯片的比较基因组杂交技术(array-based comparative genomic hybridization, aCGH)、SNP 分型芯片技术和新一代测序技术。CNV 的形成机制有多种, 并可分为DNA 重组和DNA 错误复制两大类。CNV 可以导致呈孟德尔遗传的单基因病与罕见疾病, 同时与复杂疾病也相关。其致病的可能机制有基因剂量效应、基因断裂、基因融合和位置效应等。对CNV 的深入研究, 可以使我们对人类基因组的构成、个体间的遗传差异、以及遗传致病因素有新的认识。 关键词: 拷贝数变异; 突变机理; 疾病; 人类基因组 Copy number variations in the human genome: their mutational mechanisms and roles in diseases DU Ren-Qian 1,2, JIN Li 1,2,3, ZHANG Feng 1,2 1. MOE Key Laboratory of Contemporary Anthropology , School of Life Sciences , Fudan University , Shanghai 200433, China ; 2. State Key Laboratory of Genetic Engineering , School of Life Sciences , Fudan University , Shanghai 200433, China ; 3. Institutes of Biomedical Sciences , Fudan University , Shanghai 200032, China Abstract: Copy number variation (CNV) is the main type of structure variation (SV) caused by genomic rearrangement, which mainly includes deletion and duplication of sub-microscopic but large (>1 kb) genomic segments. CNV has been recognized as one of the main genetic factors underlying human diseases. The mutation rate (per locus) of CNV is much higher than that of single nucleotide polymorphism (SNP). The genome-wide assays for CNV study include array-based comparative genomic hybridization (aCGH), SNP genotyping microarrays, and next-generation sequencing techniques. Various molecular mechanisms are involved in CNV formation, which can be divided into two main categories, DNA re-combination-based and DNA replication-based mechanisms. CNVs can be associated with Mendelian diseases, sporadic diseases, and susceptibility to complex diseases. CNVs can convey clinical phenotypes by gene dosage, gene disruption, gene fusion, and position effects. Further studies on CNVs will shed new light on human genome structure, genetic varia-tions between individuals, and missing heritability of human diseases. Keywords: copy number variation; mutational mechanism; diseases; human genome

中日韩人种基因拷贝数变异图谱出炉

中日韩人种基因拷贝数变异图谱出炉 韩国首尔大学基因医学研究所徐廷瑄教授领导的研究小组宣称,他们通过对30名中国人、韩国人和日本人的基因组研究,成功绘制出中日韩人种超高清基因拷贝数变异图谱,并根据该图谱发现,亚洲人独有的基因拷贝数变异共有3500多个。 所谓基因拷贝数变异(Copy Number Vriations)是指在人类基因组中广泛存在的,从1000bp(碱基对)到数百万bp范围内的缺失、插入、重复和复杂多位点的变异。研究表明,不少人类复杂性状疾病都和拷贝数变异有密切关系。 2019年,第一张人类基因组第一代基因拷贝数变异图谱问世。这张遗传图谱是通过对欧洲、非洲和亚洲祖先4个人群的270个个体样品进行分析,用两个互补的技术——单核苷酸多态性(SNPs)基因分型和以克隆为基础的比较基因组杂交进行基因拷贝数变异筛选,获得了一共1447个拷贝数变异。 之后的一系列研究显示,基因拷贝数变异是个体之间在基因组序列差异上的一个重要源泉,是研究基因组进化和表型差异的一个重要因素。许多关于基因拷贝数变异的研究结果表明,拷贝数变异可导致不同程度的基因表达差异,对正常表型的构成及疾病的发生发展具有一定作用。拷贝数变异研究在法医学方面也具有重要意义,在探索法医学个体识别的遗

传变异时不能忽略拷贝数变异这一基因组多样性的新形式。首尔大学医学院此次绘制的基因拷贝数变异图谱与西方绘制的现有图谱不同,是只针对中日韩人种进行研究并绘制完成的,将有效适用于特定人群的疾病诊疗,并为今后正式研究基因拷贝数变异和疾病之间的关联性提供了良好平台。(薛严) 当第一张人类基因组草图问世时,我们对这一划时代的成就充满期待,渴望它在医学诊断、预防和治疗方面,能够迅速兑现基因组研究的初衷。10年过去了,我们发现那不过是生命科学这部天书的扉页。基因组测序现已不算难事,科学家面临的更大挑战,是从浩繁的基因组序列中找到惠及健康的有用信息。或许,研究基因拷贝数变异,我们才翻到了这部天书的某一章节。

人类遗传变异-拷贝数变异(CNVs)和疾病研究及检测

在人类细胞遗传学研究的早期,人们在显微镜下研究染色体,发现了染色体的拷贝数、重排和结构方面存在变异,而且在很多情况下这些变异可能与疾病相关。在分辨率频谱的另一端即高分辨率区域,DNA短片段的分析和测序方法的发展导致了短串联重复序列和单核苷酸多态性(SNPs)的发现。显而易见,人为遗传变异范围包括从序列水平上单一碱基对的变化到用显微镜检测到的几兆碱基长度的染色体差异。最近,通过观测亚微观DNA片段中广泛颁布的拷贝数变异,我们对于人类遗传变异的认识又进一步得到了拓展。全基因组扫描方法的实行大大推动了这种关于人为变异的新认识,这些方法给我们提供了一个在显微镜细胞遗传学(>5-10Mb)和DNA序列分析(1-700bp)之间的对基因组中间范围遗传变异进行解读的强有力工具。正如图6所示的结构变民中的中等分辨率范围内的测亚微观部分。 现在已经发展了很多方法来检测这类中等大小范围内的DNA遗传变异,DNA生物芯片技术可能是其中最为有效的方法。拷贝数变异(CNV)鉴定的主要方法是比较基因组杂交(CGH),而商业的标准CGH芯片在人类基因组的每1Mb长度范围有一个细菌人工染色体(BAC)克隆,这样就很难精确鉴定小于50kb的单拷贝数差异。昂飞的人类基因组图谱SNP芯片500K和SNP 5.0芯片的标记间距离中位数为2.5kb,最近推出的SNP 6.0的中位数则少于700个碱基对。这类基因型芯片通过将测试样本所获取的信息强度与其他个体的进行比较来确定每个位点相对基因组拷贝数。同时,拷贝数检测运算法中将探针的长度和GC含量考虑到其中,从而进一步降低了基因型芯片检测噪音。另外一个优点是,基因型芯片对拷贝数变异区域进行全面检测,并通过在连续的几个探针中要有重大的比率变化来确认。所以说,这样的工具明显提高了检测的精确度。除了提供拷贝数信息,SNP 基因型芯片提供的基因型信息不但可以用于遗传关联性研究,还可以用于检测杂合性丢失,这为缺失的存在提供支持证据,还可能提示片段性单亲二体。 近年来通过拷贝数变异(CNVs)的研究,我们知道人类群体中的任何两个个体基因组结构上的差异比核苷酸序列水平上的差异更大(请参阅应用案例2)。保守的估计显示个体之间CNVs总计有4Mb(相当于每800bp 就有1个不同)。不保守估计则认为有多达5-24Mb范围内存在CNVs。无论是哪种估计,平均来说CNVs中的核苷酸变异数量比SNPs还要多,后者总数大约是2.5Mb(相当于每1,200个bp中有1个SNP)。因此人类个休之间的所有基因组差异性要远远大于先前所认为的,至少存在0.2%的差异:结构水平上有0.12%以上的差异,核苷酸水平上有0.08%的差异。 昂飞芯片技术革新不但为之前未被发现的人类健康人群中存在的基因组变异的基础研究敞开了大门,也为研究疾病的遗传基础打开了一扇新的窗户.致癌基因的扩增和/或肿 瘤抑制基因的缺失是癌症起始和发展的特点,这一特点近来被认为可用来暗示癌症对治疗剂的反应。因此在细胞系和肿瘤样品中对这些 2008年7月23日第三十三期第 8 页,共 14 页下一页 返 回

相关文档