文档库 最新最全的文档下载
当前位置:文档库 › 基因表达的分析技术

基因表达的分析技术

基因表达的分析技术
基因表达的分析技术

第二篇细胞的遗传物质

第三章基因表达的分析技术

生物性状的表现均是通过基因表达调控实现的。对基因结构与基因表达调控进行研究,是揭示生命本质的必经之路。在基因组研究的过程中,逐步建立起一系列行之有效的技术。针对不同的研究内容,可建立不同的研究路线。

第一节PCR技术

聚合酶链反应(polymerase chain reaction,PCR)技术是一种体外核酸扩增技术,具有特异、敏感、产率高、快速、简便等突出优点。。PCR技术日斟完善,成为分子生物学和分子遗传学研究的最重要的技术。应用PCR技术可以使特定的基因或DNA片段在很短的时间内体外扩增数十万至百万倍。扩增的片段可以直接通过电泳观察,并作进一步的分析。

一、实验原理

PCR是根据DNA变性复性的原理,通过特异性引物,完成特异片段扩增。第一,按照欲检测的DNA的5'和3'端的碱基顺序各合成一段长约18~24个碱基的寡核苷酸序列作为引物(primer)。引物设计需要根据以下原则:①引物的长度保持在18~24bp之间,引物过短将影响产物的特异性,而引物过长将影响产物的合成效率;②GC含量应保持在45~60%之间;③5'和3'端的引物间不能形成互补。第二,将待检测的DNA变性后,加入四种单核苷酸(dNTP)、引物和耐热DNA聚合酶以及缓冲液。通过95℃变性,在进入较低的温度使引物与待扩增的DNA链复性结合,然后在聚合酶的作用下,体系中的脱氧核苷酸与模板DNA链互补配对,不断延伸合成新互补链,最终使一条DNA双链合成为两条双链。通过变性(92~95℃)→复性(40~60℃)→引物延伸(65~72℃)的顺序循环20至40个周期,就可以得到大量的DNA片段。理论上循环20周期可使DNA扩增100余万倍。

二、PCR技术的分类及其应用范围

1.逆转录PCR 逆转录PCR(RT-PCR)是将RNA反转录和PCR结合而建立起来的一种PCR技术。其包括两个过程:通过逆转录合成cDNA和对之进行PCR扩增。其中,用于逆转录的RNA模板要求完整,并且不含DNA和蛋白质等杂质。逆转录PCR可以检测低于10个拷贝的特异RNA。

2.原位PCR 原位PCR技术(in situ PCR)是将检测细胞内特定基因的原位杂交技术和聚合酶链式反应(PCR)法相结合的方法。它是扩增组织切片或细胞内微量的基因,并将其检测出来的技术。

3.甲基化PCR 甲基化PCR与常规PCR在原理上一致,但在引物的设计以及DNA样本的处理上有所不同。针对扩增的DNA甲基化区域,一般需要设计三条引物:正常序列引物、甲基化对应引物以及DNA序列修饰引物。通过三组PCR,判断DNA序列中甲基化的存在与否。

4.实时荧光定量PCR 实时荧光定量PCR(real time quantitative PCR)是在PCR反应体系中加入荧光基团,利用荧光信号累积实现实时监测整个PCR进程,并能对起始模板进行定量分析。RT-PCR需要荧光探针参与,常用的探针可分为以下几类:1)内掺式染料SYBR Green I;2)序列特异性探针:Taqman,Molecular Beacons,Dual Probes;3)特异性引物:Amplifluor(Intergen),Lux 引物,Scorpion;4)阴阳探针。

荧光定量PCR不仅可以测定靶DNA的含量,用于临床诊断,而且可以应用不同的探针检测基因突变和SNP分析。

5.多重引物PCR 多重引物PCR是在同一扩增体系加入多对引物,同时扩增多个基因片段的PCR技术。其技术的优点是通过一次扩增可诊断几种疾病或同一疾病的几个不同的基因突变。

6.随机引物PCR 多态DNA的随机扩增(random amplication of polymorphic DNA,RAPD)或随机引物PCR(arbitrarily primed PCR,AP PCR)是应用基因组DNA中单一、随机序列的短引物,通过PCR扩增产生一组代表种或株特性的DNA片段。因此,RAPD是获得种或株的DNA分子指纹图谱的通用方法。

7.套式PCR 又称巢式PCR,是对靶DNA片段设计两套引物系统,第1

套引物扩增15~30个循环,再用扩增的DNA片段内设定的第2套引物扩增15~30个循环,可使目的DNA序列得到高效扩增。套式引物PCR可减少引物的非特异性扩增,增加特异性扩增,减少PCR的误诊率。

8.突变体构建PCR

(1)应用载体构建突变体的PCR:原理是将野生型目的基因的cDNA插入到克隆载体上,设计携带突变点的一对引物,对克隆载体进行扩增,然后将经过PCR而获得的DNA转染感受态细胞,并用筛选培养基筛选转染的细胞,获得的克隆可以通过细胞扩增,获得大量的携带突变体DNA的载体。

(2)应用内外引物构建突变体的PCR:载体构建突变体PCR是构建点突变的高效方法,但不适用于缺失、易位、倒位等突变方式。内外引物构建突变体PCR可以克服载体构建突变体PCR的不足。其原理是合成两对引物,即一对扩增整个cDNA的外引物和一对包含突变序列并部分互补的内引物。分别以一个外引物与一个内引物进行PCR,可以获得两条DNA序列,该两条DNA在突变位点存在部分重合。去除引物,将两条DNA变性,而后进行复性,将可导致两条DNA重合部分互补,并在Taq酶的作用下补齐3'末端。用外引物扩增DNA,将获得含有突变的cDNA。

PCR引物的设计是PCR成功的关键,必须遵守以下原则:①确定扩增区域及其长度;②确定引物的Tm值;③避免引物自身二聚体、引物间二聚体和发夹结构等二级结构的形成;④具有扩增的特异性。

三、应用PCR技术检测性别决定基因

(一)实验原理

SRY基因又称睾丸决定基因(Testis determining factor),位于人类Y染色体,在X染色体上没有相应的同源节段。根据SRY基因序列合成一对特异性引物,通过PCR反应检查患者有无此基因相应扩增片段,以及患者的表型可对患者的真正性别和病因作出判断,另外对胎儿性别的产前诊断有利于防止性连锁遗传病患儿的出生。

(二)实验准备

1. 材料人体静脉血、注射器、微量加样器及吸头、1.5ml及0.5ml Eppendorf 管。引物序列:(SRY1:5′-GATCAGCAAGCAGCTGGGATACCAGTG-3′;SRY2:

5′-CTGTAGCGGTCCCGTTGCTGCGGTG-3′)

2. 试剂(实验中有关试剂和器材要进行高压灭菌处理)

生理盐水、细胞裂解液(50mmol Tris-HCl,pH 8.0;1mmol Na2 EDTA ,pH 8.0;0.5% SDS;0.1mmol NaCl)、10mg/ml蛋白酶K 、20%SDS 、水饱和酚(1mol/L Tris-HCl 抽提)、酚:氯仿:异戊醇(25∶24∶1)、氯仿:异戊醇(24∶1)、8mol/L 醋酸钾、无水乙醇、70%乙醇、TE(pH8.0)(10 mmol/L Tris-HCl,pH8.0;0.1 mmol/L Na2EDTA,pH8.0)、10×buffer(500mmol/L KCl、100mmol/L Tris·HCl,pH8.3,室温15mmol/L MgCl2;0.1% 明胶)、4×dNTP(1 mmol/LdATP,1 mmol/L dCTP,1 mmol/L dGTP,1 mmol/L dTTP)、Taq 酶(1U/μl)、引物溶液(10pmol/μl)、5×TBE 缓冲液(1000ml)(54g Tris碱,27.5g硼酸,20ml 0.5mol/L EDTA,pH8.0)、DNA 分子量标记、2%琼脂糖凝胶、载样缓冲液(100ml)(0.2%溴酚蓝,50%蔗糖,10mol/L NaOH 1~2滴)、10mg/ml溴化乙锭溶液(戴手套谨慎称取溴化乙锭约200mg,放入棕色瓶中,加重蒸水20ml,溶解后置4℃冰箱保存备用。使用时100ml 琼脂糖凝胶中加5μl 10mg/ml 溴化乙锭溶液,终浓度为0.5μg/ml)。

3. 实验仪器PCR扩增仪、超净工作台、高速台式离心机、电泳仪及电泳槽、紫外检测仪。

(三)实验步骤

1. DNA模板制备

方法Ⅰ:取毛发1~2根,尽量剪碎,于15~20ml生理盐水中100℃水浴10min,离心取上清备用。

方法Ⅱ:外周血提取DNA

(1)白细胞的分离

①抗凝血用1~2倍的生理盐水或磷酸缓冲的生理盐水(PBS)稀释并混合。

②在50ml离心管中加入1倍体积淋巴细胞分离液(上海试剂二厂),在上面仔细铺一层2倍体积已稀释的血液。

③室温以2000rpm离心15min~20min,红细胞应沉于管底,而白色的淋巴细胞应分布于上层血浆与下层淋巴细胞分离液的界面。

④吸弃血浆,小心吸取淋巴细胞层,直至把淋巴细胞转移完全。

⑤用生理盐水或PBS洗淋巴细胞二次。

⑥最后得到的淋巴细胞沉淀,可立即用于DNA的提取,或冻存于超低温冰箱中,直至使用。

(2)DNA的提取(见本篇第一章)。

2. PCR反应体系配制及扩增

(1)PCR反应总体积50μl,取一洁净的0.5ml Eppendorf管,依次加入:10×buffer 5μl

dNTP 5μl

引物1 2.5μl

引物2 2.5μl

模板DNA 10μl

Taq DNA 2U

d3H2O 补足50μl

(2)将反应管放入PCR扩增仪上进行聚合酶链反应,条件为94℃变性10min 后,94℃ 45s、55℃ 45s、72℃ 90s共30个循环;最末一个循环紧接72℃再延伸10min。

3. 扩增产物电泳检测

取PCR扩增产物10μl与2μl上样缓冲液混合后,与DNA Marker同时进行琼脂糖凝胶电泳。电泳结束,取出凝胶置于紫外检测仪上观察。

(四)注意事项

1. 实验过程应设阴性及阳性模板对照。

2. PCR常见问题及解决办法

(1)没有得到预期的PCR扩增产物:①确证聚合酶的活性是否正常;②DNA解链是否充分,变性温度是否准确;③引物组成是否正确,有无二级结构组成;④反应系统有无蛋白酶或核酸酶存在,使聚合酶或模板及产物降解。

(2)有非特异性扩增产物出现:①增加复性温度,缩短复性时间及延伸时间;②降低引物和Taq DNA聚合酶的用量;③调整Mg2+浓度;④减少热循环次数。

(3)形成了引物二聚体:①检查引物的序列,特别是3′端是否有互补区;

②增加引物的长度;③调整引物与模板浓度,使模板比例增高,降低引物使用浓度;④增加复性温度;⑤减少热循环次数。

(4)PCR产物在凝胶电泳中成片状:①减少Taq DNA聚合酶的用量;②增加复性温度,减少复性时间及延伸时间;③降低Mg2+浓度;④减少循环次数;

⑤从凝胶中回收与预期分子量相同的DNA,再次进行PCR反应。

3. 实验安全

溴化乙锭是强诱变剂,并有中度毒性,取用含有这一染料的溶液时务必戴上手套,这些溶液经使用后,应进行净化处理。

第二节单链构象多态性(SSCP)分析

单链构象多态性(single strand conformation polymorphism,SSCP)分析是利用DNA或RNA单链构象具有多态性的特点,结合PCR进行基因检测的一种分析技术,称为PCR-SSCP技术。其基本原理为:DNA或cDNA在变性后,由于序列的不同而导致单链DNA的空间结构各异。在非变性聚丙烯酰胺凝胶电泳的过程中,不同空间结构的单链DNA迁移率存在差异。因此,PCR-SSCP可以用来鉴定单核苷酸的差异。该技术已被广泛用于癌基因和抗癌基因变异的检测、遗传病的致病基因分析以及基因诊断、基因制图等领域。

PCR-SSCP的敏感性随核苷酸片段长度的增加而降低,在检测200个核苷酸片段中单个碱基的突变时,检出率高达90%;而400个核苷酸片段单个碱基突变的检出率为80%。因而,在实验中要将大片段分成较短的片段。哺乳动物基因组中的外显子一般小于300个碱基,可以使用内含子引物直接对目的片段进行PCR-SSCP。

一、PCR-SSCP技术的基本程序

PCR-SSCP技术的基本程序为:首先PCR扩增特定靶序列,然后将扩增产物变性为单链,进行非变性聚丙烯酰胺凝胶电泳。在不含变性剂的中性聚丙烯酰胺凝胶中电泳时,DNA单链的迁移率除与DNA链的长短有关外,更主要的是取决于DNA单链所形成的构象。在非变性条件下,DNA单链可自身折叠形成具有一定空间结构的构象。这种构象由DNA单链碱基决定,其稳定性靠分子内局部

顺序的相互作用(主要为氢键)来维持。相同长度的DNA单链其顺序不同,甚至单个碱基不同,所形成的构象不同,电泳迁移率也不同。PCR产物变性后,单链产物经中性聚丙烯酰胺凝胶电泳,靶DNA中含单碱基置换,或数个碱基插入或缺失等改变时,因迁移率变化会出现泳动变位,从而可将变异DNA与正常DNA区分开。由此可见,PCR-SSCP分析技术是一种DNA单链凝胶电泳技术,它根据形成不同构象的等长DNA单链在中性聚丙烯酰胺凝胶中的电泳迁移率变化来检测基因变异。

二、实验准备

(一)试剂

甲酰胺加样缓冲液(95%甲酰胺,20mmoL/L EDTA,0.05%溴酚蓝和0.05%二甲苯青)、6%丙烯酰胺(丙烯酰胺与甲叉双丙烯酰胺=49∶1)、10%甘油、0.5×TBE、10%醋酸、2%硝酸银、显影液(3%无水碳酸钠,0.2%甲醛,0.02%硫代硫酸钠)、去离子水

(二)实验仪器

PCR扩增仪、超净工作台、高速台式离心机、电泳仪及电泳槽、紫外检测仪。

三、实验步骤

1.目的片段的PCR及其产物的变性根据扩增的目的片段制定PCR扩增条件。PCR扩增结束后,用5倍体积的甲酰胺加样缓冲液混合。将样品于95℃变性5min并直接置于冰浴上。

2.电泳电泳胶有两种:①聚丙烯酰胺凝胶由6%丙烯酰胺、10%甘油和0.5×TBE组成。上样5μl,在室温下0.5W/cm,用0.5×TBE电极缓冲液电泳2.5h 以上;②聚丙烯酰胺凝胶由6%丙烯酰胺和0.5×TBE组成。上样5μl,在4℃下0.5 W/cm,用0.5×TBE电极缓冲液电泳2.5h以上。

3.染色取下凝胶,置10%醋酸固定液中30min,再以去离子水漂洗3次(2min/次),加入2%硝酸银染液染色20min后,去离子水洗胶20s,凝胶置显影液中显色5~10min,以10%醋酸终止反应,漂洗及分析结果。

4.结果判读SSCP结果判读的标准是正常个体由于等位基因相同,仅存在两条单链,因此在凝胶上多出现两条带,有时由于两条链接近可形成一条带,或

一条单链有两种空间结构可形成三条带;突变个体由于等位基因不同,可以形成四种不同的单链,因此在凝胶上多出现四条带,有时也可形成五条带。如果存在复杂突变,可以形成超过5条的带纹(图2-3-1)。

四、注意事项

1. 核酸片段的大小是决定检测敏感性的首要因素:用于SSCP分析的核酸片段越小,检测的敏感性越高。对于大于400bp的PCR产物可采用以下两种策略进一步处理:①用限制性内切酶对PCR产物进行消化,产生较小片段;②通过改变引物的位置和增加PCR扩增次数,缩短PCR产物。

2. 聚丙烯酰胺凝胶孔径的大小是影响检测敏感性的另一个重要的因素:一般情况下,丙烯酰胺与甲叉双丙烯酰胺的比例为49∶1。可以选用10%甘油在室温或无甘油在4℃条件下进行电泳。

3. 游离引物:游离引物可能同PCR产物结合而改变其泳动率,即使游离引物量为6nM都有明显影响。因此,应尽可能除去游离引物。可以采用不对称引物扩增方法,尽可能消耗多余的引物。也可以运用过柱或磁性球方法纯化PCR 产物。或者是稀释PCR产物,减少游离引物的干扰。

4. 低浓度变性剂:凝胶中加入低浓度的变性剂,如5%~10%甘油、5%尿素或甲酸胺、10%二甲亚砜(DMSO)或蔗糖等有助于提高敏感性,可能是因为轻微改变单链DNA的构象,增加分子的表面积,降低单链DNA的泳动率。但有些变异序列却只能在没有甘油的凝胶中被检出。因此,对同一序列使用2~3种条件做SSCP,可能提高敏感性。

5. 电泳温度:一般认为保持凝胶内温度恒定是SSCP分析最关键的因素,温度有可能直接影响DNA分子内部稳定力的形成及其所决定的单链构象,从而影响突变的检出。室温下电泳适于大多数情况,但由于在电泳时温度会升高,为确

保电泳温度相对恒定,应采取以下措施:减少凝胶厚度,降低电压,有效的空气冷却或循环水冷却等。

6. 凝胶的长度:可用测序板进行SSCP分析,凝胶板长度在40cm以上。

7. 凝胶浓度及厚度:凝胶浓度很重要,一般使用5%~8%的凝胶,凝胶浓度不同,突变带的相对位置也不相同,如果在进行未知突变种类的SSCP分析时,最好采用两种以上凝胶浓度,这样可以提高突变种类的检出率。凝胶的厚度对SSCP分析也很重要,凝胶越厚,背景越深,在上样量较多的前提下,尽量使凝胶越薄越好。

8. 假阴性:一般认为,如没有污染,PCR-SSCP分析不存在假阳性结果,但可能出现假阴性结果,后者是由于点突变引起的空间构象变化甚微,迁移率相差无几所致,尤其是点突变发生在扩增片段的两端时。如果有阳性和阴性对照,结果可以重复确定的突变带是可信的,如果没有阳性对照,应经测序来确定其是否为突变带。由于PCR-SSCP的不足之处主要是可能检出假阴性结果。应通过设置阳性对照,摸索电泳条件,假阴性结果在很大程度上是可以避免的。但对未知基因变异的检测,假阴性结果就难以百分之百地消除。

9. 结果分析:单链凝胶电泳时,互补单链迁移率不同,一般形成两条单链带。PCR产物进行单链凝胶电泳之前,通过加热变性产生单链。如变性不彻底,残留双链亦可形成一条带.因此,PCR-SSCP分析结果至少显示三条带。但是,由于一种DNA单链有时可形成两种或多种构象,检出三条或四条单链带就不足为奇。

第三节基因表达谱研究技术

人类基因组大约有30000个左右的结构基因,其中在任一细胞中表达的基因仅占总数的15%。管家基因在任何生长发育阶段以及生理状态下均有所表达,而奢侈基因的表达则有组织特异性、时空特异性以及调节特异性。两者同时决定了包括发育与分化、内环境稳定(homeostans)、对逆境的反应、细胞周期调控、衰老乃至程序化死亡等整个生命过程。基因表达的变化是调控生命活动过程的核心机制。通过比较同一类或不同种类细胞在不同生理条件下或在不同生长发育阶段

的基因表达差异,可为分析生命活动过程提供重要信息。因此,基因的表达谱研究是揭示细胞生长、细胞分化、组织器官建立以及细胞衰老死亡的重要方向。

研究基因表达谱的方法主要有基因表达系列分析、基因芯片技术、差异显示PCR法以及消减杂交技术等(表2-3-1)。

表2-3-1 不同基因表达谱研究技术的比较

方法技术与原理优点缺点

基因表达系列分析克隆、DNA测序不需特殊设备、实验成本

较低、测序效率较高、可

获得新基因。

克隆步骤较多、基因片段有可能丢失、提供

信息有限。

基因芯片分子杂交操作简便、不需测序。实验费用高、需要特殊设备;存在假阳性和

假阴性;图象和数据分析工作量较大。

差异显示PCR 电泳、分子杂交、

PCR技术、DNA

测序不需特殊设备、可展示所

有基因、差异表达基因片

段、可获得新基因。

方法繁琐、假阳性高、片段短而靠近

mRNA3'末端。

代表性差异分析技术克隆、PCR技术、

分子杂交

mRNA需求少、特异性高酶切连接步骤多、cDNA存在丢失现象、获

得的片段是酶切片段。

抑制消减杂交技术PCR、克隆、测序特异性高低丰度cDNA存在丢失、不能合成全长

cDNA。

基于PCR的消减杂交技术分子杂交、PCR、

克隆、测序

设备要求不高、操作简

便、可获得新基因。

研究经费高、不能同时展示所有的基因和差

异基因、存在一定的假阳性、需大量测序。

一、SAGE技术

(一)概述

基因表达系列分析(serial analysis of gene expression,SAGE)是由Velculescu 等建立并用以分析基因组表达的方法,可以在未知目的基因的前提下,分析来自一个细胞的全部转录本信息;对已知或未知基因表达进行定性和定量分析;假阳性率低,可重复性强。

随着SAGE技术的日益成熟,在基因表达方面已经得到了广泛的使用。

(二)SAGE的原理

mRNA的3'末端特定部位存在可以标识其特异性的标签(tag),其长度一般在10~14个核苷酸之间,检测tag可以获得该mRNA的表达信息。SAGE技术主要是基于以上原理,通过获得tag从而确定基因的表达情况。其次,分离获得的tag可以通过串联连接克隆于载体上,以便测序,提高了分析效率。同时,

根据同一tag重复次数,可以判断转录本的表达水平。

SAGE技术包括以下几个步骤:①提取RNA,并将其与携带生物素标记的oligodT混合,以mRNA为模板,经逆转录得到双链cDNA;②锚定酶(anchoringenzyme,AE) 酶切生物素标记的双链cDNA。锚定酶要求至少在每一种转录本上有一个酶切位点,一般4碱基限制性内切酶能达到这种要求。Nia Ⅲ是一种广泛的限制性内切酶,平均每250bp就存在一个Nia Ⅲ识别位点CATG,因此是理想的SAGE锚定酶;③应用带有亲和素的磁珠分离生物素标记的cDNA3′端酶解片段,获得mRNA polyA尾部与最近的酶切位点之间的片段;④将分离得到的cDNA酶切片段等分为A和B两部分,分别与设计好的两种连接子A或B连接。连接后的DNA片段在3'端包含有ⅡS型内切酶(如BsmF Ⅰ)的识别位点;⑤用ⅡS型内切酶(又称标签酶)消化以上步骤获得的连接产物,并去除与磁珠相连的DNA片段。ⅡS型内切酶的作用方式以标签酶BsmF Ⅰ为例,BsmF Ⅰ的识别和切割位点为5′-GGGAC(N)10↓-3′/3′-CCCTG(N)14↓-5′,因此产生连有接头的短cDNA片段,长为10碱基,即释放的cDNA标签,不同的标签酶获得的碱基数不同,如Fok I可以获得9碱基的标签;⑥利用Klenow 片段或T4 DNA聚合酶消化产生的粘性末端,混合两个cDNA池的短cDNA片段,并连接成100bp的双标签(ditag)⑦以引物A和B通过PCR扩增双标签,扩增产物含有2个尾尾相接的标签(一个Ditag),其侧翼有锚定酶切割位点;⑧利用锚定酶酶切扩增产物,分离纯化以收集标签(Ditag);⑨将每30~50个双标签连接起来,并克隆到pZErO-1载体中,建立SAGE文库;⑩对插入到pZErO-1载体中的双标签序列进行测序,并利用相应的应用软件进行结果分析,确定原始序列中每个标签序列、数目以及发生率。同时可以与NCBI的SAGEmap、GenBank 以及EST公众数据库进行比对,找出标签与基因及EST之间的对应关系,对标签进行定性(图2-3-2、2-3-)。

(三)SAGE技术的应用

1.全基因组转录图谱的建立早在1995年,Velculescu等选择BsmFI和Nia Ⅲ分别作为标签酶和锚定酶对胰腺组织中1000多个标签进行手工测序,发现95%以上的标签能够代表唯一的转录物。2001年,Caron等将公众SAGE数据库的231万标签以及他们自己从神经母细胞瘤分离到的16万个标签按照组织来源分成12组,并经过计算,将这12组不同组织的标签与已做染色体定位的基因进行比对,获得了可以反映基因表达丰度的全基因组转录图谱,并发现染色体上存在高表达的基因簇区域(region of increased gene expression,RIDGE)。结果提示,基因组结构是高度有序的,一个典型的RIDGE在1CR(centiary)的染色体长度上通常含有6~30个基因,而低转录区域仅含有1~2个基因,例如在18号染色体上,目前发现有385个表达丰度较低的基因,而在大小相近的19号染色体上分布着一连串RIDGE,包含了937个基因。

2.在基因差异表达中的研究在生物的基因组中存在两大类基因:管家基因和奢侈基因。管家基因在不同组织来源的细胞中广泛表达,而奢侈基因的表达具有组织特异性。研究组织特异性基因的表达是揭示细胞分化的基础。SAGE技术为基因差异表达的研究提供了有效的手段,在发育生物学以及肿瘤生物学中得到了广泛的应用。

通过SAGE技术对病理状态和正常生理状态的组织进行基因表达谱比较研究,可以发现疾病相关的标记基因。此外,SAGE技术也可应用于化学物质处理细胞前后基因表达变化的研究。例如有学者研究了神经生长因子(NGF)、雌激素、细菌脂多糖(LPS)等对相映的细胞神经元、乳腺癌细胞以及单核细胞处理前后基因表达差异,发现了与之相关的下游基因。

3.模式生物的研究SAGE技术已经广泛地应用于其它模式生物的研究中。Velculescue等在酵母上分离得到60633个SAGE标签,其中93%的标签可与4665个基因对应。Matsumura等从水稻秧苗中分离出10122个标签,其中23.1%可与已知的1367个cDNA、EST匹配。

二、差异显示技术

(一)概述

差异显示技术(differential display RT-PCR,DDRT-PCR)是1992年由Liang

和Pardee创立而用于研究基因表达差异的方法。其原理是:真核细胞mRNA3′polyA上游的两个碱基MN(M=A/C/G,N=A/C/G/T)可以形成12种组合,以T7T12MN作为锚定引物与mRNA的polyA以及上游的两个碱基结合,在反转录酶作用下进行总mRNA的反转录,将形成与引物匹配的十二类cDNA。在mRNA(cDNA)5′端设计带有荧光标记的随机引物,并结合锚定引物,对cDNA 进行扩增。由于不同的mRNA(cDNA)其随机引物结合部位不同,因此PCR 产物的大小和序列不同。经聚丙烯酰胺凝胶电泳,分离cDNA扩增产物,用GenomyxSC荧光扫描系统检测2kb~300bp的DNA片段。从聚丙烯酰胺胶中回收特异cDNA片段,经再次PCR扩增和琼脂糖凝胶电泳检测,并以Northern blot 排除假阳性后,对目的片段进行克隆。获得的cDNA可以制备为探针,从cDNA 文库或基因组文库中筛选全长cDNA或全基因序列。

差异显示技术在基因表达研究中具有以下优势:①实验要求的mRNA样品量较少;②DDRT-PCR技术包含PCR扩增过程,因此能够用于检测组织或细胞中极低丰度表达mRNA样品的差异表达;③可以将两种或两种以上特定组织样品来源的扩增产物放在同一块凝胶上鉴定,因此保证了测定的一致性,因此可以用于鉴定不同来源组织或细胞转录水平mRNA的定性和定量变化。然而,差异显示技术也存在以下主要缺陷:①假阳性较高,引起假阳性的因素有:DNA污染、差异cDNA条带可能包含多种产物、某些cDNA片段较小等;②cDNA产物的质量较低,在序列胶中表现为条带不清晰;③由于随机引物与模板匹配不适,引起扩增产物产率较低。

改善DDRT-PCR合成体系是提高其应用的基础。引物的合理设计是降低差异显示技术缺陷的重要手段。

RNA的质量是决定DDRT-PCR成功的另一个决定因素,实验要求:①RNA 保持完整性;②OD260与OD280的比值在2左右;③RNA应无DNA污染,可以通过应用无RNase的DNase除去提取物中残存的DNA分子,也可通过oligo (dT)层析法分离纯化具有polyA尾部的RNA分子。

(二)实验操作的具体步骤

1.实验操作步骤

(1)总RNA的制备:按试剂盒提供的方法或按《分子克隆试验指南》提

供的方法提取总RNA,以RNase free DNase I(终浓度80 000U/L)降解其中污染的DNA,经甲醛变性凝胶电泳鉴定其完整性,并以紫外分光光度仪检测其纯度。

(2)逆转录反应:选择锚定引物T7(dT12)AP对总RNA进行逆转录反应,反应体系如下:总RNA10μg,引物4pmol,70 ℃ 5 min,置于冰上3 min,加入50mmol/L Tris-HCl(PH 8.3),75mmol/L KCl,3mmol/L MgCl2,10mmol/L DTT,25μmol/L dNTPmix (1:1:1:1),SuperScript Ⅱ 60U,总反应体系20μl。42 ℃ 5 min,50 ℃ 50 min,70 ℃ 15 min。

(3)荧光标记差异PCR:选取带有荧光标记的锚定引物TMR T7(dT12)AP和任意一个随机引物对逆转录产物进行PCR反应。反应体系包括:20mmol/L Tris-HCl(PH 8.4),50mmol/L KCl,3.75mmol/L MgCl2,逆转录产物3.0μl,50μmol/L dNTPmix (1:1:1:1),0.35μmol/L 5′随机引物,0.35μmol/L 3′锚定引物,AmpliTaq 0.5 U,总反应体系10μl。95 ℃ 2min;94 ℃15 s,50 ℃ 30 s,72 ℃ 90 s,4个循环;

94 ℃ 15 s,60 ℃ 30 s,72 ℃ 90 s, 25个循环;72 ℃延伸7min。

(4)分离差异显示片段:配置5.6%变性聚丙烯酰胺胶,胶厚0.25mm,大小61×33cm。将取PCR产物10μl与10μl上样缓冲液混合,95℃变性后上样。3000V、100W、55℃电泳4.5h。制成干胶,在GenomyxSC上扫描,用AcquireSC program软件分析扫描结果。

(5)回收差异条带:确定差异条带位置,用一次性手术刀片切割下所需条带,置于30μl去离子水中,37℃水浴30~60min,备用。

(6)差异条带的再扩增:以回收条带为模板,用T7启动子锚定引物T7(dT12)AP 和随机引物对模板进行再扩增反应:模板 2.0μl,20mmol/L Tris-HCl(pH 8.4),50mmol/L KCl,1.5mmol/L MgCl2,20μmol/L dNTPmix (1:1:1:1),

0.2 μmol/L 的引物,10U AmpliTaq,总反应体系20μl。反应条件同差异显示PCR。

三、基因芯片技术

基因芯片是生物芯片的一种,由分子生物学、微电子学和计算机科学等多种学科相互交融而形成的新技术。其为基因表达谱的研究、新基因的发现、基因突变的检测、DNA多态性的分析、基因组作图等提供了有效的手段。

(一)概述

基因芯片(genechip)又称DNA芯片或DNA微阵列,以DNA分子杂交技术

为基础,将许多已知的、特定的寡核苷酸或基因(cDNA)片段作为探针,有序地、高密度地排列在玻璃、硅片或尼龙膜等载体上,制成DNA微阵列(DNAmicroarray),对待测样品DNA或由RNA通过RT-PCR扩增得到的cDNA 进行荧光分子标记,并与芯片上的探针杂交,再经过激光共聚焦荧光扫描系统扫描,检测探针分子杂交信号强度,通过计算机系统对荧光信号综合分析获得样品中大量基因序列及表达的信息。基因芯片可以获得每个点在不同波长下的荧光强度值及其比值(ratio值),并得到直观的显色图。目前常用的荧光染料是Cy3(绿色)和Cy5(红色)。以Cy3 dUDP标记正常对照组织mRNA,Cy5 dUDP标记实验组织mRNA,杂交后仅在实验组织中高表达基因呈现红色,而在正常对照组织中高表达的基因呈现绿色;在两组织中表达水平相当的显黄色,而均不表达的则为无色。基因芯片可同时对两组或两组以上样品中的基因表达水平进行平行检测,从而可对来源于不同个体(正常人与患者)、不同组织、不同细胞周期、不同发育阶段、不同分化阶段、不同病变、不同刺激(包括不同诱导、不同治疗手段)下细胞内的mRNA或逆转录产物cDNA进行大规模检测和分析。

根据微阵列上探针的种类,可将基因芯片分为寡核苷酸芯片和cDNA芯片。前者是将寡核苷酸原位合成或合成后固定在芯片上,并与标记样本DNA杂交,根据杂交信号出现部位的寡核苷酸序列,推测与其互补的DNA序列。可用于基因发现、突变检测、表达监控和遗传制图等。后者是将cDNA固定在芯片上,并与一组标记探针杂交,可用于基因表达的研究。

(二)基因芯片使用的基本流程

基因芯片技术包括四个主要步骤:芯片制备、样品制备、杂交反应及信号检测和结果分析。

1.待测样本的制备基因芯片的样本来自于两个方面:其一是直接从组织细胞中分离纯化DNA,并对待测样本中的DNA进行特异扩增;其二是提纯RNA,并进行逆转录以及cDNA扩增。在DNA扩增的过程中需要完成样本的标记。目前样品标记常采用荧光标记法,也可用生物素或放射性同位素。标记后的样品需要进行纯化,以减小荧光背景对杂交信号检测的影响。

2.分子杂交反应基因芯片的分子杂交与Southern印迹的方法一致。由于探针是附着在基因芯片的表面,会干扰靶分子与探针的结合,因此需要相应地延

长杂交时间或增加靶分子的浓度。杂交反应条件必须根据探针的长度、类型以及GC含量等调整杂交液的盐浓度、杂交温度以及时间。

3.检测分析基因芯片的分子杂交信号的检测和分析需要高灵敏度的检测系统——阅读仪及其分析软件。根据成像原理的不同,阅读仪可分为激光共聚焦扫描和CCD两种。前者分辨率和灵敏度较高,可获取高质量的图像和数据,但扫描速度较慢,而且价格昂贵。后者的特点与之相反。目前常用的是激光共聚焦扫描仪。

基因芯片杂交实验可以产生成千上万个点的杂交信息,因此需要生物信息学手段的支持。借助读取和分析杂交信号的应用软件以及与网络公共数据库连接进行数据分析的应用软件,可以高效获得研究对象的有效信息。

(三)基因芯片的应用领域

1.基因表达分析发现和研究新基因可以从分子水平探求细胞生长代谢的调控机制,揭示基因突变诱导人类疾病的病因以及发生机理。基因芯片技术是基因筛选的有效方法。

个体生长发育、细胞分化或组织生理功能的发挥常需要一个或几个功能基因群共同作用。基因芯片可同时检测成千上万个基因,获得细胞、组织和机体在某一特定时点所有基因表达的信息,从而揭示细胞在某个阶段的调控网络或对某刺激的反应通路。基因芯片在组织特异性基因筛选的研究中具有高效性和全面性,而且可以检测低丰度表达水平的mRNA。

2.基因突变检测基因芯片是检测基因突变高效的手段。经典的研究多采用PCR-SSCP、手工或自动测序、异源双链分析、蛋白截短检测等方法,其缺点为步骤烦琐、工作量大、工作效率较低,限制了在大规模研究中的应用。基因芯片方法可以克服以上的不足,结合DNA聚合酶或连接酶,可进一步提高分辨率。

3.药物筛选筛选、分离和鉴定药的有效成份是目前中药产业和传统的西药开发的重要方向。基因芯片技术为大规模筛选药物提供了有效的手段,并能够从基因水平揭示药物的作用机理。应用基因芯片技术不仅能够分析用药前后机体的不同组织、器官基因表达的差异,而且可以利用RNA或单链DNA与靶蛋白质结合形成蛋白质-RNA或蛋白质-DNA复合物的特点,筛选特异的药物蛋白或核酸。生物芯片技术不仅使药物筛选、靶基因鉴别和新药测试的速度大大提高,

而且大大降低了研究成本。

4.基因芯片在其它领域中的应用随着人类基因组计划(HGP)的完成,人类医学将从群体医学向个体医学过度。由于每个个体的遗传背景不同,其对临床治疗将有新的要求,即因人而治。由于不同患者对药物的敏感性存在差异,确定患者与药物代谢相关的基因多态性极为重要,基因芯片为患者的基因多态研究提供了高通量的测试手段。另外,基因芯片也是诊断同种疾病不同病原体的有效手段。例如乙肝有多种亚型,HBV基因在S、P及C基因区易发生变异。利用乙肝病毒基因多态性检测芯片进行检测,可以指导临床用药,以及防止乙肝病毒耐药性,因此具有临床指导意义。

在生物体的细胞内,存在着几千至数万个基因。不同基因间的关系错综复杂,一个基因表达的上调或者下调均会影响上游和下游几个基因表达的改变,从而进一步引起与该几个基因相关的更多基因表达的改变。生物信息学在分析基因相互关系的网络中扮演至关重要的角色。基因芯片技术为生物信息的建立提供了高速、并行采集和分析的技术平台,成为基因组信息学研究的主要技术支撑。

(潍坊医学院杜长青、高志芹)

基因表达的分析技术

第二篇细胞的遗传物质 第三章基因表达的分析技术 生物性状的表现均是通过基因表达调控实现的。对基因结构与基因表达调控进行研究,是揭示生命本质的必经之路。在基因组研究的过程中,逐步建立起一系列行之有效的技术。针对不同的研究内容,可建立不同的研究路线。 第一节PCR技术 聚合酶链反应(polymerase chain reaction,PCR)技术是一种体外核酸扩增技术,具有特异、敏感、产率高、快速、简便等突出优点。。PCR技术日斟完善,成为分子生物学和分子遗传学研究的最重要的技术。应用PCR技术可以使特定的基因或DNA片段在很短的时间内体外扩增数十万至百万倍。扩增的片段可以直接通过电泳观察,并作进一步的分析。 一、实验原理 PCR是根据DNA变性复性的原理,通过特异性引物,完成特异片段扩增。第一,按照欲检测的DNA的5'和3'端的碱基顺序各合成一段长约18~24个碱基的寡核苷酸序列作为引物(primer)。引物设计需要根据以下原则:①引物的长度保持在18~24bp之间,引物过短将影响产物的特异性,而引物过长将影响产物的合成效率;②GC含量应保持在45~60%之间;③5'和3'端的引物间不能形成互补。第二,将待检测的DNA变性后,加入四种单核苷酸(dNTP)、引物和耐热DNA聚合酶以及缓冲液。通过95℃变性,在进入较低的温度使引物与待扩增的DNA链复性结合,然后在聚合酶的作用下,体系中的脱氧核苷酸与模板DNA链互补配对,不断延伸合成新互补链,最终使一条DNA双链合成为两条双链。通过变性(92~95℃)→复性(40~60℃)→引物延伸(65~72℃)的顺序循环20至40个周期,就可以得到大量的DNA片段。理论上循环20周期可使DNA扩增100余万倍。

基因表达谱芯片的数据分析

基因表达谱芯片的数据分析(2012-03-13 15:25:58)转载▼ 标签:杂谈分类:生物信息 摘要 基因芯片数据分析的目的就是从看似杂乱无序的数据中找出它固有的规律, 本文根据数据分析的目的, 从差异基因表达分析、聚类分析、判别分析以及其它分析等角度对芯片数据分析进行综述, 并对每一种方法的优缺点进行评述, 为正确选用基因芯片数据分析方法提供参考. 关键词: 基因芯片; 数据分析; 差异基因表达; 聚类分析; 判别分析 吴斌, 沈自尹. 基因表达谱芯片的数据分析. 世界华人消化杂志2006;14(1):68-74 https://www.wendangku.net/doc/1a2238814.html,/1009-3079/14/68.asp 0 引言 基因芯片数据分析就是对从基因芯片高密度杂交点阵图中提取的杂交点荧光强度信号进行的定量分析, 通过有效数据的筛选和相关基因表达谱的聚类, 最终整合杂交点的生物学信息, 发现基因的表达谱与功能可能存在的联系. 然而每次实验都产生海量数据, 如何解读芯片上成千上万个基因点的杂交信息, 将无机的信息数据与有机的生命活动联系起来, 阐释生命特征和规律以及基因的功能, 是生物信息学研究的重要课题[1]. 基因芯片的数据分析方法从机器学习的角度可分为监督分析和非监督分析, 假如分类还没有形成, 非监督分析和聚类方法是恰当的分析方法; 假如分类已经存在, 则监督分析和判别方法就比非监督分析和聚类方法更有效率。根据研究目的的不同[2,3], 我们对基因芯片数据分析方法分类如下: (1)差异基因表达分析: 基因芯片可用于监测基因在不同组织样品中的表达差异, 例如在正常细胞和肿瘤细胞中; (2)聚类分析: 分析基因或样本之间的相互关系, 使用的统计方法主要是聚类分析; (3)判别分析: 以某些在不同样品中表达差异显著的基因作为模版, 通过判别分析就可建立有效的疾病诊断方法. 1 差异基因表达分析(difference expression, DE) 对于使用参照实验设计进行的重复实验, 可以对2样本的基因表达数据进行差异基因表达分

基因表达的检测的几种方法

基因表达检测的最终技术目标是能确定所关注的任何组织、细胞的 RNA的绝对表达量。可以先从样本中抽提RNA,再标记RNA, 然后将这些标记物作探针与芯片杂交,就可得出原始样本中不同 RNA的量。然而用于杂交的某个特定基因的RNA的量与在一个 相应杂交反应中的信号强度之间的关系十分复杂,它取决于多种 因素,包括标记方法、杂交条件、目的基因的特征和序列。所以 芯片的方法最好用于检验两个或多个样本中的某种RNA的相对 表达量。样本之间某个基因表达的差异性(包括表达的时间、空 间特性及受干扰时的改变)是基因表达最重要的,而了解RNA 的绝对表达丰度只为进一步的应用或多或少地起一些作用。 基因表达的检测有几种方法。经典的方法(仍然重要)是根据在 细胞或生物体中所观察到的生物化学或表型的变化来决定某一 特定基因是否表达。随着大分子分离技术的进步使得特异的基因 产物或蛋白分子的识别和分离成为可能。随着重组DNA技术的 运用,现在有可能检测.分析任何基因的转录产物。目前有好几 种方法广泛应用于于研究特定RNA分子。这些方法包括原位杂交.NORTHERN凝胶分析.打点或印迹打点.S-1核酸酶分 析和RNA酶保护研究。这里描述RT-PCR从RNA水平上检查 基因表达的应用。8 f3 f- |2 L) K) b7 ]- ~- | RT-PCR检测基因表达的问题讨论

关于RT-PCR技术方法的描述参见PCR技术应用进展,在此主要讨论它在应用中的问题。理论上1μL细胞质总RNA对稀有mRNA扩增是足够了(每个细胞有1个或几个拷贝)。1μL差不多相当于50-100,000个典型哺乳动物细胞的细胞质中所含RNA的数量,靶分子的数量通常大于50,000,因此扩增是很容易的。该方法所能检测的最低靶分子的数量可能与通常的DNAPCR相同;例如它能检测出单个RNA分子。当已知量的转录RNA(用T7RNA聚合酶体外合成)经一系列稀释,实验结果表明通过PCR的方法可检测出10个分子或低于10个分子,这是反映其灵敏度的一个实例。用此技术现已从不到1个philadelphia染色体阳性细胞株K562中检测到了白血病特异的MRNA的转录子。因此没必要分离polyA+RNA,RNA/PCR法有足够的灵敏度来满足绝大多数实验条件的需要。 7 H+ F& _* S6 W( a8 p: [, @- d, { 将PCR缓冲液同时用于反转录酶反应和PCR反应,可简化实验步骤。我们发现整个反应过程皆用PCR缓冲液的结果相当于或优于先用反转录缓冲液合成CDNA,然后PCR缓冲液进行PCR扩增循环。当然,值得注意的是PCR缓冲液并不最适合第一条DNA链的合成。我们对不同的缓冲液用于大片段DNA 合成是否成功还没有进行过严格的研究。

基因表达系列分析技术及其应用

万方数据

万方数据

万方数据

基因表达系列分析技术及其应用 作者:党冬梅, 魏晓萍, 惠起源, 符兆英 作者单位:延安大学医学院,陕西,延安,716000 刊名: 延安大学学报(医学科学版) 英文刊名:JOURNAL OF YANAN UNIVERSITY(MEDICAL SCIENCE EDITION) 年,卷(期):2005,3(1) 被引用次数:0次 参考文献(8条) 1.Velculescu E查看详情 1995 2.Menssen A.Hermeking H Characterization of the c-MYC regulated transcriptome by SAGE:Identification and analysis of target genes 2002(09) 3.Levens D Disentangling the MYC web 2002(09) 4.Matsumura H.Nirasawa S.Terachi R Transcript profiling in rice (Oryzn sation L.) seedlings using serial analysis of gene expression 1999(06) 5.Margulies E H.Kardia S L R.Innis J W查看详情 2001 6.Du Z.Scott A D.May G D Expression profiling of UV-and Gamma-irradiated Ambidopsis plantlets through serial analysis of gene expression 2001 7.Inadera H.Hashimot0 S.Dongi H Y WISP-2 as a novel estrogen-responsive gene in human breast cancer cell 2000(01) 8.Xu L L.Shanmugan N.Sesterhenn I A A novel androgen regulated gene,PMEPAI.Iocated on chromosome 20113 exhibit high level expression in protstate 2000(03) 本文链接:https://www.wendangku.net/doc/1a2238814.html,/Periodical_yadxxb-yxkxb200501045.aspx 授权使用:西安交通大学(xajtdx),授权号:fa53fce6-7ae2-4ac8-b779-9e9900a7d328 下载时间:2011年3月1日

基因差异表达技术

基因差异表达技术 真核生物中,从个体的生长、发育、衰老、死亡,到组织的得化、调亡以及细胞对各种生物、理化因子的应答,本质上都涉及基因的选择性表达。高等生物大约有30000个不同的基因,但在生物体内任意8细胞中只有10%的基因的以表达,而这些基因的表达按特定的时间和空间顺序有序地进行着,这种表达的方式即为基因的差异表达。其包括新出现的基因的表达与表达量有差异的基因的表达。生物体表现出的各种特性,主要是由于基因的差异表达引起的。 由于基因的差异表达的变化是调控细胞生命活动过程的核心机制,通过比较同一类细胞在不同生理条件下或在不同生长发育阶段的基因表达差异,可为分析生命活动过程提供重要信息。研究基因差异表达的主要技术有差别杂交(differential hybridization)、扣除(消减)杂交(subtractive hybridization of cDNA,SHD)、mRNA差异显示(mRNA differential display,DD)、抑制消减杂交法(suppression subtractive hybridization,SSH)、代表性差异分析(represential display analysis,RDA)、交互扣除RNA差别显示技术(reciprocal subtraction differential RNA display)、基因表达系列分析(serial analysis of gene expression,SAGE)、电子消减(electronic subtraction)和DNA微列阵分析(DNA microarray)等。 一、差别杂交与扣除杂交 差别杂交(differential hybridization)又叫差别筛选(differential screening),适用于分离经特殊处理而被诱发表达的mRNA的cDNA克隆。为了增加这种方法的有效性,后来又发展出了扣除杂交(subtractive hybridization)或扣除cDNA克隆(subtractive cDNA cloning),它是通过构建扣除文库(subtractive library)得以实现的。 (一)差别杂交 从本质上讲,差别杂交也是属于核酸杂交的范畴。它特别适用于分离在特定组织中表达

基因表达系列分析(Serial Analysis of Gene Expression,SAGE)技术

SAGE 技术 MRNA 结合到微珠子上(Microscopic Bead and mRNA) mRNA 转录成DNA(mRNA binds to bait and is copied into DNA)

用酶切开DNA的一小段(An enzyme cuts the DNA) 另一个酶定在DNA末端以便切下一小段(An enzyme locks onto the DNA and cuts off a short tag),这一小段就被视为这个基因的标签 两个标签连在一起(Two tags are linked together)

在末端的定位分子被切掉(Enzymes cut off the "Docking Molecules") 都连成一条线(Di-Tags are combined into large concatemers)

DNA上所携带的遗传信息,需要通过RNA为中介体,合成出组织和正常生理功能所需要的蛋白质,这个过程被称为基因的表达。在生物体中不同的组织和器官所表达的基因群是不一样的,我们把基因群的表达状况称为基因表达谱。目前,高通量地研究基因表达谱的方法主要有两种,即生物芯片和基因表达串联分析(serial analysis of gene expression, SAGE)。基因芯片所能检测的基因必须是已知的基因,放在芯片上几种基因的探针就只能检测这几种基因的表达谱;相比之下,SAGE能以远高于DNA芯片的精确度和重复性来检测在病理条件下基因表达谱的改变,而不必考虑所检测的基因是已知的还是未知的。因此在检测疾病相关的新基因,特别是无法用基因芯片进行检测的低表达量致病基因时,SAGE是目前的最佳手段,无可取代。 SAGE技术为Genzyme公司所拥有的专利技术。其技术简介如下: SAGE技术得以建立的理论基础 首先,一段来自于任一转录本特定区域的"标签"(Tag),即长度仅9-14bp的短核苷酸序列,就已包含足够的信息以特异性地确定该转录本。例如:一个9碱基的序列能有49=262144种不同的排列组合,而人类基因组据估计仅编码80000种转录本,因此在理论上每一个9碱基标签就能够代表一种转录本的特征序列。 第二,如果将短片段标签相互连接、集中形成长的DNA分子,则对该克隆进行

基因表达分析

基因表达分析 1、EST(Expressed Sequence Tag)表达序列标签(EST)分析 1、EST基本介绍 1、定义: EST是从已建好的cDNA库中随机取出一个克隆,进行5’端或3’端进行一轮单向自动测序,获得短的cDNA部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20到7000bp不等,平均长度为400bp。 EST来源于一定环境下一个组织总mRNA所构建的cDNA文库,因此,EST也能说明该组织中各基因的表达水平。 2、技术路线: 首先从样品组织中提取mRNA,在逆转录酶的作用下用oligo(dT)作为引物进行RT-PCR 合成cDNA,再选择合适的载体构建cDNA文库,对各菌株加以整理,将每一个菌株的插入片段根据载体多克隆位点设计引物进行两端一次性自动化测序,这就是EST序列的产生过程。

3、EST数据的优点和缺点: (1)相对于大规模基因组测序而言,EST测序更加快速和廉价。 (2)EST数据单向测序,质量比较低,经常出现相位的偏差。 (3)EST只是基因的一部分,而且序列里有载体序列。 (4)EST数据具有冗余性。 (5)EST数据具有组织和不同时期特异性。 4、EST数据的应用 EST作为表达基因所在区域的分子标签因编码DNA序列高度保守而具有自身的特殊性质,与来自非表达序列的标记(如AFLP、RAPD、SSR等)相比,更可能穿越家系与种的限制。因此,EST标记在亲缘关系较远的物种间比较基因组连锁图和比较质量性状信息是特别有用的。同样,对于一个DNA序列缺乏的目标物种,来源于其他物种的EST也能用于该物种有益基因的遗传作图,加速物种间相关信息的迅速转化。具体说,EST的作用表现在:

基因表达及分析技术

基因表达及其分析技术 生命现象的奥秘隐藏在基因组中,对基因组的解码一直是现代生命科学的主流。基因组学研究可以说是当今生命科学领域炙手可热的方向。从DNA 测序到SNP、拷贝数变异(copy number variation , CNV)等DNA多态性分析,到DNA 甲基化修饰等表观遗传学研究,生命过程的遗传基础不断被解读。 基因组研究的重要性自然不言而喻。应该说,DNA 测序技术在基因组研究 中功不可没,从San ger测序技术到目前盛行的新一代测序技术(Next Gen eration Seque ncing NGS)到即将走到前台的单分子测序技术,测序技术是基因组解读最重要的主流技术。而基因组测序、基因组多态性分析、DNA 甲基化修饰等表观遗传分析等在基因组研究中是最前沿的课题。但是基因组研究终究类似“基因算命”,再清晰的序列信息也无法真正说明一个基因的功能,基因功能的最后鉴定还得依赖转录组学和蛋白组学,而转录作为基因发挥功能的第一步,对基因功能解读就变得至关重要。声称特定基因、特定SNP、特定CNV、特定DNA修饰等与某种表型有关,最终需要转基因、基因敲除、突变、 RNAi 、中和抗体等技术验证,并必不可少要结合基因转录、翻译和蛋白修饰等数据。 基因实现功能的第一步就是转录为mRNA或非编码RNA,转录组学主要研究基因转录为RNA 的过程。在转录研究中,下面几点是必须考虑的: 1,基因是否转录(基因是否表达)及基因表达水平高低(基因是低丰度表达还是中、高丰度表达)。特定基因有时候在一个细胞中只有一个拷贝的表达,而表达量会随细胞类型不同或发育、生长阶段不同或生理、病理状态不同而改变。因此任何基

基因表达数据分析

第8章基因表达数据分析 基因芯片或DNA微阵列等高通量检测技术的发展,可以从全基因组水平定量或定性检测基因转录产物mRNA,获取基因表达的信息。由于生物体中的细胞种类繁多,同时基因表达具有时空特异性,因此,基因表达数据要比基因组数据更为复杂、数据量更大、数据的增长速度更快。基因表达数据中蕴含着基因调控的规律,可以反映细胞当前的生理状态,例如(??)是否恶化、(??)是否对药物有效等。对基因表达数据的分析是生物信息学的重大挑战之一,也是DNA微阵列能够推广应用的关键环节之一。 基因表达数据分析的对象是在不同条件下,全部或部分基因的表达数据所构成的数据矩阵。通过对数据矩阵的分析,回答一些生物学问题,例如,基因的功能是什么?在不同条件或不同细胞类型中,哪些基因的表达存在差异?在特定的条件下,哪些基因的表达发生了显著改变,这些基因受到哪些基因的调节,或者调控哪些其它的基因?哪些基因的表达是条件特异性的,根据它们的行为可以判断细胞的状态(正常或癌变)????等等。对这些问题的回答,结合其他生物学知识和数据有助于阐明基因的调控路径和基因之间的调控网络。揭示基因调控路径和网络是生物学和生物信息学共同关注的目标,是系统生物学(Systems Biology,在附录中增加解释条目!)研究的核心内容。目前,对基因表达数据的分析主要是在三个逐渐复杂的层次上进行:1、分析单个基因的表达水平,根据在不同实验条件下,该基因表达水平的变化,来判断它的功能,例如可以确定肿瘤类型特异基因。采用的分析方法可以是统计学中的假设检验等。2、考虑基因组合,将基因分组,研究基因的共同功能、相互作用以及协同调控等。多采用聚类分析等方法。3、尝试推断潜在的基因调控网络,从机理上解释观察到的基因表达谱。多采用反工程的方法。 本章首先介绍基因表达数据的来源和预处理方法;然后介绍基因表达数据分析的主要方法,即表达差异分析和聚类分析;最后简单介绍从基因表达数据出发研究基因调控网络的一些经典模型。 8.1 基因表达数据的获取 基因表达数据反映的是直接或间接测量得到的基因转录产物mRNA在细胞中的拷贝数或者水平(转录??),这些数据可以用于分析哪些基因的表达发生了改变,它们有何相关性,在不同条件下基因是如何受影响的。它们在医学临床诊断、药物疗效判断、揭示疾病发生机制等方面有重要的应用。目前检测mRNA水平的方法有DNA微阵列、基因芯片、基因表达串行化分析(Serial analysis of gene expression,SAGE)、RT-PCR、EST测序等。目前,最主要的表达数据来自于基因芯片或cDNA微阵列,它们的原理是相同的,利用4种核苷酸之间两两配对互补的特性,使两条在序列上互补的单链形成双链,这个过程被称为杂交。基本技术是:在一个约1cm2大小的玻璃片上,将称为探针的核苷酸片段固定在上面,这个过程称为芯片制备;从细胞或组织中提取mRNA,通过RT-PCR合成荧光标记的cDNA,与芯片杂交;用激光显微镜或荧光显微镜检测杂交后的芯片,获取荧光强度,分析细胞中的mRNA的相对水平。

基因表达分析

荧光定量PCR 在基因表达分析中的应用 所谓基因表达就是指在特定的时刻某种我们感兴趣的基因在组织或细胞中的mRNA 的表达数量。众所周知,很多的疾病(如肿瘤)的发生发展、很多药物的作用机理、很多生物的代谢调控作用等都和基因表达的变化有关,因此对基因表达进行精确定量是十分重要的。过去为了对mRNA 进行定量有了各种各样的方法,如Southern 杂交、Northern 杂交、原位杂交、传统PCR 等,但是我们也都知道这些技术灵敏性较差,重复性不好,操作比较烦琐,已经无法满足现在科研和检测的需要,于是荧光定量PCR 技术也就应运而生了。荧光定量PCR 技术能对核酸进行精确定量,因此大大提高了在基因表达的准确性和灵敏度,深受用户的青睐,广泛的应用于肿瘤研究、药物筛选、功能基因组研究等各个领域,目前已经成了很多科研文章发表的重要实验内容。 基因表达分析中常见到的重要问题 1、要检测的基因 基因表达分析的目的就是检测某种我们感兴趣的基因在不同组织或细胞中的表达差异。荧光定量PCR 技术可以对核酸物质的含量进行精确的定量,也就成了研究基因表达差异的一把利器。 在基因表达分析实验中要检测两个基因,一个是目的基因和另一个是看家基因。之所以要引入看家基因是由于不能确定要比较的样品所用的组织起始量相同。就是说比如有的老师提取正常样品的基因时用了100个细胞,而提取病变样品时只用了10个细胞,这时候的基因表达差异可能是由于提取时候的样品细胞数不同引起的,为了纠正这种误差,我们选用认为在两个样本中表达量不变的基因作为内参照,来去除这带来的干扰。例如,要研究某个基因在肿瘤样品和正常样品中的基因表达差异。我们在实验中发现我们选择研究的正常样品中的看家基因的表达量是肿瘤样品中的10倍,就认为正常样品的细胞数就是肿瘤样品细胞数的10倍,那么在肿瘤样品中目的基因的基因表达量应该乘以10倍,才能和正常样品进行比较。 2、计算基因表达差异 基因表达差异的计算是通过所得到的Ct 值来计算的,要计算两个样品(待测样品和对照样品)的目的基因的表达差异必须检测得到4个Ct 值:待测样品和对照样品中目的基因和看家基因的Ct 值。 那么基因表达差异应该计算为 基因表达差异=2(△Ct1-△Ct2) 目的基因 看家基因 待测样品 对照样品 △Ct1 △Ct2

基因表达谱分析技术

基因表达谱分析技术 1、微阵列技术(microarray) 这是近年来发展起来的可用于大规模快速检测基因差别表达、基因组表达谱、DNA序列多态性、致病基因或疾病相关基因的一项新的基因功能研究技术。其原理基本是利用光导化学合成、照相平板印刷以及固相表面化学合成等技术,在固相表面合成成千上万个寡核苷酸“探针”(cDNA、ESTs或基因特异的寡核苷酸),并与放射性同位素或荧光物标记的来自不同细胞、组织或整个器官的DNA或mRNA反转录生成的第一链cDNA进行杂交,然后用特殊的检测系统对每个杂交点进行定量分析。其优点是可以同时对大量基因,甚至整个基因组的基因表达进行对比分析。包括cDNA芯片(cDNA microarray)和DNA 芯片(DNA chips)。 cDNA芯片使用的载体可以是尼龙膜,也可以是玻片。当使用尼龙膜时,目前的技术水平可以将20000份材料点在一张12cm×18cm的膜上。尼龙膜上所点的一般是编好顺序的变性了的双链cDNA片段。要得到基因表达情况的数据,只需要将未知的样品与其杂交即可。杂交的结果表示这一样品中基因的表达模式,而比较两份不同样品的杂交结果就可以得到在不同样品中表达模式存在差异的基因。杂交使用的探针一般为mRNA的反转录产物,标记探针使用32PdATP。如果使用玻片为载体,点阵的密度要高于尼龙膜。杂交时使用两种不同颜色的荧光标记不同的两份样品,然后将两份样品混合起来与一张芯片杂

交。洗去未杂交的探针以后,能够结合标记cDNA的点受到激发后会发出荧光。通过扫描装置可以检测各个点发出荧光的强度。对每一个点而言,所发出的两种不同荧光的强度的比值,就代表它在不同样品中的丰度。一般来讲,显示出来的图像中,黄色的点表示在不同的样品中丰度的差异不大,红色和绿色的点代表在不同样品中其丰度各不相同。使用尼龙膜为载体制作cDNA芯片进行研究的费用要比玻片低,因为尼龙膜可以重复杂交。检测两种不同的组织或相同组织在不同条件下基因表达的差异,只需要使用少量的尼龙膜。但是利用玻片制作的cDNA芯片灵敏度更高,而且可以使用2种探针同时与芯片杂交,从而降低了因为杂交操作带来的差异;缺点是无法重复使用还必须使用更为复杂的仪器。 Guo等(2004)将包含104个重组子的cDNA文库点在芯片上,用于检测拟南芥叶片衰老时的基因表达模式,得到大约6200差异表达的ESTs,对应2491个非重复基因。其中有134个基因编码转录因子,182个基因预测参与信号传导,如MAPK级联传导路径。Li等(2006)设计高密度的寡核苷酸tiling microarray方法,检测籼稻全基因组转录表达情况。芯片上包含13,078,888个36-mer寡核苷酸探针,基于籼稻全基因组shot-gun测序的序列合成,大约81.9%(35,970)的基因发生转录事件。Hu等(2006)用含有60,000寡核苷酸探针(代表水稻全部预测表达基因)的芯片检测抗旱转基因植株(过量表达SNAC1水稻)中基因的表达情况,揭示大量的逆境相关基因都是上升表达的。 2、基因表达系列分析(Serial analysis of gene expression, SAGE)

基因表达谱分析技术

基因表达谱分析技术 1微阵列技术(microarray) 这是近年来发展起来的可用于大规模快速检测基因差别表达、基因组表达谱、DNA序列多态性、致病基因或疾病相关基因的一项新的基因功能研究技术。其原理基本是利用光导化学合成、照相平板印刷以及固相表面化学合成等技术,在固相表面合成成千上万个寡核苷酸“探针”(cDNA、ESTs或基因特异的寡核苷酸),并与放射性同位素或荧光物标记的来自不同细胞、组织或整个器官的DNA或mRNA反转录生成的第一链cDNA进行杂交,然后用特殊的检测系统对每个杂交点进行定量分析。其优点是可以同时对大量基因,甚至整个基因组的基因表达进行对比分析。包括cDNA芯片(cDNA microarray)和DNA芯片(DNA chips)。 cDNA芯片使用的载体可以是尼龙膜,也可以是玻片。当使用尼龙膜时,目前的技术水平可以将20000份材料点在一张12cm×18cm的膜上。尼龙膜上所点的一般是编好顺序的变性了的双链cDNA片段。要得到基因表达情况的数据,只需要将未知的样品与其杂交即可。杂交的结果表示这一样品中基因的表达模式,而比较两份不同样品的杂交结果就可以得到在不同样品中表达模式存在差异的基因。杂交使用的探针一般为mRNA的反转录产物,标记探针使用32PdATP。如果使用玻片为载体,点阵的密度要高于尼龙膜。杂交时使用两种不同颜色的荧光标记不同的两份样品,然后将两份样品混合起来与一张芯片杂交。洗去未杂交的探针以后,能够结合标记cDNA的点受到激发后会发出荧光。通过扫描装置可以检测各个点发出荧光的强度。对每一个点而言,所发出的两种不同荧光的强度的比值,就代表它在不同样品中的丰度。一般来讲,显示出来的图像中,黄色的点表示在不同的样品中丰度的差异不大,红色和绿色的点代表在不同样品中其丰度各不相同。使用尼龙膜为载体制作cDNA芯片进行研究的费用要比玻片低,因为尼龙膜可以重复杂交。检测两种不同的组织或相同组织在不同条件下基因表达的差异,只需要使用少量的尼龙膜。但是利用玻片制作的cDNA芯片灵敏度更高,而且可以使用2种探针同时与芯片杂交,从而降低了因为杂交操作带来的差异;缺点是无法重复使用还必须使用更为复杂的仪器。 Guo等(2004)将包含104个重组子的cDNA文库点在芯片上,用于检测拟南芥叶片衰老时的基因表达模式,得到大约6200差异表达的ESTs,对应2491个非重复基因。其中有134个基因编码转录因子,182个基因预测参与信号传导,如MAPK级联传导路径。Li等(2006)设计高密度的寡核苷酸tiling microarray方法,检测籼稻全基因组转录表达情况。芯片上包含13,078,888个36-mer寡核苷酸探针,基于籼稻全基因组shot-gun测序的序列合成,大约81.9%(35,970)的基因发生转录事件。Hu等(2006)用含有60,000寡核苷酸探针(代表水稻全部预测表达基因)的芯片检测抗旱转基因植株(过量表达SNAC1水稻)中基因的表达情况,揭示大量的逆境相关基因都是上升表达的。 2基因表达系列分析(Serial analysis of gene expression,SAGE) 基因表达系列分析(SAGE)是一种转录物水平上研究细胞或组织基因表达模式的快速、有效的技术,也是一种高通量的功能基因组研究方法,它可以同时将不同基因的表达情况进行量化研究(Velculescu et al.,1995)。SAGE的基本原理是:每一条mRNA序列都可以用它包含的9bp的小片段(TAG)代替,因此考查这些TAGs出现的频率就能知道每一种mRNA 的丰度。首先利用生物素标记的oligo(dT)引物将mRNA反转录成双链cDNA,然后利用NlaIII 酶切双链cDNA。NlaIII酶的识别位点只有4bp,因此cDNA都被切成几十bp的小片段。带有生物素标记的小片段cDNA被分离出来,平均分成2份。这2份cDNA分别跟2个接头连接,2个接头中均有一个FokI酶切位点。FokI是一种II S型核酸内切酶,其识别位点不对称,切割位点位于识别位点下游9bp且不依赖于特异的DNA序列。FokI酶切分成2份的cDNA之

基因表达谱分析技术

基因表达谱分析技术 1、微阵列技术( microarray) 这是近年来发展起来的可用于大规模快速检测基因差别表达、基因组表达谱、DNA 序列多态性、致病基因或疾病相关基因的一项新的基因功能研究技术。其原理基本是利用光导化学合成、照相平板印刷以及固相表面化学合成等技术,在固相表面合成成千上万个寡核苷酸探针”(cDNA、ESTs或基因特异的寡核苷酸),并与放射性同位素或荧光物标记的来自不同细胞、组织或整个器官的DNA 或mRNA 反转录生成的第一链cDNA 进行杂交,然后用特殊的检测系统对每个杂交点进行定量分析。其优点是可以同时对大量基因,甚至整个基因组的基因表达进行对比分析。包括cDNA芯片(cDNA microarray)和DNA 芯片( DNA chips)。 cDNA 芯片使用的载体可以是尼龙膜,也可以是玻片。当使用尼龙膜时,目前的技术水平可以将20000份材料点在一张12cmxi8cm的膜上。尼龙膜上所点的一般是编好顺序的变性了的双链cDNA 片段。要得到基因表达情况的数据,只需要将未知的样品与其杂交即可。杂交的结果表示这一样品中基因的表达模式,而比较两份不同样品的杂交结果就可以得到在不同样品中表达模式存在差异的基因。杂交使用的探针一般为mRNA的反转录产物,标记探针使用 32PdATP。如果使用玻片为载体,点阵的密度要高于尼龙膜。杂交时使用两种不同颜色的荧光标记不同的两份样品,然后将两份样品混合起来与一张芯片杂交。洗去未杂交的探针以后,能够结合标记cDNA 的点受到激发后会发出荧光。通过扫描装置可以检测各个点发出荧光的强度。对每一个点而言,所发出的两种不同荧光的强度的比值,就代表它在不同样品中的丰度。一般来讲,显示出来的图像

基因表达数据分析的方法

基因表达数据分析的方法 摘要:基因表达数据的一个重要应用是给疾病样本分类,如鉴别白血病的类型。而对成千上万个基因表达进行分析,必产生总量巨大的数据集。近年来,支持向量机(SVM)的理论已经取得重大进展,其算法实现策略以及实际应用也发展迅速,开始成为克服“维数灾难”和“过学习”等传统困难的有力手段。利用这一技术分析与整理这些基因表达数据,已有效地解决了生物信息学上这一海量数据的瓶颈问题。本文就支持向量机在基因表达数据分析方面的算法和应用进行了介绍和分析。 关键词:生物信息学;基因表达数据;支持向量机 Methods of gene expression data analysis Abstract:Gene expression data has an important application to the classification of disease samples, such as identifying the types of leukemia. The analysis of thousands of gene expression data, will produce a tremendous amount of data sets. In recent years, support vector machine (SVM) theory that significant progress has been made towards its strategy and practical applications of algorithms has been developing rapidly and became overcome the "Dimension disaster" and "Over-study", a powerful means of the traditional difficulties. Using this technology analysis and collation of these gene expression data have been effectively solved bottleneck on the enormous bioinformatics data. This paper discusses the algorithms and application of support vector machine in gene expression data analysis. Keywords:Bioinformatics ;Gene expression data; Support vector machine

基因表达研究技术

1、基因表达系列分析技术(Serial Analysis of Gene Expression,SAGE) 是以DNA序列测定为基础分析全基因组表达模式的技术。任何长度超过9-10个碱基的核苷酸片段都可能代表一种特异性的转录产物,因此,根据某个序列占总标签数的比例可分析所对应基因的表达频率。 2、原位杂交(In Situ Hybridization,ISH)是用标记的核酸探针,经放射自显影或非放射检测体系,在组织、细胞、间期核及染色体上对核酸进行定位和相对定量研究的一种手段,分为RNA原位杂交和染色体原位杂交。 3、RNA原位杂交:用放射性或非放射性(如地高辛、生物素等)标记的特异性探针与被固定的组织切片反应,若细胞中存在与探针互补的mRNA分子,两者杂交产生双链RNA,可通过放射性标记或经酶促免疫显色,对该基因的表达产物做出定性定量分析。 4、荧光原位杂交(fluorescence in situ hybridization,FISH).首先对寡核苷酸探针做特殊的修饰和标记,然后用原位杂交法与靶染色体或DNA上特定的序列结合,再通过与荧光素分子相耦联的单克隆抗体来确定该DNA序列在染色体上的位置。 5、基因定点突变(site-directedmutagenesis).通过改变基因特定位点核苷酸序列来改变所编码的氨基酸序列,用于研究某个(些)氨基酸残基对蛋白质的结构、催化活性以及结合配体能力的影响,也可用于改造DNA调控元件特征序列、修饰表达载体、引入新的酶切位点等。 6、基因敲除(gene knock-out)又称基因打靶,通过外源DNA与染色体DNA之间的同源重组,进行精确的定点修饰和基因改造,具有专一性强、染色体DNA可与目的片段共同稳定遗传等特点。 7、基因敲除分为: 完全基因敲除:是指通过同源重组法完全消除细胞或者动物个体中的靶基因活性 条件型基因敲除:(又称不完全基因敲除),是指通过定位重组系统实现特定时间和空间的基因敲除。 8、酵母单杂交系统(Yeast one-hybridsystem)是上世纪90年代中发展起来的研究DNA-蛋白质之间相互作用的新技术,可识别稳定结合于DNA上的蛋白质,在酵母细胞内研究真核生物中DNA-蛋白质之间的相互作用,并通过筛选DNA文库直接获得靶序列相互作用蛋白的编码基因。将已知顺式作用元件构建到最基本启动子(minimal promoter,Pmin)的上游,把报告基因连接到Pmin下游。将编码待测转录因子cDNA与已知酵母转录激活结构域(transcription-activating domain,AD)融合表达载体导入酵母细胞,该基因产物如果能够与顺式作用元件相结合,就能激活Pmin启动子,使报告基因得到表达。 9、酵母双杂交系统(Yeast two-hybrid system)真核生物转录调控因子具有组件式结构(modular)特征,这些蛋白往往由两个或两个以上相互独立的结构域,其中DNA结合结构域(binding domain,BD)和转录激活结构域(activation domain,AD)是转录激活因子发挥功能所必须的。BD能与特定基因启动区结合,但不能激活基因转录,由不同转录调控因子的BD和AD所形成的杂合蛋白却能行使激活转录的功能。

相关文档
相关文档 最新文档