文档库 最新最全的文档下载
当前位置:文档库 › 基因表达及分析技术

基因表达及分析技术

基因表达及分析技术
基因表达及分析技术

基因表达及其分析技术

生命现象的奥秘隐藏在基因组中,对基因组的解码一直是现代生命科学的主流。基因组学研究可以说是当今生命科学领域炙手可热的方向。从DNA测序到SNP、拷贝数变异(copy number variation,CNV)等DNA多态性分析,到DNA甲基化修饰等表观遗传学研究,生命过程的遗传基础不断被解析。

基因组研究的重要性自然不言而喻。应该说,DNA测序技术在基因组研究中功不可没,从Sanger测序技术到目前盛行的新一代测序技术(Next Generation Sequencing, NGS)到即将走到前台的单分子测序技术,测序技术是基因组解析最重要的主流技术。而基因组测序、基因组多态性分析、DNA甲基化修饰等表观遗传分析等在基因组研究中是最前沿的课题。但是基因组研究终究类似“基因算命”,再清晰的序列信息也无法真正说明一个基因的功能,基因功能的最后鉴定还得依赖转录组学和蛋白组学,而转录作为基因发挥功能的第一步,对基因功能解析就变得至关重要。声称特定基因、特定SNP、特定CNV、特定DNA修饰等与某种表型有关,最终需要转基因、基因敲除、突变、RNAi、中和抗体等技术验证,并必不可少要结合基因转录、翻译和蛋白修饰等数据。

基因实现功能的第一步就是转录为mRNA或非编码RNA,转录组学主要研究基因转录为RNA的过程。在转录研究中,下面几点是必须考虑的:

1,基因是否转录(基因是否表达)及基因表达水平高低(基因是低丰度表达还是中、高丰度表达)。特定基因有时候在一个细胞中只有一个拷贝的表达,而表达量会随细胞类型不同或发育、生长阶段不同或生理、病理状态不同而改变。因此任何基因表达检测技术,其是否科学,就是要看能否检测到低丰度表达基因,能否检测到基因丰度的变化尤其是微弱变化,线性范围是否宽广等。这方面的误区在于,很多人过分强调特定技术能否检测到低丰度基因的表达,忽视了特定技术能否检测到基因表达丰度微弱的改变。

如果关注全基因组表达信息,那么目前最经典的技术就是全基因组表达谱芯片技术,这种基因芯片设计了数据库中所有已知基因、EST和预测基因、EST

的已知转录本的探针,用来分析全基因组中已知基因、预测基因的已知转录本的表达信息。在利用基因芯片进行转录研究时,应该选择能检测低丰度表达基因的芯片技术,选择可以反映基因表达微弱变化并且线性范围广的技术,比如Affymetrix公司的转录研究方面的芯片。以GeneChip? Human Genome U133 Plus 2.0 Array 为例,该芯片可以分析多达38500个基因的47400个转录本(而GeneChip? Human Genome U133A 2.0 Array 是对其中14500个

well-characterized human genes的18400个转录本进行分析的)。从精确度、重复性、性价比等角度来讲,芯片技术仍然是基因表达研究的首选技术。

除人全基因组表达谱芯片外,Affymetrix公司还可以提供以下物种的全基因组表达谱芯片:大鼠,小鼠,拟南芥,大麦,牛,线虫,狗,鸡,柑橘,棉花,果蝇,大肠杆菌,玉米,苜蓿,绿脓杆菌,蚊子/疟原虫、杨树,猪,恒河猴,水稻,金黄色葡萄球菌,大豆,甘蔗,西红柿,葡萄,小麦,爪蟾,酵母,斑马鱼等。

2,对mRNA表达而言,更重要的问题是,每个基因的编码区域由若干外显子组成,而特定基因在不同细胞类型中或不同发育、生长阶段或不同生理、病理

状态下,外显子存在选择性剪接(alternative splicing),因而会出现不同转录本。不同转录本正是解释同一基因具有不同功能甚至相反功能遗传基础。因此分析基因表达,不仅要知道基因是否表达与表达水平高低,更重要的是需要知道特定基因表达的转录本是什么。

如果关注全基因组所有外显子表达并希望预测每个基因选择性剪接,那么基因芯片仍然是该方面研究的经典技术。以Affymetrix公司的GeneChip Human Exon 1.0 ST Array为例,该芯片可以分析已知的及预测的转录区域内的超过1百万个外显子簇的表达,分析选择性剪接。这是迄今为止最全面的、唯一的同时可以研究基因表达与选择性剪接的基因芯片。Affymetrix公司也可以提供小鼠、大鼠的此类芯片,分别分析小鼠的1百万个外显子或大鼠的85万个外显子。

3,基因调节分析。任何基因表达都是受到严格调控的,包括转录因子调控和表观遗传修饰等。如果关注特定转录因子调节的所有基因,那么ChIP on chip技术是必须的。以Affymetrix公司的GeneChip Human Promoter 1.0R Array为例,该芯片可以分析任何特定蛋白质如转录因子与超过25500个启动子的相互作用。每个启动子覆盖10-12.5kb(转录起始位点下游2.5kb+上游7.5kb,对1300个癌基因而言,上游延长至10kb)。如果分析特定转录因子在特定细胞类型的特定生长、发育阶段或特定生理、病理下调控基因表达的特点,该芯片是很好的工具。该芯片也覆盖了UCSC in NCBI human genome assembly (Build 34)中注解的59% 的CpG岛,该芯片同时可以用于DNA甲基化修饰的分析。Affymetrix公司也可以提供小鼠的此类芯片,分析转录因子与28000个启动子的相互作用。

非编码RNA也是转录组学研究的热点,Affymetrix公司的GeneChip miRNA Array可以分析71个物种的数以千计的microRNA与Small nucleolar RNAs (snoRNAs)的表达。

4,样本问题。最科学的样本应该是同质细胞。不同细胞类型,其基因表达是有差异的,建立细胞类型特异的基因表达数据,才能真正揭示特定细胞类型基因表达的真实面貌。对于组织,制作组织切片,利用(免疫)组织化学技术对特定细胞类型进行鉴定,进而利用激光显微切割技术分离特定细胞类型,这是目前从组织中获得同质细胞的关键技术。问题在于组织切片制备和(免疫)组织化学等环节可能造成RNA的降解,针对这种情况,Affymetrix公司有专门分析福尔马林固定的、石蜡包埋的组织的全基因组表达的芯片GeneChip(R) Human X3P Array,该芯片设计的每个基因的探针,都更靠近mRNA 3'端位臵,因为mRNA 越靠近3'端越稳定。

对于医学样品的分组,临床上对疾病、行为等的诊断、分类的公认标准是转录分析中对样本分组的必不可少的参考,比如肿瘤样本的病理学判读、血液分析中的各种参数、心脑血管分析中的各种参数、精神类疾病诊断中的行为学参数等。优秀的高级别的科学论文,往往在样本分组分类上非常严格,描述很清晰,篇幅很大。没有合格样本及没有合格样本分组,任何下游分析技术都无法得出有价值数据。

5,候选基因表达分析技术。在实际研究中,经常会遇到两类转录分析,全基因组表达分析与候选基因表达分析。

应该说,只有通过全基因组表达分析,才能了解特定生命过程相关的所有基因表达,从中鉴定出特定生命过程的关键候选基因(如转录因子)及相关基因的网络、信号通路。

关于候选基因表达分析技术,在实时定量PCR技术独领风骚很多年后,新的技术不断冲击,包括Affymetrix公司的Branch-DNA技术。该技术在分析基因表达时,不是基于将模板进行PCR扩增的原理,而是检测杂交于特异基因的一组特异探针的信号,避免了PCR过程引发的很多问题;而且可以进行单基因表达分析或3-36个基因表达的多重分析。本期基因快讯有专门介绍Branch-DNA技术的文献。相信Branch DNA技术很快会成为候选基因表达分析的主流技术。

总之,Affymetrix全基因组表达谱芯片等技术被广泛应用于人类和动物生命科学的基础研究中,如鉴定发育、生长、分裂、分化、细胞凋亡、信号转导等重要生命过程的相关基因,鉴定疾病相关基因。大量的研究在利用基因芯片技术鉴定癌症发生发展和转移的基因,对癌症进行分子分类/分期,寻找癌症分子机制的关键分子,为癌症诊断筛选重要标志分子,为癌症治疗筛选重要的靶分子,预后分析等.

而在作物遗传育种领域,针对转基因生物新品种培育,全基因组表达谱芯片等技术也大有作为:

1,高产、抗逆、优质等农业优良性状相关基因的鉴定:每个物种在自然界中都有不同品种,传统育种也产生了很多栽培种。不同品种、栽培种间性状差异很明显,因此

深入分析表型差异的遗传机制,鉴定高产、抗逆、优质等农业优良性状相关基因对

转基因育种很重要。利用中国丰富的种质资源,通过各物种全基因组表达谱芯片技

术,可以分析作物各种表型的分子机制,并从数以万计的基因中鉴定农业优良性状

相关基因,为转基因作物提供目的基因储备。Affymetrix可以提供多个物种的全基

因组表达芯片,包括:大豆基因组(包括大豆线虫基因组、大豆疫霉菌基因组)、

玉米、小麦、大麦、水稻、苜蓿(含固氮菌)、杨树(包括胡杨)、葡萄、西红柿、

拟南芥、猪、牛、鸡、甘蔗、棉花、柑橘等。

2,转基因生物安全的评估:转基因生物安全的评估需要从多层次综合进行,系统比较基因修饰作物与传统育种作物是必须的。国际上这方面的评估正在形成相关理论技

术体系,具体包括:基因组层次(转进去的目的基因是否对作物基因组稳定性产生

影响),转录组层次(从基因转录水平上评估转进去的目的基因及其表达是否对作

物全基因组表达产生影响),蛋白组层次(转进去的目的基因的蛋白产物是否对作

物蛋白组学特征产生影响)。其他包括代谢组层次,功能特征分析等。转录组学层

次的分析是至关重要的,而且技术相当成熟。已经有科学家做了初步研究,结果显

示:传统育种的大豆不同栽培品种间基因表达是有差异的,这也从遗传机制上解释

了大豆不同栽培品种间为什么有性状差异;更重要的是,该研究也显示,转基因大豆与其相应的对照栽培种间的基因表达差异非常小,也就是说,转基因大豆与其相应的对照栽培种间的基因表达本质是一致的!拟南芥的相关分析也证明,转基因拟南芥与非转基因拟南芥间的基因表达本质上是一致的!拟南芥在胁迫环境下基因表达的变化远大于转进去的目的基因对拟南芥基因表达的影响!玉米、水稻、小麦、大麦等物种的相关分析也在进行。当然不同的物种、不同的目的基因对安全的影响可能不一样,安全性评估目前只是开始,大量的评估还需要做,而基于基因表达谱芯片技术的转录组水平的分析是非常重要的技术。

基因表达的分析技术

第二篇细胞的遗传物质 第三章基因表达的分析技术 生物性状的表现均是通过基因表达调控实现的。对基因结构与基因表达调控进行研究,是揭示生命本质的必经之路。在基因组研究的过程中,逐步建立起一系列行之有效的技术。针对不同的研究内容,可建立不同的研究路线。 第一节PCR技术 聚合酶链反应(polymerase chain reaction,PCR)技术是一种体外核酸扩增技术,具有特异、敏感、产率高、快速、简便等突出优点。。PCR技术日斟完善,成为分子生物学和分子遗传学研究的最重要的技术。应用PCR技术可以使特定的基因或DNA片段在很短的时间内体外扩增数十万至百万倍。扩增的片段可以直接通过电泳观察,并作进一步的分析。 一、实验原理 PCR是根据DNA变性复性的原理,通过特异性引物,完成特异片段扩增。第一,按照欲检测的DNA的5'和3'端的碱基顺序各合成一段长约18~24个碱基的寡核苷酸序列作为引物(primer)。引物设计需要根据以下原则:①引物的长度保持在18~24bp之间,引物过短将影响产物的特异性,而引物过长将影响产物的合成效率;②GC含量应保持在45~60%之间;③5'和3'端的引物间不能形成互补。第二,将待检测的DNA变性后,加入四种单核苷酸(dNTP)、引物和耐热DNA聚合酶以及缓冲液。通过95℃变性,在进入较低的温度使引物与待扩增的DNA链复性结合,然后在聚合酶的作用下,体系中的脱氧核苷酸与模板DNA链互补配对,不断延伸合成新互补链,最终使一条DNA双链合成为两条双链。通过变性(92~95℃)→复性(40~60℃)→引物延伸(65~72℃)的顺序循环20至40个周期,就可以得到大量的DNA片段。理论上循环20周期可使DNA扩增100余万倍。

基因表达谱芯片的数据分析

基因表达谱芯片的数据分析(2012-03-13 15:25:58)转载▼ 标签:杂谈分类:生物信息 摘要 基因芯片数据分析的目的就是从看似杂乱无序的数据中找出它固有的规律, 本文根据数据分析的目的, 从差异基因表达分析、聚类分析、判别分析以及其它分析等角度对芯片数据分析进行综述, 并对每一种方法的优缺点进行评述, 为正确选用基因芯片数据分析方法提供参考. 关键词: 基因芯片; 数据分析; 差异基因表达; 聚类分析; 判别分析 吴斌, 沈自尹. 基因表达谱芯片的数据分析. 世界华人消化杂志2006;14(1):68-74 https://www.wendangku.net/doc/a317681056.html,/1009-3079/14/68.asp 0 引言 基因芯片数据分析就是对从基因芯片高密度杂交点阵图中提取的杂交点荧光强度信号进行的定量分析, 通过有效数据的筛选和相关基因表达谱的聚类, 最终整合杂交点的生物学信息, 发现基因的表达谱与功能可能存在的联系. 然而每次实验都产生海量数据, 如何解读芯片上成千上万个基因点的杂交信息, 将无机的信息数据与有机的生命活动联系起来, 阐释生命特征和规律以及基因的功能, 是生物信息学研究的重要课题[1]. 基因芯片的数据分析方法从机器学习的角度可分为监督分析和非监督分析, 假如分类还没有形成, 非监督分析和聚类方法是恰当的分析方法; 假如分类已经存在, 则监督分析和判别方法就比非监督分析和聚类方法更有效率。根据研究目的的不同[2,3], 我们对基因芯片数据分析方法分类如下: (1)差异基因表达分析: 基因芯片可用于监测基因在不同组织样品中的表达差异, 例如在正常细胞和肿瘤细胞中; (2)聚类分析: 分析基因或样本之间的相互关系, 使用的统计方法主要是聚类分析; (3)判别分析: 以某些在不同样品中表达差异显著的基因作为模版, 通过判别分析就可建立有效的疾病诊断方法. 1 差异基因表达分析(difference expression, DE) 对于使用参照实验设计进行的重复实验, 可以对2样本的基因表达数据进行差异基因表达分

基因表达的检测的几种方法

基因表达检测的最终技术目标是能确定所关注的任何组织、细胞的 RNA的绝对表达量。可以先从样本中抽提RNA,再标记RNA, 然后将这些标记物作探针与芯片杂交,就可得出原始样本中不同 RNA的量。然而用于杂交的某个特定基因的RNA的量与在一个 相应杂交反应中的信号强度之间的关系十分复杂,它取决于多种 因素,包括标记方法、杂交条件、目的基因的特征和序列。所以 芯片的方法最好用于检验两个或多个样本中的某种RNA的相对 表达量。样本之间某个基因表达的差异性(包括表达的时间、空 间特性及受干扰时的改变)是基因表达最重要的,而了解RNA 的绝对表达丰度只为进一步的应用或多或少地起一些作用。 基因表达的检测有几种方法。经典的方法(仍然重要)是根据在 细胞或生物体中所观察到的生物化学或表型的变化来决定某一 特定基因是否表达。随着大分子分离技术的进步使得特异的基因 产物或蛋白分子的识别和分离成为可能。随着重组DNA技术的 运用,现在有可能检测.分析任何基因的转录产物。目前有好几 种方法广泛应用于于研究特定RNA分子。这些方法包括原位杂交.NORTHERN凝胶分析.打点或印迹打点.S-1核酸酶分 析和RNA酶保护研究。这里描述RT-PCR从RNA水平上检查 基因表达的应用。8 f3 f- |2 L) K) b7 ]- ~- | RT-PCR检测基因表达的问题讨论

关于RT-PCR技术方法的描述参见PCR技术应用进展,在此主要讨论它在应用中的问题。理论上1μL细胞质总RNA对稀有mRNA扩增是足够了(每个细胞有1个或几个拷贝)。1μL差不多相当于50-100,000个典型哺乳动物细胞的细胞质中所含RNA的数量,靶分子的数量通常大于50,000,因此扩增是很容易的。该方法所能检测的最低靶分子的数量可能与通常的DNAPCR相同;例如它能检测出单个RNA分子。当已知量的转录RNA(用T7RNA聚合酶体外合成)经一系列稀释,实验结果表明通过PCR的方法可检测出10个分子或低于10个分子,这是反映其灵敏度的一个实例。用此技术现已从不到1个philadelphia染色体阳性细胞株K562中检测到了白血病特异的MRNA的转录子。因此没必要分离polyA+RNA,RNA/PCR法有足够的灵敏度来满足绝大多数实验条件的需要。 7 H+ F& _* S6 W( a8 p: [, @- d, { 将PCR缓冲液同时用于反转录酶反应和PCR反应,可简化实验步骤。我们发现整个反应过程皆用PCR缓冲液的结果相当于或优于先用反转录缓冲液合成CDNA,然后PCR缓冲液进行PCR扩增循环。当然,值得注意的是PCR缓冲液并不最适合第一条DNA链的合成。我们对不同的缓冲液用于大片段DNA 合成是否成功还没有进行过严格的研究。

基因表达系列分析技术及其应用

万方数据

万方数据

万方数据

基因表达系列分析技术及其应用 作者:党冬梅, 魏晓萍, 惠起源, 符兆英 作者单位:延安大学医学院,陕西,延安,716000 刊名: 延安大学学报(医学科学版) 英文刊名:JOURNAL OF YANAN UNIVERSITY(MEDICAL SCIENCE EDITION) 年,卷(期):2005,3(1) 被引用次数:0次 参考文献(8条) 1.Velculescu E查看详情 1995 2.Menssen A.Hermeking H Characterization of the c-MYC regulated transcriptome by SAGE:Identification and analysis of target genes 2002(09) 3.Levens D Disentangling the MYC web 2002(09) 4.Matsumura H.Nirasawa S.Terachi R Transcript profiling in rice (Oryzn sation L.) seedlings using serial analysis of gene expression 1999(06) 5.Margulies E H.Kardia S L R.Innis J W查看详情 2001 6.Du Z.Scott A D.May G D Expression profiling of UV-and Gamma-irradiated Ambidopsis plantlets through serial analysis of gene expression 2001 7.Inadera H.Hashimot0 S.Dongi H Y WISP-2 as a novel estrogen-responsive gene in human breast cancer cell 2000(01) 8.Xu L L.Shanmugan N.Sesterhenn I A A novel androgen regulated gene,PMEPAI.Iocated on chromosome 20113 exhibit high level expression in protstate 2000(03) 本文链接:https://www.wendangku.net/doc/a317681056.html,/Periodical_yadxxb-yxkxb200501045.aspx 授权使用:西安交通大学(xajtdx),授权号:fa53fce6-7ae2-4ac8-b779-9e9900a7d328 下载时间:2011年3月1日

基因差异表达技术

基因差异表达技术 真核生物中,从个体的生长、发育、衰老、死亡,到组织的得化、调亡以及细胞对各种生物、理化因子的应答,本质上都涉及基因的选择性表达。高等生物大约有30000个不同的基因,但在生物体内任意8细胞中只有10%的基因的以表达,而这些基因的表达按特定的时间和空间顺序有序地进行着,这种表达的方式即为基因的差异表达。其包括新出现的基因的表达与表达量有差异的基因的表达。生物体表现出的各种特性,主要是由于基因的差异表达引起的。 由于基因的差异表达的变化是调控细胞生命活动过程的核心机制,通过比较同一类细胞在不同生理条件下或在不同生长发育阶段的基因表达差异,可为分析生命活动过程提供重要信息。研究基因差异表达的主要技术有差别杂交(differential hybridization)、扣除(消减)杂交(subtractive hybridization of cDNA,SHD)、mRNA差异显示(mRNA differential display,DD)、抑制消减杂交法(suppression subtractive hybridization,SSH)、代表性差异分析(represential display analysis,RDA)、交互扣除RNA差别显示技术(reciprocal subtraction differential RNA display)、基因表达系列分析(serial analysis of gene expression,SAGE)、电子消减(electronic subtraction)和DNA微列阵分析(DNA microarray)等。 一、差别杂交与扣除杂交 差别杂交(differential hybridization)又叫差别筛选(differential screening),适用于分离经特殊处理而被诱发表达的mRNA的cDNA克隆。为了增加这种方法的有效性,后来又发展出了扣除杂交(subtractive hybridization)或扣除cDNA克隆(subtractive cDNA cloning),它是通过构建扣除文库(subtractive library)得以实现的。 (一)差别杂交 从本质上讲,差别杂交也是属于核酸杂交的范畴。它特别适用于分离在特定组织中表达

基因表达系列分析(Serial Analysis of Gene Expression,SAGE)技术

SAGE 技术 MRNA 结合到微珠子上(Microscopic Bead and mRNA) mRNA 转录成DNA(mRNA binds to bait and is copied into DNA)

用酶切开DNA的一小段(An enzyme cuts the DNA) 另一个酶定在DNA末端以便切下一小段(An enzyme locks onto the DNA and cuts off a short tag),这一小段就被视为这个基因的标签 两个标签连在一起(Two tags are linked together)

在末端的定位分子被切掉(Enzymes cut off the "Docking Molecules") 都连成一条线(Di-Tags are combined into large concatemers)

DNA上所携带的遗传信息,需要通过RNA为中介体,合成出组织和正常生理功能所需要的蛋白质,这个过程被称为基因的表达。在生物体中不同的组织和器官所表达的基因群是不一样的,我们把基因群的表达状况称为基因表达谱。目前,高通量地研究基因表达谱的方法主要有两种,即生物芯片和基因表达串联分析(serial analysis of gene expression, SAGE)。基因芯片所能检测的基因必须是已知的基因,放在芯片上几种基因的探针就只能检测这几种基因的表达谱;相比之下,SAGE能以远高于DNA芯片的精确度和重复性来检测在病理条件下基因表达谱的改变,而不必考虑所检测的基因是已知的还是未知的。因此在检测疾病相关的新基因,特别是无法用基因芯片进行检测的低表达量致病基因时,SAGE是目前的最佳手段,无可取代。 SAGE技术为Genzyme公司所拥有的专利技术。其技术简介如下: SAGE技术得以建立的理论基础 首先,一段来自于任一转录本特定区域的"标签"(Tag),即长度仅9-14bp的短核苷酸序列,就已包含足够的信息以特异性地确定该转录本。例如:一个9碱基的序列能有49=262144种不同的排列组合,而人类基因组据估计仅编码80000种转录本,因此在理论上每一个9碱基标签就能够代表一种转录本的特征序列。 第二,如果将短片段标签相互连接、集中形成长的DNA分子,则对该克隆进行

基因表达分析

基因表达分析 1、EST(Expressed Sequence Tag)表达序列标签(EST)分析 1、EST基本介绍 1、定义: EST是从已建好的cDNA库中随机取出一个克隆,进行5’端或3’端进行一轮单向自动测序,获得短的cDNA部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20到7000bp不等,平均长度为400bp。 EST来源于一定环境下一个组织总mRNA所构建的cDNA文库,因此,EST也能说明该组织中各基因的表达水平。 2、技术路线: 首先从样品组织中提取mRNA,在逆转录酶的作用下用oligo(dT)作为引物进行RT-PCR 合成cDNA,再选择合适的载体构建cDNA文库,对各菌株加以整理,将每一个菌株的插入片段根据载体多克隆位点设计引物进行两端一次性自动化测序,这就是EST序列的产生过程。

3、EST数据的优点和缺点: (1)相对于大规模基因组测序而言,EST测序更加快速和廉价。 (2)EST数据单向测序,质量比较低,经常出现相位的偏差。 (3)EST只是基因的一部分,而且序列里有载体序列。 (4)EST数据具有冗余性。 (5)EST数据具有组织和不同时期特异性。 4、EST数据的应用 EST作为表达基因所在区域的分子标签因编码DNA序列高度保守而具有自身的特殊性质,与来自非表达序列的标记(如AFLP、RAPD、SSR等)相比,更可能穿越家系与种的限制。因此,EST标记在亲缘关系较远的物种间比较基因组连锁图和比较质量性状信息是特别有用的。同样,对于一个DNA序列缺乏的目标物种,来源于其他物种的EST也能用于该物种有益基因的遗传作图,加速物种间相关信息的迅速转化。具体说,EST的作用表现在:

基因表达及分析技术

基因表达及其分析技术 生命现象的奥秘隐藏在基因组中,对基因组的解码一直是现代生命科学的主流。基因组学研究可以说是当今生命科学领域炙手可热的方向。从DNA 测序到SNP、拷贝数变异(copy number variation , CNV)等DNA多态性分析,到DNA 甲基化修饰等表观遗传学研究,生命过程的遗传基础不断被解读。 基因组研究的重要性自然不言而喻。应该说,DNA 测序技术在基因组研究 中功不可没,从San ger测序技术到目前盛行的新一代测序技术(Next Gen eration Seque ncing NGS)到即将走到前台的单分子测序技术,测序技术是基因组解读最重要的主流技术。而基因组测序、基因组多态性分析、DNA 甲基化修饰等表观遗传分析等在基因组研究中是最前沿的课题。但是基因组研究终究类似“基因算命”,再清晰的序列信息也无法真正说明一个基因的功能,基因功能的最后鉴定还得依赖转录组学和蛋白组学,而转录作为基因发挥功能的第一步,对基因功能解读就变得至关重要。声称特定基因、特定SNP、特定CNV、特定DNA修饰等与某种表型有关,最终需要转基因、基因敲除、突变、 RNAi 、中和抗体等技术验证,并必不可少要结合基因转录、翻译和蛋白修饰等数据。 基因实现功能的第一步就是转录为mRNA或非编码RNA,转录组学主要研究基因转录为RNA 的过程。在转录研究中,下面几点是必须考虑的: 1,基因是否转录(基因是否表达)及基因表达水平高低(基因是低丰度表达还是中、高丰度表达)。特定基因有时候在一个细胞中只有一个拷贝的表达,而表达量会随细胞类型不同或发育、生长阶段不同或生理、病理状态不同而改变。因此任何基

基因表达数据分析

第8章基因表达数据分析 基因芯片或DNA微阵列等高通量检测技术的发展,可以从全基因组水平定量或定性检测基因转录产物mRNA,获取基因表达的信息。由于生物体中的细胞种类繁多,同时基因表达具有时空特异性,因此,基因表达数据要比基因组数据更为复杂、数据量更大、数据的增长速度更快。基因表达数据中蕴含着基因调控的规律,可以反映细胞当前的生理状态,例如(??)是否恶化、(??)是否对药物有效等。对基因表达数据的分析是生物信息学的重大挑战之一,也是DNA微阵列能够推广应用的关键环节之一。 基因表达数据分析的对象是在不同条件下,全部或部分基因的表达数据所构成的数据矩阵。通过对数据矩阵的分析,回答一些生物学问题,例如,基因的功能是什么?在不同条件或不同细胞类型中,哪些基因的表达存在差异?在特定的条件下,哪些基因的表达发生了显著改变,这些基因受到哪些基因的调节,或者调控哪些其它的基因?哪些基因的表达是条件特异性的,根据它们的行为可以判断细胞的状态(正常或癌变)????等等。对这些问题的回答,结合其他生物学知识和数据有助于阐明基因的调控路径和基因之间的调控网络。揭示基因调控路径和网络是生物学和生物信息学共同关注的目标,是系统生物学(Systems Biology,在附录中增加解释条目!)研究的核心内容。目前,对基因表达数据的分析主要是在三个逐渐复杂的层次上进行:1、分析单个基因的表达水平,根据在不同实验条件下,该基因表达水平的变化,来判断它的功能,例如可以确定肿瘤类型特异基因。采用的分析方法可以是统计学中的假设检验等。2、考虑基因组合,将基因分组,研究基因的共同功能、相互作用以及协同调控等。多采用聚类分析等方法。3、尝试推断潜在的基因调控网络,从机理上解释观察到的基因表达谱。多采用反工程的方法。 本章首先介绍基因表达数据的来源和预处理方法;然后介绍基因表达数据分析的主要方法,即表达差异分析和聚类分析;最后简单介绍从基因表达数据出发研究基因调控网络的一些经典模型。 8.1 基因表达数据的获取 基因表达数据反映的是直接或间接测量得到的基因转录产物mRNA在细胞中的拷贝数或者水平(转录??),这些数据可以用于分析哪些基因的表达发生了改变,它们有何相关性,在不同条件下基因是如何受影响的。它们在医学临床诊断、药物疗效判断、揭示疾病发生机制等方面有重要的应用。目前检测mRNA水平的方法有DNA微阵列、基因芯片、基因表达串行化分析(Serial analysis of gene expression,SAGE)、RT-PCR、EST测序等。目前,最主要的表达数据来自于基因芯片或cDNA微阵列,它们的原理是相同的,利用4种核苷酸之间两两配对互补的特性,使两条在序列上互补的单链形成双链,这个过程被称为杂交。基本技术是:在一个约1cm2大小的玻璃片上,将称为探针的核苷酸片段固定在上面,这个过程称为芯片制备;从细胞或组织中提取mRNA,通过RT-PCR合成荧光标记的cDNA,与芯片杂交;用激光显微镜或荧光显微镜检测杂交后的芯片,获取荧光强度,分析细胞中的mRNA的相对水平。

基因表达分析

荧光定量PCR 在基因表达分析中的应用 所谓基因表达就是指在特定的时刻某种我们感兴趣的基因在组织或细胞中的mRNA 的表达数量。众所周知,很多的疾病(如肿瘤)的发生发展、很多药物的作用机理、很多生物的代谢调控作用等都和基因表达的变化有关,因此对基因表达进行精确定量是十分重要的。过去为了对mRNA 进行定量有了各种各样的方法,如Southern 杂交、Northern 杂交、原位杂交、传统PCR 等,但是我们也都知道这些技术灵敏性较差,重复性不好,操作比较烦琐,已经无法满足现在科研和检测的需要,于是荧光定量PCR 技术也就应运而生了。荧光定量PCR 技术能对核酸进行精确定量,因此大大提高了在基因表达的准确性和灵敏度,深受用户的青睐,广泛的应用于肿瘤研究、药物筛选、功能基因组研究等各个领域,目前已经成了很多科研文章发表的重要实验内容。 基因表达分析中常见到的重要问题 1、要检测的基因 基因表达分析的目的就是检测某种我们感兴趣的基因在不同组织或细胞中的表达差异。荧光定量PCR 技术可以对核酸物质的含量进行精确的定量,也就成了研究基因表达差异的一把利器。 在基因表达分析实验中要检测两个基因,一个是目的基因和另一个是看家基因。之所以要引入看家基因是由于不能确定要比较的样品所用的组织起始量相同。就是说比如有的老师提取正常样品的基因时用了100个细胞,而提取病变样品时只用了10个细胞,这时候的基因表达差异可能是由于提取时候的样品细胞数不同引起的,为了纠正这种误差,我们选用认为在两个样本中表达量不变的基因作为内参照,来去除这带来的干扰。例如,要研究某个基因在肿瘤样品和正常样品中的基因表达差异。我们在实验中发现我们选择研究的正常样品中的看家基因的表达量是肿瘤样品中的10倍,就认为正常样品的细胞数就是肿瘤样品细胞数的10倍,那么在肿瘤样品中目的基因的基因表达量应该乘以10倍,才能和正常样品进行比较。 2、计算基因表达差异 基因表达差异的计算是通过所得到的Ct 值来计算的,要计算两个样品(待测样品和对照样品)的目的基因的表达差异必须检测得到4个Ct 值:待测样品和对照样品中目的基因和看家基因的Ct 值。 那么基因表达差异应该计算为 基因表达差异=2(△Ct1-△Ct2) 目的基因 看家基因 待测样品 对照样品 △Ct1 △Ct2

基因表达谱分析技术

基因表达谱分析技术 1微阵列技术(microarray) 这是近年来发展起来的可用于大规模快速检测基因差别表达、基因组表达谱、DNA序列多态性、致病基因或疾病相关基因的一项新的基因功能研究技术。其原理基本是利用光导化学合成、照相平板印刷以及固相表面化学合成等技术,在固相表面合成成千上万个寡核苷酸“探针”(cDNA、ESTs或基因特异的寡核苷酸),并与放射性同位素或荧光物标记的来自不同细胞、组织或整个器官的DNA或mRNA反转录生成的第一链cDNA进行杂交,然后用特殊的检测系统对每个杂交点进行定量分析。其优点是可以同时对大量基因,甚至整个基因组的基因表达进行对比分析。包括cDNA芯片(cDNA microarray)和DNA芯片(DNA chips)。 cDNA芯片使用的载体可以是尼龙膜,也可以是玻片。当使用尼龙膜时,目前的技术水平可以将20000份材料点在一张12cm×18cm的膜上。尼龙膜上所点的一般是编好顺序的变性了的双链cDNA片段。要得到基因表达情况的数据,只需要将未知的样品与其杂交即可。杂交的结果表示这一样品中基因的表达模式,而比较两份不同样品的杂交结果就可以得到在不同样品中表达模式存在差异的基因。杂交使用的探针一般为mRNA的反转录产物,标记探针使用32PdATP。如果使用玻片为载体,点阵的密度要高于尼龙膜。杂交时使用两种不同颜色的荧光标记不同的两份样品,然后将两份样品混合起来与一张芯片杂交。洗去未杂交的探针以后,能够结合标记cDNA的点受到激发后会发出荧光。通过扫描装置可以检测各个点发出荧光的强度。对每一个点而言,所发出的两种不同荧光的强度的比值,就代表它在不同样品中的丰度。一般来讲,显示出来的图像中,黄色的点表示在不同的样品中丰度的差异不大,红色和绿色的点代表在不同样品中其丰度各不相同。使用尼龙膜为载体制作cDNA芯片进行研究的费用要比玻片低,因为尼龙膜可以重复杂交。检测两种不同的组织或相同组织在不同条件下基因表达的差异,只需要使用少量的尼龙膜。但是利用玻片制作的cDNA芯片灵敏度更高,而且可以使用2种探针同时与芯片杂交,从而降低了因为杂交操作带来的差异;缺点是无法重复使用还必须使用更为复杂的仪器。 Guo等(2004)将包含104个重组子的cDNA文库点在芯片上,用于检测拟南芥叶片衰老时的基因表达模式,得到大约6200差异表达的ESTs,对应2491个非重复基因。其中有134个基因编码转录因子,182个基因预测参与信号传导,如MAPK级联传导路径。Li等(2006)设计高密度的寡核苷酸tiling microarray方法,检测籼稻全基因组转录表达情况。芯片上包含13,078,888个36-mer寡核苷酸探针,基于籼稻全基因组shot-gun测序的序列合成,大约81.9%(35,970)的基因发生转录事件。Hu等(2006)用含有60,000寡核苷酸探针(代表水稻全部预测表达基因)的芯片检测抗旱转基因植株(过量表达SNAC1水稻)中基因的表达情况,揭示大量的逆境相关基因都是上升表达的。 2基因表达系列分析(Serial analysis of gene expression,SAGE) 基因表达系列分析(SAGE)是一种转录物水平上研究细胞或组织基因表达模式的快速、有效的技术,也是一种高通量的功能基因组研究方法,它可以同时将不同基因的表达情况进行量化研究(Velculescu et al.,1995)。SAGE的基本原理是:每一条mRNA序列都可以用它包含的9bp的小片段(TAG)代替,因此考查这些TAGs出现的频率就能知道每一种mRNA 的丰度。首先利用生物素标记的oligo(dT)引物将mRNA反转录成双链cDNA,然后利用NlaIII 酶切双链cDNA。NlaIII酶的识别位点只有4bp,因此cDNA都被切成几十bp的小片段。带有生物素标记的小片段cDNA被分离出来,平均分成2份。这2份cDNA分别跟2个接头连接,2个接头中均有一个FokI酶切位点。FokI是一种II S型核酸内切酶,其识别位点不对称,切割位点位于识别位点下游9bp且不依赖于特异的DNA序列。FokI酶切分成2份的cDNA之

基因表达谱分析技术

基因表达谱分析技术 1、微阵列技术( microarray) 这是近年来发展起来的可用于大规模快速检测基因差别表达、基因组表达谱、DNA 序列多态性、致病基因或疾病相关基因的一项新的基因功能研究技术。其原理基本是利用光导化学合成、照相平板印刷以及固相表面化学合成等技术,在固相表面合成成千上万个寡核苷酸探针”(cDNA、ESTs或基因特异的寡核苷酸),并与放射性同位素或荧光物标记的来自不同细胞、组织或整个器官的DNA 或mRNA 反转录生成的第一链cDNA 进行杂交,然后用特殊的检测系统对每个杂交点进行定量分析。其优点是可以同时对大量基因,甚至整个基因组的基因表达进行对比分析。包括cDNA芯片(cDNA microarray)和DNA 芯片( DNA chips)。 cDNA 芯片使用的载体可以是尼龙膜,也可以是玻片。当使用尼龙膜时,目前的技术水平可以将20000份材料点在一张12cmxi8cm的膜上。尼龙膜上所点的一般是编好顺序的变性了的双链cDNA 片段。要得到基因表达情况的数据,只需要将未知的样品与其杂交即可。杂交的结果表示这一样品中基因的表达模式,而比较两份不同样品的杂交结果就可以得到在不同样品中表达模式存在差异的基因。杂交使用的探针一般为mRNA的反转录产物,标记探针使用 32PdATP。如果使用玻片为载体,点阵的密度要高于尼龙膜。杂交时使用两种不同颜色的荧光标记不同的两份样品,然后将两份样品混合起来与一张芯片杂交。洗去未杂交的探针以后,能够结合标记cDNA 的点受到激发后会发出荧光。通过扫描装置可以检测各个点发出荧光的强度。对每一个点而言,所发出的两种不同荧光的强度的比值,就代表它在不同样品中的丰度。一般来讲,显示出来的图像

基因表达数据分析的方法

基因表达数据分析的方法 摘要:基因表达数据的一个重要应用是给疾病样本分类,如鉴别白血病的类型。而对成千上万个基因表达进行分析,必产生总量巨大的数据集。近年来,支持向量机(SVM)的理论已经取得重大进展,其算法实现策略以及实际应用也发展迅速,开始成为克服“维数灾难”和“过学习”等传统困难的有力手段。利用这一技术分析与整理这些基因表达数据,已有效地解决了生物信息学上这一海量数据的瓶颈问题。本文就支持向量机在基因表达数据分析方面的算法和应用进行了介绍和分析。 关键词:生物信息学;基因表达数据;支持向量机 Methods of gene expression data analysis Abstract:Gene expression data has an important application to the classification of disease samples, such as identifying the types of leukemia. The analysis of thousands of gene expression data, will produce a tremendous amount of data sets. In recent years, support vector machine (SVM) theory that significant progress has been made towards its strategy and practical applications of algorithms has been developing rapidly and became overcome the "Dimension disaster" and "Over-study", a powerful means of the traditional difficulties. Using this technology analysis and collation of these gene expression data have been effectively solved bottleneck on the enormous bioinformatics data. This paper discusses the algorithms and application of support vector machine in gene expression data analysis. Keywords:Bioinformatics ;Gene expression data; Support vector machine

基因表达谱分析技术

基因表达谱分析技术 1、微阵列技术(microarray) 这是近年来发展起来的可用于大规模快速检测基因差别表达、基因组表达谱、DNA序列多态性、致病基因或疾病相关基因的一项新的基因功能研究技术。其原理基本是利用光导化学合成、照相平板印刷以及固相表面化学合成等技术,在固相表面合成成千上万个寡核苷酸“探针”(cDNA、ESTs或基因特异的寡核苷酸),并与放射性同位素或荧光物标记的来自不同细胞、组织或整个器官的DNA或mRNA反转录生成的第一链cDNA进行杂交,然后用特殊的检测系统对每个杂交点进行定量分析。其优点是可以同时对大量基因,甚至整个基因组的基因表达进行对比分析。包括cDNA芯片(cDNA microarray)和DNA 芯片(DNA chips)。 cDNA芯片使用的载体可以是尼龙膜,也可以是玻片。当使用尼龙膜时,目前的技术水平可以将20000份材料点在一张12cm×18cm的膜上。尼龙膜上所点的一般是编好顺序的变性了的双链cDNA片段。要得到基因表达情况的数据,只需要将未知的样品与其杂交即可。杂交的结果表示这一样品中基因的表达模式,而比较两份不同样品的杂交结果就可以得到在不同样品中表达模式存在差异的基因。杂交使用的探针一般为mRNA的反转录产物,标记探针使用32PdATP。如果使用玻片为载体,点阵的密度要高于尼龙膜。杂交时使用两种不同颜色的荧光标记不同的两份样品,然后将两份样品混合起来与一张芯片杂

交。洗去未杂交的探针以后,能够结合标记cDNA的点受到激发后会发出荧光。通过扫描装置可以检测各个点发出荧光的强度。对每一个点而言,所发出的两种不同荧光的强度的比值,就代表它在不同样品中的丰度。一般来讲,显示出来的图像中,黄色的点表示在不同的样品中丰度的差异不大,红色和绿色的点代表在不同样品中其丰度各不相同。使用尼龙膜为载体制作cDNA芯片进行研究的费用要比玻片低,因为尼龙膜可以重复杂交。检测两种不同的组织或相同组织在不同条件下基因表达的差异,只需要使用少量的尼龙膜。但是利用玻片制作的cDNA芯片灵敏度更高,而且可以使用2种探针同时与芯片杂交,从而降低了因为杂交操作带来的差异;缺点是无法重复使用还必须使用更为复杂的仪器。 Guo等(2004)将包含104个重组子的cDNA文库点在芯片上,用于检测拟南芥叶片衰老时的基因表达模式,得到大约6200差异表达的ESTs,对应2491个非重复基因。其中有134个基因编码转录因子,182个基因预测参与信号传导,如MAPK级联传导路径。Li等(2006)设计高密度的寡核苷酸tiling microarray方法,检测籼稻全基因组转录表达情况。芯片上包含13,078,888个36-mer寡核苷酸探针,基于籼稻全基因组shot-gun测序的序列合成,大约81.9%(35,970)的基因发生转录事件。Hu等(2006)用含有60,000寡核苷酸探针(代表水稻全部预测表达基因)的芯片检测抗旱转基因植株(过量表达SNAC1水稻)中基因的表达情况,揭示大量的逆境相关基因都是上升表达的。 2、基因表达系列分析(Serial analysis of gene expression, SAGE)

基因表达研究技术

1、基因表达系列分析技术(Serial Analysis of Gene Expression,SAGE) 是以DNA序列测定为基础分析全基因组表达模式的技术。任何长度超过9-10个碱基的核苷酸片段都可能代表一种特异性的转录产物,因此,根据某个序列占总标签数的比例可分析所对应基因的表达频率。 2、原位杂交(In Situ Hybridization,ISH)是用标记的核酸探针,经放射自显影或非放射检测体系,在组织、细胞、间期核及染色体上对核酸进行定位和相对定量研究的一种手段,分为RNA原位杂交和染色体原位杂交。 3、RNA原位杂交:用放射性或非放射性(如地高辛、生物素等)标记的特异性探针与被固定的组织切片反应,若细胞中存在与探针互补的mRNA分子,两者杂交产生双链RNA,可通过放射性标记或经酶促免疫显色,对该基因的表达产物做出定性定量分析。 4、荧光原位杂交(fluorescence in situ hybridization,FISH).首先对寡核苷酸探针做特殊的修饰和标记,然后用原位杂交法与靶染色体或DNA上特定的序列结合,再通过与荧光素分子相耦联的单克隆抗体来确定该DNA序列在染色体上的位置。 5、基因定点突变(site-directedmutagenesis).通过改变基因特定位点核苷酸序列来改变所编码的氨基酸序列,用于研究某个(些)氨基酸残基对蛋白质的结构、催化活性以及结合配体能力的影响,也可用于改造DNA调控元件特征序列、修饰表达载体、引入新的酶切位点等。 6、基因敲除(gene knock-out)又称基因打靶,通过外源DNA与染色体DNA之间的同源重组,进行精确的定点修饰和基因改造,具有专一性强、染色体DNA可与目的片段共同稳定遗传等特点。 7、基因敲除分为: 完全基因敲除:是指通过同源重组法完全消除细胞或者动物个体中的靶基因活性 条件型基因敲除:(又称不完全基因敲除),是指通过定位重组系统实现特定时间和空间的基因敲除。 8、酵母单杂交系统(Yeast one-hybridsystem)是上世纪90年代中发展起来的研究DNA-蛋白质之间相互作用的新技术,可识别稳定结合于DNA上的蛋白质,在酵母细胞内研究真核生物中DNA-蛋白质之间的相互作用,并通过筛选DNA文库直接获得靶序列相互作用蛋白的编码基因。将已知顺式作用元件构建到最基本启动子(minimal promoter,Pmin)的上游,把报告基因连接到Pmin下游。将编码待测转录因子cDNA与已知酵母转录激活结构域(transcription-activating domain,AD)融合表达载体导入酵母细胞,该基因产物如果能够与顺式作用元件相结合,就能激活Pmin启动子,使报告基因得到表达。 9、酵母双杂交系统(Yeast two-hybrid system)真核生物转录调控因子具有组件式结构(modular)特征,这些蛋白往往由两个或两个以上相互独立的结构域,其中DNA结合结构域(binding domain,BD)和转录激活结构域(activation domain,AD)是转录激活因子发挥功能所必须的。BD能与特定基因启动区结合,但不能激活基因转录,由不同转录调控因子的BD和AD所形成的杂合蛋白却能行使激活转录的功能。

相关文档
相关文档 最新文档