文档库 最新最全的文档下载
当前位置:文档库 › 高等植物基因组测序回顾与展望_刘蓉蓉

高等植物基因组测序回顾与展望_刘蓉蓉

高等植物基因组测序回顾与展望_刘蓉蓉
高等植物基因组测序回顾与展望_刘蓉蓉

#综述与专论#

生物技术通报

BI OTEC HNOLOG Y BULLETI N

2011年第5期

高等植物基因组测序回顾与展望

刘蓉蓉

(中国农业科学院科技管理局,北京100081)

摘 要: 全基因组序列测定为揭示植物重要性状形成的分子和遗传机制提供了强大工具,基因组学研究正开始指引着农作物新品种培育向定向化和精确化转变。在新一代测序技术的带动下,植物全基因组测序的热潮已经到来。对迄今开展的高等植物基因组测序工作进行简要回顾,并对未来的研究热点进行展望。

关键词: 植物

基因组

测序

Retros pect and Prospect of H i gh P l antGeno m e Se quenci ng Projects

L i u Rongrong

(D e part m e nt of Science and Tec hnology M anage m ent ,Chinese A c ade my of Agric ult ural Sciences ,B eiji ng 100081)

Abstrac:t P lan t geno

m e sequenc i ng is a po w erful too l to study mo lecu l a r and gene ti c m echanis m s behi nd agrono m ic traits ,and the rap i d develop m ent i n plant genom i cs is gu i di ng crop breeding t o a m ore d irective and prec ise stag e .Due t o t he success o f the nex t -gen -e ration sequencing techno l ogy ,a boom o f plan t geno m e sequenc i ng has co m e .P l ant genom e pro jects carried out so far we re br i e fly re -v ie w ed ,and perspecti ves o f agr i cultural genom ics w ere su mm ar i zed .

K ey words : P lant G enom e Sequenc i ng

收稿日期:2010-11-30

作者简介:刘蓉蓉,女,博士,助理研究员,研究方向:农业科技管理;E-m ai:l li urr @caas .n et .cn

自2000年全球首个高等植物拟南芥全基因组序列得到解析以来,迄今为止,共有10余种高等植物完成了全基因组测序。随着新一代测序技术的发展和

应用,全基因组测序所需的时间与成本均大幅下降。对任意物种进行全基因组图谱绘制即将实现,基因组学与/后基因组学0的各种研究方法和技术随之涌现,对高等植物生长发育过程各种生理生化机制的探究将上升到基因组水平,从而对植物分子生物学、生物技术和农作物品种改良带来深远影响。

1全基因组测序对植物分子生物学研究的影响

基因组学极大地拓宽了植物学研究的视野,开

辟了新兴研究领域,提供了全新的思路和方法,使解决问题的能力有了飞跃式提升,加速了重大发现的获得,对植物分子生物学和生物技术发展的驱动作用越来越显著。111

使得同时解析全部遗传信息成为可能传统的植物分子生物学通常针对一个或数个基

因进行/零敲碎打0式的研究,难以了解基因组的全貌,研究结果往往带有一定的局限性。当全基因组测序成为现实后,基因组学取得长足发展,并催生了蛋白组学、转录组学、代谢组学和RNA 组学等一系列新兴的/后基因组学0,可同时对一个细胞、组织或植株进行整体性研究。这些/组学0与计算生物学相结合形成了/系统生物学0,旨在以生物体整个基因组全部遗传信息为基础,破解表现型的遗传基础、形成机制和调控网络。这些新兴研究手段使植物分子生物学研究产生了革命性发展,呈现出全新的面貌。112

大大促进了对重要农艺性状遗传基础的理解获得全基因组序列后,借助基于序列特征分析的计算机软件进行全基因组搜索,综合利用高密度物理或遗传图谱、比较基因组学手段及基因芯片技术等,能够开展功能基因预测,显著提高基因克隆效率。事实上,植物基因组学或/后基因组学0的主要任务之一,就是找到与生长、发育、产量、品质和抗性等重要性状相关的候选基因/QTL 或紧密连锁的分

2011年第5期刘蓉蓉:高等植物基因组测序回顾与展望

子标记,为作物遗传改良奠定基础。由于重要农艺性状通常是受多基因控制的数量性状,要想对其形成机制、基因互作和代谢网络进行整体、深入和全面的了解,就必须借助基因组学研究手段。

113显著增进了对染色体结构与分子进化过程的认识

全基因组序列的解析使人们对于染色体结构特征有了更为深刻的认识。例如,可以通过染色体不同区域的DNA序列特征分析,辨别出富含重复序列而重组概率低的异染色质区与富含基因序列而重组概率高的常染色质区,还可鉴别转座因子(transposa-b le ele m ents)的种类与数量,以及参与调控染色体复制和重组的序列,了解突变、转座、重排等变化的内容与控制机理。另外,通过染色体同源性分析与比较基因组学研究,能够确定在生物进化过程中发生基因组加倍的事件及大致年代,推测染色体发生复制、断裂、融合、丢失或重排的过程,为分子进化学提供十分有效的研究手段,有助于深入理解进化发生的机制。114对基因表达调控的理解上升到基因组层面基因表达受到不同水平的复杂调控,植物生长发育繁殖过程和应对外界各种环境的机制就是这些调控综合作用的结果。对基因表达起调控作用的编码或非编码序列构成基因组的重要内容,这些序列如何在不同环节影响特定基因的表达,传统分子生物学往往很难全面回答这一问题。当知道全基因组序列后,借助计算机软件分析,可以推测转录、剪切等调控元件的数量、结构和位置等信息,比较不同基因或同一基因不同拷贝间在转录与转录后水平所受调控的异同,有利于从相对宏观的水平理解这一复杂机制[1]。小分子RNA组学、表观基因组学等为研究基因表达调控开辟了全新的重要研究领域。

2植物基因组计划

迄今为止,共有近20种高等植物完成了全基因组框架图或精细图的绘制(表1),涵盖了模式植物、粮食作物、园艺作物和油料作物等[2-21]。从逐步克隆(c l o ne-by-c l o ne)策略,到全基因组鸟枪法(whole geno m e shotgun)策略,再到采用新一代测序技术实现从头(d e novo)测序,植物基因组测序呈现效率不断提高而成本显著下降的趋势。

表1已完成的植物基因组计划简况

物种基因组大小(M b)推测基因数(个)完成国家完成年份*完成程度

拟南芥12531114美国、日本、德国等2000精细图

水稻43037000-56000日本、美国、法国等2002精细图

杨树485>45000美国、瑞典、加拿大等2006框架图

葡萄48730434法国、意大利2007框架图

木瓜37024746美国、中国2008框架图

高粱73034496美国、德国、中国等2009框架图

黄瓜35026682中国、丹麦、美国等2009框架图

棕榈1800/马来西亚2009框架图

玉米2500>32000美国、法国、印度2009框架图

白菜49241835中国、澳大利亚、英国等2009精细图

马铃薯840>35000中国、荷兰、英国等2009框架图

大豆110046430美国、日本2010框架图

短柄草27225532美国、英国、波兰等2010框架图

蓖麻32531237美国、尼日利亚、德国2010框架图

木薯41647164美国2010框架图

苹果74257386意大利、美国、法国等2010框架图

*以公开发表文章或公开宣布的年份代表

11

生物技术通报B iotechnology Bulletin2011年第5期

211简要回顾

拟南芥和粳稻的全基因组测序采取逐步克隆策略,分别历经5年和9年时间才完成,在取得开创性成果的同时,也耗费了大量的人力物力。我国科研人员独立绘制的籼稻基因组是世界首例以全基因组鸟枪法构建的高等植物基因组图谱[4,5],随后,以遗传图谱和物理图谱为参照,植物基因组测序普遍采用这一更为便捷的策略。玉米基因组是迄今为止已测序高等植物基因组中最大的,采用逐步克隆、每个克隆用鸟枪法测序的策略完成[6]。黄瓜基因组首次利用新一代So lexa系统测序技术,结合传统San-ger法,实现了从头测序[7],而棕榈基因组则完全依靠新一代罗氏454测序技术独立完成了从头测序[8]。新一代测序技术大大提高了全基因组测定效率,例如白菜基因组框架图仅用半年时间即绘制完成。

通过基因组全序列测定,发现了一大批与不同生理生化特点相关的基因,例如杨树与木质纤维素合成、分生组织发育和代谢产物运输等过程相关的基因[9],合成赋予葡萄香味的萜类化合物和丹宁酸的基因[10];高粱与C4光合作用和强耐旱性有关的基因[11];玉米与突出的杂种优势特性相关的DNA 片段等[12]。商业化的转基因抗病毒木瓜是首例被测序的转基因作物,测序确认了3个拷贝外源基因的插入位点[13]。禾本科稻亚科(水稻)、黍亚科(高粱、玉米)和早熟禾亚科(二穗短柄草)均有物种完成了全序列测定,为世界主要粮食作物的分子生物学研究与品种改良提供了强大助力,其中二穗短柄草全序列测定为同属此亚科的小麦和大麦基因组学研究提供了十分重要的借鉴。由于基因组规模巨大(约是水稻的38倍)、结构复杂且序列重复度高,小麦基因组计划正面临着前所未有的挑战。此外,还通过种间染色体序列比对,揭示了高等植物在进化过程中发生的全基因组复制事件[2,10,14,15],为分子进化学提供了可靠证据。新近宣布完成测序的油料作物蓖麻基因组解析了蓖麻毒素与油脂代谢的基因[16],而木薯基因组框架图的构建,将极大促进对这一热带地区主要粮食作物的深入研究和改良[17]。212即将迎来的大发展

以Illu m ina公司的Solexa系统、罗氏公司的454系统以及App lied B i o syste m s公司的SOL i D系统为代表的新一代测序技术系统渐渐成为大规模全基因组测序的技术主导,从根本上改变了解析生物全基因组的方式,使得DNA数据产出能力呈指数增长,同时成本急剧降低,对任意物种进行全基因组测序即将成为现实[22]。2010年1月,深圳华大基因研究院正式宣布启动一项规模庞大的/千种动植物基因组计划0,计划在两年时间内对约1000种具有重要科研或经济价值的动植物物种进行全基因组测序,其中包括高等植物约500种[23]。目前,一大批重要农作物的全基因组测序工作正在进行中,包括小麦、棉花、西瓜、兰花和番茄等。可以预计,在不久的将来,这些基因组图谱便会新鲜出炉,/植物全基因组俱乐部成员0的数量将会呈现/井喷0式增长。在此背景下,一方面,科研大联合、大协作日益加深,另一方面,世界范围内对物种全基因组测序、抢占知识产权高地、提升国际学术地位和话语权的竞争将空前加剧。

3基因组学与/后基因组学0展望

基因组序列信息源源不断地从测序仪读出,解析这些序列所包含的全部遗传信息便成为基因组测序后的首要任务,可以说,全基因组图谱构建完成后,真正艰巨的工作才刚刚开始。以下对由新一代测序技术带动的基因组学与/后基因组学0研究作一展望。

311转录组学(transcri p to m ics)

转录组(transcripto m e)指细胞中全部转录产物的总和。通常用来研究转录组的方法主要有表达芯片、定量PCR和基因表达系列分析(S AGE)等,但这些方法要么只能通过间接的方法测定基因表达水平,要么无法研究未知转录产物,或者步骤繁琐、费用高昂。借助通量高、成本低、速度快的新一代测序技术,可以通过对转录组c DNA测序而直接读出所有基因表达产物的丰度,并能鉴别出以前未知的转录产物[24]。应用新一代测序技术,已经建立了多种模式生物的表达序列标签(EST)数据库,对基因组解析和基因克隆具有重要价值[25]。通过对转录组c DNA进行鸟枪法测序并拼接,还获得了拟南芥、豌豆和玉米等植物的转录组全貌。将新一代测序技术与SAGE法相结合,利用测序反应获得的小片段序

12

2011年第5期刘蓉蓉:高等植物基因组测序回顾与展望

列为标签,能够方便的鉴定不同品种或不同环境条件下基因表达的异同。

312小分子RNA组学(Rno m ics)

基因组转录产物中,编码蛋白的mRNA只占很小一部分,大部分是不被翻译为蛋白的非编码RNA,其中包括小分子调控型的si R NA、m i R NA和pi R NA等。小分子非编码RNA在基因表达的转录、转录后和翻译水平都有着十分重要的调控功能,也与DNA甲基化和转座子沉默密切相关,是近年来分子生物学研究的一个热点。新一代测序技术读长较短,非常适合小分子RNA测序,大大促进了小RNA 基因的发现,特别是表达丰度和同源性较低的分子。此外,对特定组织、特定发育阶段或特定诱导条件下植物体内小RNA转录组进行测序,为揭示小RNA 的功能提供了依据。研究者利用新一代测序技术测定了拟南芥、水稻、小麦、大豆、玉米和番茄等物种的小分子RNA文库,获得了105-107个小分子RNA 序列,从中鉴定了大量新分子,并通过表达特征分析进行了功能研究[26]。RNA组学的一个分支是计算RNA组学,即通过开发各种算法,从基因组水平对小RNA基因进行预测和分类鉴定,并寻找作用的靶序列,预测其功能与调控网络[27]。

313表观基因组学(epigeno m ics)

表观基因组学是从基因组水平上研究表观遗传学的学科。DNA甲基化是生物界普遍存在的表观遗传修饰方式,已成为表观基因组学最重要的研究内容。DNA甲基化后,与转录因子等DNA结合蛋白的相互作用发生改变,或染色质结构发生改变,在植物生长发育和应对环境胁迫过程的基因表达调控中起着重要的作用[28]。发生甲基化的胞嘧啶在亚硫酸氢钠作用下可被转化为尿嘧啶,从而通过测序与非甲基化胞嘧啶区分开。应用新一代测序技术,研究者获得了拟南芥野生型与DNA甲基转移酶突变体的全基因组甲基化图谱,再结合转录组学研究,鉴别出了突变体中数百个表达发生改变的基因、转座子和非编码RNA[29]。下一步的工作还包括研究不同发育阶段及不同环境条件下植物甲基化位点的变化,借助于全基因组表达分析,辨别出起调控作用的甲基化位点及受到调节的基因,并研究这些位点的遗传模式及对基因表达的影响。对DNA甲基化更深入的理解将为农作物遗传改良指出新的方向。314基因组重测序(resequenci n g)

全基因组重测序是指在已知基因组序列的基础上,选择不同品种、品系或个体重新进行全基因组测序,再与原始序列进行比对研究。利用重测序结果可以对种质资源进行普查筛选,对个体或群体进行基因组序列和结构的差异性分析,发现单核苷酸多态性位点(SNPs)、拷贝数变异、插入、缺失、移位和倒位等变异类型,从而开展分子进化学研究及重要功能基因预测。高粱基因组序列发表后,我国研究者选择3个代表性的甜高粱种质进行了全基因组重测序,序列比对发现了40多万个SNPs、4万个以上小的插入缺失多态性(I nDe ls)和6000个以上的基因组结构变异,这些结果为发展高密度分子标记和功能基因挖掘打下了基础。新一代测序技术突破了序列测定的瓶颈,华大基因日产数据量已达60Gb,相当于将水稻基因组测140遍的能力。但是,如何从数以万计的种质资源和大批现代育成品种、品系、突变体等遗传材料中筛选出具有代表性的核心种质作为重测序对象,仍然是一项极具挑战性的工作。315农业育种技术革命

目前农作物育种面临着几大难题,首先是材料遗传背景狭窄,据称,在现存于各国的250万份以上农作物及近缘野生种种质资源中,仅有不到5%的材料在育种中得到了应用[30],其次是改良复杂性状难度大以及难以对表型进行精确评价与高效选择等。全基因组测序大大促进了重要基因/QTL和分子标记的挖掘,而基于重测序的基因组学研究能够找到大量遗传变异,再利用关联分析、比较研究和生物信息学分析开发出高密度的分子标记,能显著促进对种质资源的挖掘与利用效率,缩短育种工作周期[31]。现代育种家们已将关注的目光投向了农艺性状形成的分子机制研究,将基因组学最新研究成果应用到对培育品种目标性状的控制中去。利用快速而精确的分子标记辅助选择(m arker-assistant se-lection,MAS),能够以植株发育早期或早代分离群体中的选择部分代替温室或田间筛选,还能对一些难以精确评价的表现型,如抗病性、耐旱性等进行筛选,将显著提高育种效率[32]。据称,全基因组解析将使马铃薯育种选择效率提高1000倍,育种时间

13

生物技术通报B iotechnology Bulletin2011年第5期

从10-12年缩短到5年左右[20]。利用基因组学研究精确确定的分子标记、关键基因位点及其调控网络,可以在计算机平台上优化设计出聚合有利遗传信息的育种方案,指导作物新品种培育,实现分子设计育种。这些新策略、新方法和新技术将为农作物品种遗传改良带来一场革命。

致谢:作者衷心感谢中国农业科学院科技管理局戴小枫副局长对本文所提出的指导性修改建议。

参考文献

[1]朱玉贤.现代分子生物学(第3版)[C].北京:高等教育出版

社,2007.

[2]In iti ati ve AG.Analys i s of the geno m e sequen ce of the fl o w eri ng p l an t

Arabi d o p sis t ha li ana.Nat u re,2000,408(6814):796-815.

[3]Internati on al R i ce G eno m e S equenci ng Project.The m ap-based s e-

quence of t he ri ce geno m e.Nat u re,2005,436(7052):793-800. [4]Yu J,Hu S,W ang J,et a.l A d raft sequen ce of the rice geno m e(Ory-

za sa ti va L.ssp.i nd i ca).S ci en ce,2002,296(5565):79-92.

[5]中国科学院基因组生物信息学研究中心暨北京华大基因研究中

心.水稻(籼稻)基因组工作框架图与精细图的绘制.中国科学院院刊,2003(1):29-31.

[6]Schnab le PS,W areD,Fulton RS,et a.l The B73m aize geno m e:co m-

p l ex i ty,d ivers i ty,and dyna m i cs.Sci en ce,2009,326(5956): 1112-1115.

[7]H uang S,L iR,Zhang Z,et a.l The geno m e of t he cucum ber,Cucum is

sa ti vus L..N ature Genetics,2009,41:1275-1281.

[8]h tt p://www.b i o-equ i p.co m/ne w s.as p?I D=453061145.

[9]Tu s kan GA,D if azio S,Jansson S,et a.l The geno m e of b lack cott on-

w ood,P opu l u s tric hoc arpa(Torr.&Gray).Sci en ce,2006,313 (5793):1596-1604.

[10]The Fren ch-It ali an Pub lic Con s orti um for Grapevi n e Geno m e C har-

acteri zati on.The grapevi ne gen o m e sequen ce s uggests ancestral hexap l oidizati on i n m aj or angi osper m phyla.Nature,2007,449:

463-468.

[11]Paterson A H,Bow ers J E,B ruggmann R,et a.l The S orghum bicolor

geno m e and the d ivers ifi cati on of grasses.Nat u re,2009,457:

551-556.

[12]Feuill et C,Evers o l e K.So l vi ng t he maze.S ci en ce,2009,326

(5956):1071-1072.

[13]M i ng R,H ou S,Feng Y,et a.l The draft geno m e of the tran s gen i c

tropical fru i t tree papaya(Ca ri ca papaya L i nnaeus).Nat u re,2008,

452:991-997.

[14]S ch m u tz J,C annon SB,S chluet er J,et a.l Geno m e sequence of the

p al aeopol yp l oi d soybean.Nat u re,2010,463:178-183.

[15]V el asco R,Zhark i kh A,A ff ourtit J,et a.l The geno m e of t he do m es-

ticated apple(M a l u s d o m estica Borkh.).Nat u re Gen eti cs,2010,

48:833-839.

[16]Chan AP,Crabtree J,Zhao Q,et a.l Draft geno m e sequ ence of the

oils eed species R icinu s co mm unis.Nature B i otechnology,2010,28

(9):951-959.

[17]h ttp://www.phyt ozo m https://www.wendangku.net/doc/a116688398.html,/cassava.php.

[18]杜永臣,王晓武,黄三文.我国蔬菜作物基因组研究与分子育

种.中国农业科技导报,2010,12(2):24-27.

[19]h ttp://https://www.wendangku.net/doc/a116688398.html,/j rz g/2009-10/13/con tent_1438031.h t m

[20]h ttp://https://www.wendangku.net/doc/a116688398.html,/caas/ShowArticl e.asp?I d=6874.

[21]V ogel J P,Garvi n DF,M ock l er TC,et a.l Geno m e s equ enci ng and a-

na l ysis of the model grass Brac hypod i um distac hyon.Nat u re,2010,

463:763-768.

[22]周晓光,任鲁风,李运涛,等.下一代测序技术:技术回顾与展

望.中国科学,2010,40(1):23-37.

[23]h ttp://www.geno m i https://www.wendangku.net/doc/a116688398.html,.

[24]M ard is ER.Next-gen erati on DNA sequen cing m et h ods.Annu Rev

Geno m H um an Genet,2008,9:387-402.

[25]M orozova O,H i rstM,M arra MA.App lications of ne w sequen cing

technologies f or transcri pto m e analys is.Annu Rev Geno m H um an Genet,2009,10:135-151.

[26]卫波,张荣志,李爱丽,等.利用高通量测序技术发现植物小分

子RNA研究进展.中国农业科学,2009,42(11):3755-3764. [27]郑凌伶,屈良鹄.计算RNA组学:非编码RNA结构识别与功能

预测.中国科学,2010,40(4):294-310.

[28]赵云雷,叶武威,王俊娟,等.DNA甲基化与植物抗逆性研究进

展.西北植物学报,2009,29(7):1479-1489.

[29]Lister R,O.M alley RC,Tont-i Filipp i n i J,et a.l H i gh l y i ntegrated

si ng l e-base res o l uti on m aps of t he ep i geno m e in A rabi d o p sis.C el,l 2008,133(3):523-536.

[30]李瑞国.国际农业生物技术发展趋势分析.中国农业科技导报,

2010,12(4):6-11.

[31]黄三文,戴小枫,王俊,等.新一代DNA测序技术给农业育种带

来革命.生物产业技术,2008(2):20-25.

[32]Edw ard s D,Batley J.P l an t genom e sequen ci ng:appli cati ons for crop

i m prove m ent.P l ant B i otechn ol ogy Jou rna,l2010,8(1):2-9.

(责任编辑马鑫)

14

高通量测序基础知识

高通量测序基础知识简介 陆桂 什么是高通量测序? 高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变,一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又被称为深度测序(Deep sequencing)。 什么是Sanger法测序(一代测序) Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。 什么是基因组重测序(Genome Re-sequencing) 全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。 什么是de novo测序 de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。获得一个物种的全基因组序列是加快对此物种了解的重要捷径。随着新一代测序技术的飞速发展,基因组测序所需的成本和时间较传统技术都大大降低,大规模基因组测序渐入佳境,基因组学研究也迎来新的发展契机和革命性突破。利用新一代高通量、高效率测序技术以及强大的生物信息分析能力,可以高效、低成本地测定并分析所有生物的基因组序列。 什么是外显子测序(whole exon sequencing) 外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大的优势,但无法研究基因组结构变异如染色体断裂重组等。

转录组测序(RNA-seq)技术

转录组测序(RNA-seq)技术 转录组是某个物种或者特定细胞类型产生的所有转录本的集合。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理,已广泛应用于基础研究、临床诊断和药物研发等领域。基于Illumina高通量测序平台的转录组测序技术使能够在单核苷酸水平对任意物种的整体转录活动进行检测,在分析转录本的结构和表达水平的同时,还能发现未知转录本和稀有转录本,精确地识别可变剪切位点以及cSNP(编码序列单核苷酸多态性),提供最全面的转录组信息。相对于传统的芯片杂交平台,转录组测序无需预先针对已知序列设计探针,即可对任意物种的整体转录活动进行检测,提供更精确的数字化信号,更高的检测通量以及更广泛的检测范围,是目前深入研究转录组复杂性的强大工具。 技术优势: ?数字化信号:直接测定每个转录本片段序列,单核苷酸分辨率的精确度,同时不存在传统微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题。 ?高灵敏度:能够检测到细胞中少至几个拷贝的稀有转录本。 ?任意物种的全基因组分析:无需预先设计特异性探针,因此无需了解物种基因信息,能够直接对任何物种进行转录组分析。同时能够检测未知基因,发现新的转录本,并精确地识别可变剪切位点及cSNP,UTR区域。 ?更广的检测范围:高于6个数量级的动态检测范围,能够同时鉴定和定量稀有转录本和正常转录本。 应用领域:转录本结构研究(基因边界鉴定、可变剪切研究等),转录本变异研究(如基因融合、编码区SNP研究),非编码区域功能研究(Non-coding RNA研究、microRNA前体研究等),基因表达水平研究以及全新转录本发现。 图1 RNA-seq获得的数据能够进行全面的数据挖掘,既能够进行基因结构分析,鉴定UTR、可变剪切位点,也能够发现新的转录本及非编码RNA,比较样本间的表达水平差异

诺禾致源高分文章集锦-植物基因组

陆地棉基因组测序揭示四倍体棉进化与纤维发育机制Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement 研究对象:陆地棉遗传标准系TM-1 期刊:Nature Biotechnology 影响因子:41.514 合作单位:南京农业大学 发表时间:2015年4月 摘 要 Upland cotton is a model for polyploid crop domestication and transgenic improvement. Here we sequenced the allotetraploid Gossypium hirsutum L. acc. TM-1 genome by integrating whole-genome shotgun reads, bacterial artificial chromosome (BAC)-end sequences and genotype-by-sequencing genetic maps. We assembled and annotated 32,032 A-subgenome genes and 34,402 D-subgenome genes. Structural rearrangements, gene loss, disrupted genes and sequence divergence were more common in the A subgenome than in the D subgenome, suggesting asymmetric evolution. However, no genome-wide expression dominance was found between the subgenomes. Genomic signatures of selection and domestication are associated with positively selected genes (PSGs) for fiber improvement in the A subgenome and for stress tolerance in the D subgenome. This draft genome sequence provides a resource for engineering superior cotton lines.关键词 陆地棉;de novo;四倍体 研究背景 陆地棉(Gossypium hirsutum L.)隶属锦葵目(Malvales),锦葵科(Malvaceae),棉属(Gossypium),因最早在美洲大陆种植而得名,是世界上最重要的棉花栽培品种,占全球棉花种植面积的90%以上。尽管陆地棉在棉花产业中占据核心地位,但由于其为异源四倍体,相关的全基因组测序工作一直难以开展。来自南京农业大学、北京诺禾致源、美国德克斯大学的国际团队,利用最新测序技术,成功构建了高质量的陆地棉全基因组图谱,为进一步改良棉花的农艺性状提供了基础,同时也为多倍体植物的形成和演化机制提供了新的启示。

植物数量性状全基因组选择研究进展

4期吴永升等:植物数量性状全基因组选择研究进展1511 全基因组选择的概念和原理 全基因组选择(Genome-wideselection,GWS),又称基因组选择(Genomicselection,GS),由Meu—wissen于2001年首先提出∞J。主要是通过全基因组中大量的分子标记和参照群体(trainingpopula—tion)的表型数据建立BLUP模型估计出每一标记的育种值,然后仅利用同样的分子标记估计出后代个体育种值并进行选择[7】。 全基因组选择理论主要利用连锁不平衡信息,即假设标记与其相邻的QTL处于连锁不平衡状态,因而由相同标记估计的不同群体的染色体片段效应是相同的,这就要求标记密度足够高以使所有的QTL与标记处于连锁不平衡(LD)状态哺J。而目前随着拟南芥、水稻、玉米等植物基因组序列图谱及SNP图谱的完成或即将完成,提供了大量的SNP标记用于基因组研究。而随着SNP芯片等大规模高通量SNP检测技术的发展和成本的降低,使得全基因组选择应用成为可能。 2全基因组选择的基本方法及案例说明 2.1全基因组选择的基本方法 全基因组选择在实施过程中应该包括以下几个基本步骤:在需要实行选择的参照群体中获取参照群体的基因型数据和表现型数据;然后,通过BLUP程序估计出每个标记位点的标记效应值,从而获得育种值;最后,在接下来每一轮的选择中,不再需要表型数据,根据每一轮次群体基因型信息估计育种值,直接选择群体的优良单株【9j。 全基因组选择的核心过程就是用从参照群体中每一个体的表现型数据和基因型数据建立的数学模型来估算接下来的育种群体中仅有基因型数据的个体的GEBV值。由既有表现型数据又有基因型数据的每一个体组成的群体被成为参照群体。参照群体用来估计数学模型的参数,这个参数接着用来计算仅有基因型数据的育种个体GEBV值,然后根据计算的GEBV值对育种群体进行选择并提升到下一轮次的选择中。因此,通过模型来预测个体的育种值,可以不进行表型鉴定就直接对育种群体的个体进行选择(Meuvissen,2001)。为了使估算的GEBV值尽可能地准确,参照群体必须具有代表性,尽可能地代表接下来在育种过程中用全基因组选择方法来进行选择的分离群体。 2.2全基因组选择方法案例 如图l所示,在这个例子中,笔者的目标是把外来种质中的优良性状基因(包括产量、矮杆、抗逆等)导入本地优良的自交系,从而实现种质的改良 图1在玉米中利用全基因组选择方法导入外源种质 Fig.1Genomewideselectionto introgr%exotictraitsintoadaptedmaize

基因组重测序

基因组重测序 背景介绍 全基因组重测序,是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。与已知序列比对,寻找单核苷酸多态性位点(SNP )、插入缺失位点(InDel ,Insertion/Deletion )、结构变异位点(SV ,Structure Variation )位点及拷贝数变化(CNV) 。 可以寻找到大量基因差异,实现遗传进化分析及重要性状候选基因的预测。涉 及临床医药研究、群体遗传学研究、关联分析、进化分析等众多应用领域。 随着测序成本的大幅度降低以及测序效率的数量级提升, 全基因组重测序已经成为研究人类疾病及动植物分子育种最为快速有效的方法之一。利用illumina Hiseq 2000 平台,将不同插入片段文库和双末端测序相结合,可以高效地挖掘基因序列差异和结构变异等信息, 为客户进行疾病研究、分子育种等提供准确依据。 重测序的两个条件:(1)该物种基因组序列已知;(2)所测序群体之间遗传性差异不大( >99% 相似度 ) 在已经完成的全基因组测序及其基因功能注释的基础上,采用全基因组鸟枪法(WGS )对DNA 插入片段进行双末端测序。 技术路线 生物信息学分析

送样要求 1.样品总量:每次样品制备需要大于5ug 的样品。为保证实验质量及延续性,请一次性提供至少20ug的样品。如需多次制备样品,按照制备次数计算样品总量。 2.样品纯度:OD值260/280应在1.8~2.0 之间;无蛋白质、RNA或肉眼可见杂质污染。 3.样品浓度:不低于50 ng/μL。 4.样品质量:基因组完整、无降解,电泳结果基因组DNA主带应在λ‐Hind III digest 最大条带23 Kb以上且主带清晰,无弥散。 5.样品保存:限选择干粉、酒精、TE buffer或超纯水一种,请在样品信息单中注明。 6.样品运输:样品请置于1.5 ml管中,做好标记,使用封口膜封好;基因组DNA如果用乙醇沉淀,可以常温运输;否则建议使用干冰或冰袋运输,并选择较快的运输方式。 提供结果 根据客户需求,提供不同深度的信息分析结果。

转录组高通量测序

转录组高通量测序 2010-11-22 09:48 (第二代高通量测序技术-454) 转录组即特定细胞在某一功能状态下所能转录出来的所有RNA的总和,是研究细胞表型和功能的一个重要手段。与基因组不同的是,转录组的定义中包含了时间和空间的限定。同一细胞在不同的生长时期及生长环境下,其基因表达情况是不完全相同的。罗氏GS-FLX-Titanium第二代高通量测序仪平均读长超过 400bp,在测序读长上遥遥领先于其它第二代高通量测序仪,使其成为转录组学研究的首选测序平台,已被广泛应用于基础研究、临床诊断和药物研发等领域。 一、罗氏454测序技术在环境微生物生态多样性研究中的突出优势体现在:(1)测序序列长,便于聚类拼接,可以对转录本进行从头组装(de novo assembly)。 (2)测序通量高,可以检测到低丰度转录本信息。 (3)可以对无基因组参考序列的新物种进行转录组测序,发现新的转录本和亚型。 (4)实验操作简单、结果稳定,可重复性强。无需进行克隆的文库构建,双链cDNA连接454接头后可以直接进行测序,实验周期短。 (5)测序数据便于进行生物信息分析,可以进行基因差异表达分析、鉴定基因的可变剪切以及预测新基因。 二、美吉公司在环境微生物生态多样性研究中的突出优势体现在: (1)拥有自主实验室和高通量测序平台,可以根据客户要求灵活安排实验,实验周期短,取样方便,质量可靠。 (2)技术人员经验丰富,可以稳定地进行总RNA的提取和双链cDNA的合成,可以根据顾客要求第一时间提供实验方案。 (3)有专业的生物信息团队和大型计算机,可以为客户提供个性化的生物信息分析服务。 (4)开放式实验室,参与式服务。客户不但可以参与整个实验过程,而且可以参与生物信息分析,提供最为增值的售后服务。 三、服务流程 (1)客户提供样本背景信息、实验目的和实验预期。 (2)美吉公司设计实验方案,提供测序深度建议和生物信息分析建议。 (3)客户认可实验方案,双方签订项目合作协议。 (4)项目开始运作,美吉公司指定专人和客户保持无障碍沟通。 (5)项目结束,美吉公司提供标准结题报告。 (6)客户可以和美吉公司签订长期合作协议,享受折扣和VIP服务。 四、送样要求 (1)动物、植物、微生物组织: > 请提供足量的新鲜样品,样品量≥5g;植物材料应避免过老的组织,尽量用柔嫩部位。 > 新鲜程度要求:采样后将样品立即液氮速冻-80℃保存(保存期不超过1个月),干冰运输,运输时间不超过72h。 > 样本保存期间切忌反复冻融。

植物功能基因组学及其研究技术_崔兴国

第9卷 第1期2007年3月 衡水学院学报 J o u r n a l o f H e n g s h u i U n i v e r s i t y V o l.9,N o.1 Ma r.2007植物功能基因组学及其研究技术 崔兴国 (衡水学院 生命科学系,河北 衡水053000) 摘 要:植物基因组的研究已经由以全基因组测序为目标的结构基因组学转向以基因功能鉴定为目标的功能基因组学研究.植物功能基因组学研究是利用结构基因组学积累的数据,从中得到有价值的信息,阐述D N A序列的功能,从而对所有基因如何行使其职能并控制各种生命现象的问题作出回答.近年来植物功能基因组学的研究技术主要包括表达序列标签、基因表达的系列分析、D N A微阵列和反向遗传学等.对植物功能基因组学的研究将有利于我们对基因功能的理解和对植物形状的定性改造和利用. 关键词:植物;功能基因组学;研究技术 中图分类号:Q3-3 文献标识码:A 文章编号:1673-2065(2007)01-0023-04 基因是细胞的遗传物质,决定细胞的生物学形状,细胞的生物学功能最终是由大量的基因表达完成的.随着人类基因组“工作框架图”的完成,生命科学研究的重点已经从结构基因组学转移到了功能基因组学的研究,特别是模式植物拟南芥(A r a b i d o p-s i s t h a l i a n a)和水稻(O r y z a s a t i v a)基因组测序的完成,公共数据库中已经积累了大量基因序列信息,获得了许多与植物发育相关的功能基因,在此基础上应用实验分析方法并结合统计和计算机分析来研究基因的表达、调控与功能,并相应诞生和发展了一批新的研究技术,为功能基因组学的研究提供了必要而有效的技术支撑.功能基因组学研究的最终目标是解析所有基因的功能,即从基因水平上大规模批量鉴定基因的功能,进而全面研究控制植物生长发育及响应环境变化的遗传机制,在基因组序列与细胞学行为之间起到桥梁作用,共同承担起从整体水平上解析生命现象的重任. 1 植物功能基因组学研究 植物的生长和发育是一个有机体或有机体的一部分形态建成和功能按一定次序而进行的一系列生化代谢反应的总合,反应在分子水平上,它要求相应的遗传代谢途径必须按照特定的时空次序严格进行以保证正常发育.植物功能基因组研究就是要利用植物全基因组序列的信息,通过发展和应用系统基因组水平的实验方法来研究和鉴别基因组序列的作用;研究基因组的结构、组织与植物功能在细胞、有机体和进化上的关系以及基因与基因间的调控关系;从表达时间、表达部位和表达水平3个方面对目的基因在植物中的精细调控进行系统研究.当前植物功能基因组学研究主要集中于一年生的拟南芥与水稻两个物种上,这主要是由于它们的遗传背景清楚,基因组较小,基因结构简单而且易于进行分子生物学操作.拟南芥研究组“2010计划”的宏伟目标是充分利用拟南芥基因组计划获得的序列信息并结合功能基因组研究技术来获知其25000个基因的全部功能,例如开花的诱导过程是植物生活周期中最奇妙的过程,目前从拟南芥中鉴定了提早开花和延迟开花的多种突变体,显示植物开花受多个遗传基因的控制,如延迟开花的两个突变体是由等位基因 C O(C O N S T A N S)和L D(C O L D L U M I N I D E P E N- D E N S)突变引起,这两个基因均已被克隆,并使其在转基因植物的叶片中进行表达,将C O基因转移到拟南芥中,高效表达C O蛋白的转基因植株即使处于短日照条件下也会开花,这说明C O基因具有激活开花基因的作用.对模式植物功能基因组的研究将有助于整个植物基因组学的研究. 目前的功能基因组研究主要包括以下几个方面:(1)c D N A全长克隆与测序;(2)获得D N A芯片 ①收稿日期:2006-10-12 作者简介:崔兴国(1963-),女,河北冀州市人,衡水学院生命科学系副教授.

已完成基因组测序的生物(植物部分)分析解析

水稻、玉米、大豆、甘蓝、白菜、高粱、黄瓜、西瓜、马铃薯、番茄、拟南芥、杨树、麻风树、苹果、桃、葡萄、花生 拟南芥籼稻粳稻葡萄番木瓜高粱黄瓜玉米栽培大豆苹果蓖麻野草莓马铃薯白菜野生番茄番茄梨甜瓜香蕉亚麻大麦普通小麦西瓜甜橙陆地棉梅毛竹桃芝麻杨树麻风树卷柏狗尾草属花生甘蓝 物种基因组大小和开放阅读框文献 Sesamum indicum L. Sesame 芝麻(2n = 26)293.7 Mb, 10,656 orfs 1 Oryza brachyantha短药野生稻261 Mb, 32,038 orfs 2 Chondrus crispus Red seaweed爱尔兰海藻105 Mb, 9,606 orfs 3 Pyropia yezoensis susabi-nori海苔43 Mb, 10,327 orfs 4 Prunus persica Peach 桃226.6 of 265 Mb 27,852 orfs 5 Aegilops tauschii 山羊草(DD)4.23 Gb (97% of the 4.36), 43,150 orfs 6 Triticum urartu 乌拉尔图小麦(AA)4.66 Gb (94.3 % of 4.94 Gb, 34,879 orfs 7 moso bamboo (Phyllostachys heterocycla) 毛竹2.05 Gb (95%) 31,987 orfs 8 Cicer arietinum Chickpea鹰嘴豆~738-Mb,28,269 orfs 9 520 Mb (70% of 740 Mb), 27,571 orfs 10 Prunus mume 梅280 Mb, 31,390 orfs 11 Gossypium hirsutum L.陆地棉2.425 Gb 12 Gossypium hirsutum L. 雷蒙德氏棉761.8?Mb 13 Citrus sinensis甜橙87.3% of ~367 Mb, 29,445 orfs 14 甜橙367 Mb 15 Citrullus lanatus watermelon 西瓜353.5 of ~425 Mb (83.2%) 23,440 orfs 16 Betula nana dwarf birch,矮桦450 Mb 17

全基因组重测序数据分析

全基因组重测序数据分析 1. 简介(Introduction) 通过高通量测序识别发现de novo的somatic和germ line 突变,结构变异-SNV,包括重排 突变(deletioin, duplication 以及copy number variation)以及SNP的座位;针对重排突变和SNP的功能性进行综合分析;我们将分析基因功能(包括miRNA),重组率(Recombination)情况,杂合性缺失(LOH)以及进化选择与mutation之间的关系;以及这些关系将怎样使 得在disease(cancer)genome中的mutation产生对应的易感机制和功能。我们将在基因组 学以及比较基因组学,群体遗传学综合层面上深入探索疾病基因组和癌症基因组。 实验设计与样本 (1)Case-Control 对照组设计; (2)家庭成员组设计:父母-子女组(4人、3人组或多人); 初级数据分析 1.数据量产出:总碱基数量、Total Mapping Reads、Uniquely Mapping Reads统计,测序深度分析。 2.一致性序列组装:与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列。3.SNP检测及在基因组中的分布:提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基 因组信息对检测到的变异进行注释。 4.InDel检测及在基因组的分布: 在进行mapping的过程中,进行容gap的比对并检测可信的short InDel。在检测过程中,gap的长度为1~5个碱基。对于每个InDel的检测,至少需 要3个Paired-End序列的支持。 5.Structure Variation检测及在基因组中的分布: 能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进行注释。

高通量测序 名词解释

高通量测序基础知识汇总 一代测序技术:即传统的Sanger测序法,Sanger法是根据核苷酸在待定序列模板上的引物点开始,随机在某一个特定的碱基处终止,并且在每个碱基后面进行荧光标记,产生以A、T、C、G结束的四组不同长度的一系列核苷酸,每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH 基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,通过检测得到DNA碱基序列。 二代测序技术:next generation sequencing(NGS)又称为高通量测序技术,与传统测序相比,二代测序技术可以一次对几十万到几百万条核酸分子同时进行序列测定,从而使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(Deep sequencing)。NGS主要的平台有Roche(454 & 454+),Illumina(HiSeq 2000/2500、GA IIx、MiSeq),ABI SOLiD等。 基因:Gene,是遗传的物质基础,是DNA或RNA分子上具有遗传信息的特定核苷酸序列。基因通过复制把遗传信息传递给下一代,使后代出现与亲代相似的性状。 DNA:Deoxyribonucleic acid,脱氧核糖核酸,一个脱氧核苷酸分子由三部分组成:含氮碱基、脱氧核糖、磷酸。脱氧核糖核酸通过3',5'-磷酸二酯键按一定的顺序彼此相连构成长链,即DNA链,DNA链上特定的核苷酸序列包含有生物的遗传信息,是绝大部分生物遗传信息的载体。

植物基因组测序

千年基因将应邀参加第十六届全国植物基因组学大会 第十六届全国植物基因组学大会将于2015年8月19日-22日在陕西杨凌召开,千年基因应邀参加此次会议,并将在会场学术交流区设立展台。届时千年基因的技术团队会向大家展示我们最全面的测序平台、一站式的基因组学解决方案以及近年来在植物基因组学领域取得的科研成果,欢迎广大科研人员莅临指导交流! 在测序平台方面,千年基因目前拥有国内最全面的测序平台,能够为科研人员提供一站式解决方案。以PacBio RS II三代平台为例,千年基因自去年提供PacBio RS II测序以来,通过项目经验的积累及严格的质量控制,目前各项数据指标已达国内最高水平。数据产出已稳步升级至1.4Gb/ SMRT cell,读长最长可达42 Kb,reads N50高达18Kb,远超PacBio官方提供的数据标准!在植物基因组de novo测序的研究中,千年基因提供的超长读长测序可更好地跨越基因组高重复序列、转座子区域以及大的拷贝数变异区域和结构变异区,从而实现对高杂合及高重复基因组的完美组装。在植物转录组测序的研究中,千年基因提供的超长读长测序无需拼接即可获得全长转录组序列信息,同时可获得全面的可变剪切、融合基因以及Isoform信息。另外,千年基因提供的HiSeq 4000及HiSeq 2000/2500测序可解决研究人员在植物基因组重测序、转录组测序、小RNA测序等方面的科研需求。 在项目经验方面,千年基因与来自全球的科研人员合作开展了大量植物基因组项目,相关成果已发表于Nature、Nature Genetics、Science等杂志。例如,油棕榈基因组项目在Nature 杂志同时发表两篇文章,辣椒基因组项目的成果发表于Nature Genetics,玉米基因组项目的成果发表于Science。在国外合作方面,千年基因与美国爱荷华州立大学Patrick Schnable教授领导的国际玉米基因组团队合作开展的上万份玉米样本重测序项目也正在进行中;千年基因与国际半干旱热带作物研究所建立长期战略合作关系,正在开展上千份木豆、鹰嘴豆及高粱样本的群体遗传学研究;同时千年基因与华盛顿大学的Evan Eugene Eichler院士及佐治亚大学的Jeffrey Lynn Bennetzen院士也有大量基因组项目合作。在国内合作方面,千年基因与广东省农科院、山东省农科院共同启动的花生基因组项目已全部完成de novo测序及数据挖掘,同时与中国科学院、北京大学、中国农业大学、中国科学技术大学、上海交通大学、

美科学家完成大豆基因组测序

Animal Reproduction,Prague(C),Blackwell Publishing Inc, November23-25 Ptak G.,Tischer M.,Bernabo N.,and Loi P.,2003,Donor-depen-dent developmental competence of oocytes from lambs sub-jected to repeated hormonal stimulation,Biology of Repro-duction,69:278-285 Revel F.,Mermillod P.,Peynot N.,Renard J.P.,and Heyman Y., 1995,Low developmental capacity of in vitro matured and fertilize oocytes from calves compared with that of cows, Journal of Reproduction and Fertility,103:115-120Salkamone D.F.,Damiani P.,Fissore R.A.,Robl J.M.,and Duby R.T.,2001,Biochemical and developmental evidence that ooplasmic maturation of prepubertal bovine oocytes is com-promised,Biology of Reproduction,64:1761-1768 Taneja M.,Bols P.E.J.,van de Velde A.,Ju J.C.,Schreiber D., Tripp M.W.,Levine H.,Echelard Y.,Riesen J.,and Yang X. Z.,2000,Developmental competence of juvenile calf oocytes in vitro and in vivo:Influence of donor animal varia-tion and repeated gonadotropin stimulation1,Biology of Re-production,62:206-213 幼畜繁殖(JIVET)技术在性成熟前奶牛上的应用 Application of Juvenile in intro Embryo Transfer(JIVET)Technology on Prepubertal Dairy Cattle !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 美科学家完成大豆基因组测序 US Scientists Sequenced the Genome of Soybean 期待已久的大豆基因组序列终于测通。在2010年1月14日的《Nature》杂志上,公布了由美国农业部、美国能源部联合基因组研究所和普渡大学等多家科研机构联合完成的豆科植物最重要的物种大豆的完整基因组序列草图。 科学家门利用全基因组鸟枪测序法对大豆基因组的1.1GB的序列进行了测序,结合物理图谱和高密度遗传图谱,获得了大豆基因组的序列拼接草图。研究结果表明大豆中有46320个编码蛋白的臆测基因,约78%的臆测基因位于染色体末端,这些基因在数量上不到染色体基因组的一半,但几乎全部发生了遗传重组。大豆基因组的编码蛋白比双子叶模式植物拟南芥多70%,与同为“古老的多倍体”的杨树的基因组大小相似。研究人员推测大豆基因组的复制至少发生了两次,一次大约是在5900万年前,另一次则可能发生在1300万年前,由此引起了整个基因组的高度重复,约75%的基因以多拷贝形式出现。两次复制发生后紧接着出现了基因多样化和基因丢失,大量的染色体发生重排。 毫无疑问,精确的大豆基因组序列图谱将为更多的大豆性状遗传基础的鉴定提供便利,并加快大豆品种改良的步伐。大豆是人类最重要的食用油来源作物,研究人员通过对大豆基因组基因序列的分析,发现了约1110个基因与脂代谢有关,这些基因及其相关通路对大豆油含量有重要的影响,通过对某些基因的修饰和调控,或许可增加大豆的油脂产量。 作者:Courtney H.Wilcox,本刊通讯员 本文引用格式:Courtney Wilcox,2010,美科学家完成大豆基因组测序,农业生物技术学报,18(1):191 信息来源:https://www.wendangku.net/doc/a116688398.html,/nature/journal/v463/n7278/full/nature08670.html 191

转录组测序技术的应用及发展综述

转录组测序技术的应用及发展综述 摘要:转录组测序(RNA-Seq)作为一种新的高效、快捷的转录组研究手段正在改变着人们对转录组的认识。RNA-Seq利用高通量测序技术对组织或细胞中所有RNA 反转录而成cDNA文库进行测序,通过统计相关读段(reads)数计算出不同RNA的表达量,发现新的转录本;如果有基因组参考序列,可以把转录本映射回基因组,确定转录本位置、剪切情况等更为全面的遗传信息,已广泛应用于生物学研究、医学研究、临床研究和药物研发等。文章主要比较近年来转录组研究的几种方法和几种RNA-Seq的研究平台,着重介绍RNA-Seq的原理、用途、步骤和生物信息学分析,并就RNA-Seq技术面临的挑战和未来发展前景进行了讨论及在相关领域的应用等内容,为今后该技术的研究与应用提供参考。 关键词: RNA-Seq;原理应用;方法;挑战;发展前景 Abstract:Transcriptome sequencing (RNA-Seq) is a kind of high efficiency, quick transcriptome research methods are changing our understanding of transcriptome. RNA-Seq to use high-throughput sequencing of tissues or cells of all RNA reverse transcription into cDNA library were sequenced, through statistical correlation read paragraph (reads) numbers were calculated from the expression of different RNA transcripts, find new; if the genome reference sequence, the transcripts mapped to genomic, determine the position of the transcription shear condition, more genetic information, has been widely used in biological research, medical research, clinical research and drug development. This paper compared several methods of platform transcriptome studies and several kinds of RNA-Seq in recent years, RNA-Seq focuses on the principle, purpose, steps and bioinformatics analysis, and discusses the RNA-Seq technology challenges and future development prospect and the application in related field and other content, provide the reference for the research and application of the technology future. Key word:RNA-Seq ;application; principle; method; challenge; development prospects

全基因组从头测序(de novo测序)

全基因组从头测序(de novo测序) https://www.wendangku.net/doc/a116688398.html,/view/351686f19e3143323968936a.html 从头测序即de novo 测序,不需要任何参考序列资料即可对某个物种进行测序,用生物信息学分析方法进行拼接、组装,从而获得该物种的基因组序列图谱。利用全基因组从头测序技术,可以获得动物、植物、细菌、真菌的全基因组序列,从而推进该物种的研究。一个物种基因组序列图谱的完成,意味着这个物种学科和产业的新开端!这也将带动这个物种下游一系列研究的开展。全基因组序列图谱完成后,可以构建该物种的基因组数据库,为该物种的后基因组学研究搭建一个高效的平台;为后续的基因挖掘、功能验证提供DNA序列信息。华大科技利用新一代高通量测序技术,可以高效、低成本地完成所有物种的基因组序列图谱。包括研究内容、案例、技术流程、技术参数等,摘自深圳华大科技网站 https://www.wendangku.net/doc/a116688398.html,/service-solutions/ngs/genomics/de-novo-sequencing/ 技术优势: 高通量测序:效率高,成本低;高深度测序:准确率高;全球领先的基因组组装软件:采用华大基因研究院自主研发的SOAPdenovo软件;经验丰富:华大科技已经成功完成上百个物种的全基因组从头测序。 研究内容: 基因组组装■K-mer分析以及基因组大小估计;■基因组杂合模拟(出现杂合时使用); ■初步组装;■GC-Depth分布分析;■测序深 度分析。基因组注释■Repeat注释; ■基因预测;■基因功能注释;■ ncRNA 注释。动植物进化分析■基因家族鉴定(动物TreeFam;植物OrthoMCL);■物种系统发育树构建; ■物种分歧时间估算(需要标定时间信息);■基因组共线性分析; ■全基因组复制分析(动物WGAC;植物WGD)。微生物高级分析 ■基因组圈图;■共线性分析;■基因家族分析; ■CRISPR预测;■基因岛预测(毒力岛); ■前噬菌体预测;■分泌蛋白预测。 熊猫基因组图谱Nature. 2010.463:311-317. 案例描述 大熊猫有21对染色体,基因组大小2.4 Gb,重复序列含量36%,基因2万多个。熊猫基因组图谱是世界上第一个完全采用新一代测序技术完成的基因组图谱,样品取自北京奥运会吉祥物大熊猫“晶晶”。部分研究成果测序分析结果表明,大熊猫不喜欢吃肉主要是因为T1R1基因失活,无法感觉到肉的鲜味。大熊猫基因组仍然具备很高的杂合率,从而推断具有较高的遗传多态性,不会濒于灭绝。研究人员全面掌握了大熊猫的基因资源,对其在分子水平上的保护具有重要意义。 黄瓜基因组图谱黄三文, 李瑞强, 王俊等. Nature Genetics. 2009. 案例描述国际黄瓜基因组计划是由中国农业科学院蔬菜花卉研究所于2007年初发起并组织,并由深圳华大基因研究院承担基因组测序和组装等技术工作。部分研究成果黄瓜基因组是世界上第一个蔬菜作物的基因组图谱。该项目首次将传

高通量测序:第二代测序技术详细介绍

高通量测序:第二代测序技 术详细介绍 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

在过去几年里,新一代DNA 测序技术平台在那些大型测序实验室中迅猛发展,各种新技术犹如雨后春笋般涌现。之所以将它们称之为新一代测序技术(next-generation sequencing),是相对于传统Sanger 测序而言的。Sanger 测序法一直以来因可靠、准确,可以产生长的读长而被广泛应用,但是它的致命缺陷是相当慢。十三年,一个人类基因组,这显然不是理想的速度,我们需要更高通量的测序平台。此时,新一代测序技术应运而生,它们利用大量并行处理的能力读取多个短DNA 片段,然后拼接成一幅完整的图画。 Sanger 测序大家都比较了解,是先将基因组DNA 片断化,然后克隆到质粒载体上,再转化大肠杆菌。对于每个测序反应,挑出单克隆,并纯化质粒DNA。每个循环测序反应产生以ddNTP 终止的,荧光标记的产物梯度,在测序仪的96 或384 毛细管中进行高分辨率的电泳分离。当不同分子量的荧光标记片断通过检测器时,四通道发射光谱就构成了测序轨迹。 在新一代测序技术中,片断化的基因组DNA 两侧连上接头,随后运用不同的步骤来产生几百万个空间固定的PCR 克隆阵列(polony)。每个克隆由单个文库片段的多个拷贝组成。之后进行引物杂交和酶延伸反应。由于所有的克隆都是系在同一平面上,这些反应就能够大规模平行进行。同样地,每个延伸所掺入的荧光标记的成像检测也能同时进行,来获取测序数据。酶拷问和成像的持续反复构成了相邻的测序阅读片段。

Solexa 高通量测序原理 --采用大规模并行合成测序法(SBS, Sequencing-By-Synthesis)和可逆性末端终结技术(Reversible Terminator Chemistry) --可减少因二级结构造成的一段区域的缺失。 --具有高精确度、高通量、高灵敏度和低成本等突出优势 --可以同时完成传统基因组学研究(测序和注释)以及功能基因组学(基因表达及调控,基因功能,蛋白/核酸相互作用)研究 ----将接头连接到片段上,经 PCR 扩增后制成 Library 。 ----随后在含有接头(单链引物)的芯片( flow cell )上将已加入接头的 DNA 片段变成单链后通过与单链引物互补配对绑定在芯片上,另一端和附近的另外一个引物互补也被固定,形成“桥” ----经30伦扩增反应,形成单克隆DNA簇 ----边合成边测序(Sequencing By Synthesis)的原理,加入改造过的DNA 聚合酶和带有4 种荧光标记的dNTP。这些dNTP是“可逆终止子”,其3’羟基末端带有可化学切割的基团,使得每个循环只能掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3'端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA 片段的序列。目前的配对末端读长可达到2×50 bp,更长的读长也能实现,但错误率会增高。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。 Roche 454 测序技术 “一个片段 = 一个磁珠 = 一条读长(One fragment =One bead = One read)”

相关文档
相关文档 最新文档