文档库 最新最全的文档下载
当前位置:文档库 › 作物QTL定位方法研究进展

作物QTL定位方法研究进展

评述第51卷第19期 2006年10月

作物QTL定位方法研究进展

章元明

(南京农业大学作物遗传与种质创新国家重点实验室, 国家大豆改良中心, 南京210095. E-mail: soyzhang@https://www.wendangku.net/doc/781913645.html,)

摘要论述了数量性状基因座(quantitative trait locus, QTL)定位方法的产生与发展; 重点介绍了近几年提出的一些QTL定位方法, 包括多QTL定位、QTL精细定位与动态性状的QTL定位等; 展望了QTL 定位方法的可能发展方向, 包括育成品种群体新基因发掘的统计方法、表达数量性状基因座(expression quantitative trait locus, eQTL)定位方法、遗传交配设计的QTL定位方法以及生活力基因定位方法等. 目的在于引导植物遗传工作者在进行数量性状遗传分析和种质资源新基因挖掘等研究时选用适宜的统计方法, 以揭示出更多的潜在遗传信息.

关键词数量性状基因座 参数估计 效应 最大似然法 Bayesian方法

早在20世纪20年代, Sax[1]研究认为菜豆种皮色(单基因质量性状)不同基因型间种子大小(数量性状)的显著差异是由于控制种皮色基因与控制种子大小基因间的连锁造成的. 这实质上就是单标记分析. 由此, 出现了基于标记的性状平均数差异t检验法、方差分析法、回归分析法和极大似然法[2~7]以及基于性状的标记频率差异检验方法. 这些方法的缺点是众所周知的. Thoday[8]提出利用两连锁标记来定位数量性状多基因, 此方法的研究结果更为准确. 但是, 筛选两连锁标记在当时十分困难, 限制了它的应用. 随着分子生物学的发展, 研究人员已获得了许多作物的高密度分子标记连锁图谱, 使从整个基因组上定位QTL成为可能, Lander和Botstein[9]的区间作图法就应运而生. 其主要贡献是建立了QTL定位的基本框架, 首次实现了在全基因组水平上搜索QTL, 并估计其效应与位置. 与区间作图类似的有回归分析法[10,11]. 前者是目标性状对后验概率的回归, 后者是对先验概率的回归. 若QTL在标记附近, 两种概率相近, 则两方法结果相当; 否则, 前者优于后者[12]. 这纠正了原认为两方法结果均相似的观点.

若同一染色体上有多个连锁的QTL, 用区间作图法会造成待估QTL位置与效应估计值的偏差. 极端地, 若紧密连锁两QTL的作用方向相反, 往往检测不到; 若作用方向相同, 在两QTL间可能会出现一个“幻影”QTL[11,13,14]. 当检测多个QTL时, 因不同QTL所用的遗传模型不同, 致使其贡献率不能直接相加. 即使强行相加, 也经常会出现总贡献率远大于100%的情形. 为此, Jansen[15]和Zeng[16,17]独立地提出复合区间作图法. 其关键在于怎样选择作为控制遗传背景的协变量—分子标记. 标记太多会降低QTL检测的功效[14], 太少又达不到控制遗传背景的目的. 实质上, 该法仍然是单QTL模型. 为此, Kao 和Zeng[18~20]提出了多区间作图法, 其模型中同时包含了多个QTL及其两两互作. 这是真正意义上的多QTL遗传模型, 为QTL定位开辟了新视野, 也体现了QTL定位的艺术.

目前, 多QTL定位的方法主要有极大似然法和Bayesian方法两大类. 前者包括多区间作图法[18~20]和惩罚最大似然法[21], 其运算速度较快; 后者则主要有可逆跳跃MCMC (Markov chain Monte Carlo)方法[22~26]、Yi等人[27,28]提出的方法和压缩估计方法[29~32]. 多区间作图法的不足在于, 只能检测具有主效QTL间的互作, 有时还不能检测到效应较小的QTL[32]. 可逆跳跃MCMC的Bayesian法的收敛速度太慢, 这是Yi等人[27,28]抛弃该方法并提出一种新的Bayesian方法的原因. Wu和Li[33]认为, Bayesian压缩估计方法将QTL定位策略推进到利用所有标记的上位性QTL的全基因组检测. 虽然该法收敛较快, 但是它假定的QTL数太多致使运算时间太长. 为克服这一问题, 提出了惩罚最大似然方法[21]. 但是, 若标记太多, 该法的参数估计也是困难的. 为此, 我们已将可变区间思想同惩罚最大似然方法与Bayesian压缩估计方法相结合, 以显著减少模型中变量个数[31,32]. 上述方法均是针对某一时间点数量性状观测值(往往为最终结果)的QTL定位, 即静态QTL定位. 然而, 性状的表达是一个过程. 因此, 从动态角度定位QTL也是重要的. 最近, 国际上的最新热点是eQTL定位, 即利用表型观测值、分子标记和表达

第51卷 第19期 2006年10月

评 述

谱数据定位出控制数量性状的基因.

迄今为止, QTL 定位方法有了长足的发展, 已经发展了适合不同倍性(二倍体、三倍体胚乳[34~37]与同源多倍体[38~42])、连续性与间断性(二歧或多歧)变量[43~45]、静态与动态性状、单一性状与多个相关性状联合[46]、单个组合与多个组合联合以及两个亲本与多个亲本甚至育成品种群体的QTL 定位方法. 本文主要对多QTL 定位、QTL 精细定位和动态性状的QTL 定位进行较为详细的介绍.

1 多QTL 定位

1.1 多区间作图法

[18~20]

若回交群体中某一数量性状受m 个分别位于标记区间I 1, I 2, … , I m 的p 1, p 2, … , p m 处QTL (Q 1, Q 2, … , Q m )控制, 则第i 个体数量性状表型值y i 可表示为

1

()m

m

i j ij jk jk ij ik i j j k

y a x w x x e μδ=<=+++∑∑ (1)

其中, μ 为群体平均数; x ij 为QTL 基因型编码变量, 若基因型为Q j Q j (或Q j q j )时, x ij 为1/2(或?1/2); a j 为QTL 主效; w jk 为两QTL 间的上位性效应; δjk 为上位

性指示变量, 存在上位性时取1, 否则取0; e i 为服从N (0, σ

e 2

)的随机误差.

由此, 样本似然函数为

2211(|)(;,).m

n

ij i ij e j i L p y θφμσ==??=????

∑∏Y (2)

其中, φ (.)是正态分布密度函数; μ ij 和p ij 分别是模型

(1)中2m 个不同QTL 基因型值和条件概率. 若各QTL 间相互独立, 可通过多点方法计算p ij .

多区间作图法包括4个组成部分: (ⅰ) 分析特定遗传模型似然的评价程序; (ⅱ) 优化遗传模型的搜索策略; (ⅲ) 特定模型下各QTL 位置、主效与互作参数的估计方法; (ⅳ) 用于标记辅助选择的个体或子代基因型值的预测模块. 中间两过程是关键. 对于前者, 最初提出用逐步回归[19]; 后改为在基础模型上再进行最优模型的确定, 此时互作项为t 项, 不是m (m ? 1)/2项[47]. 对于后者, Kao 和Zeng [18]提出了最大化ln L (Y |θ)以估计参数的EM 算法的一般迭代公式. 最近, 该方法已拓展到间断型性状[48].

在应用中发现, 当无主效QTL 有互作时, 其功效偏低; 当QTL 效应较小时, 其功效偏低[32]. 这可能是由于在模型拟合开始时误差方差较大所致. 若初始模型确定较好, 可能会避免该问题. 建议联合使用

复合区间作图法和双标记互作分析来确定初始模型. 但是, 若QTL 位于区间较大的标记中间时, 其功效会降低.

1.2 Bayesian 压缩估计方法[29~32]

Xu [29]在Meuwissen 等人[49]的工作基础上, 提出

了全基因组所有标记联合分析的Bayesian 压缩估计方法, Zhang 和Xu [30]将该法延伸到多QTL 分析, Wang 等人[32]全面阐述了该方法, Zhang 和Xu [31]将它延伸到QTL 间上位性检测.

模型(1)可变为

01

q

i ij j i j y b z b e ==++∑. (3)

其中, δjk = 1, q = m (m +1)/2, b 0 = μ, b j = a j 和z ij = x ij (j = 1, 2, … , m ), b j+m = w rs 和z i (j+m ) = x ir x is (r = 1, 2, … ,

m ?1; s = r +1, r +2, … , m ; j = 1,2, … , q ?m ). 在多标记

分析中, 假定每标记上存在一个QTL, m 为标记数目;

在多QTL 分析中, 假定每标记区间存在一个QTL, m 为标记区间个数. 若假定的QTL 是假的, 则将其效应估计值向0压缩; 否则, 不压缩. 为实现该目标, 让每一QTL (或标记)效应有自己的方差参数, 同时该方差有其先验分布, 致使每一效应的方差都能从现有资料中估计, 以调节效应估计值. 其具体作法是

假定每一参数有其先验分布, 如p (b 0)∝1, p (σ e

2

)∝1/ σ e

2, p (b j ) = N (0, σ j 2)和p (σ j 2)∝1/σ j 2

(j = 1, 2, … , q ); 然后, 获得每一参数的条件后验分布; 例如, b j 是从平

均数为1

222011q n n j ij e j ij i ik k i i k j b x x y b x b σσ?==≠????=+????????????

∑∑∑和方差为2

j s =1

22221n ij e j e i x σσσ?=??+????

∑的正态分布中抽

样, σ j 2从自由度为1的逆χ 2

分布中抽样; 最后, 从各个参数条件后验分布中抽样. 当抽样链收敛时, 用样

本的特征数来估计各参数. 若将基因组作为横坐标, 各QTL 效应估计值作为纵坐标绘图, 就可明显看出QTL 的数目、位置及其效应.

若模型(3)中某QTL 是假的, 从资料中估计的2?j

σ极端地趋近于0, 使b j 的条件后验分布平均数j b 与方差s j 2均趋于0, 则b j 的抽样观测值趋于0. 应当指出, σ j 2抽样相当重要. 它既可克服岭回归中岭参数固定的缺点, 又不断从资料中估计以真实反映资料信息.

这是因为σ j 2 = b j 2/χ 2v =1. 当b j →0时, 则σ j 2

→0. 但是,

当χ 2v =1非常小时, σ j 2

也可回复到一定的水平. 这就是

评 述

第51卷 第19期 2006年10月

通过σ j 2调节b j 估计值的一般原理, 以达到真QTL 的效应不压缩而假QTL 的效应值向0压缩的目的.

Braak 等人[50]认为, 上述方法的σ j 2先验分布不当并进行了改进. 但是, 通过比较发现两者效果相差不大. 与此相似的还有考虑不同先验方差或平均数的情形. 对于前者, Yi 等人[51]和Oh 等人[52]假定每一效应b j 服从平均数为0, 方差较大和较小的两个正态分布的混合分布, 这就是他们独立应用George 和 McMulloch [53]的变量选择方法来定位QTL 的随机搜

索变量选择方法. 其中, 先验方差不从数据中估计而是人为确定. 这导致了它比上述压缩估计方法效果差[32]. 对于后者, Zhang 等人[54]假定每一效应b j 服从平均数为正、零和负的3个正态分布的混合分布, 提出了QTL 定位的Bayesian 分类方法. 1.3 惩罚最大似然方法

针对用上述方法估计互作模型参数的运行时间长的不足, 有必要用极大似然方法实现其思想, 以节省运行时间. 这就是惩罚最大似然方法. 遗传模型与模型(3)相同, 此时, m 为全基因组上标记数. 若将所有参数的联合先验分布作为惩罚因子, 与似然函数一起构成惩罚似然函数, 通过最大化惩罚似然函数就可以估计QTL 效应及其先验分布参数. 应当指出, 该方法对参数的先验分布比较敏感, 研究发现, 下述

先验是可行的: p (b 0)∝1, p (σ e 2)∝1/σ e 2, p (b j ) = N (μj , σ j 2

), p (μj ) = N (0, σ j 2/η)和p (σ j 2)∝1. 该方法的特点在于各

效应的先验平均数与先验方差同各效应一起同时从现有资料中估计. 例如, QTL 效应的估计值为

1

222122

01? .n j ij e j i q

n ij i ik k j e j i k j b x x y b x b σσμσσ?==≠??=+????

????×??+????????????

∑∑∑ (4)

若σ j 2→0, 则?j b →μj . 由于??(1)j j

b μη=+, 不断迭代后, 会使?j

b

→0. 这说明假QTL 的效应估计值接近0, 而真实QTL 的效应估计值远离0, 以检测主效与互作

QTL, 以达到在参数估计过程中选择变量的目的, 并解决了最大似然方法中待估参数个数远大于样本容量时参数估计的难题. 模型中待估参数个数最多为样本容量的10倍时, 该方法是有效的[21,55]. Yi 等人[56]将该法作为精确定位QTL 的方法之一, 这可能是由于在模型拟合初期误差方差估计值偏小, 从而增大了检测小效应QTL 的功效. 然而, 对于相邻标记间

的互作, 其功效偏低. 这是由于相邻标记间的多重共

线性关系, 使其与b 0合并, 特别是标记密度大的情形.

在实际应用时, 一种方法是先用惩罚似然方法对所有标记的主效与互作进行分析(这时也可嵌合可变区间的思想以减少模型变量个数), 然后用Bayesian 压缩估计方法进行多QTL 主效与互作的分

析; 另一种方法是采取可变区间Bayesian 压缩估计方法进行多QTL 主效与互作分析.

2 QTL 精细定位

初步定位QTL 只说明在某区域可能存在一个控制数量性状的基因, 即找到一个基因座, 距基因还有一段距离. 一方面, QTL 定位的精度还不高, 其位置的95%置信区间通常为10~30 cM [57]; 另一方面, 即使1 cM 的主要农作物DNA 序列长度至少包括几十万碱基. 因此, 精细定位QTL 是应当考虑的. 它是指QTL 位置的95%置信区间为1~5 cM 的QTL 定位[58].

目前, 精细定位QTL 有3种途径, 即发展新的统计方法、增加重组的机会和利用次级分离群体. Lin 等人[59]在研究高粱开花期遗传时, 用区间作

图只检测到1个QTL, 但是, 用已检测的QTL 效应来调整表型观测值后, 发现另外两个QTL, 这被其他独立实验所证实. 这说明统计方法的合理利用可挖掘出更多的潜在信息. 不过, 这只是对连锁信息的巧妙利用, 只是将单QTL 模型拓展到多QTL 模型. 实际上, 连锁不平衡信息也是可供利用的. Bodmer [60]最早提出用连锁不平衡进行QTL 的精细定位. 由于不构建分离群体和解析度较高[61,62]等原因, 它在人类复杂疾病的QTL 定位研究中应用相当广泛. 但是, 在作物QTL 定位中应用较少. 不过, 近年来日益受到重视[63], 我国学者在水稻和小麦方面进行了探索. 它的精度取决于研究群体的连锁不平衡的结构, 群体中分布不均的等位基因亚群往往会导致较高的假阳性. 例如, 复杂的育种历史和野生种间有限基因流动造成了种质资源内的复杂分层, 这使关联分析复杂化[64,65]. 幸运的是, Pritchard 等人[66]结合群体结构估计与关联分析而提出的新方法及Yu 等人[65]提出的混合模型方法克服了该缺点, 前者已应用于玉米开花时间基因Dwarf8的定位. 当然, 将连锁不平衡与连锁信息联合, 精度会更高[67]. 若QTL 区间存在候选基因, 就可直接利用它进行基因的关联分析或互补检验. 这种方法已在玉米研究中应用[68,69].

第51卷第19期 2006年10月评述

在增加重组机会方面, 目前有几种策略: 高代互交系(advanced intercross line, AIL)[70,71]、选择表型(selective phenotyping)、轮回选择与回交系(recurrent selection and backcross, RSB)[72~75]、高代回交系(advanced backcross line, ABL)[76]、育成品种群体[77]等. AIL是通过F t?1代两两个体间相互杂交使重组率增加, 以提高QTL定位精度, 如血浆胆固醇浓度QTL精细定位[78]. 若只选择分离群体中对QTL定位信息量大的重组个体, 显然会使重组频率增加, 这就是选择表型的思想. Jannink[79]通过计算机模拟证实了两种选择方案的优越性. Weight[72]认为, 大效应的QTL可通过轮回回交与选择来积累紧密连锁座位间的重组, 即QTL及其附近区域在不同系间仍保持分离, 其他区域趋近轮回亲本. 这就是RSB. 后来, Hill[73]获得了在RSB中对非轮回亲本表型进行定向选择后的QTL频率. 最近, Luo等人[74,75]构建了RSB 的QTL精细作图的理论方法, 并已精细定位并克隆了酵母乙醇耐受性的主效基因ASG1[80]. ABL就是没有实施选择的RSB, 为作物QTL精细定位的常用策略, 已用于精细定位番茄果重QTL[81]. Li等人[82]将ABL与选择表型相结合, 提出了相应的QTL定位方法. 众所周知, 新品种的培育是育种家有意识地重组优良基因的过程, 说明由育成品种构成群体的重组频率比较高, 因而可用来高解析地定位QTL. 这为Zhang等人[77]的结果所证实.

利用次级分离群体也是QTL精细定位的主要手段之一. 它已应用于水稻抽穗期[83~85]、分蘖角度[86]、矮秆[87]、油菜芥酸[88]等性状的QTL精细定位. 可以发现, 这些研究都采用了大样本和目标区段高密度分子标记图谱, 不过, 对重组个体的大样本后裔鉴定有时也是重要的[65]. 为节约费用, 可用分离亚群体[87], 其精度也比较高1). 利用次级分离群体的技术关键是: (ⅰ) 构建稳定的突变体[86,89]或单QTL[76,83,88]的近等基因系或染色体单片段的代换系(或渗入系)[90,91]. 不过, 构建近等基因系的方法与QTL效应大小有关. 常用的方法是用高代回交法[76,92]. 但是, 当QTL效应较大时, 也可直接在同一群体相同家系内中选择QTL近等基因系[88,92], 还可节约时间; (ⅱ) 获得近等基因系(或代换系)与野生型杂交的分离群体; (ⅲ) 获得目标区间与目标基因紧密连锁的分子标记. 若目标区段的DNA序列已知, 如有大量的EST或BAC的DNA序列, 设计新的SSR标记是容易的. 此外, 若有大量可供利用的染色体片段缺失系, 通过互补检验也可精细定位QTL. 这时, 需要个体数较少[64].

由于水稻等DNA全序列测定的完成, 在目标区间寻找控制目标性状的候选基因应当是不难的. 这为数量性状基因研究进入分子水平奠定了基础.

3动态性状的QTL定位

动态性状是生物体在生长发育过程中随时间变化的数量性状, 也称为发育性状[93]、无限维特征[94]、函数值性状[95]和纵向性状[96]等. 动态性状QTL定位方法一般分3类[96,97]: (ⅰ) 将不同时间点表型观测值(或时间间隔表型观测值增量)视为相同性状的重复测定值, 在重复观测值框架下依次分析该性状; (ⅱ) 将不同时间点观测值视为不同性状, 由多变量方法分析该性状; (ⅲ) 拟合时间点与表型观测值的数学模型, 用多变量方法分析模型参数.

第1类方法最简单. 用常规的QTL定位方法分别分析不同时间点的资料, 在不同时间点上定位了控制水稻分蘖数[98], 松树苗直径、株高和体积[99]以及老鼠体重[100]的若干QTL, 揭示出不同发育阶段可能存在不同的基因. 同时, 若用Zhu[93]提出的条件QTL 定位方法分析两时间点的净效应时, 其结果也是相似的[101,102]. 因而, 用第1类方法分析动态性状可能不是最优的, 可采用多性状QTL定位方法[46], 即第2类方法. 不过. 随着观测时间点数的增加, 变量维数和参数个数都会增加, 增加了计算载荷. 因而该方法适合于时间点数较少的情形. 但是, 若时间点数少, 往往又不能准确地刻划性状动态变化过程. 为减少变量维数, 可用主成分方法[103]获得主要的综合变量. 但是, 多个时间点表型观测值的线性组合(综合变量)的生物学意义有时是不清的. 我们知道, 随着时间点的增加, 表型观测值与时间的曲线可能是一平滑曲线, 该曲线可用生长曲线等数学模型来描述. 因此, 利用生长曲线等数学模型来拟合表型观测值与时间的关系, 并对有生物学意义的模型参数进行多性状QTL定位便具有实际生物学意义. 在这个意义上说, 第3类方法是最优的. 在实际应用中, 最先使用的是

1) 林飞, 万素琴, 程利国, 等. 基于分离亚群体QTL定位的模拟研究. 遗传(待发表)

评述第51卷第19期 2006年10月

两步法: 先拟合数学模型, 再以模型参数为依变量进行多性状QTL定位. 利用该方法已定位了水稻叶龄动态性状的QTL[97]. 与第2类方法相比, 有一些优点: 表型数据量减少, 减轻了计算载荷; 可处理非平衡数据; 由于模型参数具有生物学意义, 从而更能理解性状发育的遗传学基础[97]. 其不足之处是, 没有考虑数学模型参数的估计误差. 由此, Wu等人[33,104~108]将两步法改为一步法. 迄今为止, 已考虑的数学模型主要有: 生长模型[33,104~107]、正交多项式[96]和异速生长模型[108]. Wu和Li[33]认为, 基于模型选择的QTL定位方法和Bayesian压缩估计方法均可用于动态性状的功能定位.

4展望

4.1种质资源新基因发掘的QTL定位方法

作物QTL定位群体一般是两纯合近交系的杂交后代, 往往要求两近交系间差异较大. 但是, 若两者携带相同等位基因, 即使其效应较大, 也不能被检测到. 因而, 增加亲本数目的四向杂交[109]甚至八向杂交就被提出. 不过, 其亲本数目也十分有限. 而且, 新基因是蕴藏在种质资源中的. 因而, 利用统计方法从大量种质资源中寻找新基因就是统计遗传学家的一大任务. 目前, 这方面的统计方法还不够成熟, 需要进一步研究. 它主要包括关联分析、“in silico”方法和基于IBD的混合模型方法. 关联分析已在前面讨论, 这里只介绍后两种方法.

Grupe等人[110]提出了一种“in silico” QTL定位方法, 在15个近交系组成的群体中定位了老鼠疾病相关性状的多个QTL. 它主要是通过数量性状表型距离与标记遗传型距离的相关分析预测QTL与标记间的连锁关系. 若相关显著, 说明该标记与QTL连锁. 其中, 数量性状表型距离是两纯系(品种)表型观测值之差; 标记遗传型距离定义为: 若两纯系SNP的单倍型(haplotype)相同, 遗传型距离为0; 否则为1. 然而, Chesler等人[111]不能重复Grupe等人[110]的结果, 且功效低和假阳性率高. Darvasi等人[112]认为, 在理想条件下检测遗传率为5%~20%的QTL时, 需要纯合系40~150个; 假阳性率太高, 导致检测到的QTL需要用常规QTL定位方法予以验证. 因而, 该方法还需要进一步研究.

若利用大量育成纯合品种数量性状表型观测值、分子标记和品种间系谱关系, 也可高解析定位QTL, 并且这些信息可用于品种分子设计育种[62,77]. 该方法的主要思想是利用品种的系谱关系计算品种间的后裔同样(identity by descent, IBD)值, 并将IBD值嵌入方差组分模型以定位QTL的位置与效应; 然后, 用最优线性无偏预测(best linear unbiased prediction, BLUP)法预测出各品种的QTL效应值. 根据每一品种各QTL效应预测值, 可进行新品种的亲本选配和分子设计育种, 也可研究基因在品种中的传递规律. Zhang等人[77]应用该方法定位了玉米GDUSHD (growing degree day heat units to pollen shedding)的8个QTL, 误差变异系数仅为1.5%, QTL定位的置信区间也较小. 这些结果都说明其精度较高.

我国有丰富的品种资源, 只要获得更多的相关信息, 就可发掘出大量的有利基因并预测其遗传效应, 进行分子设计育种, 提高育种效率.

4.2 eQTL定位的统计方法

表达谱数据分析通常是通过比较两个或多个处理间表达谱的差异以发掘与处理有关的基因; 连锁遗传分析是检测分离群体中标记与性状间的连锁. 显然, 分离群体所有个体的表达谱使得让每一基因的表达谱作为一个性状成为可能, 将表达谱作为数量性状所定位得到的QTL称为eQTL. 当eQTL的遗传连锁与该基因的位置一致时, 便可确定与数量性状有关的基因. 这就是Jansen和Nap[113,114]提出的eQTL定位的基本思想, 并在酵母[115]、玉米和老鼠等[116]中得以应用. 与此不同的是, Hoti和Sillanp??[55]将数量性状或分级性状表型观测值表示为分子标记遗传型、基因表达量以及标记遗传型与基因表达量互作的线性函数, 用Bayesian压缩估计方法[29~32]定位QTL并获得相关基因信息. 由于获得表达谱数据成本较高, 该方法还未得到广泛应用. 但是, 这是近年来国际上新的研究热点[114].

4.3遗传交配设计的QTL定位方法

从作物QTL定位群体来看, 主要是针对简单的分离群体, 如F2, BC (backcross), DH (double haploid), RIL (recombinant inbred line)和AIL等, 所涉及的亲本较少. 但是, 从数量遗传学发展历程可知, 遗传交配设计对数量遗传学有很大的贡献. 因此, 研究基于遗传交配设计的QTL定位方法也是应当重视的. 最近, Verhoeven等人[117]通过QTL定位方法检测双列杂交设计的QTL, 并通过双列杂交遗传分析确定研究

第51卷第19期 2006年10月评述

多基因遗传模式的新方法; 我国学者提出利用随机交配群体来无偏估计胚乳性状QTL的第一和第二显性效应[118]. 然而, 这方面的研究还相当薄弱, 需要进一步探索.

4.4生活力基因定位方法

由于生活力基因影响其附近分子标记的分离比例, 故可通过分子标记偏分离来检测生活力基因. 一般的方法是获得它的选择系数、显性度和与标记的重组率, 还可间接获得其基因型频率. 然而, 不能提供其遗传效应估计值. 这对阐明进化机制是不利的. 其主要原因是没有表型观测值. 最近, Luo等人[119]考虑了一种假想性状(liability)受生活力基因控制, 它对研究者来说是不可见的, 但是, 对自然来说是可见的. 由此, 可用QTL定位方法来定位生活力基因, 并获得其遗传效应估计值, 为遗传进化研究提供一种新方法. Nichols[120]也给出了一个很好的评论. 利用该模型, 我们研究了标记偏分离对标记间遗传距离估计值的影响, 认为偏分离一般会低估标记间遗传距离, 只有在特定遗传模式下会高估之. 但是, 其偏性可被矫正. 今后, 这方面还有很多工作要做.

总之, 有关数量性状基因研究将不断深入, 新方法与新技术将不断出现. 例如, 在稀有疾病研究中, 连锁定位精度受到可利用减数分裂数和有信息标记密度的限制, 但是, SNP标记的出现就克服了这些缺点, 以便精细定位QTN (quantitative trait nucleotide). 毫无疑问, 本文未囊括所有QTL定位方法的进展. 尽管多性状QTL定位有高的功效且能研究一因多效, 但是, 本文未予综述.

致谢本研究为国家自然科学基金(批准号: 30470998)、江苏省自然科学基金(批准号: BK2005087)、教育部“长江学者和创新团队发展计划”和新世纪优秀人才支持计划(批准号: NCET-05-0489)、国家重点基础研究发展计划(批准号: 2006CB101708)、教育部与人事部留学回国人员基金和南京农业大学人才基金资助项目.

参考文献

1 Sax K. The association of size difference with seed-coat pattern

and pigmentation in Phaseolus vulgaris. Genetics, 1923, 8: 552—

560

2 Soller M, Brody T, Genizi A. On the power of experimental design

for the detection of linkage between marker loci and quantitative trait loci in crosses between inbred lines. Theor Appl Genet, 1976, 47: 35—39

3 Weller J I. Maximum likelihood techniques for the mapping and

analysis of quantitative trait loci with the aid of genetic markers.

Biometrics, 1986, 42: 627—640

4 Edwards M D, Stuber C W, Wendel J F. Molecular-marker-facili-

tated investigated of quantitative trait loci in maize.Ⅰ. Numbers, genomic distribution and types of gene action. Genetics, 1987, 116: 113—125

5 Stuber C W, Edwards M D, Wendel J F. Molecular-marker-facili-

tated investigated of quantitative trait loci in maize.Ⅱ. Factors in-fluencing yield and its component traits. Crop Sci, 1987, 27: 639—648

6 Tanksley S D, Medina-Hilho H, Rick C M. Use of naturally-oc-

curring enzyme variation to detect and map gene controlling quan-titative traits in an interspecific backcross of tomato. Heredity, 1982, 49: 11—25

7 Luo Z W, Kearsey M J. Maximum likelihood estimation of linkage

between a marker gene and a quantitative trait locus. Heredity, 1989, 63: 401—408

8 Thoday J M. Location of polygenes. Nature, 1961, 191: 368—370

9 Lander E S, Botstein D. Mapping Mendelian factors underlying

quantitative traits using RFLP linkage maps. Genetics, 1989, 121: 185—199

10 Haley C S, Knott S A. A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers. He-redity, 1992, 69: 315—324

11 Martinez O, Curnow R N. Estimation the locations and the sizes of

the effects of quantitative trait loci using flanking markers. Theor Appl Genet, 1992, 85: 480—488

12 Kao C H. On the differences between maximum likelihood and

regression interval mapping in the analysis of quantitative trait loci. Genetics, 2000, 156: 855—865

13 Jansen R C. Quantitative trait loci in inbred lines. In: Balding D J,

Bishop M, Cannings C, eds. Handbook of Statistical Genetics.

Chichester, UK: John Wiley & Sons, 1999. 567—597

14 Broman K W, Speed T P. A review of methods for identifying

QTLs in experimental crosses. In: Seillier-Moiseiwitsch F, ed.

Statistics in Molecular Biology and Genetics. IMS Lecture Notes-Monograph Series, 1999, 33: 114—142

15 Jansen R C. Interval mapping of multiple quantitative trait loci.

Genetics, 1993, 135: 205—211

16 Zeng Z B. Theoretical basis for separation of multiple linked gene

effects in mapping of quantitative trait loci. Proc Natl Acad Sci USA, 1993, 90: 10972—10976

17 Zeng Z B. Precision mapping of quantitative trait loci. Genetics,

1994, 136: 1457—1468

18 Kao C H, Zeng Z B. General formulas for obtaining the MLEs and

the asymptotic variance-covariance matrix in mapping quantitative trait loci when using the EM algorithm. Biometrics, 1997, 53: 653—665

19 Kao C H, Zeng Z B, Teasdale R D. Multiple interval mapping for

quantitative trait loci. Genetics, 1999, 152: 1203—1216

20 Kao C H, Zeng Z B. Modeling epistasis of quantitative trait loci

评述第51卷第19期 2006年10月

using Cockerham's model. Genetics, 2002, 160: 1243—1261

21 Zhang Y M, Xu S. A penalized maximum likelihood method for

estimating epistatic effects of QTL. Heredity, 2005, 95(1): 96—104

22 Green P J. Reversible jump Markov chain Monte Carlo computa-

tion and Bayesian model determination. Biometrika, 1995, 82: 711—732

23 Satagopan J M, Yandell B S, Newton M A, et al. A Bayesian ap-

proach to detect quantitative trait loci using Markov chain Monte Carlo. Genetics, 1996, 144: 805—816

24 Sillanp M J, Corander J. Model choice in gene mapping: What and

why. Trends Genet, 2002, 18: 301—307

25 Sillanp?? M A, Arjas E. Bayesian mapping of multiple quantitative

trait loci from incomplete inbred line cross data. Genetics, 1998, 148: 1373—1388

26 Sillanp?? M A, Arjas E. Bayesian mapping of multiple quantitative

trait loci from incomplete outbred offspring data. Genetics, 1999, 151: 1605—1619

27 Yi N. A unified Markov chain Monte Carlo framework for map-

ping multiple quantitative trait loci. Genetics, 2004, 167: 967—975

28 Yi N, Yandell B S, Churchill G A, et al. Bayesian model selection

for genome-wide epistatic quantitative trait loci analysis. Genetics, 2005, 170: 1333—1344

29 Xu S. Estimating polygenic effects using markers of the entire

genome. Genetics, 2003, 163: 789—801

30 Zhang Y M, Xu S. Mapping quantitative trait loci in F2 incorpo-

rating phenotypes of F3 progeny. Genetics, 2004, 166: 1981—1993 31 Zhang Y M, Xu S. Advanced statistical methods for detecting mul-

tiple quantitative trait loci. Recent Res Dev Genet Breed, 2005, 2: 1—23

32 Wang H, Zhang Y M, Li X M, et al. Bayesian shrinkage estimation

of quantitative trait loci parameters. Genetics, 2005, 170: 465—480

33 Wu R L, Li M. Functional mapping: How to map and study the

genetic architecture of dynamic complex traits. Nat Rev Genet, 2006, 7: 229—237

34 Mo H D. Genetic expression for endosperm traits. In: Weir B S,

Goodman M M, Eisen E J, et al. eds. Proceedings of the Second International Conference on Quantitative Genetics. Sunderland, M A: Sinauer Associates, Inc. 1987. 478—487

35 Wu R, Lou X, Ma C, et al. An improved genetic model generates

high-resolution mapping of QTL for protein quality in maize en-dosperm. Proc Natl Acad Sci USA, 2002, 99: 11281—11286

36 Wu R, Ma C, Gallo-Meagher M, et al. Statistical methods for dis-

secting triploid endosperm traits using molecular: An autogamous model. Genetics, 2002, 162: 875—892

37 Kao C H. Multiple-Interval Mapping for quantitative trait loci

controlling endosperm traits. Genetics, 2004, 167: 1987—2002

38 Luo Z W, Zhang Z, Lindsey L, et al. Constructing genetic linkage

maps under a tetrasomic model. Genetics, 2006, 172: 2635—2645 39 Luo Z W, Zhang R M, Kearsey M J. Theoretical basis for genetic

linkage analysis in autotetraploid species. Proc Natl Acad Sci USA, 2004, 101: 7040—7045

40 Hackett C A, Bradshaw J E, McNicol J W. Interval mapping of

quantitative trait loci in autotetraploid species. Genetics, 2001, 159: 1819—1832

41 Luo Z W, Hackett C A, Bradshaw J E, et al. Construction of a ge-

netic linkage map in tetraploid species using molecular markers.

Genetics, 2001, 157: 1369—1385

42 Luo Z W, Hackett C A, Bradshaw J E, et al. Predicting parental

genotypes and gene segregation for tetrasomic inheritance. Theor Appl Genet, 1999, 100: 1067—1073

43 Hackett C A, Weller J I. Genetic mapping of quantitative trait loci

for traits with ordinal distributions. Biometrics, 1995, 51: 1252—1263

44 Yi N, Xu S. Bayesian mapping of quantitative trait loci for com-

plex binary traits. Genetics, 2000, 155: 1391—1403

45 Yi N, Xu S. A random model approach to mapping quantitative

trait loci for complex binary traits in outbred populations. Genet-ics, 1999, 153: 1029—1040

46 Jiang C, Zeng Z B. Multiple trait analysis of genetic mapping for

quantitative trait loci. Genetics, 1995, 140: 1111—1127

47 Zeng Z B, Kao C H, Basten C J. Estimating the genetic architec-

ture of quantitative traits. Genet Res, 1999, 74: 279—289

48 Li J, Wang S, Zeng Z B. Multiple interval mapping for ordinal

traits. Genetics, 2006, 173: 1649—1663

49 Meuwissen T H E, Hayes B J, Goddard M E. Prediction of total

genetic value using genome-wide dense marker maps. Genetics, 2001, 157: 1819—1829

50 Braak C J F, Boer M P, Bink M C A M. Extending Xu’s Bayesian

model for estimating polygenic effects using markers of the entire genome. Genetics, 2005, 170: 1435—1438

51 Yi N, George V, Allison D B. Stochastic search variable selection

for identifying multiple quantitative trait loci. Genetics, 2003, 164: 1129—1138

52 Oh C, Ye K Q, He Q M, et al. Locating disease genes using

Bayesian variable selection with the Haseman-Elston method.

BMC Genet, 2003, 4(Suppl 1): S69

53 George E I, McMulloch R E. Variable selection via Gibbs sam-

pling. J Am Stat Assoc, 1993, 91: 883—904

54 Zhang M, Montooth K L, Wells M T, et al. Mapping multiple

quantitative trait loci by Bayesian classification. Genetics, 2005, 169: 2305—2318

55 Hoti F, Sillanp?? M J. Bayesian mapping of genotype × expression

interaction in quantitative and qualitative traits. Heredity, 2006, 97: 4—18

56 Yi N, Zinniel D K, Kim K, et al. Bayesian analyses of multiple

epistasis QTL models for body weight and body composition in mice. Genet Res, 2006, 87(1): 45—60

57 Kearsey M J, Farquhar A G. QTL analysis in plants: where are we

now? Heredity, 1998, 80: 137—142

第51卷第19期 2006年10月评述

58 The Complex trait consortium. The nature and identification of

quantitative trait loci: A community’s view. Nat Rev Genet, 2003, 4: 911—916

59 Lin Y R, Schertz K F, Paterson A H. Comparative analysis of

QTLs affecting plants height and maturity across the Poaceae, in regerence to an interspecific sorghum population. Genetics, 1995, 141: 391—411

60 Bodmer W F. Human genetics: The molecular challenge. Old

Spring Harbor Symp Quant Biol Ⅱ, 1986: 1—13

61 Buckler E S I, Hornsberry J M. Plant molecular diversity and ap-

plications to genomics. Curr Opin Plant Biol, 2002, 5: 107—111

62 Flint-Garcia S A, Thuillet A C, Yu J M, et al. Maize association

population: A high-resolution platform for quantitative trait locus dissection. Plant J, 2006, 44: 1054—1064

63 Flint-Garcia S A, Thornsberry J M, Buckler E S. Structure of

linkage disequilibrium in plants. Annu Rev Plant Biol, 2003, 54: 357—374

64 Remington D L, Ungerer M C, Purugganan M D. Map-based

cloning of quantitative trait loci: Progress and prospects. Genet Res, 2001, 78: 213—218

65 Yu J M, Pressoir G, Briggs W H, et al. A untied mixed-model

method for association mapping that accounts for multiple levels of relatedness. Nat Genet, 2006, 38(2): 203—208

66 Pritchard J K, Rosenberg N A. Use of unlinked genetic markers to

detect population stratification in association studies. Am J Hum Genet, 1999, 65: 220—228

67 Wu R L, Zeng Z B. Joint linkage and linkage disequilibrium map-

ping in natural populations. Genetics, 2001, 157: 899—909

68 Doebley J, Stec A, Gustus C. Teosinte branched1 and the origin of

maize: Evidence for epistasis and the evolution of dominance.

Genetics, 1995, 141: 333—346

69 Thornsberry J M, Goodman M M, Doebley J, et al. Dwarf8 poly-

morphisms associate with variation in flowering time. Nat Genet, 2001, 28: 286—289

70 Davasi A, Soller M. Advanced intercross lines, an experimental

population for fine genetic mapping. Genetics, 1995, 141: 1199—1207

71 Xiong M M, Guo S W. Fine-scale mapping of quantitative trait

loci using historical recombinations. Genetics, 1997, 145: 1201—1218

72 Wright S. The genetics of quantitative variability. In: Reeve E C R,

Waddington C H, eds. Quantitative Inheritance. London: Her Majesty’s Stationery Office, 1952. 5—14

73 Hill W G. Selection with recurrent backcrossing to develop co-

genic lines for quantitative trait loci analysis. Genetics, 1998, 148: 1341—1352

74 Luo Z W, Wu C I, Kearsey M J. Precision and high-resolution

mapping of quantitative trait loci by use of recurrent selection, backcross or intercross schemes. Genetics, 2002, 161: 915—929

75 Luo Z W, Ma L. An improved formulation of marker heterozygos-

ity in recurrent selection and backcross schemes. Genet Res, 2004,

83: 49—53

76 Tanksley S D, Nelson J C. Advanced backcross QTL analysis: A

method for the simultaneous discovery and transfer of valuable QTLs from unadapted germplasm into elite breeding lines. Theor Appl Genet, 1996, 92: 191—203

77 Zhang Y M, Mao Y C, Xie C Q, et al. Mapping QTL using natu-

rally occurring genetic variance among commercial inbred lines of maize (Zea mays L). Genetics, 2005, 169(4): 2267—2275

78 Wang X S, Roy I S, Nicodeme E, et al. Using advanced intercross

lines for high-resolution mapping of HDL cholesterol quantitative trait loci. Genome Res, 2003, 13: 1654—1664

79 Jannink J L. Selective phenotyping to accurately map quantitative

trait loci. Crop Sci, 2005, 45: 901—908

80 胡小华. 酵母数量性状主效基因的定位分离及克隆. 博士学位

论文. 上海: 复旦大学遗传研究所, 2005. 69—106

81 Frary A, Nesbitt T C, Frary A, et al. fw2.2: A quantitative trait lo-

cus key to the evolution of tomato fruit size. Science, 2000, 289: 85—88

82 Li Z K, Fu B Y, Gao Y M, et al. Genome-wide introgression lines

and their use in genetic and molecular dissection of complex phe-notypes in rice (Oryza sativa L). Plant Mol Biol, 2005, 59: 33—52 83 Zhang Y S, Luo L J, Xu C G, et al. Quantitative trait loci for pani-

cle size, heading date and plant height co-segregating in trait-performance derived near-isogenic lines of rices (Oryza sa-tiva). Theor Appl Genet, 2006, 113: 361—368

84 Yamamoto T, Kuboki Y, Lin S Y, et al. Fine mapping of quantita-

tive trait loci Hd-1, Hd-2 and Hd-3, controlling heading date of rice, as single Mendelian factors. Theor Appl Genet, 1998, 97: 37—44

85 Yamamoto T, Lin S Y, Sasaki T, et al. Identification of heading

date quantitative trait locus Hd6 and characterization of its epistatic interactions with Hd2 in rice using advanced backcross progeny. Genetics, 2000, 154: 885—891

86 李培金, 曾大力, 刘新仿, 等. 水稻散生突变体的遗传和基因定

位研究. 科学通报, 2003, 48(21): 2271—2274

87 梁国华, 曹小迎, 隋炯明, 等. 水稻半矮秆基因sd-g的精细定位.

科学通报, 2004, 49(8): 778—783

88 Peleman J D, Wye C, Zethof J, et al. Quantitative trait loci (QTL)

isogenic recombinant analysis: A method for high-resolution map-ping of QTL within a single population. Genetics, 2005, 171: 1341—1352

89 王斌, 肖晗, 钱前, 等. 水稻稀穗突变体的遗传分析及基因的精

细定位. 科学通报, 2003, 48(15): 1666—1670

90 Eshed Y, Zamir D. An introgression line population of Lycopersi-

con pennellii in the cultivated tomato enables the identification and fine mapping of yield-associated QTL. Genetics, 1995, 141: 1147—1162

91 Fridman E, Carrari F, Liu Y S, et al. Zooming in on a quantitative

trait for tomato yield using interspecific introgressions. Science, 2004, 305: 1786—1789

92 Li J Z, Huang X Q, Heinrichs F, et al. Analysis of QTLs for yield

评述第51卷第19期 2006年10月

components, agronomic traits, and disease resistance in an ad-

vanced backcross population of spring barley. Genome, 2006, 49(5): 454—466

93 Zhu J. Analysis of conditional genetic effects and variance com-

ponents in developmental genetics. Genetics, 1995, 141: 1633—

1639

94 Kirkpatrick M, Heckman N. A quantitative genetic model for

growth, shape, reaction norms, and other infinite-dimensional characters. J Math Biol, 1989, 27: 429—450

95 Pletcher S D, Geyer C J. The genetic analysis of age-dependent

traits modeling in the chatacter process. Genetics, 1999, 153: 825

—835

96 Yang R Q, Tian Q, Xu S. Mapping quantitative trait loci for lon-

gitudinal traits in line crosses. Genetics, 2006, 173: 2339—2356

97 Wu W R, Zhou Y, Li W M, et al. Mapping of quantitative trait loci

based on growth models. Theor Appl Genet, 2002, 105: 1043—

1049

98 Wu W R, Li W M, Tang D Z, et al. Time related mapping of quan-

titative trait loci underlying tiller numbers in rice. Genetics, 1999, 151: 297—303

99 Emwbiri L C, Devey M E, Matheson A C, et al. Age-related

changed in the expression of QTLs for growth in radiate pine seedlings. Theor Appl Genet, 1998, 97: 1053—1061

100 Cheverud J M, Routman E J, Duarte F A M, et al. Quantitative trait loci for murine growth. Genetics, 1996, 142: 1305—1319

101 Yan J Q, Zhu J, He C X, et al. Quantitative trait loci analysis for the developmental behavior of tiller number in rice (Oryza sativa

L). Theor Appl Genet, 1998, 97: 267—274

102 Yan J Q, Zhu J, He C X, et al. Molecular dissection of develop-ment behavior of plant height in rice (Oryza sativa L). Genetics, 1998, 150: 1257—1265

103 Mangin B, Thoquet P, Grimsley N. Pleiotropic QTL analysis.

Biometrics, 1998, 54: 88—99

104 Wu R L, Ma C X, Chang M, et al. A logistic mixture model for characterizing genetic determinants causing differentiation in growth trajectories. Genet Res, 2002, 79: 235—245

105 Wu R L, Ma C X, Chang M, et al. Quantitative trait loci for growth trajectories in Populu. Genet Res, 2003, 81: 51—64 106 Wu R L, Ma C X, Min L, et al. A general framework for analyzing the genetic architecture of developmental characteristics. Genetics, 2004, 166: 1541—1551

107 Ma C, Casella G, Wu R. Functional mapping of quantitative trait loci underlying the character process: A theoretical framework.

Genetics, 2002, 161: 1751—1762

108 Wu R, Hou W. A hyperspace model to decipher the genetic archi- tecture of developmental processes: Allometry meets ontogeny.

Genetics, 2006, 172: 627—637

109 Rao S Q, Xu S. Mapping quantitative trait loci for ordered cate- gorical traits in four-way crosses. Heredity, 1998, 81: 214—224 110 Grupe A, Germer S, Usuka J, et al. In silico mapping of complex disease-related traits in mice. Science, 2001, 292: 1915—1918

111 Chesler E J, Rodriguez S L, Mogil J S. In silico mapping of mouse quantitative trait loci. Science, 2001, 294: 2423

112 Darvasi A. In silico mapping of mouse quantitative trait loci. Sci-ence, 2001, 294: 2423

113 Jansen R C, Nap J P. Genetical genomics: The added value from segregation. Trends Genet, 2001, 17(7): 388—391

114 Gibson G, Weir B. The quantitative genetics of transcription.

Trends Genet, 2005, 21(11): 616—623

115 Brew R B, Yvert G, Clinton R, et al. Genetic dissection of tran- scriptional regulation in budding yeast. Science, 2002, 296: 752—755

116 Schadt E E, Monks S A, Drakes T A, et al. Genetics of gene ex- pression surveyed in maize, mouse and man. Nature, 2003, 422: 297—302

117 Verhoeven K J F, Jannink J L, McIntyre L M. Using mating designs to uncover QTL and the genetic architecture of complex traits. Heredity, 2006, 96: 139—149

118 温永仙, 吴为人. 基于随机交配设计的胚乳性状QTL定位方法.

科学通报, 2006, 51(14): 1666—1670

119 Luo L, Zhang Y M, Xu S. A quantitative genetics model for viabil-ity selection. Heredity, 2005, 94: 347—355

120 Nichols R A. Quantitative genetics focus issue. Heredity, 2005, 94: 273—274

(2006-05-30收稿, 2006-09-01接受)

相关文档