文档库 最新最全的文档下载
当前位置:文档库 › 两种微孢子虫全基因组中密码子偏好性比较

两种微孢子虫全基因组中密码子偏好性比较

两种微孢子虫全基因组中密码子偏好性比较

张瑞芝

1,2*

向恒

1,3

潘国庆1 李田1 周泽扬

1*

(1.西南大学蚕学与系统生物学研究所;2.西南大学生物技术中心;

3.西南大学动物科技学院,重庆 400715)

摘 要 微孢子虫(M icrospor idia)是一类细胞内营专性寄生的单细胞真核生物。基于其已测得的两个典型种的基因组数据,比较了家蚕微孢子虫(N os ema bomby cis )与兔脑炎微孢子虫(En -cep hal itoz oon cuniculi)之间全基因组的密码子偏好性异同。结果表明两基因组的密码子偏好性都较弱,基因表达程度都较低。而且二者之间确实存在显著差异,表现在兔脑炎微孢子虫的偏好性比家蚕微孢子虫的更弱,其最优密码子的偏好性也更弱,完全不同于家蚕微孢子虫偏向于使用第三位是A /U 的最优密码子。这些差异与它们在核苷酸组成上的不同是一致的,有可能是两微孢子虫寄生于不同环境中导致了它们在密码子偏好性上的差异。关键词 微孢子虫 密码子偏好性 比较基因组学

微孢子虫(Microspor idia)是自然界中广泛分布的一类专性寄生于细胞内的单细胞真核生物。它的宿主范围非常之广,包括几乎所有的无脊椎动物和脊椎动物,甚至于人类自身[1]

,并

能引发目前尚无药物根治的微孢子虫病,因此受到广泛关注

[2]

。近年来,随着基因组测序技术

的广泛应用,微孢子虫研究进入了一个崭新阶段。多种微孢子虫的基因组测序计划已开展,其中,尤以兔脑炎微孢子虫(E ncep halitoz oon cuniculi )基因组和本实验室完成的家蚕微孢子虫(N osema bomby cis)基因组最具代表性。兔脑炎微孢子虫基因组大小为2.9M b,是目前已知最小的真核生物基因组,其基因间区缩减、基因长度缩短、基因重叠以及一些基因缺失,呈现了其基因组简缩紧密的特点[3];而家蚕微孢子虫基因组大小为15.7M b,其基因间区较宽松、基因长度更长、大量的基因重复、丰富的转座元件,又展现微孢子虫基因组的另一面。因此,对这两个基因组进行比较研究具有重要意义。

作为比较基因组学的一个重要组成部分)密码子偏好性(codon bias),是指某一物种的基因组或其基因对某一种或几种特定的同义密码子有使用偏好的遗传特性,而这些偏好的密码子即为最优密码子(optimal co don)。近年来,利用大量基因组数据的研究,发现密码子偏好性在物种的分子进化、翻译调控等领域具有重要作用,而且其偏好模式也具有一定规律。如密码子偏好与基因GC 含量,尤其是第三位密码子含量GC3s 密切相关[4-5];高表达基因的密码子偏好性比低表达的更强,表明密码子偏好性也与基因的表达有关[6-7];此外,tRN A 的丰度分布、进化状态、多态性、自然选择压力等众多因素也会影响基因组或基因的密码子偏好。因此,本文基于上述两种微孢子虫全基因组数据,开展其密码子偏好性的比较分析,旨在更清楚的认识不同微孢子虫之间其基因组特征和遗传进化模式的差异,进而为预防和治疗微孢子虫病打

1

第31卷 第1期

2011年 3月

蚕 学 通 讯

N ew sletter of Sericultural Science

*

资助项目:中央高校基本科研业务费(N o.XDJK2009C149),西南大学博士基金(N o.SW U 110047)。

作者简介:张瑞芝(1982-),女,硕士研究生。T el:023-********;E -mail:zhang ruizhibb@https://www.wendangku.net/doc/f811976794.html, 。通讯作者:周泽扬,教授,博士生导师。T el:023-********;E -mail:zyzhou@sw https://www.wendangku.net/doc/f811976794.html, 。

2蚕学通讯31卷下一定科学基础。

1材料与方法

1.1基因组数据

本文所采用的家蚕微孢子虫全基因组数据由本实验室提供,包括1.5~2Kb的WGS reads序列(7.8倍全基因组覆盖度)、约30Kb的miniBAC文库序列(0.3倍覆盖度,约10倍物理覆盖度)以及25倍覆盖度的Solexa测序数据,预测基因组大小为15.7M b,含有4305个编码基因。兔脑炎微孢子虫全基因组数据及编码的1997个基因检索自GenBank数据库(ht-tp://w w w.ncbi.nlm.nih.go v/)。

1.2数据分析

运用CodonW软件(John Peden,http://w w w.m olbio https://www.wendangku.net/doc/f811976794.html,/cu)计算家蚕微孢子虫和兔脑炎微孢子虫各个基因的密码子指数,包括密码子适应指数(Codon Adaptation Index, CA I)、密码子偏好性指数(Codon Bias Index,CBI)、有效密码子数(Effective Number of Co-don,EN c)和最优密码子使用频率(Frequency o f Optimal Codons,Fop)。同时计算诸如第三位密码子核苷酸组成的GC3s值等一些其他常用数值以及各基因的密码子使用情况。统计分析由SPSS17计算完成。

2结果与分析

2.1密码子指数分析

对家蚕微孢子虫4305个基因和兔脑炎微孢子虫1997个基因的密码子指数数据进行统计(图1),发现二者间的密码子指数分布差异显著,峰值也大不相同。T检验结果表明在四个密码子偏好性指数CAI(P-value=0.000,<0.05)、CBI(P-v alue=0.000,<0.05)、EN c(P-va-l ue=0.000,<0.05)和Fop(P-value=0.003,<0.05)方面,两基因组的差异具有统计意义。

密码子适应指数CAI值一般用来预测基因的表达水平,其值介于0至1之间,该数值越大表示偏好性越强,表达程度也越高[8]。密码子偏好性指数CBI值反应了基因中高表达偏好密码子的组成情况,也能反应偏好性和表达水平的程度[9]。有效密码子数EN c值是目前公认的评价密码子偏好性的最具参考价值的参数,它描述了密码子使用偏离非均衡选择的程度,能反映同义密码子随机使用的偏好程度[10]。其值范围在20(每个氨基酸只使用一个密码子)至61(各个密码子均被平均使用)之间。一般情况下,与CAI值和CBI值呈负相关关系,即该数值越靠近20表明偏好性越强,表达水平也越高,越靠近61表示偏好性越弱,表达程度越低[11]。因此,根据图1的结果,可以观察到两微孢子虫的CA I值和CBI值都偏小、EN c值偏大,表明它们的偏好性都较弱,表达程度都较低。并且,相对于家蚕微孢子虫而言,兔脑炎微孢子虫的CA I值(图1A)和CBI值(图1B)更小、EN c值更大(图1C),表明其基因组中基因偏好性更弱,表达水平更低。最优密码子是指在物种基因组中高表达基因所使用频率最高的密码子。在Fop图(图1D)中,虽然两基因组的分布近似,但还是能观察到家蚕微孢子虫比兔脑炎微孢子虫的数值偏小,认为它们的最优密码子的使用频率略低于兔脑炎微孢子虫基因的。

图1 家蚕微孢子虫(黑色)和兔脑炎微孢子虫(灰色)全基因组的四种密码子指数分布图四种密码子指数分别是:密码子适应指数,密码子偏好性指数,有效密码子数,最优密码子使用频率。

2.2 EN c 峰图(EN c -plot)

EN c 峰图自被提出以来就被广泛应用,它可以用以探讨各基因的密码子偏好性情况,以及探测核苷酸组成对密码子偏好性的影响[11]。图2分别以家蚕微孢子虫和兔脑炎微孢子虫全基因组基因的有效密码子数EN c 值为纵坐标,以及其第三位密码子的GC 含量GC 3s 为横坐标绘制成图。其中,图中曲线表示密码子偏好性仅由核苷酸组成所决定的标准情况,公式为:EN c =2+S+

29

S 2

+(1-S)2

(S is the frequency of G+C (i.e.GC 3s )),位于该线上方的基因

认为其密码子偏好性可能受到正向的自然选择压力作用,而位于下方认为受到负选择压力

[11]

。因此,我们发现家蚕微孢子虫和兔脑炎微孢子虫的大部分基因都位于EN c 期望值回归曲线的下方,认为这些基因的密码子偏好性都受到自然选择压力的负向作用,受净化选择压力的影响,这也是大多数物种基因组都具有的正常现象。此外,从图中也可以观察到兔脑炎微孢子虫基因的GC 含量比家蚕微孢子虫的更高、更紧密,而家蚕微孢子虫的总体比兔脑炎微孢子虫低,但是也存在少数一些高GC 含量的基因。2.3 密码子使用分析

我们统计了家蚕微孢子虫4305个基因和兔脑炎微孢子虫1997个基因的密码子使用情况(表1)。分析发现,对家蚕微孢子虫基因组而言,在40719个高偏好的和29080个低偏好的密码子数据集中,鉴定了29个最优密码子以及6个稀有密码子。而兔脑炎微孢子虫基因组使用了36700个高偏好和25873个低偏好密码子,其中25个最优密码子被鉴定,但没鉴定到稀有密码子。比较两基因组的密码子使用情况,可以观察到二者虽然存在相同的地方,但总体

3

1期 张瑞芝等:两种微孢子虫全基因组中密码子偏好性比较

上还是有差异。如家蚕微孢子虫基因组偏好的29个最优密码子中,仅AGG 和GGG 这2个(占29个的6.90%)密码子的第三位是G,表明该基因组特别偏向于使用第三位是A/U 的密码子;而兔脑炎微孢子虫基因组偏好的25个中,则有14个(占25个的56.00%)密码子的第三位是G/C,说明该基因组的倾向性不明显,也证实了上文分析的偏好性更弱的结果。两基因组的这种差异也可能与它们的GC 含量有关(家蚕微孢子虫GC 含量平均值约为30%,兔脑炎微孢子虫的约为47.6%)。此外,统计这些最优密码子的GC 含量,发现家蚕微孢子虫基因组的为35.63%,而兔脑炎微孢子虫的为49.33%,不仅反映了两基因组的差异,也表明它们最优密码子的GC 含量与其基因组的GC 含量密切相关。而两基因组的相似之处,主要体现在编码Phe 、Ile 、T yr 、H is 、A sn 、Asp 、Cys 这7个氨基酸的密码子上,它们的偏好性一致。当然,也存在诸如CU G 、AGC 、GCG 、CGG 这四个密码子在家蚕微孢子虫基因组中不偏好而兔脑炎

微孢子虫偏好的显著差异情况。

图2 家蚕微孢子虫(黑色)和兔脑炎微孢子虫(灰色)全基因组的EN c 峰图

表1 家蚕微孢子虫和兔脑炎微孢子虫全基因组的密码子使用表

Amino acid

Nos ema b ombycis

Cod on w ith significance

H igh RSCU Bias CU Low RSCU Bias CU En cep halitoz oon cu niculi Cod on w ith significance H igh RSCU Bias CU Low RSCU Bias CU Phe

UU U* 1.751790 1.28789UU U* 1.267410.74559UU C 0.252600.72447UU C 0.74438 1.26945Leu

UU A* 3.7126680.86406UU A 0.20970.28161UU G

0.664720.71337UU G*0.773710.40227CU U* 1.138120.85401CU U 1.67804 1.62928CU C 0.191400.79375CU C 0.91438 2.041170CU A 0.292060.35165CU A 0.321540.67387CU G-0.03

22

2.44

1156

CU G*

2.13

1026

1.00

573

4

蚕 学 通 讯 31卷

Amino acid

Nos ema b ombycis

Cod on w ith

significance

H igh

RSCU

Bias

CU

Low

RSCU

Bias

CU

En cep halitoz oon cu niculi

Cod on w ith

significance

H igh

RSCU

Bias

CU

Low

RSCU

Bias

CU

Ile AU U* 1.702339 1.33793AUU* 1.288070.60417 AU C0.23322 1.11664AUC0.73463 1.701191 AU A* 1.0714760.56331AU A*0.996240.70489

M et AU G 1.00864 1.00781AUG 1.001267 1.00540

Val GUU* 1.56684 1.01491GUU* 1.289340.77243 GUC0.23101 1.11539GUC0.56406 1.57494 GUA* 1.888230.68329GUA0.372720.88276 GUG0.32141 1.21590GUG* 1.7913120.78246

Tyr U AU* 1.541372 1.05465U AU*0.984900.80349 U AC0.464050.95418U AC 1.02509 1.20524

ST OP U AA 1.74114 1.3978U AA0.7324 1.4849 U AG0.43280.4324U AG0.7926 1.0334 UGA0.8354 1.1866UGA 1.48490.4816

H is CAU* 1.70483 1.02336CAU*0.952290.71304 CAC0.30850.98323CAC 1.05251 1.29555

Gln CAA* 1.858240.64395CAA0.361350.92301 CAG0.1569 1.36832CAG* 1.64624 1.08350

As n AAU* 1.793073 1.05639AAU*0.954560.70323 AAC0.213650.95581AAC 1.05502 1.30599

Lys AAA* 1.624048 1.311021AAA0.294380.83421 AAG0.389520.69539AAG* 1.712536 1.17592

As p GAU* 1.882321 1.17859GAU*0.989270.85303 GAC0.121460.83609GAC 1.02957 1.15414

Glu GAA* 1.673007 1.16916GAA0.4610330.98415 GAG0.336020.84664GAG* 1.543502 1.02430

Ser UC U* 2.159950.91294UC U 1.30536 1.22538 UC C0.442040.92298UC C0.46189 1.78785 UC A* 1.295970.92299UC A0.28116 1.18519 UC G0.13590.93301UC G* 1.094500.47206 AGU* 1.928890.86278AGU* 1.275220.44195 AGC-0.0732 1.46473AGC* 1.596550.91399

Pro CCU* 2.064790.76238CCU* 1.292530.97516 CCC0.39910.93291CCC0.74145 1.09577 CCA* 1.443330.76239CCA0.65128 1.50795 CCG0.1125 1.55487CCG* 1.322600.45239

5

1期张瑞芝等:两种微孢子虫全基因组中密码子偏好性比较

Amino acid

Nos ema b ombycis

Cod on w ith

significance

H igh

RSCU

Bias

CU

Low

RSCU

Bias

CU

En cep halitoz oon cu niculi

Cod on w ith

significance

H igh

RSCU

Bias

CU

Low

RSCU

Bias

CU

Th r ACU* 1.987030.65260ACU0.842110.78330 ACC0.34119 1.50598ACC0.63158 1.39589 ACA* 1.445120.72289ACA0.91229 1.41597 ACG0.2484 1.13450ACG* 1.624050.42177

Ala GCU* 2.213810.67402GCU0.753450.81332 GCC0.4374 1.45870GCC0.66307 1.48604 GCA* 1.312260.56337GCA 1.48684 1.41575 GCG-0.058 1.31783GCG* 1.115110.30122

Cys UGU* 1.906360.88169UGU*0.933190.52148 UGC0.1032 1.12217UGC 1.07366 1.48425

Trp UGG 1.00231 1.00364UGG 1.00423 1.00294

Arg CGU0.28640.99291CGU0.231300.55111 CGC-0.012 2.12624CGC0.191080.93187 CGA0.26600.55161CGA0.221250.80162 CGG-0.06130.89261CGG* 1.086210.4591 AGA* 3.447830.84248AGA 1.54886 1.87377 AGG* 1.944420.60177AGG* 2.761592 1.39281

Gly GGU* 1.104320.94474GGU0.342670.67147 GGC-0.0625 1.75884GGC0.65518 1.18259 GGA* 1.837200.57287GGA 1.271013 1.52334 GGG* 1.014000.75377GGG* 1.7413860.62137

为了鉴定所使用的最优密码子,占基因总数5%基因的密码子偏好性单独生成一个数据集,进行卡方检验。其结果中, *表示极显著(P-value<0.01),@表示显著(P-value<0.05),这两者表示了所使用的最优密码子,而相对同义密码子使用值(Relative Syn on ymous Codon U sag e,RS CU)小于0.10的为极少使用的稀有密码子,以-表示。

3讨论

本文所分析的两种具有代表性的微孢子虫,都是细胞内营专性寄生的,只是家蚕微孢子虫的宿主是家蚕,而兔脑炎微孢子虫的主要宿主是兔,两者所寄生环境的不同可能是导致它们物种特征及其基因组模式上差异的原因之一。密码子是生物体内遗传信息传递的重要组成部分,在物种的长期进化过程中,为适应其生存环境,其基因组都表现出各自的/基因组特征(ge-nom e signature)0,而其密码子使用模式也形成了特定的符合基因组的偏好性[12]。通常认为,核苷酸组成是影响密码子偏好性的一个重要因素[13]。家蚕微孢子虫GC含量平均值约为30%,属于含量偏低的微生物,兔脑炎微孢子虫的约为47.6%,属于含量中等的。两者间的这种差异不仅体现在了它们密码子的GC含量上,也体现在了密码子的偏好性上。而通过分析两基因组的四种密码子指数分布,也观察到兔脑炎微孢子虫与家蚕微孢子虫显著不同,其密码子偏好性更弱,基因表达程度更低。表明两个微孢子虫基因组确实具有各自的特点,这对于认6蚕学通讯31卷

识微孢子虫的基因组特征具有一定参考意义。

参 考 文 献

[1] Canning EU.M icrosporidia.In Kreier,J.P.(ed).Parasitic Protozoa[M ].Academic Press,New York,1993.[2] W inner M .H isto ric per spectiv e on the micr ospo ridia:ex panding hor izons.T he micr ospo ridia and m-i

crospor idiosis[J].A mer So ciety fo r M icr obio log y,1999:1.

[3] K atinka M D,Duprat S,Co rnillo t E,M etenier G ,T ho marat F ,P rensier G,Barbe V ,P eyr et aillade E,

Brott ier P ,W incker P ,Delbac F,El A laoui H ,Pey ret P ,Saur in W,G ouy M ,W eissenbach J,V iv ares CP.Genome sequence and gene compaction of the eukary ote par asite Encephalit ozo on cuniculi[J].Na -ture 2001,414:450-453.

[4] G ho sh T C,Gupta SK ,M ajumdar S.Studies on codon usag e in Entamo eba histolytica[J].Int J Par asitol

2000,30:715-722.

[5] Epstein R J,Lin K ,T an T W.A functional significance fo r codon third bases[J].Gene 2000,245:291-298.

[6] M usto H ,Cruveiller S,D'O no frio G,Romer o H ,Ber nar di G.T ranslatio nal select ion on co do n usage in

Xenopus laevis[J].M o l Biol Evo l 2001,18:1703.

[7] Gustafsson C,Go vinda rajan S,M inshull J.Codo n bias and heter olo go us pro tein expressio n[J].T rends

Biotechno l 2004,22:346-353.

[8] Sharp PM ,L i WH.T he co don adaptat ion index -a measure of directional synonymo us codon usage b-i

as,and it s pot entia l applicatio ns[J].N ucleic A cids Res 1987,15:1281.

[9] M o rto n BR.Chlo roplast DN A codon use:evidence for select ion at the psb A lo cus based on t RN A avai-l

ability[J].J M ol Evo l 1993,37:273-280.

[10] F uglsang A.T he 'effective number of codons'revisited[J].Biochem Biophys Res Co mmun 2004,317:957-964.

[11] W r ight F.T he 'effect ive number o f codo ns'used in a g ene[J].Gene 1990,87:23-29.

[12] Gr antham R,G aut ier C,G ouy M ,M ercier R ,Pave A.Co do n catalo g usag e and the g eno me hypothesis

[J].Nucleic A cids Res 1980,8:197.

[13] L ynn DJ,Singer G A C,H ickey DA.Synonymo us co do n usag e is subject to selectio n in thermo philic

bacteria[J].N ucleic Acids Res 2002,30:4272.

Comparison of the Codon Bias Between Two Microsporidian Genomes

ZH AN G R u -i zh i

1,2*

XIAN G H e ng 1,3

PANGu o -qin g 1

LI Tian 1

ZH OU Ze -ya n g

1,*

(1.I nstitute of Sericulture and Sy stems Biology ;2.Biotechnology Resear ch Center ;

3.College of Animal Science and Technology ,Southw est University ,Beibei,Chongqing 400715,China)

ABST R AC T

Microsporidia are a group of obligate intracellular eukaryotic parasites.In this study,the codon

7

1期 张瑞芝等:两种微孢子虫全基因组中密码子偏好性比较

8蚕学通讯31卷

bias was compared between Nosema bomby cis and Encep halitozoon cuniculi based on their genomes. The results show ed that the codon bias was rather weak in both genomes,indicating a low-level ex-pression of their genes.Significant difference was observed between the tw o genomes in that the co-don bias of E.cuniculi genome and of its optimal codons were w eaker than those of N.bombycis. Most(93.10%)of the optimal codons in N.bomby cis genome w ere found in the third bases w ith A/U,while44.00%w ere noticed in E.cuniculi.The differences between the two genomes w ere shown to be consistent with their GC content(~30%for N.bombycis and~47.6%for E.cunic-uli),and their different host environments might be a most important factor responsible for their different codon bias patterns.

Key words m icrosporidia codon bias co mparative g en om ics

家蚕基因组框架图论文入选

5Science Watch6高引用率论文

近日,著名的汤姆森路透科技信息集团旗下的科学观察5Science Watch6致函西南大学蚕学所,祝贺该所于2004年在Science上发表的家蚕基因组框架图论文/A draft sequence for the ge-nome of the domesticated silkw orm(Bombyx mori)0入选5Science Watch6/Featured Emerging Re-search Fronts(重要研究前沿)0分子生物学及遗传学领域的/The most-cited paper(最高引用率论文)0。自发表至今,家蚕基因组框架图论文他引次数已达到295次。5Science Watch6就此对论文第一作者夏庆友教授进行了书面专访。

5Science Watch6是全球科技信息权威来源汤姆森-路透科技信息集团旗下专门跟踪基础科学研究发展趋势与表现的信息提供者。汤姆森-路透是目前全球科技创新、知识产权发展以及医药研发等领域最权威的信息服务解决方案供应商,所提供的信息资源与服务包括著名的Sc-i ence Citation Index(SCI)、ISI Web of Knowledg e等。汤姆森-路透的科技专家依据其独有的5Essential Scientific Indicators(基本科学指标)6数据分析统计体系,对最近取得显著进展或具有特别影响的科研领域进行引用分析和评论,筛选出覆盖面很广的22个科学领域中引用率最高的论文。这些论文构成各领域每年前1%的顶尖论文,并且每两个月更新一次入选论文,代表了正在日益得到科学界关注的最新的科学贡献。

据统计,自2001年开设Featured Emerging Research Fronts专题至今,全世界共有211篇研究论文入选,但以中国科研机构或大学为第一完成单位的并不多。蚕学所家蚕基因组框架图研究论文的入选,既是我国家蚕领域的第一次,也是国际蚕学领域的第一次。

相关文档