《生物信息学》实验报告
实验七系统发生树的构建
学号:姓名:
班级:机器号:
【实验原理】
生物进化分析是生物信息学的一个重要分支。它通过对生物序列的研究推测基因或物种的进化历史。主要方法包括通过DNA序列,蛋白质序列,蛋白质结构等来构建分子进化树或者种系发生树, 或者通过蛋白质结构比较包括刚体结构叠合和多结构特征比较等方法建立结构进化树。
分子进化分析的主要内容有:
1)直系/旁系同源基因的判定;
2)估计分歧时间;
3)重建祖先序列/性状;
4)发现生物序列上自然选择影响较大的重要位点;
5)确定基因重组的发生位点;
6)识别和疾病关联的突变;
7)确定病原体的分类;
8)基因的演化历史……
分子进化分析的第一步是多序列比对。然后再用距离法、最大似然法、最大简约法或贝叶斯方法等建立序列之间的关系(基因树),了解基因的起源或演化历史,或根据基因树推测物种树(系统发育分析)。
目前有系统发育分析软件有很多,比较有名的有PAUP、PHYLIP、MEGA、PAML、MrBayes等。本实验学习使用MEGA进行HAP3基因家族的分子进化分析。
随着不同物种基因组测序的快速发展,产生了大量的DNA 序列信息,这时就需要一种简便而快速的统计分析工具来对这些数据进行有效的分析,以提取其中包含的大量信息。MEGA 就是基于这种需求开发的。MEGA 软件的目的就是提供一个以进化的角度从DNA 和蛋白序列中提取有用的信息的工具,并且,此软件可以免费下载使用。MEGA因为界面简单易用,近年使用的人越来越多。
MEGA的最新版本是MEGA5。它主要集中于进化分析获得的综合的序列信息。使用它我们可以编辑序列数据、序列比对、构建系统发育树、推测物种间的进化距离等。此软件的输出结果资源管理器允许用户浏览、编辑、打印输入所得到的结果而且所得到的结果具有不同形式的可视化效果。此外,该软件还能够得出不同序列间的距离矩阵,这是他不同与其他分析软件的地方。在计算矩阵方面有一些自己的特点:
①推测序列或者物种间的进化距离
②根据MCL(Maximum Composite Likeliood method)的方法构建系统发育树
③考虑到了不同碱基替换的不同的比率,考虑到了碱基转换和颠换的差别。
④随时可以使用标注:所以的结果输入都可以使用标注,而且标注的内容可以被保存,复制。
【实验目的】
1. 熟悉构建分子系统发生树的基本过程,获得使用不同建树方法、建树材料和建树参数对建树结果影响的正确认识;
2. 掌握使用Clustalx进行序列多重比对的操作方法;
3. 掌握MEGA构建系统发生树及查看编辑树的操作方法。
【设备与软件】
Windows系统电脑,MEGA
【实验方法】
【实验内容】
1.使用软件 ClustalX对花生过敏原Ara h1蛋白及其同源蛋白进行多序列比对分析
(1)运行ClustalX;
(2)Ctrl+O打开包含fasta格式的序列文件at_hap3_cds.fa;
(3)在菜单中选取Alignment –> Output Format Options设置输出文件格式;
(4)在菜单中选取Alignment –> Alignment Parameters –> Multiple Alignment Parameters设置序列比对参数;
(5)在菜单中选取Alignment –> Do complete alignment,弹出对话框中设定好输出文件名后,点击OK按钮开始多序列比对。
2.利用MEGA软件构建Ara h1蛋白与其同源蛋白的NJ系统发育树(经Bootstrap检验)(1)运行MEGA;
(2)将.aln文件转换成.meg文件:file -> Convert to MEGA Format,对话框中打开clustal 比对好的序列,转换完成后,保存退出;
(3)打开.meg文件:File -> Open Data,找到刚才保存的.meg文件,选择是核酸序列还是蛋白序列;
(4)构建系统发生树:菜单Phylogeny -> Construct Phylogeny,选邻接法(NJ)构建系统发生树。
(5)构建带检验值的系统发生树:Phylogeny -> Bootstrap Test of Phylogeny
要求:
1.使用的软件/工具,实验步骤,结果文件记录/截图;2.实验中遇到的问题,如何解决的。