文档库 最新最全的文档下载
当前位置:文档库 › 计算生物学方法发展及其在分子生物学和药物研究中的应用

计算生物学方法发展及其在分子生物学和药物研究中的应用

计算生物学方法发展及其在分子生物学和药物研究中的应用
计算生物学方法发展及其在分子生物学和药物研究中的应用

附件2

作者姓名:张健

论文题目:计算生物学方法发展及其在分子生物学和药物研究中的应用

作者简介::张健,男,1978年11月出生,2002年9月师从于中国科学院上海药物研究所蒋华良研究员,于2007年7月获博士学位。

中文摘要

重大疾病药物靶标的发现与相关药物的开发对于改善人类生命质量起着十分重要的作用。在现代生物医学和药物开发研究中,阐明和重大疾病有密切关系的蛋白质的作用机制,构建调控网络,有针对性地设计高效、高选择性的药物分子,具有重要的科学意义和应用前景。随着信息科学和计算机技术等的不断进步,计算生物学在潜在靶标蛋白作用机制和相关作用通路的研究中,起到了实验无法替代的作用,并与实验形成良好互补,在生命科学研究和创新药物发现中发挥着越来越重要的作用。与此同时,药物设计已经成为药物靶标先导化合物发现的核心技术。在本论文的第一部分,我们主要发展和完善了一些计算生物学方法和药物设计方法,包括第一章的蛋白相互作用网络预测方法发展和第二章的虚拟组合集中库程序设计。在论文的第二部分,我们阐明了多个与重大疾病密切相关的潜在药物靶标的作用机制,为实验提供了有益的信息,并发现了一些高质量的全新先导化合物。这一部分包括第三章的细菌组氨酸激酶自磷酸机理的研究及抑制剂的发现,和第四章的葡萄糖激酶变构性机制研究及调控位点的发现。

蛋白质-蛋白质相互作用几乎决定着生物体所有的生理功能,这方面的研究具有重要的科学价值和应用前景。近年来,蛋白质-蛋白质相互作用预测方法的研究取得了很大的进展,在多个领域发挥了重要作用。然而,当前的各类预测算法在应用的准确度和适应度上还存在较大缺陷。针对以上缺点,我们利用全新的策略和优化方法,发展了基于蛋白质序列的三联子信息表征方法,并配合我们新设计的S型可交换内核函数,使用支持向量机构造普适化的快速高精度蛋白-蛋白相互作用预测模型,相互作用预测结果优于同类方法。我们将此方法拓展到不同形式的生物体内蛋白相互作用网络预测上,取得了很好的预测结果。在待预测网络中加入少量的已知信息后,我们方法的预测范围和预测精度获得进一步提高,体现了其重要的实际应用前景。在此算法的基础上,我们创建了蛋白结合对象预测服务器SPPS(https://www.wendangku.net/doc/db7472785.html,/spps),提供对包括人类在内的多个物种体内蛋白潜在的直接或间接结合对象及其相互作用网络的概率预测服务,访问量超过2500次,给实验带来很好的导向性,大大提高了实验效率。该服务器对多个体系蛋白结合对象的预测已经得到参与测试的独立实验室实验证实。除此之外,我们方法提供的服务器还有利于设计新的治疗方案,即对新的疾病相关的蛋白网络进行阻断而不是抑制单

一的靶标蛋白。

组合化学为发现和优化药物先导化合物提供了广阔的前景,但它在新药开发中是一种高成本、低利用率的方法,缺乏药物化学空间的导向性。目前,组合化学发展的趋势是和合理药物设计结合起来,在合成组合化学库之前,通过分子模拟和理论计算方法合理的设计虚拟化合物的集中库,增加库中化合物的潜在活性,提高库的质量。我们发展了新的虚拟组合集中库设计方法,基于靶标受体的三维结构信息,自动搜寻最优化的具有高亲和力、高多样性,良好药物动力学性质和低毒性的小分子先导化合物结构,并编制了相应的软件程序包,该方法能够有效地提高获得先导化合物的成功率。为了进一步验证这个方法,我们运用虚拟组合集中库软件,根据人亲环素酶A(CypA)的晶体结构,对CypA活性抑制剂进行结构优化。实验结果显示通过该方法设计的16个化合物全部可以与CypA结合,其中最优抑制剂的活性提升了1个数量级,证明我们发展的组合集中库设计方法在新化学实体优化方面具有较高的效率,同时也为以CypA 为靶标的抗HIV病毒选择性抑制剂的进一步发展提供了优质的先导化合物基础。

双组分系统是细菌体内的主要信号传导系统,核心是组氨酸激酶,广泛存在于细菌等原核生物中,迄今为止未在脊椎动物(包括人类)中发现类似系统。双组分系统参与细菌的各项生命活动,尤其是介导了细菌生长、毒力和趋化性等重要行为。因此,组氨酸激酶成为当前新的潜在抗生素靶标,用于发现新一代抗耐药菌抗生素。然而,组氨酸激酶自身磷酸化的分子作用机制还不清楚,极大的延缓了其成为药物靶标的可能和针对组氨酸激酶的合理药物设计。为了阐明这个机制,我们综合应用同源蛋白质模建、分子对接、分子动力学模拟和量子化学计算等方法研究了组氨酸激酶CheA的自身磷酸化机制。根据模拟结果,我们首次提出了组氨酸激酶自磷酸化的作用模式: 接受到外界传感信号的触发分子ATP,在组氨酸激酶结合位点处进行的周期性构象变化是负责磷酸化结构域P4打开ATP盖子的原因,从而导致了接受磷酸化的结构域P1与P4结构结合,发生从ATP到P1的自磷酸化反应,启动细菌向目标源的趋化性运动行为。即ATP不仅是磷酸基的供给基团,也是组氨酸激酶自磷酸化作用的激活剂。同时我们也很好阐释了当前组氨酸激酶高效抑制剂TNPATP的作用原理以及与ATP的差别。在CheA自磷酸化机制的基础上,根据组氨酸激酶的关键构象和配体-受体相互作用的药效团模型,我们应用虚拟筛选方

在微摩尔级以下的组氨酸激酶法对超过190000的分子数据库进行搜寻,结合生物测试获得IC

50

抑制剂6个。这些抑制剂抑菌效果明显,可以破除耐药细菌的生物膜保护,并且没有类似抗菌化合物所具有的凝血毒性,具有较好的开发前景,为发现新一代抗菌素先导化合物奠定了基础。

葡萄糖激酶是调节血液中葡萄糖水平的重要酶,主要分布于肝细胞和胰岛β细胞中。在正常生理条件下,葡萄糖激酶可以同时通过促进肝细胞合成糖原和促使胰岛β细胞囊泡将存储的胰岛素释放到细胞外血液中两条途径降低过高的血糖水平。因此,葡萄糖激酶被认为是目前最有前途的发现抗糖尿病药物的潜在靶标。葡萄糖激酶具有单体自调节全局构象变化的特征,但

是其变构机制及中间过程未知,无法进行合理的药物设计。这种中间过渡态在目前的实验水平上极难捕捉,而且通过实验从原子水平来获得上述机制的详细答案也是难以操作的。因此,我们利用理论预测结合实验验证的方法,来研究葡萄糖激酶全局变构机制及其激动剂的作用原理等问题。通过对葡萄糖激酶进行大规模的分子动力学模拟研究,我们对葡萄糖激酶自调节变构酶的机制进行了深入系统的阐述,发现了三个葡萄糖激酶自调节变构的关键中间过渡态。根据这些过渡态,我们提出: 葡萄糖激酶从闭合的激活状态,经过三个关键过渡态,最终到达超打开的非活性状态,是其作为自身调节性变构酶的本质原因;而葡萄糖激酶的激动剂正是作用于第一个过渡态,持久激活葡萄糖激酶,从而发挥降低血糖的作用。根据这个机制,我们对葡萄糖激酶过渡态上的五个关键调节残基进行了合理的预测,这些预测被进一步的突变实验和酶动力学实验所证实。这一研究结果为阐述葡萄糖激酶在体内通过自身构象变化调节血糖水平的作用机理,以及葡萄糖激酶激动剂的合理药物设计奠定了基础。与此同时,我们还对葡萄糖激酶的催化机制进行了初步探讨,建立了完整的葡萄糖激酶催化模型,预测了催化所必需的关键残基,并被突变实验所证实。根据上述结果,我们提出了葡萄糖激酶磷酸化葡萄糖的机理,为进一步研究葡萄糖激酶在体内作用机制提供了方向。

关键字: 计算生物学,药物设计,蛋白质-蛋白质相互作用,虚拟组合集中库,双组分系统,葡萄糖激酶,先导化合物发现

The Development of Computational Biology Methods and The Application in the Molecular Biology and Drug Discovery

Zhang Jian

ABSTRACT

Drug development and target discovery are of great importance to improve the quality of human life. In the modern biological medicine and pharmaceutical study, investigating the mechanism of action by the critical proteins closely related to a serious disease, constructing its regulative network, and designing new drugs with high selectivity and activity are fundamental research areas with highly potential applications. With the development of computational technology and information science, it has been recognized that computational biology as a complementary tool to experiment can assist in investigating the mechanisms of protein function and the associated pathway of a target protein. Both information remains intractable through direct experimental methods. Thus, computational biology has become an essential technique in the research field of life science and drug discovery. Meanwhile, drug design has already become a core technique of identifying leads for drug targets in drug development. The first part of dissertation will mainly focus on the development of a series of computational algorithms and drug design met hods, including “The Prediction of Protein-Protein Interaction Network” in the chapter 1 and “Virtual Target-Specific Compound Library Design” in chapter 2. In the second part, we will investigate the mechanism of action on several important potential target proteins, leading to the discovery of some novel lead compounds based on the discovered mechanism that will be useful for further experimental interrogation. This part consists of “Mechanism study of Histidine Kinase Autophosphorylation in Bacteria” in chapter 3 and “Allosteric Mechanism study of Glucokinase” in chapter 4.

Protein-protein interaction (PPI) is a key to understanding most of the biological processes. The research field has been unprecedentedly appreciated due to its important scientific value and prospective application. Recently, prediction of PPI in computational biology has been greatly improved and plays a significant role on several fields. However, these methods still have large limitation in accuracy and the scope of PPI prediction. According to such shortcoming, we proposed a novel method for PPI prediction with high accuracy and generalization. This algorithm was developed based on a new machine learning algorithm─support vector machine (SVM) combined with a newly

designed S-type exchangeable kernel function and a conjoint triad feature for describing amino acids of protein sequence. The prediction ability of our approach is better than that of other sequence-based PPI prediction methods. Remarkably, our approach has been extended to predict various PPI networks in organism, showing good consistent results compared with experiments. Furthermore, a few clues from request network can effectively enhance the prediction ability of our method in accuracy and scope, which shows its important role in practical cases. Based on the algorithm, I constructed the web server—Sequence based Protein Partner Search (https://www.wendangku.net/doc/db7472785.html,/spps) for public access, providing probability prediction service on searching potentially direct or indirect binding partners and the associated network of the request protein in different species, such as homo sapiens. This server has been visited more than 2500 times so far, providing guidance for experiments and being helpful to enhance the efficiency for experiments. The predicted results from SPPS server on several biological systems have already been proved by independent study laboratories. Besides, the server may help design novel therapeutics that can interrupt disease-related protein networks rather than simply inhibiting individual target proteins.

Combinatorial chemistry was previously thought to be a new efficient approach for discovering and optimizing lead compounds. But the applications of this approach in the past decade testified it to a high-cost strategy with low profitability in drug discovery due to lack of direction within medicinal chemistry space. Recently, there is a new attempt that combines the combinatorial chemistry with rational drug design, which may lead to a virtual combinatorial focus library with high potential bioactivity and favorable library quality in silico before synthesis. We proposed a new method for designing novel target-focused library, which automatically optimizes small organic compounds with high binding affinity, preferable diversity, acceptable pharmacokinetic properties and low toxicity based on target 3D crystal structures. Meanwhile, a software package was developed on the basis of the new method and makes effect on increasing successful ratio of searching lead compounds by several cases. To verify the method, we used the software to improve activities of the inhibitors against cyclophilin A(CypA) based on its X-ray crystal structure, which performs an essential function in HIV-1 replication by binding specifically with the capsid domain. All these sixteen molecules are CypA binders with binding affinities ranging from 0.076 to 41.0 μM, and five of them are potent CypA inhibitors with PPIase inhibitory activities of 0.25-6.43 μM. Remarkably, both the binding affinity and inhibitory activity of the most potent compound increase 10 times than that of the most active compound discovered previously. The results demonstrated that our method has great efficiency in optimizing bioactivity of a new chemical entity and provides excellent selectivity

inhibitor leads of CypA against HIV virus.

The two-component system (TCS) signal transduction is a predominant signaling system mediated by histidine kinase in bacteria. TCSs are crucial to bacteria, for they modulate a large variety of bacterial characteristics, such as growth regulation, virulence, and chemotaxis. In addition, TCSs are rarely found in mammalians. Therefore, histidine kinase involved in TCSs may be an attractive target for discovering novel antibiotics that may treat multiresistant bacteria. However, the mechanism of autophosphorylation in histidine kinase is still unclear, which largely encumber possibility of developing histidine kinase into drug target and rationally designing new compound against histidine kinase. Taking chemotaxis protein CheA as a model of TCS, the autophosphorylation mechanism of the TCS histidine kinases has been investigated by using a computational approach integrated with homology modeling, ligand-protein docking, protein-protein docking, molecular dynamics simulations and quantum chemical calculation. A mechanism of the autophosphorylation of CheA is first proposed as that ATP, which receives signal from external environment, makes conformational switch to trigger the opening of the ATP lid of P4 domain, leading to P1 domain binding tightly, and subsequently autophosphorylation from ATP to P1. This autophosphorylation initiates bacteria chemotaxis behavior to chemical source. Namely, ATP is not only a phosphoryl group donor but also an activator for CheA phosphorylation. Meanwhile, we also showed the reason that TNPATP is not an agent but an inhibitor for autophosphorylation. Based on the mechanism, we performed antibacterial design against histidine kinase, blocking process of the autophosphorylation. Six novel inhibitors of histidine kinase with IC50below μM were discovered using structure-based virtual screening from a 190,000 in-house drug-like library followed by experimental validation. These six inhibitors displayed their potential value as leads for developing novel agents to treat bacterial infection including the properties of effective antibacterial activity, breaking biofilm formation, low cytotoxicity and low hemolytic activity

Glucokinase (hexokinase IV or D, GK) is a glycolytic enzyme that plays an important role in blood sugar regulation related to the glucose utilization and metabolism in the liver and pancreatic β-cells. Under physiological condition, GK plays a dual role in reducing plasma glucose levels by facilitating hepatic g lycogen synthesis and induces insulin secretion in pancreatic β-cells. Therefore, GK might be an important target for discovering anti-diabetes drug. GK is an allosteric monomeric protein which can undergo global conformation transition. Nevertheless, allosteric mechanism of GK and the corresponding intermediate states during the conformational process is still unanswered, which limits the possibility of using rational drug design approach to target GK. Furthermore, it is

difficult to resolve the structures of the intermediate states in the pathway for the global conformational transition of GK, the investigation of the above problems in atomic detail through experimental methods is still intractable. Therefore, GK system is ideal for using theoretical prediction to investigate the mechanism of GK activator as well as the allosteric mechanism of human GK followed by experimental validation. In the study, we have performed a large series of molecular dynamics simulations. A very important mechanistic conclusion from the present simulations of GK is that there are three intermediate states in the conformational transition pathway from the close active state to the super-open inactive state. Activator is able to enhance the activity of GK through conformational restriction in first intermediate state, having continuous effect on lowering blood glucose. Based on the mechanism, the simulations expected that five key residues, Y61S, I159A, A201R, V203E and V452S mutations, have not been appreciated so far, may change the opening process of GK. These predictions have also been verified by mutageneses and kinetic analyses in this study. These observations are beneficial to understanding the mechanism of GK regulation and designing the compounds for treating metabolic diseases. Meanwhile, we have investigated catalytic mechanism of GK by building whole catalytic GK model and performing simulation on it. Our result successfully predicted key residues, which are responsible for catalytic behavior and subsequently validated by following mutation experiments. Based on the model, a catalytic mechanism of GK has been proposed, which will be instrumental for studying the catalytic behavior of GK in vivo.

Key words: Computational biology, Drug Design, Protein-protein interaction, Virtual Combinatorial library, Two Component System, Glucokinase.

计算生物学

徐书华金力

计算生物学(computational biology)是一门典型的交叉学科,涉及的学科包括数学、统计学、化学、物理学、生物学和计算机科学等。就整个学科的内容而论,计算生物学最终是以生命科学中的现象和规律作为研究对象,以解决生物学问题为最终目标,数学和计算机仅仅是解决问题的工具和手段。计算生物学的研究范畴相当广泛,几乎渗透到现代生物学研究的每一个领域。对于这样一门学科,大家有不同的认识,要给出一个既全面又精准的定义实非易事。通俗地讲,计算生物学是应用计算机科学、应用数学和统计学的方法和手段研究生物学问题的一门交叉学科[1]。一个更专业但是依然宽泛的定义是,任何关于生物学问题

的交叉学科研究,只要其工作假设(working hypothesis)可以通过建立数学模型和计算机仿真来进行检验,都可纳入计算生物学的研究范畴[2]。在称谓上,曾经有人提出过“数学生物学”(mathematical biology)或“定量生物学”(quantitative biology),但普遍认为,定量的测度以及数学和统计学分析在整个自然科学领域中都广为应用,只有“计算”(computation)可以比较好地反映这门学科各个研究领域的共同本质和内在联系,并且很好地把它们统一起来[3]。因此,“计算生物学”的概念最终被广泛接受和使用。

计算生物学的本质

计算生物学与许多其他学科有密切的联系,通常不容易区分,比如系统生物学、生物数学等,而最容易混淆的是生物信息学。随着1990年人类基因组计划(Human Genome Project, HGP)正式启动,海量数据信息迅速积累,人们发现靠传统的方法存储处理这些爆炸式增长的数据已力不从心,因此开始借鉴信息学的工具方法,由此出现了生物信息学这一新兴的学科。如今,生物信息学(bioinformatics)作为一门学科已经深入人心,为大家所熟识。但实际上,人们很快意识到,对那些海量数据只进行一些传统处理,并不能给生命科学以及医学带来太大的促进,迫切需要一个有效的研究方法体系来帮助人们了解像人体这样一个极其复杂的生物体系,这就是最近几年逐渐受到越来越多关注的计算生物学。

实际上,计算生物学与生物信息学都属于典型的交叉学科,它们的研究内容往往交织在一起,并没有一个严格的界限。但是一般认为,生物信息学主要侧重于生物学中信息的采集、存储、分析处理与可视化等方面,而计算生物学主要侧重于利用数学模型和计算仿真技术对生物学问题进行研究。生命科学已发展到后基因组时代,即人们面对的都是海量的“组学”数据集。在大多数情况下,计算生物学的研究需要经过前期的生物信息学研究过程,因此通常将生物信息学作为计算生物学的分支学科来看待。

此外,区分计算生物学与其他相关学科的一个要点是计算生物学以直接解决生物学问题为目标和出发点,而其他同样涉及数学和计算的学科不一定如此。比如生物数学也同时涉及数学计算和生物学,但在更多情况下并没有明确的、直接的生物学研究对象,而只研究那些与生物学应用有关的数学方法和理论。当然我们没有必要纠缠于各学科有多少具体差异甚至学科名称的字面解释,往往一个研究人员的兴趣可能更偏向某个领域或某一方面,而具体的研究工作同时涉及多个学科,在这种情况下一般会达成不同领域的研究人员之间的合作。跨学科研究是趋势,不同领域研究人员的合作已经是常态。

“发现的科学”与“假设驱动的科学”

一般来说,计算生物学的研究可以划分成两个部分或者两个阶段,一是数据挖掘和知识发现,从大量的实验数据中提取背后隐藏的模式,然后形成假设;第二个阶段是建立数学模型,利用计算机模拟来检验各种假设,为进一步的体内、体外实验研究提供预测结果和指导建议[4]。因此,计算生物学的两个阶段可以归纳为“发现的科学”(discovery science)和“假设驱动的科学”(hypothesis-driven science)。

具体来讲,计算生物学运用大规模高效的理论模型和数值计算来识别基因组序列中代表蛋白质的编码区,破译隐藏在核酸序列中的遗传语言规律;直接从蛋白质序列预测蛋白质三维结构以及动力学特征,研究生物大分子结构与功能的关系、生物大分子之间相互作用以及生物大分子与配体的相互作用,促进蛋白质工程、蛋白质设计和计算机辅助药物设计的发展;同时,归纳、整理与基因组遗传语言信息释放及其调控相关的转录谱和蛋白质谱的数据,模拟生命体内的信息流过程,从而认识代谢、发育、分化、进化的规律,从基因组科学新视角来探究人类健康和疾病的各个方面,使将人类基因组计划的成果转化为医学领域的进步成为可能。

运用计算生物学,科学家有望鉴定基因和生物通路在健康和疾病中的角色,挖掘它们与环境因素之间的关系;发展、评价以及应用以基因组为基础的诊断方法来预测对疾病的易感性,预测药物反应,发现疾病的早期诊断标记、疾病在分子水平上的发展机制;应用基因组和代谢通路的知识,通过分子模拟等方法进行计算机辅助药物设计,缩短新药开发周期,从而开发有效的、新的疾病治疗方法;发展基于基因组的工具来改善大众的健康状况,从而促进人类基因组计划造福于人类[5]。

在数据挖掘及知识发现阶段,常用的研究方法有统计学方法、信息论方法、集合论方法、仿生学(或人工智能)方法、语言学分析方法和其他一些广泛用于数据挖掘和知识发现的具体方法,包括频繁出现在该领域的一些关键词,如机器学习、支持向量机、隐马尔科夫模型、贝叶斯推断、模式识别等,大部分可归属到上述分类当中。此外,可视化技术作为数据挖掘和知识发现阶段的辅助技术受到越来越多的重视。

在模型建立和计算机仿真阶段,具体方法的实行与前一阶段知识发现中建立的假设以及具体的生物学问题有关。但不论用什么具体方法,总之是要将观察到的数据模式和感兴趣的生物学问题借助数学模型转变成一个可计算问题。通过数学模型表现和描述真实数据中观察到的某些现象、特征和状况,定量地描述其状态和过程。最终通过对数学模型的逻辑推理、求解以及运算,或者至少能通过计算机仿真实现对模型和假设进

行检验,获得对感兴趣的生物学问题的有关结论以及对具体生命现象本质的认识和科学解释。

如果以上两个阶段分开来看,表面上第一个阶段基本属于生物信息学的研究范畴,第二阶段大致属于生物数学和计算机科学研究范畴。然而,计算生物学的特点就在于两个研究阶段的不可分割性,它既不是单纯的生物信息学研究,也不是纯粹的生物数学理论研究,更不是简单的计算机技术应用研究。举例来讲,通过知识发现建立假设和构建数学模型进行计算机仿真并进行检验,与实验观察结果进行比较分析,一方面预测和指导进一步的体内体外实验研究,另一方面从新的实验数据中重新进行知识发现、修正假设、完善数学模型,最终阐明生命活动的现象和本质。这个过程可能反复进行,各个环节相互依赖,始终围绕生物学问题。因此一个典型的、完整的计算生物学研究两个阶段是必不可少的,往往是交互进行的。计算生物学将“发现的科学”和“假设驱动的科学”有机地联系起来,使得生物信息、知识发现、数学模型和假设检验完美地结合在一起,为生命科学研究铺开一条多学科交叉融合的高速公路。

国内外的发展概况

计算生物学在国际上受到高度重视,美国和欧洲一直走在该研究领域的前列。1975年,美国的皮帕斯(J. Pipas)和麦克马洪(J. McMahon)首先提出运用计算机技术预测RNA二级结构。1980年,美国《科学》周刊发表了关于计算分子生物学的综述。1997年,国际计算生物学学会(ISCB)在美国成立,如今发展成为一个拥有来自70多个国家的2500多名会员的庞大组织。由其负责的两本刊物,《公共科学图书馆计算生物学》(PLoS Computational Biology)和《生物信息学》(Bioinformatics),成为当今计算生物学领域主流的专业杂志。1999年,世界上第一个系统生物学研究所在美国西雅图成立。2002年秋天,第一届欧洲计算生物学会议(ECCB)在德国萨尔布吕肯召开,吸引了来自30个国家的459名参会者。2002年11月,英国《自然》杂志推出一个关于计算生物学的专辑,介绍计算生物学的学科概念、研究现状和发展前景。2004年,美国卫生研究院启动了“生物信息学和计算生物学”计划,并着手建立了数个“国家生物医学计算中心”(National Centers for Biomedical Computing)。近年来,加州大学、斯坦福大学、德克萨斯大学、芝加哥大学、威斯康星大学等机构均成立了计算生物学中心,德国、法国、澳大利亚、意大利等国也纷纷建立了计算生物学研究机构。

中国的计算生物学研究起步较晚,与欧美国家相比,在研究机构的数量和规模、研究人员组成以及资金投入方面都存在比较大的差距。由于现代生物学许多地方要求大量运用计算生物学的手段,实际上,很多大学和研究院所都有相关科研人员从事部分计算生物学的研究,或至少有意无意地用到计算生物学的研究手

段。但一直以来,国内计算生物学研究和研究人员大多分散在各个大学和研究院所的其他学科当中,没有形成体系,没有学科概念,更遑论集群优势。庆幸的是,最近几年计算生物学研究在国内逐渐受到重视,相关的学术会议相继召开。2005年10月13日,中科院上海生命科学研究院计算生物学研究所(中科院-马普学会计算生物学伙伴研究所)正式揭牌,我国第一个计算生物学研究所成立。这个由中科院和德国马普学会合作共建的研究所,标志着我国对计算生物学研究的重视达到前所未有的高度。此后,一些大学也陆续成立了系统生物学研究机构,与计算生物学相关的一些重要研究计划也纷纷出台。

当前的计算生物学仍处于探索和发展阶段,还远远没有形成一个比较完整的研究体系。计算生物学的许多方法和理论还很不完善,许多更复杂的生物学问题至今未能找到相应的计算手段和方法进行研究。尽管如此,计算生物学在一些研究领域还是取得了不少的进展。

正如计算生物学的出现和发展最初得益于人类基因组计划,目前较为显著的成果最先也是体现在基因组学领域,其中又以群体基因组学(population genomics)最具代表性,包括下述几个方面:(1)人类复杂疾病研究,主要表现在全基因组关联分析(GWAS)的广泛应用于人类复杂疾病的基因定位研究;(2)群体基因组结构研究,在群体水平研究基因组的结构,包括单体型结构、连锁不平衡结构、重组率的基因组分布等,代表性的工作是国际单体型计划(The International HapMap Project)的实施及其随后大量的研究成果;(3)自然选择研究,代表性的工作是在全基因组范围利用群体基因组学的手段寻找受到达尔文正选择的基因[6];(4)史前人口统计学研究,包括人类群体亚结构、群体大小的波动、人群基因交流等参数的估计,成果主要体现在一系列相关研究方法的发展[7],以及对人类遗传多样性计划(HGDP)的世界人群在全基因组范围的遗传结构研究[8, 9]。

当然,计算生物学在其他领域也得到不同程度的发展,如分子模拟和计算机辅助药物设计是当前计算生物学研究的一个热点,也是计算生物学与生物医药产业结合最紧密的方向之一。中国科学院上海药物研究所率先在国内将高性能计算应用于分子模拟和开展药物设计研究,发展了复杂生物大分子体系理论计算方法,进行了复杂生物大分子长时分子动力学和变构动力学模拟;并在分子模拟的基础上对30余种重要靶标进行了药物设计研究。

值得指出的是,在目前具体的研究中,相当一部分没有明确的生物学问题,要么只研究生物信息的挖掘技术,要么只研究那些涉及生物学应用有关的数学方法和理论。这说明目前的计算生物学研究还是零散的、脱节的,没有真正超越传统的生物信息学和生物数学的研究模式。计算生物学还要从生物学的需要和特点,探求新方法、新手段和新的理论体系。这是挑战也是机遇,国内众多高校和研究所也已经开始进行计算生物学领域的研究工作,相信中国科学家在这一领域会大有作为。

代表未来生命科学的发展方向

计算生物学代表未来生命科学和生物技术研究的发展方向,今后的计算生物学一定会具备以下四个特征。

第一个是组学特征,这包括从一系列组学(-omics),如表型组(phenome)、基因组(genome)、转录组(transcriptome)、蛋白质组(proteome)、相互作用组(interactome)、代谢组(metabolome)等组学数据的知识发现。

第二个是广泛深入的数学建模及应用,计算生物学要将众多知识发现有机地整合起来,把来自各方面的因素联系在一起,以定量的形式刻画、从不同角度展现生命现象的本质,必然需要建立数学模型通过数学语言的抽象描述来实现。

第三个是系统性研究,生命系统的复杂性和整体性必然要求人们对多种组学数据进行整合,系统地、整体地来考虑,通过综合分析阐明生命活动的机制。

第四个是高性能计算,由于生命现象复杂,从生物学中提出的数学问题往往也十分复杂,需要进行大量计算工作,加之当前和今后计算生物学研究面临的都是大规模的组学数据,因此,高性能计算是今后研究和解决生物学问题的重要手段和工具。

计算生物学在解决生物学问题的同时,也促使其他学科向前发展。比如数学在生物学研究中得到广泛应用,同时从生物学研究中提出了许多数学问题,萌发出许多数学发展的生长点,正吸引着许多数学家从事研究。当然,更重要的是新一代专门的计算生物学研究人才的培养。正如克拉弗里厄(J. Claverie)指出[10],今后计算生物学的发展,最需要的可能不是将DNA看作图灵机磁带的计算机专家和数学家,而是新一代专业的计算生物学家,他们不但有较好的数学和计算机知识背景,而且在生物学一系列相关领域,如转录调控、分子酶学、结构生物学、发育生物学以及进化遗传学等等领域也具有坚实的知识基础。只有如此,我们才有可能在将来真正了解DNA序列在细胞水平的功能和进化,最终阐明生命活动的机制。

[1] Wikipedia. Computational biology[EB/OL]. [2009-3-25]. https://www.wendangku.net/doc/db7472785.html,/ wiki/Computational_ biology.

[2] Bassi S,Gonzalez V,Parisi G. Computational biology in Argentina. PLoS Comput Biol,2007,3(12):e257.

[3] Surridge C. Computational biology. Nature, 2002. 420(6912):205.

[4] Kitano H. Computational systems biology. Nature, 2002. 420(6912): 206.

[5] 中科院上海分院. 东方科技论坛第60次学术研讨会会议纪要[EB/OL]. (2005-8-31)[2009-3-25]. https://www.wendangku.net/doc/db7472785.html,.

[6] Voight B F,Kudaravalli S,Wen X,et al. A map of recent positive selection in the human genome. PLoS Biol, 2006,4(3): e72.

[7] Pritchard J K, Stephens M, Donnelly P. Inference of population structure u sing multilocus genotype data. Genetics, 2000,155(2):945.

[8] Li J Z,Absher D M,T ang H,et al. Worldwide human relationships inferred from genome-wide patterns of variation . Science, 2008,319(5866):1100.

[9] Jakobsson M, Scholz S W, Scheet P, et al. Genotype, haplotype and c opy-number variation in worldwide human populations. Nature, 2008, 451(7181): 998.

[10] Claverie J M. From bioinformatics to computational biology. Genome Res, 2 000,10(9):1277.

2007-1-15 9:09:49

构建计算生物学平台促进新药开发

热点推荐

2010年广州-东莞首届国际小型猪论坛

The 1st International Mini-pig Forum Guangzhou-Dongguan,China

?更多会议

相关阅读

诱导多能干细胞

iPS干细胞(induced pluripotent stem cell)

?更多阅读

今天生物学数据的巨大积累将导致重大生物学规律的发现,因此,如何从这些海量的生物学数据中提取有用的知识,成为了对生物学家、数学家、计算机学家等的巨大挑战。由此引出了一门新兴学科:计算生物学。当前,许多科学家对生物大分子计算模拟、计算机辅助药物设计和计算生物学的发展给予了众多的关注。

现代生物学研究的核心方法

据美国国立卫生研究院(NIH)的定义,计算生物学是指开发和应用数据分析及理论的方法、数学建模和计算机仿真技术,用于生物学研究的一门学科。随着人类基因组计划的实施和深入,生物学数据积累出现了前所未有的飞跃。不仅数据量呈指数级增长,而且,数据的本质也出现了从生理生化数据向遗传信息的飞跃,以及进一步向遗传与结构功能相互关系信息。这种科学数据的急速和海量积累,在人类的科学研究历史中是空前的。虽然数据本身并不等于信息和知识,而仅仅是信息和知识的源泉,但人类科学研究史表明,科学数据的大量积累将导致重大的科学规律的发现。

计算生物学正在成为现代生物学研究的核心方法之一,成为当今生命科学最具活力的新兴前沿学科之一。计算生物学运用大规模高效的理论模型和数值计算来识别基因组序列中代表蛋白质的编码区,破译隐藏在核酸序列中的遗传语言规律;直接从蛋白质序列预测蛋白质三维结构以及动力学特征,研究生物大分子结构与功能的关系、生物大分子之间的相互作用以及生物大分子与配体的相互作用,促进蛋白质工程、蛋白质设计和计算机辅助药物设计的发展;同时,归纳、整理与基因组遗传语言信息释放及其调控相关的转录谱和蛋白质谱的数据,模拟生命体内的信息流过程,从而认识代谢、发育、分化、进化的规律,使从基因组科学新视角来探究人类健康和疾病的各个方面、将人类基因组计划的成功转化为医学领域的进步成为可能。

国内外高度关注

当前,计算生物学在国际上受到高度重视。美国国立卫生研究院是世界上从事生命科学研究最重要的研究机构之一,它的年度预算占了美国政府科学投入的60%左右。在人类基因组计划的完成和后基因组时代到来之际,NIH经过与来自美国学术机构、政府部门和私人团体的300多名生物医学权威人士长达一年多时间的一系列讨论,于2003年形成了一个通向生命科学未来的“中长期发展规划”--国立卫生研究院路线图(NIHRoadmap)。NIH路线图中启动了一个“生物信息学和计算生物学”计划,希望通过这个项目的实施而铺设一条通向生命科学未来的“信息高速公路”。该项目计划从2004年开始,建立数个“国立生物医学计算中心”,以便开发相关软件和数据管理工具。

在我国,国家自然科学基金委也将计算生物学作为重点资助的研究方向之一。对于将生物医药产业作为重点发展高科技产业的上海市,对计算生物学研究更是高度重视。中国科学院上海药物研究所与美国SGI计算机公司联合建立了计算生物学实验室。中国科学院和德国最大的研究机构--马克斯·普朗克学会合作,在上海共建计算生物学研究所。

促进新药开发的有力手段

据中国科学院上海生命科学研究院副院长赵国屏介绍,计算生物学可望在以下几方面促进人类基因组计划以造福人类:鉴定基因和途径在健康和疾病中的角色,测定它们与环境因素之间的关系;发展、评价以及应用以基因组为基础的诊断方法来预测对疾病的易感性,预测药物反应,进行疾病的早期诊断,在分子水平上对疾病精确分类。此外,重要的一方面就是,应用基因组和代谢通路的知识,通过分子模拟等方法进行计算机辅助药物设计,缩短新药开发周期,从而开发出有效的、新的疾病治疗方法。

有关专家认为,分子模拟和计算机辅助药物设计是当前计算生物学中的热点问题,又是计算生物学与生物医药产业结合最紧密的方向,计算生物学在这些方面取得的进展将直接推动生物医药产业的发展。

新加坡国立大学计算科学系主任陈宇综教授日前透露,新加坡国立大学计算科学系建立了一个药物靶点数据库TTD,包括1174个药物靶点和1251个药物/配体。通过对该数据库数据的分析,发现好的药物靶点一般都分布在1~2个代谢途径上,而且倾向于与人类蛋白质的相似度较低。那用什么方法来寻找这些靶点呢?这就是计算生物学的问题。常用的计算方法有两大类:一类是基于序列相似性的,其特点是准确度高,容易使用,但对于新出现的靶点则束手无策;另一类是基于结构和物理化学特性方面的相似性,它适用于传统和新兴的靶点,但要求现有靶点有较高的代表性。如果没有确切的关于靶点三维结构的信息,可以使用支持向量机(SVM)等人工智能的方法来建立模型。

一种名为“IN”的酶是催化艾滋病病毒(HIV)进入人体基因的祸源之一,能否有效将其抑制直接关系到病情的发展。复旦大学唐赟教授领导的项目组运用计算生物学手段已模拟出“IN”的结构模型,在该研究基础上将有望进一步设计出新的抗艾药物。

目前世界上已发现两种HIV:HIV-1和HIV-2。

目前HIV的研究以HIV-1为主。唐赟教授说,“IN”

的全名为HIV-1整合酶,负责将HIV-1整合进入人体,如何抑制它将是治疗艾滋病的重要课题,而想要抑制它则必须先了解其完整结构。据介绍,“IN”的三块结构都已被确定,但其整体结构却一直难以证实。通过计算生物学中分子模拟的方法,他们得到了“IN”全长蛋白质及其病毒和人类DNA形成复合物的结构模型。这些结构模型能够展示出“IN”是如何与HIV还有人类DNA进行相互作用

的。

齐心协力共促发展

在过去十年里,计算生物学已经取得了长足的进展,如序列比对工具的发展、艾滋病感染计算模型的建立、疾病易感基因的识别和计算机辅助药物设计等。但同时应看到,我们面临的挑战仍然很多,有的还相当艰巨,如药物化合物的生物信息学筛选、根据复杂分子的结构预测其功能、提高蛋白结构预测的精度、建立更加准确、有效、综合的系统动态模型、基因组的完全注释等,这些都需要一大批从事生命科学和计算科学研究的专家学者投入更多的精力。

此外,由于计算生物学是一门交叉学科,需要生物学家、计算机学家、数学家等来自不同背景的研究人员通力合作。对于海量的生物学数据,如何从中挖掘出最有用的信息,是对生命科学以及医药研究的巨大挑战。计算生物学家的任务,就是与生物学家、药学家等紧密结合,提出解决问题的方法学。因此,构建一个可以让不同专业背景的研究人员相互沟通交流的平台,形成不同团体相互协调合作的机制,对于计算生物学的发展非常重要。

与国外有实力的大学、研究所、制药公司等研发部门相比,我国的计算生物学研究无论是从人数和资金投入来说,都还不成规模,难以形成集群优势。因而,加大对计算生物学的重视和投入,构建一个良好的计算生物学平台,成为当前的迫切任务。

杨胜利:系统生物学——21世纪的生物学

2009-09-22 21:41:28 作者:杨胜利来源:易生物浏览次数:16 网友评论 0 条

系统生物学将在基因组序列的基础上完成由生命密码到生命过程的研究,这是一个逐步整合的过程,可能需要一个世纪或更长

时间,因此,常把系统生物学称为21世纪的生物学。

●系统生物学将在基因组序列的基础上完成由生命密码到生命过程的研究,这是一个逐步整合的过程,可能需要一个世纪或更长时间,因此,常把系统生物学称为21世纪的生物学。

●长期以来,生物学研究是在规模较小的实验室进行的,系统生物学将在更大范围和更高层次进行学科交叉和国际合作,如人类基因组计划、人类单体型图谱计划、人类表观基因组学计划等。

●系统生物学使生命科学由描述式的科学转变为定量描述和预测的科学,已在预测医学、预防医学和个性化医学中得到应用。

20世纪生物学经历了由宏观到微观的发展过程,由形态、表型的描述逐步分解、细化到生物体的各种分子及其功能的研究。1953年沃森和克里克提出的DNA双螺旋模型是生物学进入分子生物学时代的标志,70

年代出现的基因工程技术极大地加速和扩展了分子生物学的发展。1990年启动的人类基因组计划是生命科学史上第一个大科学工程,开始了对生物全面、系统研究的探索,2003年已完成了人和各种模式生物体基因组

的测序,第一次揭示了人类的生命密码。人类基因组计划和随后发展的各种组学技术把生物学带入了系统科学的时代。

系统生物学是在细胞、组织、器官和生物体整体水平研究结构和功能各异的各种分子及其相互作用,并通过计算生物学来定量描述和预测生物功能、表型和行为。系统生物学将在基因组序列的基础上完成由生命密码到生命过程的研究,这是一个逐步整合的过程,由生物体内各种分子的鉴别及其相互作用的研究到途径、网络、模块,最终完成整个生命活动的路线图。这个过程可能需要一个世纪或更长时间,因此常把系统生物学称为21世纪的生物学。

和以往系统科学研究复杂系统相比,系统生物学的研究将更为复杂和困难。非生物的复杂系统一般由相对简单的元件组合产生复杂的功能和行为,而生物体是由大量结构和功能不同的元件组成的复杂系统,并由这些元件选择性和非线性的相互作用产生复杂的功能和行为。因此,我们要建立多层次的组学技术平台,研究和鉴别生物体内所有分子,研究其功能和相互作用,在各种技术平台产生的大量数据的基础上,通过计算生物学用数学语言定量描述和预测生物学功能和生物体表型和行为。生物体的复杂性和大量过程的非线性动力学特征对计算科学也是一个新的挑战。据预测,系统生物学研究对计算机的要求高达 1000万亿次浮点运算速度。

系统生物学也将使生物学研究发生结构性的变化。长期以来,生物学研究是在规模较小的实验室进行的,系统生物学研究将由各种组学组成的大科学工程和小型生物学实验室有机结合实施的。系统生物学研究也将在更大范围和更高层次进行学科交叉和国际合作,如人类基因组计划、人类单体型图谱计划、人类表观基因组学计划等。

系统生物学的主要技术平台为基因组学、转录组学、蛋白质组学、代谢组学、相互作用组学和表型组学等。基因组学、转录组学、蛋白质组学、代谢组学分别在DNA、mRNA、蛋白质和代谢产物水平检测和鉴别各种分子并研究其功能。相互作用组学系统研究各种分子间的相互作用,发现和鉴别分子机器、途径和网络,构建类似集成电路的生物学模块,并在研究模块的相互作用基础上绘制生物体的相互作用图谱。表型组学是生物体基因型和表型的桥梁,目前还仅在细胞水平开展表型组学研究。

计算生物学可分为知识发现和模拟分析两部分。知识发现也称为数据开采,是从系统生物学各个组学实验平台产生的大量数据和信息中发现隐含在里面的规律并形成假设。模拟分析是用计算机验证所形成的假设,并对体内、外的生物学实验进行预测,最终形成可用于各种生物学研究和预测的虚拟系统。

系统生物学研究在破译生命密码和应用方面都取得了较大进展。啤酒酵母是人类基因组计划中的一种模式生物,在其基因组中预测有6243个编码序列,分别用串联亲、标签(TAP)和绿色荧光蛋白标签进行标记进行表达的定量分析和蛋白质定位研究,结果表明有4251个TAP标记的基因在对数生长期表达;并对4156个绿色荧光标证的蛋白进行亚细胞定位研究,分别定位于22个不同的亚细胞区域。用酵母双杂交技术研究了酵母系统 2039个蛋白质的相互作用,鉴别了一个由1548个蛋白质参与、包括2358个相互作用的巨型网络和几个较小的网络。另一个模式生物果蝇的蛋白质相互作用草图也已绘制。模式生物的系统生物学研究将推动更复杂系统的研究,加速由生命密码到生命的研究进程。

系统生物学使生命科学由描述式的科学转变为定量描述和预测的科学,已在预测医学、预防医学和个性化医学中得到应用,如用代谢组学的生物指纹预测冠心病人的危险程度和肿瘤的诊断和治疗过程的监控;用基因多态性图谱预测病人对药物的应答,包括毒副作用和疗效。表型组学的细胞芯片和代谢组学的生物指纹将广泛用于新药的发现和开发,使新药的发现过程由高通量逐步发展为高内涵(Highcontent),以降低居高不下的新药研发投入。为此,世界十大制药企业中的六家组成了以系统生物学技术为基础的新药研发系统的联合体,以改进新药研发的投入产出。通过系统生物学的研究,设计和重构植物和微生物新品种,以提升农业和工业生物技术产业,开拓能源生物技术、材料生物技术和环境生物技术等新产业也取得较快进展。美国能源部2002年启动了21世纪系统生物学技术平台,以推动环境生物技术和能源生物技术产业的发展。系统生物学将不仅推动生命科学和生物技术的发展,而且对整个国民经济、社会和人类本身产生重大和深远的影响。

(本文作者为:中国工程院院士、上海系统生物学研究所所长)

上海系统生物学研究所

上海交通大学与中国科学院上海生命科学研究院12月29日启动全面合作计划。作为合作的一项重要内容,系统生物学研究所同日挂牌成立。

根据合作协议,双方继续共建上海交大生命科学技术学院,互聘兼职教授、兼职研究员。上海交大生命科学技术学院、药学院、医学院和农学院根据教学和科研需要邀请生科院优秀研究人员来校讲课,生科院则为交大学生听课和实习提供方便。上海交大将发挥多学科的优势,向生科院开放相关研究生课程,并推荐优秀大学本科生报考生科院研究生。双方还将在首先植物科学和多学科交叉研究两个领域开展科研合作。

系统生物学研究所是一个集多种学科一体的新型研究机构。它将选择生科院研究所和交大院系的相关研究单元成为其“卫星实验室”,并向海内外公开招聘国际一流的学术带头人,组建“核心实验室”。通过把生物学、工程学、数学、物理学和计算机科学等多学科的研究人员有机地结合在一起,以大规模基因功能鉴定、药物创新代谢工程和生物资源高效利用为突破口,建设一个基础与应用研究浑然一体的国际一流的生命科学研究机构,成为支持上海乃至全国生物技术产业发展和传统产业技术进步的重要基地。

专家简介:杨胜利生物技术专家。江苏太仓人。中国工程院院士,研究员,博士生导师,中心学术委员会主任和学位评定委员会委员,研究员任职资格评审委员会主任。1962年毕业于上海华东化工学院有机工业系、抗生素专业;1962年9月到中国科学院上海药物研究所工作,1979年赴美国加州大学博士生研究工作;199 2-1996年担任中国科学院上海生物工程研究中心主任、党委书记。他还受聘为中科院生物技术专家委员会主任委员,中科院新药专家委员会副主任委员、国家“863”生物技术领域专家委员会委员、上海市科技进步专家咨询委员等。

杨胜利研究员长期从事于基因工程在酶、发酵和制药工业中应用研究和开发,他主持的青酶素酰化酶基因工程研究中,建立了基因克隆、定位表达系统,并采用DNA体内重组提高质粒的稳定性,优化了宿主和表达的条件,构建了高稳定性、高表达的基因工程菌,主要技术指标优于国际同类基因工程菌。他还在分子药理学、微生物血红蛋白和蛇毒基因工程、蛋白酶蛋白质工程、分子伴侣等方面进行了开拓性的创新研究,取得了一系列成果。他曾荣获中国科学院科技进步一等奖,中国科学院第二届亿利达科技奖。在国内外重要科技刊物上发表论文70余篇;培养博士研究生19名,硕士研究生14名。从 1991年起享受国务院特殊津贴,1993

年享受上海市特殊津贴。

1997年当选为中国工程院院士。

计算生物学成生物药学研究的核心方法之一

2008/10/14/10:28 来源:科学时报

计算科学是应用先进的计算能力预言和了解实际世界复杂现象演化规律的科学,它涉及数值模拟或工程仿真以及模拟所必需的高性能计算机系统、算法和应用软件等。10月7~9日在北京举行的以“我国高性能计算的发展与对策”为主题的329次香山科学会议上,与会专家指出,当今科学研究和工程应用正在向大规模、高复杂度、高微观或宏观的领域发展,这种发展趋势形成了对计算科学越来越强烈的需求。高性能计算已经成为药物设计、大气环流数值模型、数字解剖和蛋白质结构设计等各种前沿科学研究、技术开发和工程设计中必不可少的重要基石。

分子模拟和辅助药物设计是研究热点

与会专家指出,在新药研发方面,能够利用高性能计算机实现活性化合物的虚拟筛选,并从筛选的活性化合物出发进行靶点的发现与确证,以及进行生物大分子的动力学模拟来研究靶标的构象空间与作用机理。

中国科学院院士、中国科学院上海药物研究所研究员陈凯先在题为《基于生物复杂分子体系的新药物设计和分子模拟》的书面报告中介绍说,计算生物学是开发和应用数据分析及理论的方法、数学建模和计算机仿真技术并用于生物学研究的一门学科。计算生物学正在成为现代生物学研究的核心方法之一,它的重要性和复杂性在当前生物学数据量的不断增长中日益得以显示,需要回答的问题越是复杂,其重要性和复杂性就越显得尤为突出,这也使得计算生物学成为当今生命科学最具活力的新兴前沿学科之一。

陈凯先认为,分子模拟和计算机辅助药物设计是当前计算生物学研究的热点问题,也是计算生物学与生物医药产业结合最紧密的方向。目前,高性能计算在分子模拟和计算机辅助药物设计领域主要有两个方面的应用,一是通过计算机药物设计和筛选方法进行药物发现,即首先建立化合物分子的骨架库数据库,然后设计化合物组合数据库或者直接使用商业数据库,通过已经建立的计算机虚拟药物筛选技术平台,筛选出化合物结构进行类药性分析和三维定量构效关系分析,获取进一步结构优化的信息。

二是用分子动力学模拟方法进行蛋白质动态模拟。计算生物学运用大规模高效的理论模型和数值计算,直接从蛋白质序列预测蛋白质三维结构以及动力学特征,研究生物大分子结构与功能的关系、生物大分子之间相互作用以及生物大分子与配体的相互作用,促进蛋白质工程、蛋白质设计和计算机辅助药物设计的发展。通过计算生物学研究蛋白和蛋白相互间的分子识别,包括药物与多种蛋白结合,药物调控靶标信号途径的特性,可以获得正确的药物设计蛋白质构象,了解蛋白结构与功能的关系,从而提高新药的研发水平。

尚缺乏行之有效的算法

(完整版)分子生物学试题及答案(整理版)

分子生物学试题及答案 一、名词解释 1.cDNA与cccDNA:cDNA是由mRNA通过反转录酶合成的双链DNA;cccDNA是游离于染色体之外的质粒双链闭合环形DNA。 2.标准折叠单位:蛋白质二级结构单元α-螺旋与β-折叠通过各种连接多肽可以组成特殊几何排列的结构块,此种确定的折叠类型通常称为超二级结构。几乎所有的三级结构都可以用这些折叠类型,乃至他们的组合型来予以描述,因此又将其称为标准折叠单位。 3.CAP:环腺苷酸(cAMP)受体蛋白CRP(cAMP receptor protein ),cAMP与CRP结合后所形成的复合物称激活蛋白CAP(cAMP activated protein ) 4.回文序列:DNA片段上的一段所具有的反向互补序列,常是限制性酶切位点。 5.micRNA:互补干扰RNA或称反义RNA,与mRNA序列互补,可抑制mRNA的翻译。 6.核酶:具有催化活性的RNA,在RNA的剪接加工过程中起到自我催化的作用。 7.模体:蛋白质分子空间结构中存在着某些立体形状和拓扑结构颇为类似的局部区域 8.信号肽:在蛋白质合成过程中N端有15~36个氨基酸残基的肽段,引导蛋白质的跨膜。 9.弱化子:在操纵区与结构基因之间的一段可以终止转录作用的核苷酸序列。 10.魔斑:当细菌生长过程中,遇到氨基酸全面缺乏时,细菌将会产生一个应急反应,停止全部基因的表达。产生这一应急反应的信号是鸟苷四磷酸(ppGpp)和鸟苷五磷酸(pppGpp)。PpGpp与pppGpp的作用不只是一个或几个操纵子,而是影响一大批,所以称他们是超级调控子或称为魔斑。 11.上游启动子元件:是指对启动子的活性起到一种调节作用的DNA序列,-10区的TATA、-35区的TGACA 及增强子,弱化子等。 12.DNA探针:是带有标记的一段已知序列DNA,用以检测未知序列、筛选目的基因等方面广泛应用。13.SD序列:是核糖体与mRNA结合序列,对翻译起到调控作用。 14.单克隆抗体:只针对单一抗原决定簇起作用的抗体。 15.考斯质粒:是经过人工构建的一种外源DNA载体,保留噬菌体两端的COS区,与质粒连接构成。16.蓝-白斑筛选:含LacZ基因(编码β半乳糖苷酶)该酶能分解生色底物X-gal(5-溴-4-氯-3-吲哚-β-D-半乳糖苷)产生蓝色,从而使菌株变蓝。当外源DNA插入后,LacZ基因不能表达,菌株呈白色,以此来筛选重组细菌。称之为蓝-白斑筛选。 17.顺式作用元件:在DNA中一段特殊的碱基序列,对基因的表达起到调控作用的基因元件。18.Klenow酶:DNA聚合酶I大片段,只是从DNA聚合酶I全酶中去除了5’→3’外切酶活性 19.锚定PCR:用于扩增已知一端序列的目的DNA。在未知序列一端加上一段多聚dG的尾巴,然后分别用多聚dC和已知的序列作为引物进行PCR扩增。 20.融合蛋白:真核蛋白的基因与外源基因连接,同时表达翻译出的原基因蛋白与外源蛋白结合在一起所组成的蛋白质。 二、填空 1. DNA的物理图谱是DNA分子的(限制性内切酶酶解)片段的排列顺序。 2. RNA酶的剪切分为(自体催化)、(异体催化)两种类型。 3.原核生物中有三种起始因子分别是(IF-1)、(IF-2)和(IF-3)。 4.蛋白质的跨膜需要(信号肽)的引导,蛋白伴侣的作用是(辅助肽链折叠成天然构象的蛋白质)。5.启动子中的元件通常可以分为两种:(核心启动子元件)和(上游启动子元件)。 6.分子生物学的研究内容主要包含(结构分子生物学)、(基因表达与调控)、(DNA重组技术)三部分。7.证明DNA是遗传物质的两个关键性实验是(肺炎球菌感染小鼠)、( T2噬菌体感染大肠杆菌)这两个实验中主要的论点证据是:(生物体吸收的外源DNA改变了其遗传潜能)。 8.hnRNA与mRNA之间的差别主要有两点:(hnRNA在转变为mRNA的过程中经过剪接,)、 (mRNA的5′末端被加上一个m7pGppp帽子,在mRNA3′末端多了一个多聚腺苷酸(polyA)尾巴)。 9.蛋白质多亚基形式的优点是(亚基对DNA的利用来说是一种经济的方法)、(可以减少蛋白质合成过程中随机的错误对蛋白质活性的影响)、(活性能够非常有效和迅速地被打开和被关闭)。 10.蛋白质折叠机制首先成核理论的主要内容包括(成核)、(结构充实)、(最后重排)。 11.半乳糖对细菌有双重作用;一方面(可以作为碳源供细胞生长);另一方面(它又是细胞壁的成分)。所以需要一个不依赖于cAMP—CRP的启动子S2进行本底水平的永久型合成;同时需要一个依赖于cAMP—CRP的启动子S1对高水平合成进行调节。有G时转录从( S2)开始,无G时转录从( S1)开

分子生物学题库

分子生物学备选考题 名词解释: 1.功能基因组学 2.分子生物学 3.epigenetics 4.C值矛盾 5.基因簇 6.间隔基因 7.基因芯片 8.基序(Motifs) 9.CpG岛 10.染色体重建 11.Telomerase 12.足迹分析实验 13.RNA editing 14.RNA干涉(RNA interference) 15.反义RNA 16.启动子(Promoter) 17.SD序列(SD sequence) 18.碳末端结构域(carboxyl terminal domain,CTD) 19.single nucleotide polymorphism,SNP 20.切口平移(Nick translation) 21.原位杂交 22.Expressing vector 23.Multiple cloning sites 24.同源重组 25.转座 26.密码的摆动性 27.热休克蛋白嵌套基因 28.基因家族增强子 29.终止子 30.前导肽RNAi 31.分子伴侣 32.魔斑核苷酸 33.同源域 34.引物酶 35.多顺反子mRNA 36.物理图谱、 37.载体(vector) 38.位点特异性重组 39.原癌基因(oncogene) 40.重叠基因、 41.母源影响基因、

42.抑癌基因(anti-oncogene)、 43.回文序列(palindrome sequence)、 44.熔解温度(melting temperature, Tm) 45.DNA的呼吸作用(DNA respiration) 46..增色效应(hyperchromicity)、 47.C0t曲线(C0t curve)、 48.DNA的C值(C value) 49.超螺旋(superhelix) 、 50.拓扑异构酶(topoisomerase)、 51.引发酶(primase) 、 52.引发体(primosome) 53.转录激活(transcriptional activation) 54.dna基因(dna gene)、 55.从头起始(de novo initiation) 、 56.端粒(telomere) 57.酵母人工染色体(yeast artificial chromosome, YAC)、 58.SSB蛋白(single strand binding protein)、 59.复制叉(replication fork)、 60.保留复制(semiconservative replication) 61.滚环式复制(rolling circle replication)、 62.复制原点(replication origin)、 63.切口(nick) 64.居民DNA (resident DNA) 65.有义链(sense strand) 66.反义链(antisense strand) 67.操纵子(operon) 、 68.操纵基因(operator) 69.内含子(内元intron) 70.外显子(外元exon) 、 71.突变子(muton) 、 72.密码子(codon)、、 73.同义密码(synonymous codons)、 74.GC盒(GC box) 75.增强子(enhancer) 76.沉默子(silencer) 77.终止子(terminator) 78.弱化子(衰减子)(attenuator) 79.同位酶(isoschizomers) 、 80.同尾酶(isocandamers) 81.阻抑蛋白(阻遏蛋白)(repressor) 82.诱导物(inducer)、 83.CTD尾(carboxyl-terminal domain ) 84.载体(vector)、 85.转化体(transformant)

关于分子生物学试题及答案

分子生物学试题(一) 一.填空题(,每题1分,共20分) 一.填空题(每题选一个最佳答案,每题1分,共20分) 1. DNA的物理图谱是DNA分子的()片段的排列顺序。 2. 核酶按底物可划分为()、()两种类型。 3.原核生物中有三种起始因子分别是()、()和()。 4.蛋白质的跨膜需要()的引导,蛋白伴侣的作用是()。5.真核生物启动子中的元件通常可以分为两种:()和()。6.分子生物学的研究内容主要包含()、()、()三部分。 7.证明DNA是遗传物质的两个关键性实验是()、()。 8.hnRNA与mRNA之间的差别主要有两点:()、()。 9.蛋白质多亚基形式的优点是()、()、()。 10.蛋白质折叠机制首先成核理论的主要内容包括(成核)、(结构充实)、(最后重排)。 11.半乳糖对细菌有双重作用;一方面(可以作为碳源供细胞生长);另一方面(它又是细胞壁的成分)。所以需要一个不依赖于cAMP-CRP的启动子S2进行本底水平的永久型合成;同时需要一个依赖于cAMP-CRP的启动子S1对高水平合成进行调节。有G时转录从(S2 )开始,无G时转录从(S1 )开始。 12.DNA重组技术也称为(基因克隆)或(分子克隆)。最终目的是(把一个生物体中的遗传信息DNA转入另一个生物体)。典型的DNA重组实验通常包含以下几个步骤: ①提取供体生物的目的基因(或称外源基因),酶接连接到另一DNA分子上(克隆载体),形一个新的重组DNA分子。 ②将这个重组DNA分子转入受体细胞并在受体细胞中复制保存,这个过程称为转化。 ③对那些吸收了重组DNA的受体细胞进行筛选和鉴定。 ④对含有重组DNA的细胞进行大量培养,检测外援基因是否表达。 13、质粒的复制类型有两种:受到宿主细胞蛋白质合成的严格控制的称为(严紧型质粒),不受宿主细胞蛋白质合成的严格控制称为(松弛型质粒)。 14.PCR的反应体系要具有以下条件: a、被分离的目的基因两条链各一端序列相互补的 DNA引物(约20个碱基左右)。 b、具有热稳定性的酶如:TagDNA聚合酶。 c、dNTP d、作为模板的目的DNA序列 15.PCR的基本反应过程包括:(变性)、(退火)、(延伸)三个阶段。 16、转基因动物的基本过程通常包括: ①将克隆的外源基因导入到一个受精卵或胚胎干细胞的细胞核中; ②接种后的受精卵或胚胎干细胞移植到雌性的子宫;

分子生物学试题库

第2章染色体与DNA 名词解释 原癌基因:细胞内与细胞增殖相关的正常基因,是维持机体正常生命活动所必须的,在进化上高等保守。当原癌基因的结构或调控区发生变异,基因产物增多或活性增强时,使细胞过度增殖,从而形成肿瘤。 复制:以亲代DNA或RNA为模板,根据碱基配对的原则,在一系列酶的作用下,生成与亲代相同的子代DNA或RNA的过程。 转座子 (transposon 或 transposable element):位于染色体DNA上可自主复制和位移的基本单位。包括插入序列和复合转座子。 半保留复制:以亲代DNA双链为模板以碱基互补方式合成子代DNA,这样新形成的子代DNA 中,一条链来自亲代DNA,而另一条链则是新合成的,这种复制方式叫半保留复制。 染色体:染色体是遗传信息的载体,由DNA、RNA和蛋白质构成,其形态和数目具有种系的特性。在细胞间期核中,以染色质形式存在。在细胞分裂时,染色质丝经过螺旋化、折叠、包装成为染色体,为显微镜下可见的具不同形状的小体。 核小体:是构成真核生物染色体的基本单位,是DNA和蛋白质构成的紧密结构形式,包括200bp左右的DNA和9个组蛋白分子构成的致密结构。 填空题 1.真核细胞核小体的组成是 DNA和蛋白 2.天然染色体末端不能与其他染色体断裂片段发生连接,这是因为天然染色体末端存在端粒结构。 3.在聚合酶链反应中,除了需要模板DNA外,还需加入引物、DNA聚合酶、dNTP和镁离子。 4.引起DNA损伤的因素有自发因素、物理因素、化学因素。 5.DNA复制时与DNA解链有关的酶和蛋白质有拓扑异构酶Ⅱ、解螺旋酶、单链DNA结合蛋白。 6.参与DNA切除修复的酶有DNA聚合酶Ⅰ、DNA连接酶、特异的核酸内切酶。 7.在真核生物中DNA复制的主要酶是DNA聚合酶δ。在原核生物中是DNA聚合酶Ⅲ。 8.端粒酶是端粒酶是含一段RNA的逆转录酶。 9.DNA的修复方式有错配修复、碱基切除修复、核苷酸切除修复、DNA的直接修复。 选择题 1.真核生物复制起点的特征包括(B) A. 富含G-C区 B. 富含A-T区 C. Z-DNA D. 无明显特征 2.插入序列(IS)编码(A) A.转座酶 B.逆转录酶 C. DNA合成酶 D.核糖核酸酶 3.紫外线照射对DNA分子的损伤主要是(D) A.碱基替换 B.磷酸脂键断裂 C。碱基丢失 D.形成共价连接的嘧啶二聚体 4.自然界中以DNA为遗传物质的大多数生物DNA的复制方式(C) A.环式 B.D环式 C.半保留 D.全保留 5.原核生物基因组中没有(A) A.内含子 B.外显子 C.转录因子 D.插入序列 6.关于组蛋白下列说法正确的是(D)

分子生物学地研究及发展

分子生物学的应用及发展 摘要:本文在文献检索的基础上,对分子生物学的发展简史,基本原理,研究领域等作了简单介绍,阐述了分子生物学在人们日常生活中的应用并结合药学专业着重讨论了其在药学及中药开发发面的应用,并进一步对分子生物学未来的研究技术、方向和前景做了展望。 一前言 生物以能够复制自己而区别于非生物。生命现象最基本的特征是进行“自我更新”。进行“自我更新”体现了一种最高级和最复杂的运动状态。这种运动就是生物机体从环境中摄取物质和能量,以更新本身的物质组成,而山现生长、繁殖,在这样的过程中保证了将自身的特征传给历代;同时也不断地向环境输送一些物质和释放能量。在生物机体的组成物质中,防水分外,有各种无机盐类和各种有机化合物。其中生物大分子——核酸和蛋白质在进行自我更新运动中,以其功能的重要性占第一位。为探索生命现象的本质问题,产生了分子生物学这一学科[1]。 分子生物学(molecular biology)是从分子水平研究生命本质为目的的一门新兴边缘学科,它是研究核酸、蛋白质等生物大分子的形态、结构特征及其重要性、规律性和相互关系的科学,是当前生命科学中发展最快并正在与其它学科广泛交叉与渗透的重要前沿领域[2]。 分子生物学的最终目标是远大的,从产生基本细胞行为类型的各种分子的角度,来理解这五类行为类型:生长、分裂、分化、运动和相互作用。即分子生物学力图完整地描述细胞大分子的结构、功能和相互联系,从而理解细胞为什么要采取这种方式[3]。 分子生物学作为一门新兴的边缘学科。它的迅速发展及其在整个生命科学领域的广泛渗透和应用,促使人们对生物学等生命科学的认识从细胞水平进入分子水平。在农业、畜牧、林业、微生物学等领域发展十分迅速,如转基因动植物等。在医学领域,为医学诊断、治疗及新的疫苗、新药物研制等开辟了新的途径,使医学科学中原有的学科发生分化组合,医学分子生物学等新的学科分支不断产生,使医学科学发生了深刻的变革,不认识到这一点就很难跟上科学发展的步伐。 分子生物学的发展为人类认识生命现象带来了前所未有的机会,也为人类利用和改造生物创造了极为广阔的前景。 二分子生物学发展简史 分子生物学的发展大致可分为三个阶段[4-7]:

分子生物学复习题(有详细答案)

绪论 思考题:(P9) 1.从广义和狭义上写出分子生物学的定义? 广义上讲的分子生物学包括对蛋白质和核酸等生物大分子结构与功能的研究,以及从分子水平上阐明生命的现象和生物学规律。 狭义的概念,即将分子生物学的范畴偏重于核酸(基因)的分子生物学,主要研究基因或DNA结构与功能、复制、转录、表达和调节控制等过程。其中也涉及与这些过程相关的蛋白质和酶的结构与功能的研究。 2、现代分子生物学研究的主要内容有哪几个方面?什么是反向生物学?什么是 后基因组时代? 研究内容: DNA的复制、转录和翻译;基因表达调控的研究;DNA重组技术和结构分子生物学。 反向生物学:是指利用重组DNA技术和离体定向诱变的方法研究已知结构的基因相应的功能,在体外使基因突变,再导入体内,检测突变的遗传效应,即以表型来探索基因结构。 后基因组时代:研究细胞全部基因的表达图式和全部蛋白质图式,人类基因组研究由结构向功能转移。 3、写出三个分子生物写学展的主要大事件(年代、发明者、简要内容) 1953年Watson和Click发表了?脱氧核糖核苷酸的结构?的著名论文,提出了DNA的双螺旋结构模型。 1972~1973年,重组DNA时代的到来。H.Boyer和P.Berg等发展了重组DNA 技术,并完成了第一个细菌基因的克隆,开创了基因工程新纪元。 1990~2003年美、日、英、法、俄、中六国完成人类基因组计划。解读人类遗传密码。 4、21世纪分子生物学的发展趋势是怎样的? 随着基因组计划的完成,人类已经掌握了模式生物的所有遗传密码。又迎来了后基因组时代,人类基因组的研究重点由结构向功能转移。相关学说理论相应诞生,如功能基因组学、蛋白质组学和生物信息学。生命科学又进入了一个全新的时代。 第四章 思考题:(P130) 1、基因的概念如何?基因的研究分为几个发展阶段? 概念:基因是原核、真核生物以及病毒的DNA和RNA分子中具有遗传效应的核苷酸序列,是遗传的基本单位和突变单位以及控制形状的功能单位。 发展阶段:○120世纪50年代以前,主要从细胞的染色体水平上进行研究,属于基因的染色体遗传学阶段。 ○220世纪50年代以后,主要从DNA大分子水平上进行研究,属于分

分子生物学zuq题库

问答题: 1 衰老与基因的结构与功能的变化有关,涉及到:(1)生长停滞;(2)端粒缩短现象;(3)DNA损伤的累积与修复能力减退;(4)基因调控能力减退。 2 超螺旋的生物学意义:(1)超螺旋的DNA比松驰型DNA更紧密,使DNA分子体积变得更小,对其在细胞的包装过程更为有利;(2)超螺旋能影响双螺旋的解链程序,因而影响DNA分子与其它分子(如酶、蛋白质)之间的相互作用。 3 原核与真核生物学mRNA的区别: 原核:(1)往往是多顺反子的,即每分子mRNA带有几种蛋白质的遗传信息(来自几个结构基因)。(2)5端无帽子结构,3端一般无多聚A尾巴。(3)一般没有修饰碱基,即这类mRNA分子链完全不被修饰。 真核:(1)5端有帽子结构(2)3端绝大多数均带有多聚腺苷酸尾巴,其长度为20-200个腺苷酸。(3)分子中可能有修饰碱基,主要有甲基化,(4)分子中有编码区与非编码区。 4 tRNA的共同特征: (!)单链小分子,含73-93个核苷酸。(2)含有很多稀有碱基或修饰碱基。(3)5端总是磷酸化,5末端核苷酸往往是pG。(4)3端是CPCPAOH序列。(5)分子中约半数的碱基通过链内碱基配对互相结合,开成双螺旋,从而构成其二级结构,开头类似三叶草。(6)三级结构是倒L型。 5 核酶分类:(1)异体催化的剪切型,如RNaseP;(2)自体催化的剪切型,如植物类病毒等;(3)内含子的自我剪接型,如四膜虫大核26SrRNA前体。 6 hnRNA变成有活性的成熟的mRNA的加工过程: (1)5端加帽;(2)3端加尾(3)内含子的切除和外显子的拼接;(4)分子内部的甲基化修饰作用,(5)核苷酸序列的编辑作用。 7 反义RNA及其功能: 碱基序列正好与有意义mRNA互补的RNA称为反意义或反义RNA,又称调节RNA,这类RNA是单链RNA,可与mRNA配对结合形成双链,最终抑制mRNA作为模板进行翻译。这是其主要调控功能,还可作为DNA复制的抑制因子,与引物RNA互补结合抑制DNA的复制,以及在转录水平上与mRNA5末端互补,阻止RNA合成转录。 8 病毒基因组分型:(1)双链DNA(2)单链正股DNA(3)双链RNA(4)单链负股RNA(5)单链正股RNA 9 病毒基因组结构与功能的特点: (1)不同病毒基因组大小相差较大;(2)不同病毒的基因组可以是不同结构的核酸。(3)病毒基因组有连续的也有不连续的;(4)病毒基因组的编码序列大于90%;(5)单倍体基因组,(6)基因有连续的和间断的,(7)相关基因丛集;(8)基因重叠(9)病毒基因组含有不规则结构基因,主要类型有:a几个结构基因的编码区无间隔;bmRNA没有5端的帽结构;c结构基因本身没有翻译起始序列。 10 原核生物基因组的结构的功能特点: (1)基因组通常仅由一条环状双链DNA分子组成。 (2)基因组中只有1个复制起点。 (3)具有操纵子结构。(4)编码顺序一般不会重叠。(5)基因是连续的,无内含子,因此转录后不需要剪切。(6)编码区在基因组中所占的比例(约占50%)远远大于真核基因组,但又远远小于病毒基因组。(7)基因组中重复序列很少(8)具有编码同工酶的基因。(9)细菌基因组中存在着可移动的DNA序列,包括插入序列和转座子。 (10)在DNA分子中具有多种功能的识别区域。 11??真核生物基因组结构与功能的特点:

最新现代分子生物学试题库

核酸结构与功能 一、填空题 1.病毒ΦX174及M13的遗传物质都是单链DNA 。 2.AIDS病毒的遗传物质是单链RNA。 3.X射线分析证明一个完整的DNA螺旋延伸长度为 3.4nm 。 4.氢键负责维持A-T间(或G-C间)的亲和力 5.天然存在的DNA分子形式为右手B型螺旋。 二、选择题(单选或多选) 1.证明DNA是遗传物质的两个关键性实验是:肺炎球菌在老鼠体内的毒性和T2噬菌体感染大肠杆菌。 这两个实验中主要的论点证据是(C )。 A.从被感染的生物体内重新分离得到DNA作为疾病的致病剂 B.DNA突变导致毒性丧失 C.生物体吸收的外源DNA(而并非蛋白质)改变了其遗传潜能 D.DNA是不能在生物体间转移的,因此它一定是一种非常保守的分子 E.真核心生物、原核生物、病毒的DNA能相互混合并彼此替代 2.1953年Watson和Crick提出( A )。 A.多核苷酸DNA链通过氢键连接成一个双螺旋 B.DNA的复制是半保留的,常常形成亲本-子代双螺旋杂合链 C.三个连续的核苷酸代表一个遗传密码 D.遗传物质通常是DNA而非RNA E.分离到回复突变体证明这一突变并非是一个缺失突变 3.DNA双螺旋的解链或变性打断了互补碱基间的氢键,并因此改变了它们的光吸收特性。以下哪些是对DNA的解链温度的正确描述?( CD ) A.哺乳动物DNA约为45℃,因此发烧时体温高于42℃是十分危险的 B.依赖于A-T含量,因为A-T含量越高则双链分开所需要的能量越少 C.是双链DNA中两条单链分开过程中温度变化范围的中间值 D.可通过碱基在260nm的特征吸收峰的改变来确定 E.就是单链发生断裂(磷酸二酯键断裂)时的温度 4.DNA的变性(ACE )。A.包括双螺旋的解链 B.可以由低温产生C.是可逆的D.是磷酸二酯键的断裂E.包括氢键的断裂 5.在类似RNA这样的单链核酸所表现出的“二级结构”中,发夹结构的形成(AD )。 A.基于各个片段间的互补,形成反向平行双螺旋 B.依赖于A-U含量,因为形成的氢键越少则发生碱基配对所需的能量也越少 C.仅仅当两配对区段中所有的碱基均互补时才会发生 D.同样包括有像G-U这样的不规则碱基配对 E.允许存在几个只有提供过量的自由能才能形成碱基对的碱基 6.DNA分子中的超螺旋(ACE )。

(完整版)分子生物学》试题及答案

《分子生物学》考试试题B 课程号:66000360 考试方式:闭卷 考试时间: 一、名词解释(共10题,每题2分,共20分) 1. SD 序列 2. 重叠基因 3.ρ因子 4.hnRNA 5. 冈崎片段、 6. 复制叉(replication fork) 7. 反密码子(anticodon): 8. 同功tRNA 9. 模板链(template strand) 10. 抑癌基因 二、填空题(共20空,每空1分,共20分) 1.原核基因启动子上游有三个短的保守序列,它们分别为____和__区. 2.复合转座子有三个主要的结构域分别为______、______、________。 3.原核生物的核糖体由_____小亚基和_____大亚基组成,真核生物核糖糖体由_____小亚基和_______大亚基组成。 4.生物界共有___个密码子,其中__ 个为氨基酸编码,起始密码子为__ _______;终止密码子为_______、__________、____________。 5. DNA生物合成的方向是_______,冈奇片段合成方向是_______。 6.在细菌细胞中,独立于染色体之外的遗传因子叫_______。它是一

种_______状双链DNA,在基因工程中,它做为_______。 三.判断题(共5题,每题2分,共10分) 1.原核生物DNA的合成是单点起始,真核生物为多点起始。( ) 2.在DNA生物合成中,半保留复制与半不连续复制指相同概念。( ) 3.大肠杆菌核糖体大亚基必须在小亚基存在时才能与mRNA结合。( ) 4.密码子在mRNA上的阅读方向为5’→ 3’。( ) 5.DNA复制时,前导链的合成方向为5’→ 3’,后随链的合成方向也是5’→ 3’。() 四、简答题(共6题,每题5分,共30分) 1.简述三种RNA在蛋白质生物合成中的作用。 2.蛋白质合成后的加工修饰有哪些内容? 3.简述人类基因组计划的主要任务。 4.简述现代分子生物学的四大研究热点。 5.何谓转座子?简述简单转座子发生转座作用的机理。 6.简述大肠杆菌乳糖操纵子与色氨酸操纵子在阻遏调控机制上有那些区别? 四、问答题(共2题,共20分) 1.叙述蛋白质生物合成的主要过程。(10分) 2.请叙述真核基因的表达调控主要发生在那些环节?分别是怎样进行 的?(10分)

分子生物学题(含答案)

1.哪些因素引起DNA的突变?简要叙述生物体存在的修复方式。 突变引起的物理因素:辐射、紫外线等,化学因素:聚乙二醇,致癌物质等,生物因素:仙台病毒等。 修复方式:错配修复恢复错配 切除修复(碱基、核苷酸)切除突变的碱基和核苷酸片段 重组修复复制后的修复,重新启动停滞的复制叉 DNA直接修复修复嘧啶二体或甲基化DNA SOS系统DNA的修复,导致变异 2.描述乳糖操纵子的调控机制。(看不懂题目,乱写的) 乳糖操纵子的调控属于可诱导调节。在以乳糖为碳源的培养基中,在单个透过酶分子的作用下,少量乳糖分子进入细胞,又在单个β-半乳糖苷酶分子作用下转变成异构乳糖。某个异构乳糖与结合在操纵区上的阻遏物结合后使后者失活离开操纵区,开始了lac mRNA的生物合成。Lac mRNA翻译后生成大量的透过酶和β-半乳糖苷酶,加速了乳糖分子的转变。当乳糖分子都被消耗完毕时,阻遏物仍在不断被合成,有活性的阻遏物浓度超过了异构乳糖浓度,使细胞重新建立起阻遏状态,导致lac mRNA合成被抑制。mRNA半衰期短,不到一个世代生长期,mRNA几乎从细胞消失,透过酶和β-半乳糖苷酶的合成也趋于停止。 3.简述DNA半保留复制的概念。 每个子代分子的一条链来自亲代DNA,另一条链则是新合成的,这种复制方式被称为DNA的半保留复制。 4.对生物体转录和复制的特征进行说明比较?(网上找的) DNA复制和RNA转录在原理上是基本一致的,体现在:①这两种合成的直接前体是核苷三磷酸,从它的一个焦磷酸键获得能量促使反应走向合成;②两种合成都需要RNA聚合酶和四种核苷酸;③两种合成都是以DNA为模板;④合成前都必须将双链DNA解旋成单链;⑤合成的方向都是5’→ 3’。 DNA复制和RNA转录的不同点体现在:①复制和转录所用的酶是不同的,复制用的是DNA聚合酶,而转录用的是RNA聚合酶;②所用前体核苷三磷酸种类不同,DNA复制用四种脱氧核糖核苷三磷酸,即dA TP、dGTP、dCTP、dTTP,而RNA转录用四种核糖核苷三磷酸,即A TP、GTP、CrP、UTP做前体底物;③在DNA复制时是A与T配对,而RNA转录是A与U配对;④DNA复制时两条链均做模板,而RNA转录时只以其中一条链为模板;⑤DNA复制是半不连续的,可产生冈崎片段,而RNA转录是连续的;⑥DNA复制时需RNA做引物,而RNA转录无需引物;⑦DNA复制时需连接酶的参与,而RNA 转录时不需要。 5.阐述蛋白质生物合成途径 氨基酸的活化→翻译的起始(核糖体结合mRNA且甲硫氨酰-tRNA*结合到核糖体)→肽链的延伸(后续AA-tRNA与核糖体的结合,肽键生成,移位)→肽链终止→蛋白质前体加工→蛋白质的折叠 6.简要叙述真核生物mRNA的转录后加工的方式,这些加工方式各有何意义 RNA的编辑:某些RNA,特别是mRNA前体的一种加工方式,如插入、删除或取代一些核苷酸残基,导致DNA所编码的遗传信息的改变。因为经过编辑的mRNA序列发生了不同于模板DNA的变化。 生物学意义:校正作用有些基因突变在突变过程中丢失的遗传信息可能通过RNA的编辑得以回复

分子生物学题库

一.单选题 1. 有关DNA链的描述哪条不对 B A. DNA是由很多脱氧单核苷酸形成的多核苷酸 B. DNA5’端是-OH基,3’端是磷酸 C. 单核苷酸之间通过磷酸二酯键相连 D. DNA的一级结构是指dAMP,dGMP,dCMP,dTMP的排列 2 多核糖体中每一核糖体是 C A 呈解离状态 B 合成一种多肽链 C 合成多种多肽链 D 由mRNA3′端向5′移动 3 识别转录起始点的是 D A ρ因子 B 核心酶 C 聚合酶α亚基 D σ因子 4 真核生物中tRNA和5S rRNA的转录由下列哪一种酶催化 D A RNA聚合酶Ⅰ B 逆转录酶 C RNA聚合酶Ⅱ D RNA聚合酶Ⅲ 5 AUC为异亮氨酸的遗传密码,在tRNA中其相应的反密码应为 C A UAG

B TAG C GAU D GAT 6 原核生物中DNA指导的RNA聚合酶由数个亚单位组成,其核心酶的组成是 A A α 2ββ′ B α 2ββ′σ C α 2β′σ D α 2βσ E αββ′ 7 真核生物转录生成的mRNA前体的加工过程不包括 C A 5′末端加帽 B 3′末端加多聚A尾 C 磷酸化修饰 D 剪接去除内含子并连接外显子 8 转录与复制有许多相似之处,但不包括 D A 均以DNA为模板 B 所产生的新链,核苷酸之间的连接键均为磷酸二酯键 C 所用的酶均为依赖DNA的聚合酶 D 可同时合成两条互补链 E 在转录和复制过程中,遵循碱基配对的原则 9 RNA聚合酶Ⅱ催化生成之产物是A A mRNA

B tRNA及5SrRNA C 18S,28S,5.8S及5SrRNA D 18S,28S,及5.8SrRNA 10 操纵子的基因表达调节系统属于B A 复制水平调节 B 转录水平调节 C 翻译水平调节 D 翻译后水平调节 11 乳糖、阿拉伯糖、色氨酸等小分子物质在基因表达调控中作用的共同特点是 D A 与启动子结合 B 与DNA结合影响模板活性 C 与RNA聚合酶结合影响其活性 D 与蛋白质结合影响该蛋白质结合DNA E 与操纵基因结合 12 有关理想质粒载体的特点,正确的是 B A 为线性单链DNA B 含有多种限制酶的单一切点 C 含有同一限制酶的多个切点 D 其复制受宿主控制 13 以下关于顺式作用元件的叙述哪项是错误的 D

分子生物学试题库完整版

分子生物学试题库 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】

第2章染色体与DNA 名词解释 原癌基因:细胞内与细胞增殖相关的正常基因,是维持机体正常生命活动所必须的,在进化上高等保守。当原癌基因的结构或调控区发生变异,基因产物增多或活性增强时,使细胞过度增殖,从而形成肿瘤。 半保留复制:以亲代DNA双链为模板以碱基互补方式合成子代DNA,这样新形成的子代DNA中,一条链来自亲代DNA,而另一条链则是新合成的,这种复制方式叫半保留复制。 填空题 3.在聚合酶链反应中,除了需要模板DNA外,还需加入引物、DNA聚合酶、dNTP和镁离子。 4.引起DNA损伤的因素有自发因素、物理因素、化学因素。 5.DNA复制时与DNA解链有关的酶和蛋白质有拓扑异构酶Ⅱ、解螺旋酶、单链DNA结合蛋白。 6.参与DNA切除修复的酶有DNA聚合酶Ⅰ、DNA连接酶、特异的核酸内切酶。 7.在真核生物中DNA复制的主要酶是DNA聚合酶δ。在原核生物中是DNA聚合酶Ⅲ。 8.端粒酶是端粒酶是含一段RNA的逆转录酶。 9.DNA的修复方式有错配修复、碱基切除修复、核苷酸切除修复、DNA的直接修复。 简述DNA复制的过程 DNA的复制过程可被分为3个阶段,即复制的起始、延伸和终止。每个DNA复制的独立单元主要包括复制起始位点和终止位点。

DNA复制的起始包括预引发和引发两个阶段。在预引发阶段,DNA解旋解链,形成复制叉,引发体组装;在引发阶段,在引发酶的催化下以DNA链为模板合成一段短的RNA 引物。复制时DNA链的延伸由DNA聚合酶催化,以亲代DNA链为模板,引发体移动,从5′→3′方向聚合子代DNA链。当子链延伸到达终止位点是,DNA复制就终止了,切除RNA引物,填补缺口,在DNA连接酶的催化下将相邻的冈崎片段连接起来形成完整的DNA 长链。 试述真原核生物的DNA复制的特点的不同之处 ①真核生物染色体有多个复制起点,多复制眼,呈双向复制,多复制子。原核生物的染色体只有一个复制起点,单复制子也呈双向复制。 ②真核生物冈崎片段长约200bp比原核生物略短。真核生物DNA复制速度比原核慢,速度为1000~3000bp/min(仅为原核生物的1/20~1/50)。 ③真核生物复制的终止在端粒处,原核生物的复制叉相遇时即终止。 ④真核生物染色体在全部复制完之前起点不再重新开始复制;而在快速生长的原核生物染色体DNA复制中,起点可以连续发动复制。真核生物快速生长时,往往采用更多的复制起点。 ⑤真核生物有多种DNA聚合酶,DNA聚合酶δ是真正的复制酶,在PCNA存在下有持续的合成能力。PCNA称为增殖细胞核抗原,相当于大肠杆菌DNA聚合酶Ⅲ的β-夹子,RFC蛋白相当于夹子装配器。 原核生物的DNA聚合酶有三种DNA聚合酶ⅢDNA的真正复制酶:多亚基酶,含十种亚基,该酶DNA合成的持续能力强。 ⑥真核生物线性染色体两端有端粒结构,它是由许多成串的重短复序列组成,端粒功能是稳定染色体末段结构,防止染色体间的末端连接,并可补偿滞后链5’-末段在消除RNA引物后造成的空缺,使染色体保持一定长度。端粒酶是含一段RNA的逆转录酶。

分子生物学试题及答案(20200524090730)

生命科学系本科2010-2011学年第1学期试题分子生物学(A)答案及评分标准 一、选择题,选择一个最佳答案(每小题1分,共15分) 1、1953年Watson和Crick提出( A ) A、多核苷酸DNA链通过氢键连接成一个双螺旋 B、DNA的复制是半保留的,常常形成亲本——子代双螺旋杂合链 C、三个连续的核苷酸代表一个遗传密码 D、遗传物质通常是DNA而非RNA 2、基因组是( D ) A、一个生物体内所有基因的分子总量 B、一个二倍体细胞中的染色体数 C、遗传单位 D、生物体的一个特定细胞内所有基因的分子总量 3、下面关于DNA复制的说法正确的是( D ) A、按全保留机制进行 B、按3'→5'方向进行 C、需要4种NTP加入 D、需要DNA聚合酶的作用 4、当过量的RNA与限量的DNA杂交时( A ) A、所有的DNA均杂交 B、所有的RNA均杂交 C、50%的DNA杂交 D、50%的RNA杂交 5、以下有关大肠杆菌转录的叙述,哪一个是正确的?( B ) A、-35区和-10区序列间的间隔序列是保守的 B、-35区和-10区序列距离对转录效率非常重要 C、转录起始位点后的序列对于转录效率不重要 D、-10区序列通常正好位于转录起始位点上游10bp处 6、真核生物mRNA转录后加工不包括( A ) A、加CCA—OH B、5'端“帽子”结构 C、3'端poly(A)尾巴 D、内含子的剪接 7、翻译后的加工过程不包括( C ) A、N端fMet或Met的切除 B、二硫键的形成 C、3'末端加poly(A)尾 D、特定氨基酸的修饰

— 8、有关肽链合成的终止,错误的是( C ) A、释放因子RF具有GTP酶活性 B、真核细胞中只有一个终止因子 C、只要有RF因子存在,蛋白质的合成就会自动终止 D、细菌细胞内存在3种不同的终止因子:RF1、RF2、RF3 9、酵母双杂交体系被用来研究( C ) A、哺乳动物功能基因的表型分析 B、酵母细胞的功能基因 C、蛋白质的相互作用 D、基因的表达调控 10、用于分子生物学和基因工程研究的载体必须具备两个条件( B ) A、含有复制原点,抗性选择基因 B、含有复制原点,合适的酶切位点 C、抗性基因,合适的酶切位点 11、原核生物基因表达调控的意义是( D ) A、调节生长与分化 B、调节发育与分化 C、调节生长、发育与分化 D、调节代谢,适应环境 E、维持细胞特性和调节生长 12、乳糖、色氨酸等小分子物质在基因表达调控中作用的共同特点是( E ) A、与DNA结合影响模板活性 B、与启动子结合 C、与操纵基因结合 D、与RNA聚合酶结合影响其活性 E、与蛋白质结合影响该蛋白质结合DNA 13、Lac阻遏蛋白由( D )编码 A、Z基因 B、Y基因 C、A基因 D、I基因 14、紫外线照射引起DNA损伤时,细菌DNA修复酶基因表达反应性增强,这种现象称为( A ) A、诱导 B、阻遏 C、正反馈 D、负反馈 15、ppGpp在何种情况下被合成?( A ) A、细菌缺乏氮源时 B、细菌缺乏碳源时 C、细菌在环境温度太高时 D、细菌在环境温度太低时 E、细菌在环境中氨基酸含量过高时

分子生物学试题及答案

生命科学系本科2010-2011 学年第1 学期试题分子生物学( A )答案及评分标准 一、选择题,选择一个最佳答案(每小题 1 分,共15分) 1、1953 年Watson和Crick 提出(A ) A、多核苷酸DNA链通过氢键连接成一个双螺旋 B、D NA 的复制是半保留的,常常形成亲本——子代双螺旋杂合链 C、三个连续的核苷酸代表一个遗传密码 D、遗传物质通常是DNA而非RNA 2、基因组是(D ) A、一个生物体内所有基因的分子总量 B、一个二倍体细胞中的染色体数 C、遗传单位 D、生物体的一个特定细胞内所有基因的分子总量 3、下面关于DNA 复制的说法正确的是(D ) A、按全保留机制进行 B、按3Z V方向进行 C、需要4种NTP加入 D、需要DNA聚合酶的作用 4、当过量的RNA 与限量的DNA 杂交时(A ) A、所有的DNA均杂交 B、所有的RNA均杂交 C、50%的DNA 杂交 D、50%的RNA 杂交 5、以下有关大肠杆菌转录的叙述,哪一个是正确的?( B ) A、-35 区和-10区序列间的间隔序列是保守的 B、-35 区和-10区序列距离对转录效率非常重要 C、转录起始位点后的序列对于转录效率不重要 D、-10区序列通常正好位于转录起始位点上游1Obp处 6、真核生物mRNA 转录后加工不包括(A ) A、加CCA—OH B、5,端帽子”结构 C、3,端poly (A)尾巴 D、内含子的剪接 7、翻译后的加工过程不包括( C ) A、N端fMet或Met的切除 B、二硫键的形成 C、3,末端加poly (A )尾 D、特定氨基酸的修饰

8、有关肽链合成的终止,错误的是(C ) A、释放因子RF具有GTP酶活性 B、真核细胞中只有一个终止因子 C、只要有RF因子存在,蛋白质的合成就会自动终止 D、细菌细胞内存在3种不同的终止因子:RF1、RF2、RF3 9、酵母双杂交体系被用来研究(C) A、哺乳动物功能基因的表型分析 B、酵母细胞的功能基因 C、蛋白质的相互作用 D、基因的表达调控 10、用于分子生物学和基因工程研究的载体必须具备两个条件(B) A、含有复制原点,抗性选择基因 B、含有复制原点,合适的酶切位点 C、抗性基因,合适的酶切位点 11、原核生物基因表达调控的意义是(D) A、调节生长与分化 B、调节发育与分化 C、调节生长、发育与分化 D、调节代谢,适应环境 E、维持细胞特性和调节生长 12、乳糖、色氨酸等小分子物质在基因表达调控中作用的共同特点是(E) A、与DNA结合影响模板活性 B、与启动子结合 C、与操纵基因结合 D、与RNA聚合酶结合影响其活性 E、与蛋白质结合影响该蛋白质结合DNA 13、Lac阻遏蛋白由(D )编码 A、Z基因 B、Y基因 C、A基因 D、I基因 14、紫外线照射引起DNA损伤时,细菌DNA修复酶基因表达反应性增强,这种现象称为(A) A、诱导 B、阻遏 C、正反馈 D、负反馈 15、ppGpp在何种情况下被合成?(A) A、细菌缺乏氮源时 B、细菌缺乏碳源时 C、细菌在环境温度太高时 D、细菌在环境温度太低时 E、细菌在环境中氨基酸含量过高时 、填空题(每空1分,共10 分)

完整版分子生物学期末复习试题及答案

一、名词解释 二、分子生物学:包括对蛋白质和核酸等生物大分子的结构与功能,以及从分子水平研究生命活动 RNA组学:RNA组学研究细胞中sn mRNA啲种类、结构和 功能。同一生物体内不同种类的细胞、同一细胞在不同时间、不同状态下sn mRNA啲表达具有时间和空间特异性。增色效应:DNA变性时其溶液OD260曽高的现象。 减色效应:DNA复性时其溶液OD260笔低的现象。 Tm:变性是在一个相当窄的温度范围内完成,在这一范围内,紫外光吸收值达到最大值的50%寸的温度称为DNA的解链温度,又称融解温度(melting temperature, Tm) 。其大小与G+C含量成正比。 解链曲线:如果在连续加热DNA的过程中以温度对A260 (absorbanee , A, A260代表溶液在260nm处的吸光率) 值作图,所得的曲线称为解链曲线。 DNA复性:在适当条件下,变性DNA的两条互补链可恢复天然的双螺旋构象,这一现象称为复性。 核酸分子杂交:在DNA变性后的复性过程中,如果将不同种类的DNA单链分子或RNA分子放在同一溶液中,只要两种单链分子之间存在着一定程度的碱基配对关系,在适宜的条件(温度及离子强度) 下,就可以在不同的分子间形成杂化双链,这种现象称为核酸分子杂交。 基因:广义是指原核生物、真核生物以及病毒的DNA和RNA分子中具有遗传效应的核苷酸序列,是遗传的基本单位。狭义指能产生一个特定蛋白质的DNA序列。 断裂基因:不连续的基因称为断裂基因,指基因的编码序列在DNA上不连续排列而被不编码的序列所隔开。 重叠基因:核苷酸序列彼此重叠的2个基因为重叠基因,或称嵌套基因。 致死基因:删除后可导致机体死亡的基因。 基因冗余:由于一基因在个体中有若干份拷贝,当删除其中一个时,个体的表型不发生明显变化。 DNA重组:DNA分子内或分子间发生遗传信息的重新组合, 又称为遗传重组或基因重排。 同源重组:发生在同源序列间的重组称为同源重组,又称基本重组。 接合作用:当细胞与细胞、或细菌通过菌毛相互接触时,质粒DNA从一个细胞(细菌)转移至另一细胞(细菌)的DNA转移称为接合作用(conjugatio n)。 转化作用:通过自动获取或人为地供给外源DNA使细胞或培养的受体细胞获得新的遗传表型,称为转化作用(transformation) 。 转导作用:当病毒从被感染的(供体)细胞释放出来、再次感染另一 (供体) 细胞时,发生在供体细胞与受体细胞之间的DNA转移及基因重组即为转导作用位点特异重组:位点特异重组(site-specific recombi natio n) 是由整合酶催化,在两个DNA序列的特异位点间发生的整合。 12-23规则:重组发生在间隔为12bp到23bp的不同信号序列之间,称为12-23 规则。 转座子: ( transposon )在基因中可以移动的一段DNA 序列。 转座:由插入序列和转座子介导的基因移位或重排称为转座(transposition) 。 克隆:来自同一始祖的相同副本或拷贝的集合。 DNA克隆:应用酶学的方法,在体外将各种来源的遗传物质(同源的或异源的、原核的或真核的、天然的或人工的DNA与载体DNA接合成一具有自我复制能力的DNA分子——复制子(replicon) ,继而通过转化或转染宿主细胞,筛选出含有目的基因的转化子细胞,再进行扩增提取获得大量同一DNA分子,也称基因克隆或重组DNA (recombinant DNA) 。 基因工程:(genetic engineering) 实现基因克隆所用的方法及相关的工作称基因工程,又称重组DNA X艺学。限制性核酸内切酶:(restriction endonuclease, RE) 是识别DNA的特异序列,并在识别位点或其周围切割双链DNA的—类内切酶。 同功异源酶:来源不同的限制酶,但能识别和切割同一位点,这些酶称同功异源酶。 同尾酶:有些限制性内切酶虽然识别序列不完全相同,但切割DNA后,产生相同的粘性末端,称为同尾酶。 载体:为携带目的基因,实现其无性繁殖或表达有意义的蛋白质所采用的一些DNA分子。 复制:(replication) 是指遗传物质的传代,以母链DNA 为模板合成子链DNA的过程。 半保留复制: ( semi-conservative replication )DNA 生物合成时,母链DNA解开为两股单链,各自作为模板(template) 按碱基配对规律,合成与模板互补的子链。 子代细胞的DNA 一股单链从亲代完整地接受过来,另一股单链则完全从新合成。两个子细胞的DNA都和亲代DN 碱基序列一致。这种复制方式称为半保留复制。 复制子:(replicon ) DNA分子中能独立进行复制的单位称为复制子。习惯上把两个相邻起始点之间的距离定为一个复制子。 复制眼:(replication eye ) DAN正在复制的部分在电 镜下观察起来犹如一只眼睛,称为复制眼。 复制叉: ( replication fork )复制一开始,复制起始点要形成一个特殊的叉型结构,是复制有关的酶和蛋白质组装成复合物

相关文档
相关文档 最新文档