文档库 最新最全的文档下载
当前位置:文档库 › 华科生物信息学期末考试内容

华科生物信息学期末考试内容

华科生物信息学期末考试内容

华科生物信息学期末考试内容

生物信息学期末考试重点

第一讲 生物信息学(Bioinformatics)是20世纪80年代末随着人类基因组计划的启动而兴起的一门新型交叉学科,它体现了生物学、计算机科学、数学、物理学等学科间的渗透与融合。 生物信息学通过对生物学实验数据的获取、加工、存储、检索与分析,达到揭示数据所蕴含的生物学意义从而解读生命活动规律的目的。 生物信息学不仅是一门学科,更是一种重要的研究开发平台与工具,是今后进行几乎所有生命科学研究的推手。 生物技术与生物信息学的区别及联系 生物信息学的发展历史 ?人类基因组计划(HGP) ?人类基因组计划由美国科学家于1985年提出,1990年启动。根据该计划,在2015年要把人体约4万个基因的密码全部揭开,同时绘制出人类基因的谱图,也就是说,要揭开组成人体4万个基因的30亿个碱基对的秘密。HGP与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划,被誉为生命科学的登月计划。(百度百科) 随着基因组计划的不断发展,海量的生物学数据必须通过生物信息学的手段进行收集、分析和整理后,才能成为有用的信息和知识。换句话说,人类基因组计划为生物信息学提供了兴盛的契机。上文所说的基因、碱基对、遗传密码子等术语都是生物信息学需要着重研究的地方。 :

】 第二讲回顾细胞结构 细胞是所有生命形式结构和功能的基本单位 细胞组成 细胞膜主要由脂类和蛋白质组成的环绕在细胞表面的双层膜结构 细胞质细胞膜与细胞核之间的区域:包含液体流质,夹杂物存储的营养、分泌物、天然色素和细胞器 细胞器细胞内完成特定功能的结构:线粒体、核糖体、高尔基体、溶酶体等 细胞核最大的细胞器 DNA的结构 碱基(腺嘌呤A、鸟嘌呤G、胞嘧啶C、胸腺嘧啶G) 。 核苷酸 核苷酸是构成DNA分子的重要模块。每个核苷酸分子由一分子称作脱氧核糖的戊 糖(五碳糖)、一分子磷酸和一分子碱基构成。每种核苷酸都有一个碱基对,也就 是A、T、C、G 基因是什么 基因是遗传物质的基本单位 基因就是核苷酸序列。 大部分的基因大约是1000-4000个核苷酸那么长。 基因通过控制蛋白质的合成,从微观和宏观上影响细胞、组织和器官的产生。 基因在染色体上。

华科 C++期末考试试卷答案

2008-2009学年度第二学期 华中科技大学《C++语言程序设计》试卷(A) (考试时间:150分钟考试方式:闭卷) 所有答案必须写在答题纸上 一、单项选择题 (30小题,每小题1分,共30分) 1、C++程序中的语句必须以( B )结束 A 冒号 B 分号 C 空格 D 花括号 2、下列选项中,( A )不是分隔符 A 标识符 B ; C : D ( ) 3、执行语句 int a = 10, b ; int & pa = a , & pb =b ; 后,下列正确的语句是( B) A &pb = a; B pb = pa; C &pb = &pa; D *pb = *pa; 4、设I=1,J=2,则表达式 I++ +J的值为( C ) A1B2C3D4 5、执行下列语句后, int x , y ; x = y = 1 ; ++x || ++y ; y的值是( C) A不确定B0C1D2 6、逗号表达式 (x = 4 * 5 , x * 5 ), x + 25 的值为( D ) A 25 B 20 C 100 D 45 7、已知int i, x, y;在下列选项中错误的是(C) A if ( x && y ) i ++; B if ( x == y) i ――; C if ( xy ) i ――; D if ( x + y ) i++; 8、i=2,执行下列语句后的值为( B ) switch ( i ) { case 1: i++; case 2: i――; case 3: ++i; break; case 4: ――i; default : i++; } A 1 B 2 C 3 D 4 9、已知int i = 3;下面do _ while语句执行时循环次数为(B) do { i-- ; cout <

最新生物信息学考试复习

——古A.名词解释 1. 生物信息学:广义是指从事对基因组研究相关的生物信息的获取,加工,储存,分配,分析和解释。狭义是指综合应用信息科学,数学理论,方法和技术,管理、分析和利用生物分子数据的科学。 2. 基因芯片:将大量已知或未知序列的DNA片段点在固相载体上,通过物理吸附达到固定化(cDNA芯片),也可以在固相表面直接化学合成,得到寡聚核苷酸芯片。再将待研究的样品与芯片杂交,经过计算机扫描和数据处理,进行定性定量的分析。可以反映大量基因在不同组织或同一组织不同发育时期或不同生理条件下的表达调控情况。 3. NCBI:National Center for Biotechnology Information.是隶属于美国国立医学图书馆(NLM)的综合性数据库,提供生物信息学方面的研究和服务。 4. EMBL:European Molecular Biology Laboratory.EBI为其一部分,是综合性数据库,提供生物信息学方面的研究和服务。 5. 简并引物:PCR引物的某一碱基位置有多种可能的多种引物的混合体。 6. 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。

7. BLAST:Basic Local Alignment Search Tool.是通过比对(alignment)在数据库中寻找和查询序列(query)相似度很高的序列的工具。 8. ORF:Open Reading Frame.由起始密码子开始,到终止密码子结束可以翻译成蛋白质的核酸序列,一个未知的基因,理论上具有6个ORF。 9. 启动子:是RNA聚合酶识别、结合并开始转录所必须的一段DNA序列。原核生物启动子由上游调控元件和核心启动子组成,核心启动子包括-35区(Sextama box)TTGACA,-10区(Pribnow Box)TATAAT,以及+1区。真核生物启动子包括远上游序列和启动子基本元件构成,启动子基本元件包括启动子上游元件(GC岛,CAAT盒),核心启动子(TATA Box,+1区帽子位点)组成。 10. motif:模体,基序,是序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。 11. 分子进化树:通过比较生物大分子序列的差异的数值重建的进化树。 12. 相似性:序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占的比例。 13. 同源性:两个基因或蛋白质序列具有共同祖先的结论。

华中科技大学国际经济学期末试题

国际经济学习题集 一、单项选择题 1、从十五世纪初到十八世纪中叶,在国际贸易和国际投资理论方面占主导地位的是( ) A、重商主义 B、重农主义 C、重金主义 D、自由放任主义 2、绝对技术差异论的提出者是( ) A、斯密 B、李嘉图 C、奥林 D、魁奈 3、消费者对差异产品的追求与现代化大生产追求规模经济相互矛盾,其解决途径是( ) A、国际投资 B、国际技术转让 C、国际融资 D、国际贸易 4、国际贸易不仅使商品价格均等化,还使生产要素价格均等化和要素技术密集度均等化。在诸种均等化中为主导力量的是( ) A、生产要素价格均等化 B、要素技术密集度均等化 C、商品价格均等化 D、工资率均等化 5、就国家整体而言,分配进口配额最好的方法是( ) A、竞争性拍卖 B、固定的受惠 C、资源使用申请程序 D、政府适时分配 6、当一国政府对某种产品征收进口关税时,若该产品的需求弹性大于供给弹性,生产者与消费者承担关税的程度是( ) A、前者大于后者 B、后者大于前者 C、两者相等 D、不确定 7、不是成熟的国际经济一体化组织的是( ) A、欧洲联盟 B、亚欧经济合作 C、美加自由贸易区 D、东南亚国家联盟 8、多数国际卡特尔组织难以长久存在的主要原因是它们难以( ) A、制定垄断价格 B、维持垄断价格

C、控制生产成本 D、控制销售成本 9、初级产品的出口价格若下降,其出口量将增加,出口总收入( ) A、不变 B、增加 C、下降 D、不确定 10、进口替代战略与出口鼓励战略的战略取向分别是( ) A、内向型-内向型 B、内向型-外向型 C、外向型-外向型 D、外向型-内向型 11、关税与贸易总协定的基本目标是( ) A、贸易适度保护 B、关税稳定 C、贸易自由化 D、贸易公平 12、在发展中国家利用外资的主要渠道中,不需要偿还的引资方式是( ) A、官方贷款 B、发行债券 C、银行贷款 D、外商直接投资 13、劳动力在各国间的流动使劳动力的移出国的不同利益集团均会受到影响,其中( ) A、劳动力需求方受损,而供给方获利 B、劳动力需求方受损,而供给方亦受损 C、劳动力需求方获利,而供给方受损 D、劳动力需求方获利,供给方亦获利 14、在下列投资方式中,属国际直接投资的是() A、购买外国政府债券 B、购买外国企业债券 C、向外国企业提供商业贷款 D、在国外开设合资企业 15、下列贸易理论与规模经济无关的是() A、产品差异理论 B、重叠需求理论 C、相互倾销理论 D、嗜好理论 16、赫克歇尔——俄林模型认为国际贸易的根本原因() A、各国生产要素禀赋不同 B、各国劳动生产率不同 C、各国技术水平不同 D、各国产品技术含量不同

基因组学与生物信息学教案

《基因组学与生物信息学》教案 授课专业:生物学大类各专业 课程名称:基因组学与生物信息学 主讲教师:夏庆友程道军赵萍徐汉福

课程说明 一、课程名称:基因组学与生物信息学 二、总课时数:36学时(理论27学时实验9学时) 三、先修课程:遗传学、分子生物学、基因工程 四、使用教材: 杨金水. 基因组学. 北京:高等教育出版社,2002. 张成岗. 贺福初, 生物信息学方法与实践. 北京:科学出版社,2002. 五、教学参考书: T.A.布朗著,袁建刚译著,基因组(2rd版),北京:科学出版社,2006. 沈桂芳,丁仁瑞,走向后基因组时代的分子生物学,杭州:浙江教育出版社,2005. 罗静初译,生物信息学概论,北京:北京大学出版社,2002. 六、考核方式:考查 七、教案编写说明: 教案又称课时授课计划,是任课教师的教学实施方案。任课教师应遵循专业教学计划制订的培养目标,以教学大纲为依据,在熟悉教材、了解学生的基础上,结合教学实践经验,提前编写设计好每门课程每个章、节或主题的全部教学活动。教案可以按每堂课(指同一主题连续1~2节课)设计编写。教案编写说明如下: 1、编号:按施教的顺序标明序号。 2、教学课型表示所授课程的类型,请在相应课型栏内选择打“√”。 3、题目:标明章、节或主题。 4、教学内容:是授课的核心。将授课的内容按逻辑层次,有序设计编排,必要时标以“*”、“#”“?” 符号分别表示重点、难点或疑点。 5、教学方式既教学方法,如讲授、讨论、示教、指导等。教学手段指教科书、板书、多媒体、模型、 标本、挂图、音像等教学工具。 6、讨论、思考题和作业:提出若干问题以供讨论,或作为课后复习时思考,亦可要求学生作为作业 来完成,以供考核之用。 7、参考书目:列出参考书籍、有关资料。 8、日期的填写系指本堂课授课的时间。

华中科技大学《机械设计》期末考试试题(A)答案

北京电影学院2013~2014学年第一学期课程考试 一、选择题(每小题1分,共10分) 1、一般圆柱齿轮传动的接触强度是按啮合时的情况进行计算的。 A. 单对齿啮合的最高点 B. 齿顶 C. 节点 D. 啮合的极限点 2、渐开线花键通常采用的定心方式是。 A.齿侧定心 B. 外径定心 C. 内径定心 D.齿形定心 3、将齿轮的轮齿做成鼓形齿是为了减小。 A. 载荷沿接触线分布不均匀 B. 动载荷 C. 冲击 D. 齿间载荷分配不均 4、普通螺纹中同一公称直径按分为粗牙螺纹和细牙螺纹。 A. 升角的大小 B. 旋向 C. 牙型角的大小 D. 螺距的大小 5、当键联接强度不足时可采用双键。使用两个平键时要求键布置。 A.在同—直线上 B.相隔900 C.相隔1200 D相隔1800 6、在普通圆柱蜗杆中只有的轴向压力角为标准值(20 )。 A. 阿基米德蜗杆 B. 法向直廓蜗杆 C. 渐开线蜗杆 D. 锥面包络蜗杆

7、45号钢经调质处理,在常温下工作的轴,当计算表明其刚度不够时,应采取的正确措施是。 A. 改用合金钢 B. 改变表面粗糙度 C. 增大轴的直径 D. 提高轴的表面硬度 8、下面的联轴器中在工作时具有缓冲减振作用的联轴器是。 A. 刚性联轴器 B. 十字滑块联轴器 C. 齿式联轴器 D. 弹性柱销联轴器 9、在各种基本类型的向心滚动轴承中_____ 不能承受轴向载荷。 A. 调心球轴承 B. 圆柱滚子轴承 C. 调心滚子轴承 D. 深沟球轴承 10、一般转速、一般载荷工作的正常润滑的滚动轴承其主要失效形式是_ __。 A. 滚动体碎裂 B. 滚动体与滚道产生疲劳点蚀 C. 滚道磨损 D. 滚道压坏 二、判断题(每小题1分,共10分) ()1、型号为7210的滚动轴承,表示其类型为角接触球轴承。 ()2、滚动轴承的基本额定寿命是指可靠度为90%的轴承寿命。 ()3、公称接触角的深沟球轴承,只能承受纯径向载荷。 ()4、角接触球轴承的派生轴向力是由其支承的轴上的轴向载荷引起的。 ()5、滚动轴承的基本额定动载荷是指在载荷作用下轴承工作转时,90%轴承的不发生疲劳点蚀 ()6、滚动轴承内座圈与轴颈的配合,通常采用基轴制。 ()7、当载荷较大时,可选用滚子轴承,对轻、中载荷应选用球轴承。 ()8、滚动轴承的失效形式有下列三种:磨粒磨损,过度塑性变形、疲劳点蚀,其中最常见的一种是磨粒磨

生物信息学期末考试重点

1、生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解 释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计 算机科学相结合形成的一门新学科。它通过综合利用生物学,计算机科学和信息技 术而揭示大量而复杂的生物数据所赋有的生物学奥秘。 2、数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于 距今六十多年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后, 数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方 式。数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数 据存储的大型数据库系统都在各个方面得到了广泛的应用。 3、表达序列标签从一个随机选择的cDNA 克隆进行5’端和3’端单一次测序获得的短 的cDNA 部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp。EST 来源于一定环境下一个组织总 mRNA 所构建的cDNA 文库,因此EST也能说明该组织中各基因的表达水平。 4、开放阅读框是基因序列中的一段无终止序列打断的碱基序列,可编码相应的蛋白。 ORF识别包括检测六个阅读框架并决定哪一个包含以启动子和终止子为界限的 DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个 真正的单一的基因产物。ORF的识别是证明一个新的DNA序列为特定的蛋白质编 码基因的部分或全部的先决条件。 5、蛋白质的一级结构在每种蛋白质中氨基酸按照一定的数目和组成进行排列,并进 一步折叠成特定的空间结构前者我们称为蛋白质的一级结构,也叫初级结构或基 本结构。蛋白质一级结构是理解蛋白质结构、作用机制以及与其同源蛋白质生理 功能的必要基础。 6、基因识别是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别 DNA序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码基因, 也包括其他具有一定生物学功能的因子,如RNA基因和调控因子。基因识别是基 因组研究的基础。

生物信息学的主要研究内容

常用数据库 在DNA序列方面有GenBank、EMBL和等 在蛋白质一级结构方面有SWISS-PROT、PIR和MIPS等 在蛋白质和其它生物大分子的结构方面有PDB等 在蛋白质结构分类方面有SCOP和CATH等 生物信息学的主要研究内容 1、序列比对(Alignment) 基本问题是比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础,非常重要。两个序列的比对有较成熟的动态规划算法,以及在此基础上编写的比对软件包BLAST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。 2、结构比对 基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。已有一些算法。 3、蛋白质结构预测,包括2级和3级结构预测,是最重要的课题之一 从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建(Homology)和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。 4、计算机辅助基因识别(仅指蛋白质编码基因)。最重要的课题之一 基本问题是给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。 5、非编码区分析和DNA语言研究,是最重要的课题之一 在人类基因组中,编码部分进展总序列的3~5%,其它通常称为“垃圾”DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA 序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。 6、分子进化和比较基因组学,是最重要的课题之一 早期的工作主要是利用不同物种中同一种基因序列的异同来研究生物的进化,构建进化树。既可以用DNA序列也可以用其编码的氨基酸序列来做,甚至于可通过相关蛋白质的结构比对来研究分子进化。以上研究已经积累了大量的工作。近年来由于较多模式生物基因组测序任务的完成,为从整个基因组的角度来研究分子进化提供了条件。 7、序列重叠群(Contigs)装配 一般来说,根据现行的测序技术,每次反应只能测出500或更多一些碱基对的序列,这就有一个把大量的较短的序列全体构成了重叠群(Contigs)。逐步把它们拼接起来形成序列更长的重叠群,直至得到完整序列的过程称为重叠群装配。拼接EST数据以发现全长新基因也有类似的问题。已经证明,这是一个NP-完备

【最新】华科大一英语期末考前练习

1. She could not resist the temptation to declare her candidacy as there are only two other people c________ the seat. 竞争contest 2. Our o______ for the coming year is to increase our market share in Europe by 20 percent and to generate more profit. 目标objective 3. The worst o______ that we had to remove were tree trunks that had fallen across the road. 障碍物obstacles 4. The Labor Party’s electoral strategy, which was based on a tactical a______ with other minor parties, has proved successful. 联盟alliance

5. After a three-day s____ by the police, the terrorists who had seized the restaurant had to give in. 包围 Siege 6.They have found l______ jobs in private security firms. 赚钱的Profitable lucre lucrative 7. The curriculum ignored the natural interests of children and so e_____ their motivation. 消除eliminate 8. The manager a____ the staff to the crisis facing the company. 提醒,警示Alarm alert 9. She s____ the car skillfully through the narrow streets. 驾驶steer

生物信息学试题复习参考(张弓)

2014-2015学年生物信息学期末考试题 写在前面:这是我考试时候写的答案的大致内容,具体文字我已经不记得了,给大家一个参考,希望对大家复习有帮助。因为我也是扣了很多分,所以答案也有很多错的,大家不要尽信。祝大家考试顺利。 一、实验设计和基础分析 以下qPT-PCR实验方案有哪些错误?请标出错误,并说明原因和写出正确方案。 目的:比较肺癌细胞迁移前后的X基因转录水平表达量 方法:(1)用Trizol法提取细胞总RNA,并用跑胶、OD260/280等方法确认无降解。 (2)用poly-dT引物进行反转录 (3)设计基因特异性PCR引物,用qPCR仪测定X基因和GAPDH基因的Ct值。GAPDH作为内参。 (4)以2^-ΔΔCt方法计算X基因相对于GAPDH的相对含量 (5)比较迁移前后的相对表达量,做三个重复,用t-test进行统计检验,P<0.05为差异显著 1.错误:不能用GAPDH基因作为定量标准;原因:癌症迁移前后GAPDH基因的表达量已经改变了,做定量标准不准确;方案:采用外参(如:其他物种的基因) 2.错误:不能用t-test进行统计检验;原因:t-test进行统计检验的前提是数据呈正态分布,基因表达量不一定呈正太分布;方案:将数据取log10,对数化。 上述两个是我考试时候写的答案,后来经提醒:还发现了一个错误:不能用poly-dT引物进行反转录;原因:。。。。。。;方案:用Oligodt进行逆转录。 二、双序列比对的生物学意义解释 两种细菌的同源蛋白质endonuclease III,长度都为200氨基酸左右,其功能相同,蛋白质序列使用BLAST 可以比对上,同源性高达57%,但其编码DNA序列用BLAST却无法比对上,为了尽可能提高亲缘关系较远的序列的比对效率,比对已经使用BLAST网站上Somewhat similar sequence选项,默认参数(见下图):

中国科学院大学生物信息学期末考试资料,陈润生老师

生物信息学期末考试复习 1.生物学中的7个数学故事 (1) 孟德尔遗传定律(分离和自由组合定律)运用了组、合原理中的加法原理和乘法原理。 (2) Hardy-Weinberg遗传平衡定律通过构造数学关系式来证明。 (3)基因在染色体上的线性排列采用概率分布优化距离的计算距离,使其更接近真实情况。 (4)关联分析通过假设检验看两个特征的关联有无统计显著性。 (5) 序列比对设计合适的算法可以有效降低计算复杂度。 (6)基因组学和其他的组学组学时代产生的大量数据需要依赖数据库技术来寻找生物分子之间的关联。 (7)微阵列芯片大规模芯片数据需要数据挖掘:聚类、关联、预测建模、异常检测。 2. DNA、protein、RNA序列比对及其算法 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。常用的方法有:点阵法,动态规划算法,k-tup 算法等。 (1)dotplot算法:通过点阵作图的方法表示,能很直观地氨基酸序列或核苷酸序列上的插入、删除、重复和反相重复。 算法步骤:将两条序列的碱基(或残基)分别沿x轴和y轴排列,依次比较两条序列的每个碱基(或残基),如果两个碱基(或残基)相同则在矩阵中填充点,这样就形成一个点矩阵。在点矩阵中,将对角线上的点连接起来,这些直线所对应的矩形区域就是这两条序列的相似性片段。 算法特点:该算法相似性片段实际上是相同的片段;而且不能提供相似性片段在统计学意义上的相似性。 (2)动态规划算法:分为全局动态规划算法和局部动态规划算法。保证了指定打分模型的情况下,两条序列能获得尽可能的最高分 算法步骤:①初始化序列矩阵;②将序列输入矩阵,计算分数并绘制箭头;③用箭头回溯找到最优得分路径;④连接最优路径,产生序列比对。 动态规划算法优缺点: 优点:对于一个给定的计分函数集合,能找到最优的比对 缺点:时间复杂度为O(n 2),运行慢,计算所需的内存与序列长度的平方成正比,因此不适用于非常长序列的比对。 序列比对的定义,存在哪几种算法,打分矩阵是什么意思 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列; 算法种类:动态规划算法、Smith-Waterman Alterations算法、FASTA - Hi Level Algorithm 算法、BLAST – Heuristic算法; 打分矩阵:通过点矩阵对序列比对进行积分,根据不同物质情况可分为DNA序列打分矩阵:等价矩阵、转换-颠换矩阵、blast矩阵;蛋白质打分矩阵:等价矩阵、遗传密码矩阵、疏水性矩阵、PAM矩阵、BLOSUM矩阵。 1.动态规划算法,给个表格可以把数字填出:

最新生物信息学学习心得

生物信息学学习心得 第一篇:生物信息学 生物信息学是上世纪90年代初人类基因组计划(hgp)依赖,随着基因组学、蛋白组学等新兴学科的建立,逐渐发展起来的生物学、数学和计算机信息科学的一门交叉应用学科。目前生物信息学的研究领域主要包括基于生物序列数据的整理和注释、生物信息挖掘工具开发及利用这些工具揭示生物学基础理论知识等领域。生物信息学作为新型交叉应用学科,可以依托本校已有的计算机科学、信息学、生物学和数学等学科优势,充分展现投入少、见效快、起点高的特色,推动学校学科建设和本科教学水平。 本实验指导书中的8个实验均设计为综合性开发实验,面向生物信息学院全体本科学生和研究生,以及全校对生物信息学感兴趣的其他专业学生开放。生物信息学实验室将提供系统的保障,包括采用mail服务器和linux帐号管理等进行实验过程管理和支持。限选《生物信息学及实验》的生物技术专业本科生至少选择其中5个实验,并不少于8个学时,即为课程要求的0.5个学分。其他选修者按照课时和学校相关规定计算创新学分。实验一熟悉生物信息学网站及其数据的生物学意义 实验目的:

培养学生利用互联网资源获取生物信息学研究前沿和相关数据的能力,熟悉生物信息学相关的一些重要国内外网站,及其核酸序列、蛋白质序列及代谢途径等功能相关数据库,学会下载生物相关的信息数据,了解不同的数据文件格式和其中重要的生物学意义。 实验原理: 利用互联网资源检索相关的国内外生物信息学相关网站,如:ncbi、sanger、tigr、kegg、sble、中科院北京基因组研究所、北大生物信息 学中心等,下载其中相关的数据,如fasta、genbank格式的核算和蛋白质序列、pathatdb格式化库文件,并输入blast命令进行计算,获得结果文件。 实验内容: 1. 向网上blast服务器提交序列,得到匹配结果; 2. 本地使用blast,格式化库文件,输入命令行得到匹配结果;

生物信息学考试试卷

一、名词解释(每小题4分,共20分) 1、生物信息学 广义:生命科学中的信息科学。生物体系和过程中信息的存贮、传递和表达;细胞、组织、器官的生理、病理、药理过程的中各种生物信息。 狭义:生物分子信息的获取、存贮、分析和利用。 2、人类基因组计划 人类基因组计划准备用15年时间,投入30亿美元,完成人类全部24条染色体的3×109脱氧核苷酸对(bp)的序列测定,主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别。其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。作图和测序是基本的任务,在此基础上解读和破译生物体生老病死以及和疾病相关的遗传信息。 3、蛋白质的一级结构 蛋白质的一级结构是指多肽链中氨基酸的序列 4、基因 基因--有遗传效应的DNA片断,是控制生物性状的基本遗传单位。 5、中心法则 是指遗传信息从DNA传递给RNA,再从RNA传递给蛋白质,即完成遗传信息的转录和翻译的过程。也可以从DNA传递给DNA,即完成DNA的复制过程。这是所有有细胞结构的生物所遵循的法则。 6 、DNA序列比较 序列比较的根本任务是:(1)发现序列之间的相似性;(2)辨别序列之间的差异 目的: 相似序列 相似的结构,相似的功能 判别序列之间的同源性 推测序列之间的进化关系 7、一级数据库 数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释 8、基因识别 基因识别,是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别DNA 序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码基因,也包括其他具有一定生物学功能的因子,如RNA基因和调控因子。 9、系统发生学 系统发生学(phylogenetics)——研究物种之间的进化关系。 10、基因芯片 基因芯片(gene chip),又称DNA微阵列(microarray),是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。

生物信息学 本科生版 期末考试试题(机考)

暨南大学考试试卷 注意: 1. 本考试只有相对正确的答案,无论你如何作答,只要写出足够强的论证的理由和过程来 支撑你的观点,并且不违反课程内讲授的基本原理,即算正确。 2. 考试形式为机考,请自备电脑。回答可直接写在本文件里,要写出过程和明确的结论。 最终答卷以PDF形式现场提交以避免乱码和篡改,文件名请统一命名为“学号-姓名.pdf”,例如2013042213-张三.pdf。不按此格式命名文件名者将一律没有成绩! 3. 考试完毕,请用U盘将写好的报告PDF文档拷到监考老师的电脑上,或于考试结束后 15分钟内发邮件至zhanggong@jnu.edu.cn,注明主题“期末考试”。 4. 本试卷分为4小题,各题分数分别为20、30、30、20 分,满分100分。 人卵细胞受精到胚胎发育极早期,经历如下阶段: -卵细胞(oocyte) -前核(pronuclei) -受精卵(zygote) -2-细胞期 -4-细胞期 -8-细胞期 -桑椹胚(morula) 为研究在发育过程中的转录调控,研究者对以上时期的细胞进行了单细胞测序。测序仪使用Illumina HiSeq-2000,采用双端100nt测序方式。测序数据的第一端用FANSe2算法云分析平台进行一键式定量分析,得到28个基因表达定量文件(*_SVmerge.txt)。请通过推理和分析,回答以下问题: 1.真核生物中,同一个基因往往可以通过可变剪切的方式,生成若干个不同的 剪切变体。请问云平台分析的这批数据,是如何处理同一基因的不同剪切变体的?这种测序方式有没有可能定量不同的剪切变体?为什么?

暨南大学《生物信息学(本科生版)》试卷考生姓名、学号: 2.Oocyte, zygote, pronuclei, morula阶段都做了生物学重复,请问其重复性好不 好?如果不好,有哪些因素会造成重复性不好?会不会影响结论? 3.发育生物学课本上就已经说道,2-细胞期、4-细胞期、8-细胞期的每一个细胞 都不一样。受精卵已有植物极和动物极之分,在第一次卵裂的2-细胞期中,植物极和动物极被分开;然后继续进行两次纵向卵裂,形成上部4个动物极细胞和下部8个植物极细胞。将来动物极细胞发育成外胚层,植物极细胞发育成内胚层。也就是说,一个胚胎的若干个细胞之间就有不同,其转录组应该有不同。那么,同期的细胞之间差异大,还是不同期之间差异大?这些差异是由发育阶段所致,还是由于单细胞测序的随机性误差所致? 4.哪些基因是“管家基因”(housekeeping gene),哪些基因是只在未受精卵细胞中 有表达的?这两部分基因的mRNA长度分布有没有统计学意义上的差别? (RefSeq-RNA数据库里面所有的mRNA序列都在Human_hg19_refMrna20150317.fa文件中)

华中科技大学操作系统1(本部06级)期末考试试卷-B答案

2008~2009学年度第一学期软件学院2006级本科 《操作系统原理》课程考试试卷(B 卷) (闭卷) 专业、班级: 姓名:参考答案 学号: 成绩: 考试日期:2008-11-24 考试时间:15:00-17:30 一.名词解释(10分=2 分x 5) 1.访管中断: 2.(临界区访问原则)让权等待: 3.静态资源分配法: 4.置换策略: 5.设备的虚拟技术: 二.填空(10分 = 1分 ×10) 6. 在操作系统里面,根据对系统中资源和机器指令的使用权限,对处理机的工作状态可以分为核 态和 目态(或用户态) 等两种。 7. DOS 系统中,系统调用功能是利用 21H 号中断实现的。【请用16进制格式填写】 8. 在具有线程概念的操作系统中CPU 调度的基本单位是 线程 。 9. 有4个进程共享3个临界资源,若使用信号量机制实现对临界资源的互斥访问,则这个信号量 其值的变化范围是 [-1,3] 。 10. 11. 在作业调度算法中,只考虑作业等待时间的调度算法叫 先来先服务调度算法 。 12. 在程序运行时决定逻辑地址到物理地址映射的方法叫 动态 地址映射。 13. 采用页式存储管理(带快表) ,在访问某个内存单元的全过程中,最多需要访问内存 2 次。

14.一个作业8:00到达系统,其估计运行时间是2小时。若11:00才开始真正运行该作业。请问该 作业的响应比是 2.50 。【保留2位小数】 15.假定用户容忍的响应时间为1秒,则有4个并发进程的系统最理想的时间分片是 0.25 秒。三.判断题目(15分= 1分 x 15)考生注意:直接在题号前的【】内打X 或 V 。 【x 】16. 单道批处理系统中作业的启动与结束都以手工方式进行,作业串行地在系统中运行。 【v 】17. 采用层次结构设计的操作系统把所有功能模块按照调用次序分别排成若干层,确保各层之间只能是单向依赖或单向调用。 【x 】18. 多道批处理系统的特点就是把处理机时间分成等长的小片轮流地为多道作业服务。 【x 】19. 系统中中断的发生都是随机的,任何类型的中断都不可事先预知。 【x 】20. 一个进程执行V操作,相当于资源或服务请求,因而可能使自身限于阻塞。 【v 】21. 当PV操作的信号量S小于0时,其绝对值表示相应阻塞队列中进程的个数。 【v 】22. 严格来讲,分时系统中程序的执行过程是不能够完全重现的。 【x 】23. 在Linux父程序中调用fork函数生成一个新的子进程,其返回值PID在父进程中等于零,而在子进程中是一个大于零的数(不考虑程序出错的情况)。 【 v】24. 多重时间片循环调度法,即考虑了作业大小因素,又考虑了作业等待时间长短因素。 【v 】25. 虚拟存储管理的基本思想就是在小内存空间运行大的程序,其解决策略之一就是把程序划分为不同模块按需装入到内存中,而这些模块不需要占用连续的内存空间。 【 x】26. 虚拟存储器的最大容量不应该超过内存和硬盘空间之和。 【x 】27. 最久未使用(LRU)淘汰算法将驻留在主存中时间最久的页面淘汰出去。 【v 】28. 缓冲是两种不同速度的设备之间进行信息传输时平滑传输过程的常用手段。 【v 】29. 一个普通的c程序源文件(*.c)属于流式文件。 【v 】30. 位示图是记录磁盘空闲块的方法之一,在位示图中存储设备的每个物理块都对应一个比特位,用来记录该块是空闲状态还是被使用状态。

生物信息学期末期末复习

■一、选择题: 1.以下哪一个是mRNA条目序列号: A. J01536 ■. NM_15392 C. NP_52280 D. AAB134506 2.确定某个基因在哪些组织中表达的最直接获取相关信息方式是: ■. Unigene B. Entrez C. LocusLink D. PCR 3.一个基因可能对应两个Unigene簇吗? ■可能 B. 不可能 4.下面哪种数据库源于mRNA信息: ■dbEST B. PDB C. OMIM D. HTGS 5.下面哪个数据库面向人类疾病构建: A. EST B. PDB ■. OMIM D. HTGS 6.Refseq和GenBank有什么区别: A. Refseq包括了全世界各个实验室和测序项目提交的DNA序列 B. GenBank提供的是非冗余序列 ■. Refseq源于GenBank,提供非冗余序列信息 D. GenBank源于Refseq 7.如果你需要查询文献信息,下列哪个数据库是你最佳选择: A. OMIM B. Entrez ■PubMed D. PROSITE 8.比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法,下列哪种说法正确: A. 因为GenBank的数据比EMBL更多,Entrez给出的搜索结果将更多 B. 搜索结果很可能一样,因为GenBank和EMBL的序列数据实际一样 ■搜索结果应该相当,但是ExPASy中的SwissProt记录的输出格式不同 9.天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于: ■N/W/Y B. Q/W/Y C. F/W/Y D. Q/N/W 10.直系同源定义为: ■不同物种中具有共同祖先的同源序列 B. 具有较小的氨基酸一致性但是有较大的结构相似性的同源序列 C. 同一物种中由基因复制产生的同源序列 D. 同一物种中具有相似的并且通常是冗余的功能的同源序列 11.下列那个氨基酸最不容易突变: A. 丙氨酸 B. 谷氨酰胺 C. 甲硫氨酸■半胱氨酸 12.PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变: A. 1% B. 20% ■. 80% D. 250% 13.下列哪个句子最好的描述了两个序列全局比对和局部比对的不同: A. 全局比对通常用于比对DNA序列,而局部比对通常用于比对蛋白质序列 B. 全局比对允许间隙,而局部比对不允许 C. 全局比对寻找全局最大化,而局部比对寻找局部最大化 ■全局比对比对整体序列,而局部比对寻找最佳匹配子序列 14.假设你有两条远源相关蛋白质序列。为了比较它们,最好使用下列哪个BLOSUM和PAM矩阵: ■BLOSUM45和PAM250 B. BLOSUM45和PAM 1 C. BLOSUM80和PAM250 D. BLOSUM10和PAM1 15.与PAM打分矩阵比较,BLOSUM打分矩阵的最大区别是: A. 最好用于比对相关性高的蛋白 B. 它是基于近相关蛋白的全局多序列比对 ■它是基于远相关蛋白的局部多序列比对 D. 它结合了全局比对和局部比对

中科院生物信息学期末考试复习题

中科院生物信息学期末考试复习题 润生老师部分: 1.什么是生物信息学,如何理解其含义?为什么在大规模测序研究中,生物信息学至关重要? 答:生物信息学有三个方面的含义: 1)生物信息学是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和 解释的所有方面,是基因组研究不可分割的部分。 2)生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言, 特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。 3)生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。它 是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。 生物信息学是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA 基因的编码区;同时阐明基因组量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律:在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白谱数据,从而认识代、发育、分化、进化的规律。同时在发现了新基因信息之后,其还利用基因组中编码区信息进行蛋白空间结构模拟和蛋白功能预测,并将此类信息与生物体和生命过程中的生理生化信息结合,阐明其分子机制,最终进行蛋白、核酸分子设计、药物设计、个体化医疗保健设计。 2.如何利用数据库信息发现新基因,基本原理? 答:利用数据库资源发现新基因,根据数据源不同,可分2种不同的查找方式: 1)从大规模基因组测序得到的数据出发,经过基因识别发现新基因: (利用统计,神经网络,分维,复杂度,密码学,HMM,多序列比对等方法识别特殊序列,预测新ORF。但因为基因组中编码区少,所以关键是“数据识别”问题。)利用大规模拼接好的基因组,使用不同数据方法,进行标识查找,并将找到的可能的新基因同数据库中已有的基因对比,从而确定是否为新基因。可分为:①基于信号,如剪切位点、序列中的启动子与终止子等。②基于组分,即基因家族、特殊序列间比较,Complexity analysis,Neural Network 2)利用EST数据库发现新基因和新SNPs: (归属于同一基因的EST片断一定有overlapping,通过alignment可组装成一完整的基因,但EST片断太小,不存在数据来源,主要是拼接问题) 数据来源于大量的序列小片段,EST较短,故关键在正确拼接。方法有基因组序列比对、拼接、组装法等。经常采用SiClone策略。其主要步骤有:构建数据库;将序列纯化格式标准化;从种子库中取序列和大库序列比对;延长种子序列,至不能再延长;放入contig库①构建若干数据库:总的纯化的EST数据库,种子数据库,载体数据库,杂质、引物数据库,蛋白数据库,cDNA数据库; ②用所用种子数据库和杂质、引物数据库及载体数据库比对,去除杂质; ③用种子和纯化的EST数据库比对 ④用经过一次比对得到的长的片段和蛋白数据库、cDNA数据库比较,判断是否为已有序列,再利用该大片段与纯化的EST数据库比对,重复以上步骤,直到序列不能再延伸; ⑤判断是否为全长cDNA序列。

华科通信电子线路期末试题(答案)

华中科大高频电子线路期末试题(答案) 一、选择性填空: 1、C 2、A 3、ABC 4、A 5、C 6、ACD 7、BC 8、CD 9、D10、D 11﹑D 12、AB13、BCD14、BC 15、CD 二、 分析:在本题中要注意放大器的谐振电压增益Avo和稳定的电压增益之间 的关系,根据求出的放大器的增益并不一定是稳定的增益,而 才表示稳定的电压增益,为了保持放大器稳定的工作,可根据要 求的来求放大器的其他参数。本题中就应该用来求,从而可求得为了使放大器稳定工作应该在回路上并联的电阻R的值。 解:(1) (1) 而=35为了保持放大器稳定工作则=35 (2) 式(1)=(2) 而 ∴R应该并联在回路两端 (2) 因为Avo=50时B=10KHz,根据带宽增益积为一常数 则 因此 三、 根据求得Vb

根据图2可求得转移特性的斜率 ∴求得 由得 四、 解:1、根据图3画出交流等效电路如下: 由等效电路可见,振荡器属电容三端电路。 2、 给定频率为48.5MHz可求出电感L值 3、反馈系数 五、解:(1)为单边带信号,解调后V o=1V ,通过该检波器后其输出波形如图(a)所示

(2)为抑制载波的双边带调幅波,解调后, 输出电压为正半周包络,如图(b)所示。 (3)是调幅度为0.5的调幅波,输出电压 为其包络,如图(c)所示。 (4)是一过量调幅的调幅波,输出电压 如图(d)所示。 六、解:由频谱图可知该调制信号为调角波, 由于B=8KHz=2(m+1)F,而 所以m=3 若为调频波则 若为调相波则 调频波波形示意图如图所示 七、

1、一个完整的通信系统应包括:输入变换装置、发送设备、传输信道、接收设备和输出变换装置五部分,如图1-1所示。 图1-1 通信系统组成框图 输入变换装置:将要传送的信息变成电信号的装置,如话筒、摄像机、各种传感装置。 发送设备:将基带信号变换成适于信道传输特性的信号。不同的信道具有不同的传输特性,而由于要传送的消息种类很多,它们相应基带信号的特性各异,往往不适于直接在信道中传输。因此,需要利用发送设备对基带信号进行变换,以得到适于信道传输的信号。 传输信道:传输信道是传送信息的通道,又称传输媒介,如电缆、光缆或无线电波。不同的信道有不同的传输特性。 接收设备:接收设备是将信道传送过来的信号进行处理,以恢复出与发送端基带信号相一致的信号。当然,由于在信道传输中和恢复过程中会产生一定的干扰和失真,因此,接收设备恢复的信号也会有一定的失真,应尽量减小这种失真。输出变换装置:将接收设备输出的电信号变换成原来形式的消息的装置,如还原声音的喇叭,恢复图像的显像管等。 2、答:在电路参数不变时,为了提高Po采用提高的Vb方法,但效果不明显,是因为谐振功率放大器工作在过压工作状态。为了实现输出功率明显提高可采用提高供电电压Vcc和减小负载电阻Rp的方法,使放大器工作在临界工作状态。

相关文档
相关文档 最新文档