文档库 最新最全的文档下载
当前位置:文档库 › 生物信息学2005生物技术专业2007秋季试卷(A)南方医科大学

生物信息学2005生物技术专业2007秋季试卷(A)南方医科大学

生物信息学2005生物技术专业2007秋季试卷(A)南方医科大学
生物信息学2005生物技术专业2007秋季试卷(A)南方医科大学

2005年级生物技术本科

一、选择题

1. 在NCBI进行BLAST序列比对时,需要输入查询序列的信息,以下错误的格式是()

A. 序列的GB 号

B. 序列的gi号

C. 序列对应基因的ID 号

D. FASTA 格式的序列

2. BLAST比对结果报告中有一个统计数值E值,该值大小与匹配度的关系是()

A. 值越小说明匹配度越低

B. 值越小说明匹配度越高

C. 两者无内在关系

D. 以上说法都不对

3. 下列哪个不是Entrez的逻辑运算符()

A.AND B.OR

C.BUT D.NOT

4. 下面对进化树理解错误的是()

A.从根节点到任何一个节点的唯一路径和方向代表了进化方向

B.根是树中所有物种的共同祖先

C.根节点上的物种我们认为比树中其他所有的物种分化更早

D.从根节点到任何一个节点的路径与物种的进化程度相关

5. 下面这段蛋白质序列是什么格式? ( )

>gi|4506183|ref|NP_002779.1| proteasome alpha 3 [Homo sapiens] MSSIGTGYDLSASTFSPDGRVFQVEYAMKAVENSSTAIGIRCKDGVVFGVEKLVLSKLYEEGSNKRLFNVDRHVGMAVAGLL ADARSLADIAREEASNFRSNFGYNIPLKHLADRVAMYVHAYTLYSAVRPFGCSFMLGS。。。。。。

A. GBFF

B. TEXT

C. PDB

D. FASTA

6. 检测核酸序列是否受到了载体污染的最主要方法是:( )

A.在载体数据中做相似性搜索B.搜索序列中的限制性酶切位点

C.检索细胞数据库 D.检索宿主序列数据库

7. 利用ExPASy网站的AACompIdent工具软件进行蛋白质鉴定的时候不能输入的数据是:()

A.要鉴定的蛋白质氨基酸组成比例B.对应的核酸组成比例

C.限定搜索的物种范围 D.蛋白质序列的pI值

8. 关于蛋白质序列数据库,以下说法错误的是:()

A. UniProtKB/TrEMBL是Swiss-Prot数据库的一个由计算机自动注释的增补版

B. PIR-PSD是非冗余的蛋白质序列数据库

C. PDB数据库同样包含了蛋白质序列的详细信息

D. NCBI同样提供了蛋白质序列子数据库

9. ExPASy上的工具软件TMpred提供的是哪种类型的服务?()

A.蛋白质三级结构分析 B.蛋白质序列理化性质预测

C .蛋白质二级结构分析

D .蛋白质跨膜结构分析

10. 蛋白质序列的描述行:>gi|28435532|gb|AAO41714.1| NPC-associated peptide [Homo sapiens]中的AAO41714.1是什么意思? ( )

A .AAO41714是NCBI 中序列的ACCESSION ,小数点后的1是版本号

B .序列在Swiss-Prot 中的ACCESSION

C .序列的motif 数据库中的ACCESSION

D .序列对应的基因ID 号

1. C

2. B

3. D

4. D

5. D

6. A

7. B

8. C

9. D 10.A

二、简答题(总分40分)

11. 系统发生树是由二元树来表示的,它表示什么进化关系?进化树树根的确定又有哪几个重要原则?给如下数据构建进化树,三条序列,其两两距离为:9.08.04.0===bc ac ab d d d ,假设根节点离a 的距离为0.7。(15分)

12. 什么是多序列比对?完成多序列比对需要哪几个步骤?试举一种多序列比对的工具。(5)

13.请分别解释LOCUS ACCESSION VERSION KEYWODS 的意思, 并说明DEFINITION 的作用。

14. 解释一下生物信息名词BLAST 、PROSITE 、NCBI 、UniProt 、/db_xref="GeneID:281444"。(10分)

15. 翻译并简单介绍该工具:ProtParam computes various physico-chemical properties that can be deduced from a protein sequence. No additional information is required about the protein under consideration 。(5分)

三、综合题( 总分30分)

16.假设我们现在得到了一个编码蛋白的基因,名字是PSMA3,想通过NCBI 提供的Entrez 查找该基因的相关信息,请详细说明检索步骤?(20分)

17. 生物信息学是一门新兴的学科,融合了生物科学、计算机科技和数学等,同时网上提供了大量的数据库查询和数据处理的免费工具软件,通过本课程的学习,你对36学时的生物信息学课程的教学内容有何想法?例如网站数据库的检索和常用工具软件的应用该占多大比例,相关工具软件的算法应该占多大的比例。(10分)

11. (15分)系统树作图占10分。

12. (5分)答:1.所有的序列之间逐一比对(双重比对)

2.生成一个系统树图,将序列持相似性大致地分组

3.使用系统树图作为引导,产生出最终的多序列比对结果

答错一条扣2分,扣完为止。

13. (5分)每个概念1分。

14. (10分)每个解释2分。

15. (5分)准确翻译,大概意思清楚但不准确酌情扣分,主要意思错误全扣。

16. (20分)能答出找到GBFF 格式的核酸序列信息,对应蛋白质序列信息,基因的基本信息给15分,其它查找每条2分,最高20分。

17.(10分)自由发挥,酌情给分。

南方医科大学:组织学与胚胎学试卷.doc

南方医科大学:组织学与胚胎学试卷

临床医学本科组织学与胚胎学试卷 一、幻灯片(每幅0.5 分,共 15 分) 二、 A 型题(最佳选择题,每题 0.5 分,共 30 分) 1.内皮是:A. T 淋巴细胞 A .消化道腔面的单B.浆细胞 层上皮C.肥大细胞B.心血管和淋巴管D.嗜酸性粒细胞 腔面的单层上皮C.呼吸道的上皮D.胸腔、腹腔和心包腔的单层上皮2.食管上皮属于 A.单层柱状上皮 B.未角化复层扁平上皮 C.角化的复层扁平上皮 D.假复层柱状纤毛上皮 3.结缔组织起源于: A.间充质 B.外胚层 C.内胚层 D.胚外中胚层 4.产生抗体的细胞是: 5.当机体发生过敏反应时,哪种细胞会发生脱颗粒现象? A.肥大细胞 B.巨噬细胞 C.嗜酸性粒细胞 D.成纤维细胞 6.巨噬细胞来源于: A.中性粒细胞 B.单核细胞 C.巨核细胞 D.网状细胞 7.临床检验报告中性粒细胞核左移是指:A.正常情况下 1-2 叶 的细胞百分率增高B.正常情况下 4-5 叶的细胞百分率增高

C.细菌严重感染下 1-2 叶的细胞百分 率增高 D.细菌严重感染下 4-5 叶的细胞百分 率增高 8.红骨髓的主要成分是: A.疏松结缔组织和血窦 B.血窦和造血细胞 C.骨组织和造血细胞 D.造血组织和血窦 9.红细胞的形态和大 小是: A.双凸圆盘状,直径 10-12μm B.双凹圆盘状,直径 7-8μm C.球形,直径7-8 μm D.扁平状,直径10-12μm 10.关于破骨细胞,哪项错误? A.分布在骨组织表面 B.来源于巨噬细胞 C.胞质嗜酸性强 D.为多核细胞11.骨膜对骨的生长和修复有很重要的作用,其主要原因是: A.含丰富的血管 B.含成骨细胞 C.含骨祖细胞 D.含成骨细胞和丰富的血管 12.骨骼肌纤维内的 钙离子贮存在 A.肌浆内 B.横小管内 C.肌浆网内 D.线粒体内 13.关于心肌纤维结 构的叙述,哪项错误 A .短圆柱形,有分支 B.细胞连接处称闰

南方医科大学实验诊断学知识重点总结

简答题: 1、什么是管型、管型的形成条件 2、什么是核左移、核右移,有什么临床意义 3、渗出液、漏出液 4、肿瘤标志物有哪些 5、正常骨髓结构特点 6、骨髓细胞发育的特点 7、尿糖、尿蛋白什么情况下出现?选择性蛋白尿、非选择性蛋白尿 8、肾小球肾炎尿液的特点,观察到那些管型 第一章 1、分析影响前的因素 2、诊断灵敏度,特异性(联合检测意义) 第二章 1、几个参考值的范围(血常规的基本参考范围如红白细胞,血小板,血红蛋白等;血钾,血钠,GFR,血糖),以及临床意义 2、血沉加快和减慢影响因素 3、异常的红细胞形态有哪些 4、白细胞(考的多),各种情况下,粒细胞和淋巴细胞的增加和减少,贫血,辐射电离,伤寒副伤寒何种细胞增加或减少 5、网织红细胞的定义,增多减少;红细胞沉降速率实验, 6、溶血性贫血几个实验的意义,渗透脆性不需要记住参考值,高铁血红蛋白症(G6PD,蚕豆病),血红蛋白电泳临床意义,combs实验用途, 7、骨髓检查的步骤,内容,方法以及正常骨髓象的形态特点。 8、粒红比值 9、POX染色临床意义,SB染色临床意义,NAP染色临床意义,类白血病的概念,ACP.AS-D NCE,α-NAE,PAS,染色的临床意义 10、最易发生DIC——M3型 11、交叉配血试验的主侧,次侧 12、溶血贫的特点1,2(尿胆原增加)

13、白血病的各个特点/几种类型/什么样的医学方法 14、MDS熟悉 第三章血栓和止血检测 1、临床上的四项检测指标 2、内源性:APTT,延长S异常 3、外源性:PT,延长S异常 4、单纯血友病哪一项指标异常 5、凝血试验一定要做对照 6、假如APTT、PT都延长说明什么 7、凝血酶时间 8、血小板活化会伸出伪足 9、原发性纤溶、继发性纤溶区分标志,异二聚体、3P实验 10、阳性排除、阴性排除 11、肌红蛋白:心梗 第四章排泄物、分泌物及体液检测 1、怎样收集尿液,应注意什么 2、病理性尿液外观;如何区别血尿、血红蛋白尿 3、管型的定义,管型包括那些,透明管型在什么条件下出现 4、正常尿液中可以见到什么? 5、蜡样管型——慢性肾炎 6、最常见的寄生虫,如黏液遍:菌痢 7、潜血、隐血 8、三管化学检查 9、渗出液与漏出液 10、脑脊液蛋白升高最明显的是什么病理状况,糖保持正常是什么病理情况? 11、脑脊液中可见的蛋白质 12、脑脊液中乳酸脱氢酶变化表明什么

生物信息学复习题及答案

生物信息学复习题 名词解释 1. Homology (同源):来源于共同祖先的序列相似的序列及同源序列。序列相似序列并不一定是同源序列。 (直系同源):指由于物种形成的特殊事件来自一个共同祖先的不同物种中的同源序列,它们具有相似的功能。 (旁系(并系)同源):指同一个物种中具有共同祖先,通过基因复制产生的一组基因,这些基因在功能上的可能发生了改变。基因复制事件是促进新基因进化的重要推动力。 (异同源):通过横向转移,来源于共生或病毒侵染而产生的相似的序列,为异同源。 Score:The sum of the number of identical matches and conservative (high scoring) substitutions in a sequence alignment divided by the total number of aligned sequence characters. Gap总是不计入总数中。 6.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。 7. E值:得分大于等于某个分值S的不同的比对的数目在随机的数据库搜索中发生的可能性。衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义,E值越接近零,越不可能找到其他匹配序列。 值:得分为所要求的分值比对或更好的比对随机发生的概率。它是将观测得到的比对得分S,与同样长度和组成的随机序列作为查询序列进行数据库搜索进行比较得到的HSP(高分片段对)得分的期望分布联系起来计算的。通常使用低于来定义统计的显著性。P=1-e-E 9.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法,是序列相似性分析的基础,其不同的选择将会出现不同的分析结果。 10.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。 :美国国家生物技术信息学中心,属于美国国立医学图书馆的一部分,具有BLAST, Entrez ,GenBank等工具,还具有PubMed文献数据库。另外还具有Genome, dbEST, dbGSS , dbSTS, MMDB, OMIM, UniGene, Taxonomy, RefSeq, etc. 序列格式:是将DNA或者蛋白质序列表示为一个带有大于号(>)开始的核苷酸或者氨基酸序列的新文件,其中大于号后可以跟上序列的相关信息,其他无特殊要求。 13genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释,主要包含生物功能或数据库信息;第三部分是feature,对序列的注释;第四部分是序列本身,以“统发生树(Phylogenetic tree )是研究生物进化和系统发育过程中的一种用树状分支图来概括各种生物之间亲缘关系,是一种亲缘分支分类方法。在树中,每个节点代表其各分支的最近共同祖先,而节点间的线段长度对应演化距离(如估计的演化时间)。是用来研究物种进化与多样性的基础,是相近物种相关生物学数据的来源。17.基因树与物种树:物种树反映一组物种进化历程的系统树,其中每一个内部节点就代表一个物种形成的过程,而基因树则是代表来源于不同物种的单个同源基因的差异构建的系统树,而其内部的一个节点则代表一个祖先基因分化为两个新的独特的基因序列的事件。基因

生物信息学课后题及答案-推荐下载

生物信息学课后习题及答案 (由10级生技一、二班课代表整理) 一、绪论 1.你认为,什么是生物信息学? 采用信息科学技术,借助数学、生物学的理论、方法,对各种生物信息(包括核酸、蛋 白质等)的收集、加工、储存、分析、解释的一门学科。2.你认为生物信息学有什么用?对你的生活、研究有影响吗?(1)主要用于: 在基因组分析方面:生物序列相似性比较及其数据库搜索、基因预测、基因组进化和分 子进化、蛋白质结构预测等 在医药方面:新药物设计、基因芯片疾病快速诊断、流行病学研究:SARS 、人类基因组计划、基因组计划:基因芯片。 (2)指导研究和实验方案,减少操作性实验的量;验证实验结果;为实验结果提供更多的支持数据等材料。 3.人类基因组计划与生物信息学有什么关系? 人类基因组计划的实施,促进了测序技术的迅猛发展,从而使实验数据和可利用信息急剧增加,信息的管理和分析成为基因组计划的一项重要的工作 。而这些数据信息的管理、分析、解释和使用促使了生物信息学的产生和迅速发展。 4简述人类基因组研究计划的历程。 通过国际合作,用15年时间(1990-2005)至少投入30亿美元,构建详细的人类基因组遗传图和物理图,确定人类DNA 的全部核苷酸序列,定位约10万基因,并对其他生物进行类似研究。 1990,人类基因组计划正式启动。 1996,完成人类基因组计划的遗传作图,启动模式生物基因组计划。 1998完成人类基因组计划的物理作图,开始人类基因组的大规模测序。Celera 公司加入,与公共领域竞争启动水稻基因组计划。 1999,第五届国际公共领域人类基因组测序会议,加快测序速度。 2000,Celera 公司宣布完成果蝇基因组测序,国际公共领域宣布完成第一个植物基因组——拟南芥全基因组的测序工作。 2001,人类基因组“中国卷”的绘制工作宣告完成。 2003,中、美、日、德、法、英等6国科学家宣布人类基因组序列图绘制成功,人类基因组计划的.目标全部实现。2004,人类基因组完成图公布。 2.我国自主知识产权的主要基因组测序计划有哪些?水稻(2002),家鸡(2004),家蚕(2007),家猪(2012),大熊猫(2010) 2.第一章 、管路敷设技术通过管线不仅可以解决吊顶层配置不规范高中资料试卷问题,而且可保障各类管路习题到位。在管路敷设过程中,要加强看护关于管路高中资料试卷连接管口处理高中资料试卷弯扁度固定盒位置保护层防腐跨接地线弯曲半径标高等,要求技术交底。管线敷设技术包含线槽、管架等多项方式,为解决高中语文电气课件中管壁薄、接口不严等问题,合理利用管线敷设技术。线缆敷设原则:在分线盒处,当不同电压回路交叉时,应采用金属隔板进行隔开处理;同一线槽内,强电回路须同时切断习题电源,线缆敷设完毕,要进行检查和检测处理。、电气课件中调试对全部高中资料试卷电气设备,在安装过程中以及安装结束后进行 高中资料试卷调整试验;通电检查所有设备高中资料试卷相互作用与相互关系,根据生产工艺高中资料试卷要求,对电气设备进行空载与带负荷下高中资料试卷调控试验;对设备进行调整使其在正常工况下与过度工作下都可以正常工作;对于继电保护进行整核对定值,审核与校对图纸,编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料试卷试验方案以及系统启动方案;对整套启动过程中高中资料试卷电气设备进行调试工作并且进行过关运行高中资料试卷技术指导。对于调试过程中高中资料试卷技术问题,作为调试人员,需要在事前掌握图纸资料、设备制造厂家出具高中资料试卷试验报告与相关技术资料,并且了解现场设备高中资料试卷布置情况与有关高中资料试卷电气系统接线等情况,然后根据规范与规程规定,制定设备调试高中资料试卷方案。 、电气设备调试高中资料试卷技术电力保护装置调试技术,电力保护高中资料试卷配置技术是指机组在进行继电保护高中资料试卷总体配置时,需要在最大限度内来确保机组高中资料试卷安全,并且尽可能地缩小故障高中资料试卷破坏范围,或者对某些异常高中资料试卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并且拒绝动作,来避免不必要高中资料试卷突然停机。因此,电力高中资料试卷保护装置调试技术,要求电力保护装置做到准确灵活。对于差动保护装置高中资料试卷调试技术是指发电机一变压器组在发生内部故障时,需要进行外部电源高中资料试卷切除从而采用高中资料试卷主要保护装置。

南方医科大学病理学试题

基础医学院《病理学》模拟试卷(A) (此试卷必须随答题纸一同上交存档,否则取消成绩)年级:专业:学号:姓名: 一、单项选择题( 40 分) 1 .细胞缺氧时最常见的变化是C A .内质网扩张 B .粗面内质网核蛋白体脱落 C .线粒体肿胀 D .高尔基小体形成 E .溶酶体增大 2 .下列哪种变化不属于脂肪变性 ? D A .肾近曲小管上皮细胞内出现多数脂滴 B .肝细胞内出现多数脂滴 C .心肌细胞内出现多数脂滴 D .脂肪细胞内出现多数脂滴 E .巨噬细胞内出现脂滴 3 .老年人心肌细胞内常出现的色素是 C A .胆色素 B .含铁血黄素 C .脂褐素 D .黑色素 E .福尔马林色素 4 .凋亡是细胞的 D A .液化性坏死 B .干酪样坏死 C .脂肪坏死 D .固缩性坏死 E .凝固性坏死 5 .细胞坏死的主要形态学指标是 B A .细胞核增大 B .核缩、核碎、核溶 C .细胞浆红染 D .细胞内出现异常物质 E .核浆比例增大 6 .全身营养不良时首先发生萎缩的组织是 B A .骨骼肌 B .脂肪组织 C .心肌 D .肝实质 E .脑组织 7 .纤维素样变性不见于 E A .风湿病 B .恶性高血压 C .结节性多动脉炎 D .排斥反应 E .瘢痕组织 8 .心力衰竭细胞是指心力衰竭时出现的 C A .含脂褐素的心肌细胞 B .肺泡内吞噬尘埃的巨噬细胞 C .胞浆内含有含铁血黄素的巨噬细胞 D .吞噬脂质的巨噬细胞 E .吞噬黑色素的巨噬细胞 9 .槟榔肝是指 D A .肝脂肪变性 B .肝细胞肿胀 C .肝细胞萎缩 D .肝慢性淤血 E .肝硬变 10 .构成血栓头部的主要成分是 B A .红细胞 B .血小板 C .中性粒细胞 D .淋巴细胞 E .纤维蛋白 11 .弥漫性血管内凝血时可见 B A .混合性血栓 B .透明血栓 C .白色血栓 D .疣状血栓 E .红色血栓 12 .脂肪栓塞易发生于 C A .静脉注射时 B .分娩时 C .外伤骨折时 D .输血时 E .潜水作业时 13 .血栓由肉芽组织取代的过程称为 C A .溶解 B .吸收 C .机化 D .再通

生物信息学题库说课材料

生物信息学题库

■一、选择题: 1.以下哪一个是mRNA条目序列号: A. J01536■. NM_15392 C. NP_52280 D. AAB134506 2.确定某个基因在哪些组织中表达的最直接获取相关信息方式是:■. Unigene B. Entrez C. LocusLink D. PCR 3.一个基因可能对应两个Unigene簇吗?■可能 B. 不可能 4.下面哪种数据库源于mRNA信息:■ dbEST B. PDB C. OMIM D. HTGS 5.下面哪个数据库面向人类疾病构建: A. EST B. PDB ■. OMIM D. HTGS 6.Refseq和GenBank有什么区别: A. Refseq包括了全世界各个实验室和测序项目提交的DNA序列B. GenBank提供的是非冗余序列 ■. Refseq源于GenBank,提供非冗余序列信息D. GenBank源于Refseq 7.如果你需要查询文献信息,下列哪个数据库是你最佳选择: A. OMIM B. Entrez ■ PubMed D. PROSITE 8.比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法,下列哪种说法正确:A. 因为GenBank的数据比EMBL更多,Entrez给出的搜索结果将更多B. 搜索结果很可 能一样,因为GenBank和EMBL的序列数据实际一样■搜索结果应该相当,但是ExPASy中的SwissProt记录的输出格式不同 9.天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于:■ N/W/Y B. Q/W/Y C. F/W/Y D. Q/N/W 10.直系同源定义为:■不同物种中具有共同祖先的同源序列B. 具有较小的氨基酸一致性但是有较大的结构相似性的同源序列 C. 同一物种中由基因复制产生的同源序列 D. 同一物种中具有相似的并且通常是冗余的功能的同源序列 11.下列那个氨基酸最不容易突变: A. 丙氨酸 B. 谷氨酰胺 C. 甲硫氨酸■半胱氨酸 12.PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变: A. 1% B. 20%■. 80% D. 250% 13.下列哪个句子最好的描述了两个序列全局比对和局部比对的不同:A. 全局比对通常用于比对DNA序列,而局部比对通常用于比对蛋白质序列B. 全局比对允许间隙,而 局部比对不允许C. 全局比对寻找全局最大化,而局部比对寻找局部最大化■全局比对比对整体序列,而局部比对寻找最佳匹配子序列 14.假设你有两条远源相关蛋白质序列。为了比较它们,最好使用下列哪个BLOSUM和PAM矩阵:■ BLOSUM45和PAM250 B. BLOSUM45和PAM 1 C. BLOSUM80和PAM250 D. BLOSUM10和PAM1 15.与PAM打分矩阵比较,BLOSUM打分矩阵的最大区别是:A. 最好用于比对相关性高的蛋白B. 它是基于近相关蛋白的全局多序列比对 ■它是基于远相关蛋白的局部多序列比对D. 它结合了全局比对和局部比对 16.如果有一段DNA序列,它可能编码多少种蛋白质序列: A. 1 B. 2 C. 3 ■. 6 17.要在数据库查询一段与某DNA序列编码蛋白质最相似的序列,应选择: A. blastn B. blastp C. tblastn D. tblastp■ blastx 18.为什么ClustalW(一个采用了Feng-Doolittle渐进比对算法的程序)不报告E值:A. ClustalW报告E值■使用了全局比对 C. 使用 了局部比对 D. 因为是多序列比对 19.Feng-Doolittle方法提出“一旦是空隙,永远是空隙”规则的依据是:A. 保证空隙不会引物序列加入而填充B. 假定进化早期分歧的序列有较高优先级别■假定最近序列空 隙应该保留 D. 假定最远序列空隙应该保留 20.根据分子钟假说: A. 所有蛋白质都保持一个相同的恒定进化速率 B. 所有蛋白质的进化速率都与化石记录相符合C. 对于每一个给定的蛋白质,分子进化的速率是逐渐 减慢的,就如同不准时的钟■对于每一个给定的蛋白质,其分子进化的速率在所有的进化分支上大致是恒定 21.系统发生树的两个特征是: A. 进化分支和进化节点■树的拓扑结构和分支长度C. 进化分支和树根D. 序列比对和引导检测方法 22.下列哪一个是基于字母特征的系统发生分析的算法: A. 邻位连接法(NJ法)B. Kimura算法■最大似然法(ML)D. 非加权平均法(UPGMA) 23.基于字母特征和基于距离的系统发生分析的算法的基本差异是:■基于字母特征的算法没有定义分支序列的中间数据矩阵 B. 基于字母特征的算法可应用于DNA或者蛋白质序列,而基于距离仅能用于DNA C. 基于字母特征的算法无法运用简约算法 D. 基于字母特征的算法的进化分支与进化时间无关 24.一个操作分类单元(OTU)可指:A. 多序列比对■蛋白质序列C. 进化分支D. 进化节点 25.构建进化树最直接的错误来源是:■多序列比对错误B. 采样的算法差异C. 假设进化分支是单一起源D. 尝试推测基因的进化关系 26.第一个被完整测定的基因组序列是: A. 啤酒酵母的3号染色体B. 流感病毒■ФX174 D. 人类基因组 27.普通的真核生物线粒体基因组编码大约多少个蛋白质:■ 10 B. 100 C. 1000 D. 10000 28.根据基因组序列预测蛋白质编码基因的算法的最大问题是: A. 软件太难使用■. 假阳性率太高,许多不是外显子的序列部分被错误指定C. 假阳性 率太高,许多不是外显子功能未知 D. 假阴性率太高,丢失太多外显子位点 29.HIV病毒亚型的系统演化研究可以: A. 证实HIV病毒是由牛病毒演化而来■. 用于指导开发针对保守蛋白的疫苗C. 证实哪些人类组织最容易遭受病毒侵染 30.一个典型的细菌基因组大小约为多少bp: A. 20000■. 200000 C. 2000000 D. 20000000

南方医科大学-医学影像学-习题试卷1

广东省住院医师规范化考试 2013年南方医科大学习题试卷1 医学影像学 (祝大家考试成功!答案有误请指出纠正) 单项选择题 (1分)1、关于腹膜后脂肪肉瘤的叙述,不正确的是 ( )正确答案为:D A.即使分化好的肿瘤,密度也常高于人体正常脂肪 B.实体型以纤维组织为主 C.假囊肿型肿瘤多为粘液脂肪肉瘤 D.不伴有瘤内钙化 E.肿瘤密度常不均匀,边界不甚清楚,或呈浸润生长 (1分)2、以下对探头的说法正确的是 正确答案为:E A.脉冲回声式探头可分为单探头、机械探头和电子探头 B.单探头由圆形单晶片组成 C.电子探头采用多元阵结构 D.机械探头利用机械方式使声束进行扫查 E.以上均是 (1分)3、患者,男性,60岁,上腹不适伴体重下降2 月,超声声像

图显示胰头区不规则低回声实性肿块,边界不清,呈蟹足状,下腔静脉受压移位,肝内外胆管扩张,主胰管内径4mm,最可能诊断是 正确答案为:B A.胰岛细胞瘤 B.胰腺癌 C.腹膜后肿瘤 D.胆管癌 E.壶腹癌 1分)4、预后比较严重的脊椎骨折是: 正确答案为:C A.横突骨折 B.椎体压缩骨折 C.椎体骨折片嵌入椎管内 D.棘突骨折 E.肋、椎关节分离 (1分)5、肝脓肿声像图表现最不常见的是: 正确答案为:C A.病变区呈不均匀的低至中等回声,边界模糊,似肝脏恶性肿瘤 B.囊壁厚而不光滑 C.囊壁薄而光滑 D.囊内不规则低回声,随体位改变出现漂浮现象 E.囊壁可有钙化

(1分)6、在SPECT脏器显像中,最理想最常用的放射性核素是 正确答案为:A A.99mTc B.131I C.67Ga D.125I E.123I (1分)7、子宫颈口有部分性胎盘覆盖 ( ) 正确答案为:D A.正常胎盘 B.边缘性前置胎盘 C.完全性前置胎盘 D.部分前置胎盘 (1分)8、下列造影技术中,哪些不属于MR水成像范畴? 正确答案为:C A.MR胰胆管造影 B.MR尿路造影 C.MR血管造影 D.MR泪道造影 E.MR腮腺管造影 (1分)9、左肾静脉走行的位置是 正确答案为:B

南方医科大学八年制临床医学专业教学计划和培养方案_1

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 南方医科大学八年制临床医学专业教学计划和培养 方案 临床医学八年制专业教学计划和培养方案(八年一贯制)一、招生对象招收地方应届高中毕业生。 二、学制八年。 三、培养目标与要求参照国际高水平医学教育的标准和要求,结合我国医学教育的实际和特点,在职业道德、态度、行为和伦理、医学科学基础知识、临床技能、创新思维、科研能力、沟通技能、信息获取、利用等能力和素质方面与国际先进医学教育标准接轨;适应医学卫生事业发展需要,忠诚医学科学事业,团结协作精神好,事业心、进取心强,身心健康、耐挫折、善拼搏;具有宽厚扎实的人文社会科学、自然科学和医学基础知识,具有良好的英语听说读写能力;具有较强的独立分析和解决问题的能力、临床工作能力、从事医学教育和科学研究的能力,创新能力强,发展潜力大,达到临床医学博士水平(M.D)的高级临床医学人才。 (一)思想政治素质要求掌握马列主义、毛泽东思想和邓小平建设有中国特色社会主义理论的基本原理,具有坚定的建设有中国特色社会主义的信念,坚持党在新时期的基本路线,在思想上政治上同党中央保持一致;树立正确的世界观、人生观、价值观和爱国主义、集体主义、社会主义思想;具有良好的医学伦理观念 1 / 18

和职业道德;热爱祖国,热爱人民;具有为祖国富强、中华民族复兴而奋斗,为医疗卫生事业而献身的崇高理想。 (二)业务素质要求具有坚实的基础医学理论知识,系统扎实的临床医学理论知识,必备的军事与军事医学理论知识,基本的预防医学、社会医学、心理学、循征医学及祖国医学理论知识。 具有较好的人文社会科学基础和自然科学基础,熟练掌握一门外语,能够运用外语进行实际交流,并能熟练地阅读和翻译本专业外文书刊;具有良好的信息获取能力,能够熟练运用计算机网络获取、分析和处理信息,要求在第二学年通过全国大学英语四级水平考试、第三学年通过全国大学英语六级水平考试;具有较坚实的基础医学理论与知识,较强的医学实验技能;系统掌握临床医学理论知识和基本技能,基本掌握申请学位学科的发展前沿与趋势,能独立处理临床各科常见病、多发病和一般危急病症,初步掌握申请学位的二级学科的基本医疗技术,了解本学科发展前沿与趋势,达到住院医师规范化培训第一阶段水平,并能对实习医师进行业务指导;具有较强的临床科研能力,完成博士论文训练与答辩;掌握科学的思维方法,具有较强的独立获取知识能力、提出问题与分析解决问题能力、医学研究能力、专业发展能力和一定的创新能力。 (三)文化素质要求具有较广泛的人文社会科学基础,厚实的自然科学基础,基本了解文学、历史、哲学、艺术和现代科学技术的发展,了解医学与人文社会科学之间的内在联系;养成较好的文化修养、优良的道德情操和健康的心理品质,行为端庄、举

生物信息学题库

■一、选择题: 1.以下哪一个是mRNA条目序列号: A. J01536■. NM_15392 C. NP_52280 D. AAB134506 2.确定某个基因在哪些组织中表达的最直接获取相关信息方式是:■. Unigene B. Entrez C. LocusLink D. PCR 3.一个基因可能对应两个Unigene簇吗?■可能 B. 不可能 4.下面哪种数据库源于mRNA信息:■dbEST B. PDB C. OMIM D. HTGS 5.下面哪个数据库面向人类疾病构建: A. EST B. PDB ■. OMIM D. HTGS 6.Refseq和GenBank有什么区别: A. Refseq包括了全世界各个实验室和测序项目提交的DNA序列B. GenBank提供的是非冗余序列 ■. Refseq源于GenBank,提供非冗余序列信息D. GenBank源于Refseq 7.如果你需要查询文献信息,下列哪个数据库是你最佳选择: A. OMIM B. Entrez ■PubMed D. PROSITE 8.比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法,下列哪种说法正确:A. 因为GenBank的数据比EMBL更多,Entrez给出的搜索结果将更多B. 搜索结果很可能 一样,因为GenBank和EMBL的序列数据实际一样■搜索结果应该相当,但是ExPASy中的SwissProt记录的输出格式不同 9.天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于:■N/W/Y B. Q/W/Y C. F/W/Y D. Q/N/W 10.直系同源定义为:■不同物种中具有共同祖先的同源序列B. 具有较小的氨基酸一致性但是有较大的结构相似性的同源序列 C. 同一物种中由基因复制产生的同源序列 D. 同一物种中具有相似的并且通常是冗余的功能的同源序列 11.下列那个氨基酸最不容易突变: A. 丙氨酸B. 谷氨酰胺 C. 甲硫氨酸■半胱氨酸 12.PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变: A. 1% B. 20%■. 80% D. 250% 13.下列哪个句子最好的描述了两个序列全局比对和局部比对的不同:A. 全局比对通常用于比对DNA序列,而局部比对通常用于比对蛋白质序列B. 全局比对允许间隙,而局 部比对不允许C. 全局比对寻找全局最大化,而局部比对寻找局部最大化■全局比对比对整体序列,而局部比对寻找最佳匹配子序列 14.假设你有两条远源相关蛋白质序列。为了比较它们,最好使用下列哪个BLOSUM和PAM矩阵:■BLOSUM45和PAM250 B. BLOSUM45和PAM 1 C. BLOSUM80和PAM250 D. BLOSUM10和PAM1 15.与PAM打分矩阵比较,BLOSUM打分矩阵的最大区别是:A. 最好用于比对相关性高的蛋白B. 它是基于近相关蛋白的全局多序列比对 ■它是基于远相关蛋白的局部多序列比对D. 它结合了全局比对和局部比对 16.如果有一段DNA序列,它可能编码多少种蛋白质序列: A. 1 B. 2 C. 3 ■. 6 17.要在数据库查询一段与某DNA序列编码蛋白质最相似的序列,应选择: A. blastn B. blastp C. tblastn D. tblastp■blastx 18.为什么ClustalW(一个采用了Feng-Doolittle渐进比对算法的程序)不报告E值:A. ClustalW报告E值■使用了全局比对 C. 使用了局部比对 D. 因为是多序列比对 19.Feng-Doolittle方法提出“一旦是空隙,永远是空隙”规则的依据是:A. 保证空隙不会引物序列加入而填充B. 假定进化早期分歧的序列有较高优先级别■假定最近序列空隙应 该保留 D. 假定最远序列空隙应该保留 20.根据分子钟假说:A. 所有蛋白质都保持一个相同的恒定进化速率 B. 所有蛋白质的进化速率都与化石记录相符合C. 对于每一个给定的蛋白质,分子进化的速率是逐 渐减慢的,就如同不准时的钟■对于每一个给定的蛋白质,其分子进化的速率在所有的进化分支上大致是恒定 21.系统发生树的两个特征是: A. 进化分支和进化节点■树的拓扑结构和分支长度C. 进化分支和树根D. 序列比对和引导检测方法 22.下列哪一个是基于字母特征的系统发生分析的算法:A. 邻位连接法(NJ法)B. Kimura算法■最大似然法(ML)D. 非加权平均法(UPGMA) 23.基于字母特征和基于距离的系统发生分析的算法的基本差异是:■基于字母特征的算法没有定义分支序列的中间数据矩阵 B. 基于字母特征的算法可应用于DNA或者蛋白质序列,而基于距离仅能用于DNA C. 基于字母特征的算法无法运用简约算法 D. 基于字母特征的算法的进化分支与进化时间无关 24.一个操作分类单元(OTU)可指:A. 多序列比对■蛋白质序列C. 进化分支D. 进化节点 25.构建进化树最直接的错误来源是:■多序列比对错误B. 采样的算法差异C. 假设进化分支是单一起源D. 尝试推测基因的进化关系 26.第一个被完整测定的基因组序列是:A. 啤酒酵母的3号染色体B. 流感病毒■ФX174 D. 人类基因组 27.普通的真核生物线粒体基因组编码大约多少个蛋白质:■10 B. 100 C. 1000 D. 10000 28.根据基因组序列预测蛋白质编码基因的算法的最大问题是:A. 软件太难使用■. 假阳性率太高,许多不是外显子的序列部分被错误指定C. 假阳性率太高,许 多不是外显子功能未知 D. 假阴性率太高,丢失太多外显子位点 29.HIV病毒亚型的系统演化研究可以:A. 证实HIV病毒是由牛病毒演化而来■. 用于指导开发针对保守蛋白的疫苗C. 证实哪些人类组织最容易遭受病毒侵染 30.一个典型的细菌基因组大小约为多少bp:A. 20000■. 200000 C. 2000000 D. 20000000

生物信息学复习资料全

一、名词解释(31个) 1.生物信息学:广义:应用信息科学的方法和技术,研究生物体系和生物过程 息的存贮、信息的涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。狭义:应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。 2.二级数据库:对原始生物分子数据进行整理、分类的结果,是在一级数据库、 实验数据和理论分析的基础上针对特定的应用目标而建立的。 3.多序列比对:研究的是多个序列的共性。序列的多重比对可用来搜索基因组 序列的功能区域,也可用于研究一组蛋白质之间的进化关系。 4.系统发育分析:是研究物种进化和系统分类的一种方法,其常用一种类似树 状分支的图形来概括各种(类)生物之间的亲缘关系,这种树状分支的图形称为系统发育树。 5.直系同源:如果由于进化压力来维持特定模体的话,模体中的组成蛋白应该 是进化保守的并且在其他物种中具有直系同源性。 指的是不同物种之间的同源性,例如蛋白质的同源性,DNA序列的同源性。(来自百度) 6.旁系(并系)同源:是那些在一定物种中的来源于基因复制的蛋白,可能会 进化出新的与原来有关的功能。用来描述在同一物种由于基因复制而分离的同源基因。(来自百度) 7.FASTA序列格式:将一个DNA或者蛋白质序列表示为一个带有一些标记的 核苷酸或氨基酸字符串。 8.开放阅读框(ORF):是结构基因的正常核苷酸序列,从起始密码子到终止 密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。(来自百度) 9.结构域:大分子蛋白质的三级结构常可分割成一个或数个球状或纤维状的区 域,折叠得较为紧密,各行其功能,称为结构域。 10.空位罚分:序列比对分析时为了反映核酸或氨基酸的插入或缺失等而插入空 位并进行罚分,以控制空位插入的合理性。(来自百度) 11.表达序列标签:通过从cDNA文库中随机挑选的克隆进行测序所获得的部分 cDNA的3’或5’端序列。(来自文献) 12.Gene Ontology 协会: 13.HMM 隐马尔可夫模型:将核苷酸序列看成一个随机序列,DNA序列的编 码部分与非编码部分在核苷酸的选用频率上对应着不同的Markov模型。14.一级数据库:数据库中的数据直接来源于实验获得的原始数据,只经过简单 的归类整理和注释 15.序列一致性:指同源DNA顺序的同一碱基位置的相同的碱基成员, 或者蛋 白质的同一氨基酸位置的相同的氨基酸成员, 可用百分比表示。 16.序列相似性:指同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所 占的比例。 17.Blastn:是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将 同所查序列作一对一地核酸序列比对。(来自百度) 18.Blastp:是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐 一地同每条所查序列作一对一的序列比对。(来自百度)

眼科学考点整理 南方医科大学

1.前房角: (1)境界:周边角膜与虹膜根部连接处,前外侧壁为角膜缘,从角膜后弹力层止端到巩膜突;后内侧壁睫状体前端和虹膜根部。 (2)能欧见到的结构:schwalbe线,小梁网和schlemm管,巩膜突,睫状带和虹膜根部。 2.视盘:据黄斑鼻侧3mm,1.5mmx1.75mm 3.视网膜脱离位置:视网膜视杯外层形成单一的视网膜色素上皮(RPE)层,视杯内层分 化为视网膜神经感觉层,二者间间隙就是。(简而言之色素上皮和神经感觉) 4.视网膜神经感觉层由外向内:感光细胞层;外界膜;外核层;外丛状层;内核层;内丛 状层;神经节细胞层;神经纤维层;内界膜。 5.眼睑的结构: (1)从外向内分五层:皮肤,皮下组织,肌层,睑板层,结膜曾 (2)肌肉三层:前腱膜,成重睑;中间平滑肌(muller),后部腱膜止于穹窿结膜。 6.结膜的部分:间接莫,球结膜,穹窿结膜。 7.眼外肌:5,6,7,8分别指:内直肌,下直肌,外直肌和上直肌(5,6,7,8内下外上,四舍 五入) 8.视路: (1)概念:视觉信息从视网膜光感受器开始到大脑枕叶视觉中枢的传导路径。 (2)路径:视神经,视交叉,视束,外侧膝状体,视放射,枕叶视中枢 9.视神经: (1)眼内段(使神经乳头):神经血供来自视网膜动脉分支和睫状后短动脉分支 (2)眶内段:肌锥内 (3)管内段:通过视神经管的部分【最容易损伤部分】 (4)颅内段:出视神经管到达视交叉之前 10.眼部血供: (1)睫状后短动脉:主要供应脉络膜和视网膜外层 (2)睫状后长动脉:主要供应虹膜,睫状体和前部脉络膜 11.与眼相关的脑神经以及支配 (1)II:视神经 (2)III:动眼神经,支配所有眼内肌,上睑提肌和除外直肌和上斜肌以外的眼外肌。参与睫状神经节的构成; (3)IV:滑车神经,支配上斜肌,向下内 (4)V:三叉神经,眼部感觉。分出鼻睫状神经。 (5)VI:展神经,外直肌,眼外展 (6)VII:面神经,支配言论杂技 12.泪膜的分层 (1)脂质层:表面。睑板腺分泌形成 (2)水液层:中间。泪腺和副泪腺分泌形成; (3)黏蛋白层:底部。眼表上皮细胞和结膜杯状细胞分泌形成。 13.泪膜的生理作用: (1)润滑眼球表面 (2)防止角结膜干燥 (3)保持角膜光学特性 (4)共给角膜氧气 (5)冲洗和抵御眼球表面的异物和微生物

2018南方医科大学应用心理学考研招生简章

2018年南方医科大学心理学考研大纲,招生简章,专业目录,参考书目每年变动都很小,力比多学院小编建议招生简章关注报考条件、专业信息、时间流程、奖学金及联系方式,专业目录关注招生人数,推免人数及各方向注意事项。 力比多学院教研组为各位心理学考研人整理出2017南方医科大学心理学硕士研究生招生简章,希望能帮到准备考研的同学。 一、院校介绍 南方医科大学心理学系其前身为第一军医大学心理学教研室,2004年跟随第一军医大学整体转制,2005年发展为南方医科大学心理学系,2010年在学系的基础上整合校内各方资源成立南方医科大学心理学系。 心理学系现有专职教师15人,兼职教师14人,其中教授11人,研究员1人,主任医师2人,副高职称5人,博士生导师6人。所有人员均为硕士以上学历,博士13名。 在教学方面,经过多年来的建设,形成了全日制学历教育、双学位、轮训等多种培训形式,培养从本科到硕士、博士各个层次的高级心理学人才。自2004年起开设四年制应用心理学本科专业,授予理学学士学位;2008年起开设五年制临床医学(临床心理学)本科专业,授予医学学士学位;2017年起开设五年制精神医学本科专业,授予医学学士学位。2000年起开始招收应用心理学硕士研究生,2009年起开始招收心理卫生学博士研究生,2014年起开始招收博士后研究人员。 二、报名指导 2018年南方医科大学心理学考研招生简章限时占未公布,根据力比多学院小编多年混迹心理学考研圈的经验来看,2018年南方医科大学应用心理学考研大

纲,招生简章,专业目录,参考书目每年变动都很小,如需了解2018招生简章请参考历年南方医科大学心理学研招生简章。 力比多学院(https://www.wendangku.net/doc/da14459486.html,)教研组为各位心理学考研人整理出2017南方医科大学心理学硕士研究生招生简章,希望能帮到准备考研的同学。 心理学专业目录/研究方向 2017南方医科大学心理学研究生招生,研究方向,具体如下: (006)公共卫生与预防医学学位分委员会(040203)应用心理学 招生简章 一、研究生教育平台简介 南方医科大学前身为中国人民解放军第一军医大学,1951年10月创建,1978年被确定为全国首批重点大学。2004年8月,根据国务院、中央军委决定,学校整体移交广东省,更名为南方医科大学。学校座落在经济发达的历史文化名城广州,校园绿树成荫,花团锦簇,是广东省一级园林式院校。 学校下设基础医学、临床医学、生物医学工程、中医药学、公共卫生等16个二级学院和6所附属医院。学科涵盖医学、工学、理学、法学、管理学、文学、教育学、经济学八大领域,共拥有10个博士学位授权一级学科(基础医学、临床医学、生物学、中西医结合、中药学、公共卫生与预防医学、药学、特种医学、护理学、生物医学工程),专业学位博士学位授权学科1个(临床医学),博士学位授权交叉学科4个(传染病预防控制、卫生应急、生物信息学、临床遗传学);拥有3个国家重点学科(内科学(消化系病)、人体解剖与组织胚胎学、中西医结合临床)、2个国家重点培育学科(病理学与病理生理学、外科学(骨外))。共拥有19个硕士授权一级学科,3个硕士授权二级学科,其中专业学位硕士授权一级学科6个。 现有来自全国29个省、自治区、直辖市的全日制在校学生20000余人,留学生800余人,其中全日制博士、硕士研究生4000余人,在职博士、硕士研究生1500余人,港澳台研究生100余人。 学校师资力量雄厚,拥有一大批在国际国内有影响的著名学者、专家,现有中国科学院和中国工程院院士3名,国家“973”项目首席科学家3名,博士

2019版国科大生物信息学期末考试复习题

中科院生物信息学期末考试复习题 陈润生老师部分: 1.什么是生物信息学,如何理解其含义?为什么在大规模测序研究中,生物信息学至关重要? 答:生物信息学有三个方面的含义: 1)生物信息学是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和 解释的所有方面,是基因组研究不可分割的部分。 2)生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语 言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。 3)生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。它 是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。 2.如何利用数据库信息发现新基因,其算法本质是什么? 答:利用数据库资源发现新基因,根据数据源不同,可分2种不同的查找方式: 1)从大规模基因组测序得到的数据出发,经过基因识别发现新基因: (利用统计,神经网络,分维,复杂度,密码学,HMM,多序列比对等方法识别特殊序列,预测新ORF。但因为基因组中编码区少,所以关键是“数据识别”问题。)利用大规模拼接好的基因组,使用不同数据方法,进行标识查找,并将找到的可能的新基因同数据库中已有的基因对比,从而确定是否为新基因。可分为:①基于信号,如剪切位点、序列中的启动子与终止子等。②基于组分,即基因家族、特殊序列间比较,Complexity analysis,Neural Network 2)利用EST数据库发现新基因和新SNPs: (归属于同一基因的EST片断一定有overlapping,通过alignment可组装成一完整的基因,但EST片断太小,不存在数据来源,主要是拼接问题) 数据来源于大量的序列小片段,EST较短,故关键在正确拼接。方法有基因组序列比对、拼接、组装法等。经常采用SiClone策略。其主要步骤有:构建数据库;将序列纯化格式标准化;从种子库中取序列和大库序列比对;延长种子序列,至不能再延长;放入contig库①构建若干数据库:总的纯化的EST数据库,种子数据库,载体数据库,杂质、引物数据库,蛋白数据库,cDNA数据库; ②用所用种子数据库和杂质、引物数据库及载体数据库比对,去除杂质; ③用种子和纯化的EST数据库比对 ④用经过一次比对得到的长的片段和蛋白数据库、cDNA数据库比较,判断是否为已有序列,再利用该大片段与纯化的EST数据库比对,重复以上步骤,直到序列不能再延伸; ⑤判断是否为全长cDNA序列。 (利用EST数据库:原理:当测序获得一条EST序列时,它来自哪一个基因的哪个区域是未知的(随机的),所以属于同一个基因的不同EST序列之间常有交叠的区域。根据这种“交叠”现象,就能找出属于同一个基因的所有EST序列,进而将它们拼接成和完整基因相对应的全长cDNA序列。而到目前为止,公共EST数据库(dbEST)中已经收集到约800万条的人的EST序列。估计这些序列已覆盖了人类全部基因的95%以上,平均起来每个基因有10倍以上的覆盖率。)

相关文档
相关文档 最新文档