当前位置：文档库 › JBI评价工具--病例报告

JBI评价工具--病例报告

The Joanna Briggs Institute

Introduction

The Joanna Briggs Institute (JBI) is an international, membership based research and development organization within the Faculty of Health Sciences at the University of Adelaide. The Institute specializes in promoting and supporting evidence-based healthcare by providing access to resources for professionals in nursing, midwifery, medicine, and allied health. With over 80 collaborating centres and entities, servicing over 90 countries, the Institute is a recognized global leader in evidence-based healthcare.

JBI Systematic Reviews

The core of evidence synthesis is the systematic review of literature of a particular intervention, condition or issue. The systematic review is essentially an analysis of the available literature (that is, evidence) and a judgment of the effectiveness or otherwise of a practice, involving a series of complex steps. The JBI takes a particular view on what counts as evidence and the methods utilized to synthesize those different types of evidence. In line with this broader view of evidence, the Institute has developed theories, methodologies and rigorous processes for the critical appraisal and synthesis of these diverse forms of evidence in order to aid in clinical decision-making in health care. There now exists JBI guidance for conducting reviews of effectiveness research, qualitative research, prevalence/incidence, etiology/risk, economic evaluations, text/opinion, diagnostic test accuracy, mixed-methods, umbrella reviews and scoping reviews. Further information regarding JBI systematic reviews can be found in the JBI Reviewer’s Manual on our website.

JBI Critical Appraisal Tools

All systematic reviews incorporate a process of critique or appraisal of the research evidence. The purpose of this appraisal is to assess the methodological quality of a study and to determine the extent to which a study has addressed the possibility of bias in its design, conduct and analysis. All papers selected for inclusion in the systematic review (that is –those that meet the inclusion criteria described in the protocol) need to be subjected to rigorous appraisal by two critical appraisers. The results of this appraisal can then be used to inform synthesis and interpretation of the results of the study. JBI Critical appraisal tools have been developed by the JBI and collaborators and approved by the JBI Scientific Committee following extensive peer review. Although designed for use in systematic reviews, JBI critical appraisal tools can also be used when creating Critically Appraised Topics (CAT), in journal clubs and as an educational tool.

JBI Critical Appraisal Checklist for Case Reports Reviewer Date

Author Year Record Number

Yes No Unclear Not

applicable

1.Were patient’s demographic characteristics clearly described? □□□□

2.Was the patient’s history clearly described and presented as a timeline? □□□□

3.Was the current clinical condition of the patient on presentation clearly described? □□□□

4.Were diagnostic tests or assessment methods and the results clearly described? □□□□

5.Was the intervention(s) or treatment procedure(s) clearly described? □□□□

6.Was the post-intervention clinical condition clearly described? □□□□

7.Were adverse events (harms) or unanticipated events

identified and described? □

□□□8.Does the case report provide takeaway lessons? □□□□Overall appraisal: Include □Exclude □Seek further info □

Comments (Including reason for exclusion)

Explanation of case reports critical appraisal

How to cite:The Joanna Briggs Institute. Joanna Briggs Institute Reviewers' Manual: 2016 edition. Australia: The Joanna Briggs Institute; 2016.

Case Reports Critical Appraisal Tool

Answers: Yes, No, Unclear or Not/Applicable

1.Were patient’s demographic characteristics clearly described?

Does the case report clearly describe patient's age, sex, race, medical history, diagnosis, prognosis, previous treatments, past and current diagnostic test results, and medications? The setting and context may also be described.

2.Was the patient’s history clearly described and presented as a timeline?

A good case report will clearly describe the history of the patient, their medical, family and psychosocial history including relevant genetic information, as well as relevant past interventions and their outcomes. (CARE Checklist 2013).

3.Was the current clinical condition of the patient on presentation clearly described?

The current clinical condition of the patient should be described in detail including the uniqueness of the condition/disease, symptoms, frequency and severity. The case report should also be able to present whether differential diagnoses was considered.

4.Were diagnostic tests or methods and the results clearly described?

A reader of the case report should be provided sufficient information to understand how the patient was assessed. It is important that all appropriate tests are ordered to confirm a diagnosis and therefore the case report should provide a clear description of various diagnostic tests used (whether a gold standard or alternative diagnostic tests). Photographs or illustrations of diagnostic procedures, radiographs, or treatment procedures are usually presented when appropriate to convey a clear message to readers.

5.Was the intervention(s) or treatment procedure(s) clearly described?

It is important to clearly describe treatment or intervention procedures as other clinicians will be reading the paper and therefore may enable clear understanding of the treatment protocol. The report should describe the treatment/intervention protocol in detail; for e.g. in pharmacological management of dental anxiety - the type of drug, route of administration, drug dosage and frequency, and any side effects.

6.Was the post-intervention clinical condition clearly described?

A good case report should clearly describe the clinical condition post-intervention in terms of the presence or lack thereof symptoms. The outcomes of management/treatment when presented as images or figures would help in conveying the information to the reader/clinician.

7.Were adverse events (harms) or unanticipated events identified and described?

With any treatment/intervention/drug, there are bound to be some adverse events and in some cases, they may be severe. It is important that adverse events are clearly documented and described, particularly a new or unique condition is being treated or when a new drug or treatment is used. In addition, unanticipated events, if any that may yield new or useful information should be identified and clearly described.

8.Does the case report provide takeaway lessons?

Case reports should summarize key lessons learned from a case in terms of the background of the condition/disease and clinical practice guidance for clinicians when presented with similar cases.

References:

Gagnier, J. J., Kienle, G., Altman, D. G., Moher, D., Sox, H., & Riley, D. (2013). The CARE Guidelines: Consensus‐Based Clinical Case Reporting Guideline Development. Headache: The Journal of Head and Face Pain,53(10), 1541-1547.

文献质量评价具体方法及案例

附1：文献评价参考方案如何评价护理科研论文 Evaluating Research Reports 在临床护理实践中开展护理科研不仅是一种传递学术信息的手段，同时，也有利于促进护理实践水平的提高。因此，护理科研实际上是与每一名护理专业相关人员都息息相关的，并不是少数专门从事护理研究的人员的责任。作为一名专业护理执业者，我们首先应具备评价专业领域的相关研究报告的能力。因此，本篇旨在为护理专业人员提供对于护理科研论文严谨、深入评价的具体指导。本篇以评鉴量性研究研究报告质量为例，所列评价要点及问题来源于《Nursing Research: Principles and Methods》（Denise F. Polit, Bernadette P. Hungler.）（以下为本项目组的中文翻译版本）一、研究报告评价的基本原则 1.对于你所评价的研究报告，不要只评论该研究的缺陷和不足，要看到其优势及价值，任何一项研究的开展都有其对护理实践的独特意义，不要忽略这些闪光点，且应在你的文献评价报告中有所体现。 2.对于你所提出的该项研究的优势及不足之处，应给出具体的实例论证支持。切莫仅仅给出空泛的赞扬或批评。 3.让大家信服你所提出的评价。例如对研究报告中研究者未能合理解决的问题提供一个更好的解决办法或更强大的理论支持。 4.评价应尽可能的客观。不要因为你对该研究的主题不感兴趣，或是你的理论信仰与该研究的理论基础相悖就过度批判。 5.对于提出的否定的评价应措辞恰当，表达清晰明白，语言中肯，应站在研究者的角度来考虑评价的语言是否合适、易于接受，既不要过分谦逊，也不要出言讽刺。 6.给研究者或对未来类似研究的开展提出建议。不要仅仅指出问题，应提出具体的、可实施的建议。 7.对研究的各个方面综合评价——研究的本质、理论基础、方法学基础、伦理问题、对研究结果的解释和图表等多方面均应涉及。二、对研究问题及研究假设的评价 1.研究者是否明确的提出了研究问题；是否对研究的范围给出了合理的限定？ 2.该研究问题对护理学科是否具有重要意义？其研究意义具体体现在护理临床实践、护理管理、护理教育等哪些方面？ 3.该研究问题与研究开展的理论框架是否合理匹配？ 4.研究问题是通过何种方式阐述的，陈述具体的研究目的，提出研究问题，还是提出需要检验的假设条件？另外，问题的阐述是否清晰、明确？在研究报告中，提出研究问题的过程是否合乎逻辑？研究问题的阐述是否在文中位置明显，易于引起阅读者的注意？5.研究目的或研究问题表述是否完整？例如，是否确定了研究的关键概念及变量，具体指出了研究群体和目标人群？ 6.如果该研究报告没有正式的提出研究的目的或假设，这种缺失是否有其合理性？

教育测量与评价自考资料(整理打印版)

《教育测量与评价复习纲要 6、教育测量的特点有测量结果的间接性，度量单位的相对性，测量对象的复杂性，测量目的的针对性。第二节：教育评价概述 1、2.、3、4、国外学者关于教育评价的观点:①泰勒：确定教育目标在实际上被理解到何种程度的过程；②克龙巴赫：评价是为决策提供信息的过程；③斯克里文和豪斯：评价是一种对优缺点和价值的评估，是一种既有描述又有判断的活动；④大桥正飞夫：教育评价就是对照教育目标，对教育行为产生的变化进行价值上的判断。 4、5、教育评价具有导向功能、监督检查功能、激励功能、筛选择优功能、诊断改进功能。 6、7、在教育、教学活动开始之前，为使计划更有效地实施而进行的预测性、摸底性评价是诊断性评价。 8、形成性评价指在教育、教学活动计划实施的过程中，对计划、方案执行情况进行的评价。 9、总结性评价指某一教育、教学活动项目，是告一段落或完成以后进行的评价。第三节：教育测评的发展阶段 ⑩美国的教育测验运动分三个时期：1904-1915开拓期，1915-1930为兴盛期，1930-1940为批判期。 1931年塞蒙兹主人格测量应用评定发、问卷法、交谈法、轶事记录法等。 2、1904年桑代克发表了《精神与社会测验学导论》，标志着教育测验运动的开始。 3、 4、1963年，克龙巴赫发表了《通过评价改革课程》。第一节：信度 2、计算信度的几种常用的方法：①稳定性系数：又称为重测信度，它是指用同一测验试卷，在先后两个不同时间同一组被试进行测验，两次测验实得分数的相关系数。这是估量信度最简单的方法。②等值性系数：先实施第一次测验，然后在最短的时间实施第二份等值的测验，再求他们得分的相关系数，这个相关系数就是信度的等值性系数。③部一致性系数：把一次测验人为地分成两部分，比较两个部分的一致程度，从而估计信度系数。估计方法有两种：分半信度和库德尔-理查森公式法。④论文式测验信度系数；⑤评分者信度。 4、测量误差的来源基本可分为三类：第一类误差产生于测验的本身；第二类误差与特定的实施条件有关；第三类误差包括被试本身的变化。 1、2、效度分为三大类：容效度、效标关联效度、结构效度。 3、容效度是指测验目的代表所欲测量的容和引起预期反应所达到的程度。估计容效度的方法有：逻辑分析的方法和用测验题目与教材容比较的方法。 45、结构效度是指一个测量能实际测量出理论上的狗年或者心理特性的程度。 6、影响效度的因素：测验的组成；测验的实施；被试主观状态方面；估计效度所依据的效标；样本方面。 7、提高效度的方法：控制系统误差；精心编制量表；妥善组织测验；扩充样本的容量和代表性；合理处理效度和信度的关系；适当增加测验的长度。 1、2、难度对测验的影响：影响测验分数的分布形态；影响测验分数的离散程度；影响测验的鉴别能力。 3、影响题目难度的因素：①考查知识点的多少；②考查能力的复杂程度或层次的高低； ③考生对题目的熟悉程度；④命题的技巧性。

Newcastle-Ottawa Scale (NOS)文献质量评价量表(中文版)

Newcastle-Ottawa Scale (NOS)文献质量评价量表 (中文版）病例对照研究注：每一项研究在“选择”和“暴露”上的每一个条目最多可以有一个而在“可比性”上的条目最多可以有两个选择 1)病例的定义是否充分？ a)是，并有独立验证（如至少2名医生共同对病例做出诊断；或至少依据2 种或2次的诊断结果；或者查阅了原始记录，如X线、医院病历）* b)是，并有联动数据(如根据肿瘤登记数据中的ICD编码来判断是否为病例）或基于自我报告，但无原始记录 c)没有说明 2)病例的代表性 a)连续收集且有代表性的病例（如规定时间内患有目标疾病的所有合格病例；或特定饮水供应区的所有病例；或特定医院或诊所、一组医院、健康管理机构的所有病例；或从这些病例中得到的一个合适的样本，如随机样本）* b)存在潜在的选择偏倚或没有说明 3)对照的选择 a)社区对照* b)医院对照 c)没有说明 4)对照的定义 a)没有疾病史（或未发生终点事件）* b)没有说明来源

可比性 1)基于设计或分析所得的病例与对照的可比性 a)研宄控制____了 (选择最重要的因素，如年龄）（如设计时，病例和对照按年龄匹配；或两组人群的年龄比较无统计学差异）* b)研宄控制了其他重要的混杂因素（如设计时，病例和对照除按年龄匹配以外，还匹配了其他因素；或两组人群的其他重要混杂因素之间的比较无统计学差异）* 暴露 1)暴露的确定 a)可靠的记录（如手术记录）* b)在盲法（不清楚谁是病例，谁是对照）的情况下，采用结构化调查获得* c)在非盲（已清楚谁是病例，谁是对照）的情况下进行的调查 d)书面的自我报告或病历记录 e)无描述 2)病例和对照的暴露是否采用了相同的确定方法 a)是* b)没有 3)无应答率 a)两组的无应答相同* b)无描述

10试谈语文教育与测量评价的原则

试谈语文教育测量与评价的原则王萍1 摘要：制定体现新课程理念的语文教育测量与评价方案，是当前语文教学改革面临的一个重要课题。为了保证语文教育测量与评价方案的可用性，必须遵循科学性原则、简洁性原则、区分性原则、公平性原则和可行性原则。关键词：语文教育测量与评价方案；信度；效度；可行性原则教育测量与评价有许多重要的功能，如评定的功能、判断的功能、选拔的功能、反馈的功能、导向的功能和预测的功能等，但这些功能否得到很好的发挥依赖于我们能否制定出科学的方案，能否正确地认识和使用测量与评价手段。如同任何教育一样，语文教育的效果究竟如何，也需要测量，需要评价。制定体现新课程理念的语文教育测量与评价方案，是当前面临的一个重要课题。为了保证方案的可用性，必须遵循如下原则：一、科学性原则语文教育测量与评价方案的质量性能要做到可靠稳定，必须遵循科学性原则。从测量与评价的结果来说，科学性是指测评结果能准确地反映被测对象的真实情况，达到测量的目的，即测量要具有较高的信度和效度。信度即测量结果的可信程度。也就是说如果用同一测量工具测量同一种特质对象，多次测量的一致性程度就叫信度。教育测量与评价运用到语文教学，与其他学科相比情况更复杂。最典型的就是对学生作文水平的测评。高考语文科作文题是高考所有科目中赋分值最大的试题，占语文科全卷赋分的40％。然而，当两位老师同判一份卷，或者同一老师不同时间判一份卷，其结果往往会大相径庭。有人在1983年高考作文试卷中取出一个考生的作文《一幅漫画的启示》，连同教育部规定的评分标准，复印后寄给近百名的中学教师评分，收回的67位教师的评分统计表明，这篇作文所评分数从6分到25分之间，分数达17种之多，最高与最低分相差19分。[1]为了提高信度，广西率先实现了无纸化阅卷，在阅卷过程中设置了可允许误差范围。试卷经两位阅卷人员评阅后，分值在误差范围内的则取平均值作为最后成绩；分值超出误差范围，则将该试卷交第三阅卷人评判。若仍出现较大误差，则将该试卷交第四人——核心专家评判，并由其作出最终评判。效度，顾名思义就是一次测量的有效程度。严格的说，效度就是一个测验或量表实际能测出其所要测量的特性的程度。例如，为了测量学生的语文水平，总是用分辨错字、作文之类的试题，不会用数学题目。效度是测量质量的一个极其重要的方面，测量工具如果无效或效度太低，就失去了存在的价值。在处理信度与效度的关系问题上，首先要保证高的效度。由于命题的质量将直接影响到测量结果的效度，笔者对历年来的语文高考试题进行了仔细的分析，并在分析过程中发现了语文高考试题存在的一些效度较低的题目。例：1994年全国普通高考语文试题第七小题： 7、下列句子在修辞运用上与其他三句不同的一句是(2分)（） A.这几天跟过节一样热闹。 B.那里的蔬菜跟水果一样贵。 *本文为湖南文理学院人文社科项目“基于网络的作文评价系统研究”（JJQD05020）的研究成果之一。作者简介：王萍（1979—），女，湖南郴州人，湖南文理学院讲师，广西师范大学语文课程与教学论硕士研究生，主要从事语文教学评价研究。

教育测量与评价

教育测量与评价文件编码（008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256）

《教育测量与评价》习题（一）填空题 1. _桑代克_的论着《精神与社会测量导论》一书标志着教育测量理论的诞生，泰勒领导了着名的八年研究并提出“行为目标评价模式”，最早提出了教育评价的概念，被称为“当代教育评价之父”。 2. 按照测量的精确程度，教育测量量表从低级到高级分为称名量表、顺序量表、区间量表/等距量表和比率量表。 3. 某道论述题满分12分，所有考生在这道题上的平均得分为分，则此题的难度为。 4.教育基本理论研究、教育测量与评价科学研究以及教育发展理论研究已成为现代教育科学研究的三大领域。 5. 教学工作评价的内容包括对教师的备课、上课、批改作业、课外辅导、命题考试等教学工作基本环节的评价。（二）判断题（√）1. 测验的信度受许多因素的影响。一般来讲，增加测验的长度，可以提高试题取样的代表性，因而有助于提高测验的信度。（√）2. 标准分数本身是关于原始分数的一种线性变换，因此，标准分数不改变原始分数的分布形态。（×）3. 假如某学生在期中语文统考中卷面分数为85分，又知该学生所在年级中有60％的学生成绩低于85分，则该学生的百分等级为51。（×）4. 等距变量具有等级变量的特征，要求连续数量之间的差距相等，亦即具有相等的单位。因此，等距变量可以作加减乘除运算。

（×）5. 教育评价的主要功能就是甄别和选拔，通过各个层次的教育评价可以监督教师的教学工作和学生的学习活动，确保学校教育教学工作的正常进行。（√）6. 测验试题的难度影响着测验分数的分布。（×）7. 现代测量理论是在经典测量理论的基础上发展起来的，修正了经典测量理论的不足，所以现代测量理论可以完全代替经典测量理论。（√）8. 发展性教学评价认为面面俱到的课不是好课，只是“教教材”，没有“用教材教”的课也不是好课。（三）简答题 1. 常见的指标权重分配方法有哪几种【答题要点】：常见的指标权重分配方法包括：（1）关键特征调查法；（2）两两比较法；（3）专家评判平均法；（4）倍数比较法；（5）Q分类法。答题时一是要阐述清楚这五种方法各自的内涵是什么，二是简单说明这五种方法的操作步骤。相关内容可参考第七章“制定教育评价表的一般方法和步骤”中第二节“教育评价表的构成及编制”。 2. 衡量测验质量的四个指标分别是什么【答题要点】：（1）衡量测量质量的四个指标分别是信度、效度、难度和区分度。（2）在答案中需阐述清楚这四个指标分别的定义是什么。（3）一个良好的测验应该具备恰当的难度和区分度，具备较高的信度和效度。（4）指出这四个指标对于测量质量的意义，即前两个指标主要是对整个测验而言，后来两个指标主要是对测量的项目而言。相关内容可参考第三章“教育测量与评价的质量特性”。 3. 在现代社会中，具有健康人格的学生具有哪些特征

教育测量与评价

第一章、教育测量与评价的学科发展填空用数字对事物在量上的规定性予以确定，就需要有一个测量或计算的起点，这个起点叫参照点。量表，指的是确定了测量单位和参照点并具有取值系统的测量工具。泰勒指出英国剑桥大学直到1720年才开始使用笔试。20世纪初，在桑代克的影响下名词解释教育测量：就是针对学校教育影响下学生各方面的发展，侧重从量的规定性上予以确定和描述的过程。教育评价：是根据一定的标准，对教育事物或现象的价值进行系统的调查，在获取足够多的资料事实基础上，作出价值分析和价值判断。简答题教育测量的特点 ①间接性和推断性 ②测量对象的模糊性和测量误差的不可避免性 ③量表具有多样性，结果具有相对抽象性 “八年研究”的基本原则 ①应当帮助学生学习什么，即在教育计划中，应当帮助学生发展哪些思维、感觉和行动的方式。 ②为了帮助学生达到教育目标，应当提供什么学习经验，即怎样帮助学生学习预期的东西。 ③怎样组织学习经验，以使这些经验的累计效果最大，即怎样的学习顺序和学习经验的整体计划会有助于学生内化他们所学之物，并将其应用于适当的环境。 ④怎样评价方案效果，即随后采取什么步骤，以不断检查期望的学习活动所发生的变化。美国的“八年研究”对传统的教育测验提出的一些批评 ①传统测验是片断的，不能全部了解知识之过程和人格之发展。 ②测验只是关注客观的信度，但对于质的妥当性已不足以说明。 ③测验是教科书主义，测验内容关注记诵教材中的知识，是片面的，不能反映学生的全面发展。 ④对测量或考试的过分依赖必然养成个人主义与被动式的学习态度等等。第二章、教育测量与评价的类型和功能填空教育测量评价可大致分成常模参照、标准参照和潜力参照。教育测量与评价所指向的被试的行为表现，按其性质分成最佳行为和典型行为。名词解释 1、形成性测量与评价：是在教学过程中经常实施的，在性质上大致相当于现在的中小学单元测验。形成性测量与评价的目的，对教育而言是藉此获得教学过程中连续性的反馈，了解学生的学习效果、学习历程、学习特点、学习困难等信息，作为随时修正自己教学的参考。 2、常模参照测量与评价：是将被试水平与测验常模相比较，以评价被试团体中的相对地位的一种测量与评价类型。也就是说，常模参照评价对学生学习成就的解释，是采用了相对的观点。 3、标准化测验：是指由测量专家严格按照测验编制程序而编成的一种测验，通常标准化测

不同类别META分析文献质量评价工具及使用word版本

不同类别META分析文献质量评价工具 sisiyang2015-11-20 14:37:54 （一）随机对照试验的质量评价工具：Cochrane风险偏倚评估工具（最常用），PEDro量表，Delphi清单，CASP清单，Jadad量表，Chalmers量表，CONSORT声明（不专用，但可以用）。（二）观察性研究的质量评价工具：（1）NOS量表（最常用）：病例对照研究和队列研究。（2）CASP清单：病例对照研究和队列研究。（3）JBI标准：横断面研究；经验总结、案例分析及专家意见。（4）AHRQ。（5）Combie横断面研究评价工具。（6）STROBE 声明。(7)STREGA声明。（三）非随机对照实验性研究的质量评价工具：MINORS条目，Reisch 评价工具，TREND声明。（四）诊断性研究：QUADAS工具，CASP清单，STARD声明（五）动物试验：STAIR清单，CAMARADES清单，ARRIV指南。这个就用Cochrane风险偏倚评估工具，主要从6个领域条项目队偏倚风险进行评价，对每条指标采用“低度偏倚风险”、“偏倚风险部确定”、“高度偏倚风险”进行判定：

（一）选择偏倚：（1）随机序列产生：详细描述了产生随机分配序列的方法，以便评估组件可比性；（2）分配隐藏：详细描述了隐藏随机分配序列的方法，以便判断干预措施分配情况是否能预知。（二）实施偏倚：（1）对研究者和受试者施盲：详细描述了对研究者和受试者实施盲法的方法，以防其知晓受试者的干预措施。提供了判断盲法是否有效的信息。（三）测量偏倚：（1）研究结果盲法评价：详细描述了对研究结果评价者实施盲法的方法，以防其知晓受试者的干预措施。提供了判断盲法是否有效的信息。（四）随访偏倚：（1）结果数据的完整性：完整性的报告了每个主要结局指标的数据，包括失访及退出的。是否明确报道了失访及退出，每组人数（与随机入组的总人数相比），失访/退出的原因，以便系统评价者行相关的处理。（五）报告偏倚：（1）选择性报告研究结果：描述的信息可供系统评价者判断选择性报告研究结果的可能性及相关情况。（六）其他偏倚：（1）除上述偏倚外，提供的信息是否可评估存在其他引起偏倚的因素。若是已在计划书中提到某个问题或因素，需给出对应的回答。

高中语文的常规测量与评价

高中语文的常规测量与评价华中师大一附中袁汉杰一、教育测量与评价概述教育测量是根据测量学原理和方法对教育现象及其属性进行数量化研究的过程。教育测量理论的建立和完善主要得益于西方心理学理论的发展，特别是得益于20世纪初美国教育测验运动的兴起。其代表人物是美国心理学家桑代克（E·L·Thorndike），他于1904年出版了《心理与社会测量》一书，介绍了心理统计与测量的基本原理，提出“凡是存在的东西都有数量, 凡是有数量的东西都可测量”的著名论断。桑代克的心理测量理论促进了学力测验、智力测验和人格测验的发展。随后他又编写出了“书法”、“拼字”、“作文”、“图画”等一系列标准化量表，使教育测量走上了科学化的道路。教育评价则是对教育效果进行的价值判断。教育评价是教育科学一门独立的分支学科，以1940年美国发表“史密斯——泰勒报告”为标志，较为系统的教育评价理论逐渐建立起来。在报告中，泰勒（R·W·Tyler）系统地总结了教育评价思想, 第一次提出了教育评价概念，阐明了教育评价的指导思想、目的和原理，形成了以教育目标为核心的教育评价原理，从而把教育评价与教育测量区分开来。人们评论此报告为“划时代的教育评价宣言”。泰勒首先把评价纳入教学过程，强调评价对教学的反馈功能并认为对学生进行成绩测验是教学过程的有机环节。泰勒原理是教育评价理论和方法的开端，因此泰勒被尊称为“教育评价之父”。从专业理论的角度看，教育测量和教育评价的内涵十分广泛。教育测量以教育心理学和现代教学论等学科理论为背景；而即便是狭义的教育评价概念也包含了学校评价、教师评价和教学质量评价等内容。但在实际教学中，人们往往将“测量”、“测试”、“评价”、“考试”、“评估”、“评比”、“评定”等概念等同起来，习惯以“考试”、“测试”来笼而统之，而且经常将通过考试（测试）获得的量化数据作为教学评价的主要依据。其实，测量（考试）与评价之间既有联系又有区别。测量（考试）、评价同属于人们的认识判断方式。测量包含考试，而考试的结果只有通过评价的解释才能揭示其实际意义；评价必须以测量（考试）为依据，是测量（考试）的具体体现。测量（考试）与评价的不同之处在于，测量（考试）主要是描述事物的客观状况，属于事实判断，而评价是在描述属性的基础上所作的价值评判，属于价值判断的范畴。

教学设计方案含教学设计评价量表

教学设计方案案例名称打开理世界大门——走进神奇科目初中物理教学对象八年级学生提供者吴忠锋课时1课时一、教材内容分析《走进神奇》一课以典型事例突出了从自然到物理，从生活到物理，从物理到社会的基本理念。强调了物理学与其他学科的融合，体现了知识与技能、过程与方法、情感态度与价值观的三维课程目标。本节课的主要任务是展示在自然和生活中的神奇，结合《物理课程标准》中对义务教育阶段的物理课程培养目标定位，确定本节教学应达到的基本要求是：通过一些典型事例让学生体会到自然界中的神奇，这些来自大自然的神奇是让人惊叹的；通过生活中一些不起眼的小事让学生感受到生活中的神奇二、教学目标（知识，技能，情感态度、价值观） 1、知识与技能通过一些典型事例让学生体会到自然界中的神奇。 2、过程与方法通过生活中一些不起眼的小事让学生感受到生活中的神奇，而这些神奇则是人类智慧的结晶。 3、情感、态度的价值观。通过解释一些神奇现象，让学生知道通过学习科学，这些神奇是可以得到解释的。三、学习者特征分析本节课的学习者特征分析主要是根据教师平时对学生的了解以及学生年龄段的思维发展情况而做出的： ·学生是飞竹中学八年级学生 ·学生为八年级的孩子，具有较强的求知欲和好奇心 ·在这个年龄阶段的学生思维发展处在关键期四、教学策略选择与设计

1.探究引导策略：探讨式学习；教师启发引导 2.情景创设策略：运用生活中与教学内容相关的情景，设计问题，设计物理实验，组织教学内容，提出有启发性的问题，激发学生的学习兴趣五、教学环境及资源准备沪科版新课标教材初中八年级物理必修（上册）相关实验器材：饮料罐、玻璃杯、钻子、筷子、装有水的碗、拉链、圆珠笔、。专门为本课设计的多媒体课件多媒体教室。六、教学过程教学过程教师活动学生活动设计意图及资源准备 1.自然界中的神奇让学生观看多媒体课件 1.神奇的宇宙 2.傍晚红色的霞光 3.电闪雷鸣 4.火山 5.雪崩 6.龙卷风除此之外，自然界中还有很多神奇的现象，你留意到了哪些？你还想了解哪些？和大家共同分享吧。学生反应热烈，教师使学生通过实观看多媒体提出问题激激发学生学习的兴趣，二次创作栏

人员能力、素质测评工具

人员能力、素质测评工具知识或经验：依据受教育的经历、个人的持续学习，既往的工作经历，对与应聘岗位相关的知识或经验进行比照，各种知识和经验的内涵描述如下，在进行面试或笔试时可在一定程度上作出较为正确的判断。行业知识雇员从事自身职业所具备的某一行业的知识或特殊技能，如制造业、金融保险业、零售业、运输业等。专业知识学自教育和经验的为顺利完成某一特定工作的特殊知识，如专业技术知识、商务知识、市场知识等。电脑知识将电脑熟练广泛运用于各种工作环境的知识，如交流系统、数据应用等。语言知识对加强各种商务交流的外语的掌握。一般经营管理方法及工具程序分明地建立工作流程监控。能为工作流程和复杂问题的解决提供最具竞争力的、最佳的支持的具体工具和资源，如项目方法论、经营管理工具等。商务经营管理知识与各种各样公司都相关的工作范围、工作流程运作的具体知识，如材料控制、财会支出、人事管理等。各种经验的内涵描述如下。经验是在一定时期的职业活动中，通过对知识的实际运用而获得的。项目经验项目经验是通过参与某项目组的工作而获得的。通常项目组是为了改进某项具体工作或业务流程而特地组建的临时工作团队。项目管理经验项目管理经验是指对项目组的组建、领导和对项目的实施经验。销售经验

销售经验是通过从事产品、系统或服务的销售工作而获得的。它包括市场、广告、客户调研、客户服务及业务寻访等各方面的经验。管理经验管理经验是通过承担管理职责而获得的。它包括业务流程的发起、控制、监督，管理决策以及如何影响或实施管理决策的经验。领导经验领导经验是通过承担对下属的责任而获得的。跨文化工作经验跨文化工作经验是通过与具有不同文化背景的人或组织接触、协作，进行业务活动，尤其是在不同的文化环境下生活和工作而获得的。专业技术或技能：主要以实际的工作经验为依托，辅以笔试、专业测试进行判断。动机、态度或行为模式：具有内隐性，需要较长时间才能探知表象之后的本质。可通过特殊的面试设计，对这几项进行了解，关键是应聘者内在的价值观不能与企业的价值体系有根本冲突。关键素质素质评估项目 1．分析能力1．愿意对各种复杂的信息进行综合； 2．能很容易地发现他人意见中的误差或错误； 3．在收集信息时能把“假定”与“客观事实”区分开； 4．能够找出全部相关的信息——不仅仅是出现在面前的那些；5．能够寻找搜集的信息中的缺陷； 6．能够把信息分成具有相似质量或属性的组。 2．预期/前瞻性思维1．能够花时间对将来进行预测； 2．能保持广泛的阅读和倾听的兴趣，以便了解不同的想法；3．能全面考虑所有主要的行动和决策对未来的影响； 4．能够建立各种有用的倾听渠道来了解正在发生的事情；5．能够开发应变计划； 6．能够思考“还能以其他什么样方式完成这件事”。 3．关注细节1．能够为确保准确性而对工作进行双重检查； 2．能够在提供资料和信息之前先对它们进行核实； 3．能够仔细对书面工作进行检查，保证不遗留任何错误；4．能对行动的结果进行详细考虑； 5．能发现工作中的误差、错误、疏忽； 6．能请其他人对书面工作进行检查或评论。

教育测量与评价试卷及答案

卷号：A 二O 一九---二O 二O 学年第一学期期末考试教育测量与评价试题题号一二三四五六七八九十题分 30 16 28 26 得分一、单选题（ 2*15 ） 1 、下列哪类题型不属于客观题（） A 填空题 B 判断题 C 选择题 D 论述题 2 、同一量表，同一被试群体，在不同时间，两次施测，求其相关。这样得出的信度是（） A 复本信度 B 分半信度 C 重测信度 D 同质性信度 3 、名称量表上的数字具有什么特性（） A 等比性 B 等距性 C 等级性 D 区别性 4 、用测验来寻找被试某种能力上的特殊优点或缺点，这种测验是（） A 普通测验 B 诊断测验 C 预测测验 D 成绩测验 5 、把总体中各个个体按照一定标志分为不同类型或层次，然后从各类型中随机抽取若干个个体，从而构成样本的抽样方法叫做（） A 整群抽样 B 机械抽样 C 分层抽样 D 单纯随机抽样 6、下列关于分半信度的描述哪一项是不正确的（） A 计算分半信度先要对测验分半 B 要注意使那些性质不相同、联系不紧密的项目分在相同的一半 C 测验越长、项目越多，两半分数的相关就越可能高 D 不同的分半法可能会得到不同的信度值 7、下列关于区分度的描述哪一项是不正确的（） A 区分度是测验对被试实际水平的区分程度 B 取值范围为 0 到 1 C 区分度越高时，试题的质量越好 D 区分度是作为评价项目质量、筛选项目的主要指标与依据 8、区分度与难度之间的关系是（） A 题目越难，区分度越高 B 题目越难，区分度越低 C 难度为 1 时，区分度为 0 D 难度为 0 时，区分度为 1 9 、测验工具是否测到了要测的东西，即测到了被试的某种心理特性、特质、结构，这就是测验的 ( ) A 信度 B 效度 C 难度 D 区分度 10 、通常是以问卷的形式，提出一系列题目的人格测验的方法是 ( ) A 评定量表法 B 情境测验法 C 自陈量表法 D 投射测验法 11 、标准分数值具有 ( ) A 可比性 B 可加性 C 可比性而无可加性 D A 、 B 都对 12 、发展常模就是某类个体正常发展进程各特定阶段的 ( ) A 高等水平 B 一般水平 C 低等水平 D 特定水平 13 、一个与被试同类的团体在相同测验上得分的分布状况与结构模式，这一概念是（） A. 模型 B. 常模 C. 量规 D. 参照物 14 、我国高考标准分数采用了一种方案，这种方案是（） A. 正态化转换方案 B. 对比参照方案 C. 百分等级方案 D. 常模参照方案 15 、有一满分值 K=5 的试题，测试 10 名被试，实得成绩为 5 ， 3 ， 4.5 ， 2 ， 5 ， 0 ， 3.5 ， 1 ， 3 ， 4 ，其难度指数 P 为 ( ) A ． 3.1 B ． 1.3 C ． 0.26 D ． 0.62 二、名词解释（ 4*4 ） 1 、量表总分核分人姓名一?密封线内不准答题? 二?姓名?准考证号不许涂改?否则试卷无效? 三?考生在答题前应先将姓名?学号?年级和班级填写在指定的方框内? 四?试卷印刷不清楚?可举手向监考教师询问? 学号所在年级、班级密封注意

教学设计评价量规评价表

教学设计成果评价量表学校：唐南小学授课教师：韩春苗评价人：______ 评价等级评价维度优秀良好一般评分出勤（10分）（8~10分）（5~7分）（0~4分）满勤有缺课、迟到、早退缺课达1/3 教学设计方案（60 分）课题概述（5分）（4~5分）（2~3分）（0~1分）对教材版本、学科、年级、课时安排有清晰的说明对学习内容和本节课的价值及重要性介绍清晰能够说明课的基本情况，以及课的意图陈述不力，繁琐教学思想（10分）（8~10分）（5~7分）（0~4分）体现了教师主导－学生主体的教学思想体现学科教学的先进思想在一定程度上体现了先进的教学思想教学思想没有体现或比较陈旧教学目标分析（10分）（8~10分）（5~7分）（0~4分）与学习课题相关与课程整体学习目标一致，体现知识与技能、过程与方法、情感态度与价值观三维目标体现对学生综合能力尤其是创造性思维能力、解决问题能力的培养与学习课题相关与学段学习目标基本一致，体现知识与技能、过程与方法、情感态度与价值观三维目标目标阐述比较清楚、具体目标空洞，和学习主题相关性不大，与学段学习总目标不一致学习者特征分析（5分）（4~5分）（2~3分）（0~1分）详细列出学生所具备的认知能力、信息技术技能、情感态度和学习基础等对学习者的兴趣、动机等有适当的介绍列出部分学生的特征信息信息或表述不清楚或缺少许多教学过程设计（20分）（16~20分）（10~15分）（0~10分）设计合理的教学任务和教学策略；教学策略内容和形式丰富丰富、多样，便于发展学生的多种智能，体现自主、合作、探究的学习方式活动设计具有层次性，体现对学生不同阶段的能力要求，尊重学生之间的差异性教学策略与目标基本统一，围绕总体目标的实现展开教学策略要求明确，对师生的要求比较具体、可操作性较强教学策略目标与总目标多处不一致，不能有效实现总目标，形式单一，任务描述和对师生、支持的要求不清楚，缺乏层次性和差异性

教育测量与评价考试试卷

教育测量与统计测试试题（A卷）第一部分选择题（共40分）一、单项选择题（本大题共10题，每小题2分，共20分）在每小题列出的四个选项中只有一个选项是符合题目要求的，请将正确选项前的字母填在题后的括号。 1、测验手段反映真识情况的稳定性和一致性的程度是（） A．效度 B. 信度 C. 区分度 D. 难度 2、把总体中各个个体按照一定标志分为不同类型或层次，然后从各类型中随机抽取若干个个体，从而构成样本的抽样方法叫做（） A．整群抽样 B. 机械抽样 C. 分层抽样 D. 单纯随机抽样 3、一个小组有10个学生，从中选一个组长，若每个人被选到的机会是相等的，则明或华被选中的概率是（），如果进行两次选举，那么两次都选到明的概率是（） A．1/5，1/5 B. 1/5，1/100 C. 1/10，1/100 D. 1/5，1/10 4、某班36个学生，英语测验分数地标准差为9.6，则其离差平方和是（） A. 3317.6 B. 3217.0 C. 3320.5 D. 3500.1 5、一位老师对8个学生的作业成绩进行猜测。如果教师猜对的可能性为1/3，且规定教师只有猜对95%才算这个教师有一定的评判能力。那么，这个教师至少要猜对学生成绩的个数为（） A．4 B. 5 C. 6 D. 7 6、下列两组数据①14、2、1 7、9、22、13、1、7、11②1、26、11、 9、14、13、7、17、22、2的中位数分别是（）

A．11、12 B. 14、9 C. 13、9 D、14、12 7、某年初中入学考试时语文、数学、英语的计分比例为4：3：3，一个学生的考试成绩语文为72分，数学为94分，英语为79分，那么该生（假设各科难度相近）总平均分数为（） A．82 B. 82.8 C. 80 D. 80.7 8、下列数据：23、36、20、25、33、31、27、29的四分位距是（） A. 4 B. 6 C. 3 D. 8 9、某区拟对参加数学竞赛的2000人中前500名予以奖励，考试的平均分数为75，标准差为9，那么，获奖的分数线是（） A．81．03 B. 83.15 C. 84.56 D81.15 10、某区3600个学生数学测验成绩接近正态分布，其平均分为80 分，标准差为11.5分，则在70——90分之间应当有（）人。 A．2216．52 B. 2218.05 C. 2235.32 D. 2650.85 二、多项选择题(本大题共5小题，每小题4分，共20分)在每小题列出的五个选项中有二至五个选项是符合题目要求的，请将正确选项前的字母填在题后的括号。多选、少选、错选均无分。 11、在教育统计过程中，抽样调查的种类有（） A．单纯随机抽样 B. 分层抽样 C. 机械抽样 D、整群抽样 12、下列选项中，属于差异量的有（） A．全距 B. 中位数 C. 平均差 D. 标准差 13、在教育实验中,常用的教育实验有( ) A. 单组实验 B. 等组实验 C. 轮组实验 D. 田野考察 14、积差相关使用的条件有（） A. 两个变量都是连续性数据

第1章教育测量与评价的基本理论

教师教育专业必修课程《教育测量与评价》课程简介教学目标理解教育测量与评价的基本理论，学会教育测量与评价的方案设计、方案实施与结果处理的方法技术，并能应用于学生评价、教师评价、学校管理工作评价。内容大纲第一章教育测量与评价理论 1.1教育测量与评价的基本概念 1.2教育评价系统结构与功能 1.3教育评价的类型 1.4教育评价的模式第二章教育评价方案设计 2.1教育评价方案概述 2.2教育评价内容的设计 2.3教育评价的权集及其构造 2.4教育评价的标准与量表第三章教育评价的实施 3.1教育评价的实施程序 3.2收集教育评价信息的主要方法 3.3教育测量与评价的分值转换与汇总第四章教育评价结果的处理 4.1教育评价结果的质量检验 4.2教育评价结果的解释 4.3教育评价信息的反馈与利用第五章学生评价 5.1学生学习成绩评价 5.2学生综合评价 5.3真实性评定方法第六章教师评价 6.1教师评价概述 6.2教师评价的主要内容 6.3教师课堂教学质量评价

绪论一、学习这门课程有什么意义？——教育评价的目的、功能、作用“教育评价实例”分析（1）一次教师暑期培训课上的经历：一位教了多年教师略带神秘地告诉我：“从片面追求升学率”到“唯一追求升学率”。（2）一位语文优秀教师的课例：从高考题目引入“唐诗欣赏”教学。（3）“应试教育的实质”是什么？如何走出“应试教育的泥泞”？（4）新课程改革的评价逻辑：、“评价跟着改革走”、“发展性评价”、“教学－评价”的一体化 1、教育评价的目的： ◆改进、提高学生的学习与质量水平 ◆改进、提高教师的教学与质量水平 ◆改进、提高学校管理决策与质量水平 ◆为学校、地区、国家的教育改革与发展提供决策依据 2、教育评价的功能： ◆教育评价具有对教育活动状况做出事实判断的功能； ◆教育评价具有对教育活动质量做出价值判断的功能。 3、教育评价的作用 ◆诊断作用——诊断教育活动过程与方法的优劣得失 ◆导向作用——引导教育活动的方向、方式、重点 ◆鉴定作用——鉴定、甄别教育结果的水平、级别、资格 ◆监控作用——监督、控制教育活动实施规范与质量水准

NewcaseOtwaScaleNOS文献质量评价量表中文版

N e w c a s e O t w a S c a l e N O S文献质量评价量表中文版 The latest revision on November 22, 2020

Newcastle-Ottawa Scale (NOS)文献质量评价量表 (中文版）病例对照研究注：每一项研究在“选择”和“暴露”上的每一个条目最多可以有一个而在“可比性”上的条目最多可以有两个选择 1)病例的定义是否充分 a)是，并有独立验证（如至少2名医生共同对病例做出诊断；或至少依据2 种或2次的诊断结果；或者查阅了原始记录，如X线、医院病历）* b)是，并有联动数据(如根据肿瘤登记数据中的ICD编码来判断是否为病例）或基于自我报告，但无原始记录 c)没有说明 2)病例的代表性 a)连续收集且有代表性的病例（如规定时间内患有目标疾病的所有合格病例；或特定饮水供应区的所有病例；或特定医院或诊所、一组医院、健康管理机构的所有病例；或从这些病例中得到的一个合适的样本，如随机样本）*

可比性 1)基于设计或分析所得的病例与对照的可比性 a)研宄控制 __了 (选择最重要的因素，如年龄）（如设计时，病例和对照按年龄匹配；或两组人群的年龄比较无统计学差异）* b)研宄控制了其他重要的混杂因素（如设计时，病例和对照除按年龄匹配以外，还匹配了其他因素；或两组人群的其他重要混杂因素之间的比较无统计学差异）* 暴露 1)暴露的确定 a)可靠的记录（如手术记录）* b)在盲法（不清楚谁是病例，谁是对照）的情况下，采用结构化调查获得*

注：每一项研究在“选择”和“结局”上的每一个条目最多可以有一个“*”。而在“可比性”上的条目最多可以有两个“*”。选择 1)暴露队列的代表性 a)能够很真实地代表社区人群的平均 (请说明）* b)基本可以代表社区人群的平均 * c)选取特殊人群，如护士，志愿者 d)没有说明队列的来源 (注：该条目说的是对社区中所有个体的代表性，而非普通人群中某一样本的代表性。如某些健康管理机构的成员，这些女性通常是中层阶级，受过良好教育，而且很注意自身健康。该群体有可能可以作为绝经后雌激素使用者的代表性的样本，但他们并不能代表所有女性。因此，如果选用该群体作为研究人群的话，势必会低估收入低、也没受过很好教育女性的代表性） 2)非暴露队列的选择 a)来自暴露队列的同一社区*

文献质量评价

文献质量的评价一、文献质量评价的基本要素在进行文献质量评价时，应依据科学、规范的评价标准，而不是靠评价者的主观感觉、临床或研究经验来判断。通常，文献质量评价的基本要素包括文献内部真实性、临床重要性和适用性3个方面。（一）内部真实性内部真实性是指某个研究结果接近真值的程度，即研究结果受各种偏倚的影响程度。偏倚主要来源于4个方面。 1.选择偏倚选择偏倚主要发生在选择和分配研究对象时。如果在分配研究对象时，所采取的随机方法不完善，可能会造成各组的基线资料不具有可比性，从而亏大或缩小护理干预措施的效果。另外，如果用于分组的随机序列公开化，使得研究者和研究对象能够预计到下一个研究对象会将会入选到哪一组，可能会掺杂研究者或患者的主观因素，从而带来偏倚。因此，为了降低选择偏倚，在分配研究对象时，应采用严格的随机法，并对随机分配方案做到分配隐藏。分配隐藏的措施包括下列几种：由不直接参与研究的药房人员或中心办公室人员控制随机分配方案；采用相同外观的、按顺序编号的药物容器；使用按顺序编号不透明密闭信封等。分配方案的隐藏应至少维持到实际分配研究对象时，确定某研究对象被分配到哪一组后，不要随意改变分组情况。 2.实施偏倚实施偏倚主要发生在干预措施的实施过程中。指除了要验证的措施外，向实验组和对照组提供的其他措施也不相同，从而出现系统偏差，降低实施偏倚的措施是将干预方案进行标准化，并尽可能对研究对象和干预提供者实施盲法。如果干预提供者知道研究

对象接受的时哪一种干预，会有意无意的对干预组的研究对象提供格外的关注；如果研究对象知道自己接受的是哪一种措施，会倾向于提供更多症状。另外，在研究过程中，如果对照组的研究对象由于各种原因有意或无意地应用了实验组的措施，也会导致实施偏倚。 3.失访偏倚失访偏倚是指在研究的随访过程中，实验组和对照组因退出、失访、违背干预方案的人数或失访者的特征不同而造成的系统差异。失访的原因往往是发生副反应、疗效差、出现并发症、搬迁或死亡等，如果失访率较高或各组间失访情况不一样，会使研究结果失真。因此，在研究过程中，应采取措施减少失访的发生，尽量将失访率控制在20%以内。同时，应尽量获取失访者的信息，采取意向性分析，将失访对象的资料也纳入最终分析中，减少由于失访带来的影响。 4.测量偏倚测量偏倚是指在测评结局指标时，由于测评方法不可信或各组采用的测评方法不一致所造成的系统差异，尤其当结局指标是由测评者进行主观判断时。因此，为了降低测量偏倚，在测评各组的结局指标时，应采用统一、标化、可信度高的测评方法和结果判定标准，并对测评者实施盲法。（二）重要性重要性是指研究是否具有临床应用价值，在循证医学中，通常使用量化指标来评价研究结果的临床意义，不同的研究问题评价指标不同。评价证据的临床重要性应重点关注证据所涉及的临床问题是否明确、具体，所选择的评价指标是否正确等问题。 1.用于病因或危险因素研究的指标当研究问题是探讨病因及危险因素时，如果采用的是随机对照试验或队列研究，常用相对危险度来评价研究结果的重要性；如果采用的

教育测量与评价考试试卷

《教育测量与评价》试卷总分：100分考试时间：50分钟姓名：______________ 学号：______________ 考试分数______________ 一、单选题（2*13） 1、下列哪类题型不属于客观题（） A填空题B判断题C选择题D论述题 2、同一量表，同一被试群体，在不同时间，两次施测，求其相关。这样得出的信度是（）A复本信度B分半信度C重测信度D同质性信度 3、名称量表上的数字具有什么特性（） A等比性B等距性C等级性D区别性 4、用测验来寻找被试某种能力上的特殊优点或缺点，这种测验是（） A普通测验B诊断测验C预测测验D成绩测验 5、把总体中各个个体按照一定标志分为不同类型或层次，然后从各类型中随机抽取若干个个体，从而构成样本的抽样方法叫做（） A整群抽样 B 机械抽样 C 分层抽样 D 单纯随机抽样 6、下列关于分半信度的描述哪一项是不正确的（） A计算分半信度先要对测验分半 B要注意使那些性质不相同、联系不紧密的项目分在相同的一半 C测验越长、项目越多，两半分数的相关就越可能高 D不同的分半法可能会得到不同的信度值 7、下列关于区分度的描述哪一项是不正确的（） A区分度是测验对被试实际水平的区分程度 B取值范围为0到1 C区分度越高时，试题的质量越好 D区分度是作为评价项目质量、筛选项目的主要指标与依据 8、区分度与难度之间的关系是（） A 题目越难，区分度越高B题目越难，区分度越低 C 难度为1时，区分度为0 D难度为0时，区分度为1 9、测验工具是否测到了要测的东西，即测到了被试的某种心理特性、特质、结构，这就是测验的 ( ) A 信度 B 效度 C 难度 D 区分度 10、通常是以问卷的形式，提出一系列题目的人格测验的方法是( ) A 评定量表法 B 情境测验法 C 自陈量表法 D 投射测验法 11、标准分数值具有 ( ) A 可比性 B 可加性 C 可比性而无可加性 D A、B都对 12、发展常模就是某类个体正常发展进程各特定阶段的( ) A 高等水平 B 一般水平 C 低等水平 D 特定水平