文档库 最新最全的文档下载
当前位置:文档库 › 统计 资料

统计 资料

统计 资料
统计 资料

名词解释:

1.计量资料对每个观察单位用定量的方法测定某项标量的大小,所得的资料称为计量资料。计量资料亦称定量资料、测量资料。其变量值是定量的,表现为数值大小,一般有度量单位。

2.sampling error由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。

3.standard deviation是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。

4.非参数检验一类不依赖总体分布类型的检验,在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的统计方法。

5. normal distribution高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。

6.相关系数描述两个变量间线性相关关系密切程度与方向的统计指标

7. 方差分析研究多个总体均值是否存在差异的统计检验方法。

8. 率的标准化采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。

9.confidence interval指总体参数可能所在的范围

10. 构成比表示某事物内部各组成部分所占的比重或分布,常以百分数表示。

11. 正态分布高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。

12. standard normal distribution任何正态分布的X值通过u值转换后,称为标准化的正态分布。

简答题:

1、简述t分布的特征以及t检验的基本思想、t检验的注意事项,方差分析基本思想

答t分布为抽样分布,为理论分布。t分布比标准正态分布的峰值低,且尾部翘得更高。

随自由度的增大,t分布逐渐趋近标准正态分布。以t=0为中心左右对称的单峰分布;t 分布曲线形态变化与自由度v大小有关,自由度越小,t分布曲线峰部越低,尾部越高;

自由度越大,t分布曲线越接近标准正态分布曲线。

t检验的基本思想: t的分布是有规律的,在一个正态总体中随机抽样要得到|t|>=t0.05,v的概率P<=0.05,要得到|t|>=t0.01,v的概率P<=0.01

注意事项:1、假设检验结论正确的前题 2、检验方法的选用及其使用条件 3双侧检验与单侧检验的选择 4假设检验的结论不能绝对化 5正确理解P值的统计学意义 6假设检验和可信区间的关系。

方差分析基本思想将全部观测值的总变异按影响因素分解为相应若干部分变异,在此基础上,计算假设检验的统计量F值,实现对总体均数是否有差别的判断。

2、试述假设检验的步骤有哪些以及配对设计的几种情况如何

答步骤:1建立假设和确定检验水准 2选择检验方法和计算统计量 3根据P值做出统计推断。

配对设计有两种情况:1同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理。2异源配对:未消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。

3、χ2检验的基本思想是什么?进行χ2检验主要有哪3种类型的公式及其使用的条件是

什么?行列表卡方检验的注意事项

答:χ2检验的基本思想:χ2值就是理论与实际数的吻合程度。若H0成立,χ2>=χ20.5,v 或概率P<=0.05 有通用公式、专用公式和校正公式。注意事项P92

4、如何确定医学正常值范围的界限

答:1确定同质的参照总体 2选择足够例数的参照样本 3控制检测误差 4选择单、双侧界值 5选择适当的百分数范围 6选择计算参考值范围的方法

5. 相对数使用应注意的事项是什么

答1不要把构成比与率想混淆 2使用相对数时分母不宜过小 3注意资料的可比性 4样本率或构成比存在抽样误差

6. 简述描述资料离散程度的指标有哪些,正态分布的主要特征是什么

答极差、四分位数间距、方差、标准差、变异系数。

主要特征:P20

7. 简述变异系数的用途和正态分布曲线下面积分布规律

答:均数相差较大或单位不同的几组观察值的变异程度进行比较。规律:P20

8、误差的分类及其各自特点

答系统误差、随机测量误差和抽样误差。P4

9、频数分布表的用途

答:1.作为陈述资料的形式,可以代替原始资料。2便于观察数据的分布类型。3便于发现资料中某些远离群体的特大或特小值。4当样本含量比较大时,可用各组段的频率作为概率的估计值。

10、率的标准化标准如何选取

答1选取有代表性的、较稳定的、数量较大的人群构成为标准构成。2选择用于比较的各组例数合计作为标准构成。3从比较的各组中任选其一作为标准构成。

11、非参数检验的适用范围

答1总体分布类型未知或非正态分布数据2有序或半定量资料或等级资料3数据两端无确定的数值4各组离散程度相差悬殊,即各总体方差不齐。

12、线性相关分析和线性回归分析注意事项,直线相关与回归的区别与联系

答P111

13、多元逐步回归分析自变量选择方法,多元回归分析注意事项

答向前选择法、向后选择法和逐步选择法。

注意事项:1应用条件2样本含量 3定性数据的数量化 4多重共线性5关于变量筛选。

14、统计表的结构如何

答从外形看,统计表可由标题、标目(包括横标目、纵标目)、线条、数字和备注5部分够成。P36

15、试验设计的三要素是什么?医学研究设计的几个原则

答研究对象,处理因素和实验效应。

对照原则、随机化原则和重复原则。

计算分析题:

1、某医院147例大肠肝菌标本接种在A、B两种培养基上,然后进行检验,资料如下表,是分析两种培养基的检验结果是否有显著性。

大肠肝菌标本A、B两种培养基的培养结果

A培养基

B培养基

+-

+59 36

-15 37 合计74 73 [参考答案]

本题是一个配对设计的二分类资料,采用配对四个表资料的检验。

(1)建立检验假设并确定检验水准

:,即两种培养基的阳性培养率相等

:,即两种培养基的阳性培养率不相等

(2)计算检验统计量

本例b+c =36+15=51> 40 ,用配对四个表检验公式,计算检验统计量值

=,

3. 确定P 值,作出推断结论

查界值表得P < 0.05。按水准,拒绝。认为两种培养基的阳性培

养率不同。

2、为研究某补钙制剂的临床效果,观察56例儿童,其中一组给与这种新药,另一组给与钙片,观察结果如表,问两种药物预防儿童的佝偻病患病率是否不同?

表 两组儿童的佝偻病患病情况

组别 病例数 非病例数 合计 患病率(%) 新药组 8 32 40 20.0 钙片组 6 10 16 37.5 合计

14

42

56

25.0

注:自行选择使用以下公式

① χ2=∑-T T A 2

)

( ② χ2=∑--T

T A 2)5.0(

③ χ2

=c b c b +-2)( ④ χ2

=c

b c b +--2)1(

2χ0H C B =1H C B ≠05.0=α2χ2χc b c b +-=22

)(χ()65

.8153615362

=+-1=ν2

χ0.05α=0H

⑤χ2=n ???

? ??-∑12

C R n n A

χ2界值:

自由度 P =0.05的χ2界值

1 3.84

2 5.99 3

7.81

[参考答案]

本题是两组二分类频数分布的比较,用四个表检验。表中=56>40,且有一个格子的理论频数小于5,须采用四个表检验的校正公式进行计算。

(1)建立检验假设并确定检验水准

:,即新药组与钙片组儿童佝偻病患病概率相同

:,即新药组与钙片组儿童佝偻病患病概率不同

=0.05

(2)用四个表检验的校正公式,计算检验统计量值:

= =1

3. 确定P 值,作出推断结论

以=1查附表7的界值表得,<, P > 0.05。按 水准,不拒绝,无统计学意义,还不能认为新药组与钙片组儿童佝偻病患病概率不同。

创新分析题

1、统计学数学原理对医学生来说很难。随着时代进步,统计软件的逐步更新升级,医学科学研究的更加深入,我们在以后的科研工作中,肯定会遇见在大学没有学过的医学统计方法,比如我们教材145页多变量COX 回归分析,你有信心自学这个没有学过的统计学方法不?打算怎么去突破那些看不懂的数学瓶颈?说说你的办法或者思考!

2、在科研实践中,你怎么根据数据资料去选择正确的统计学检验方法并得到正确的数据处理结果?主被借助哪些工具?谈谈你的思路。

2χn 2

χ0H 21ππ=1H 21ππ≠α2

χ2

χ2

2(/2)()()()()c |ad -bc|-n n =a+b c+d a+c b+d χ050.152141640562566321082

=??????? ??

-?-?νν2χ()32.12125.0=χ2χ()2125.0χ05

.0=α0H

答在临床科研工作中,正确地抉择统计分析方法,应充分考虑科研工作者的分析目的、临床科研设计方法、搜集到的数据资料类型、数据资料的分布特征与所涉及的数理统计条件等。其中任何一个问题没考虑到或考虑有误,都有可能导致统计分析方法的抉择失误。

此外,统计分析方法的抉择应在科研的设计阶段来完成,而不应该在临床试验结束或在数据的收集工作已完成之后。

第2章 统计资料的搜集与整理作业答案

第2章统计资料的搜集与整理作业答案 一.单项选择题· 1.统计资料的特点是( 1 )。 ①数量性、总体性、客观性 ②准确性、及时性、全面性 ③大量性、同质性、差异性 ④科学性、具体性、社会性 2.数量指标一般表现为( 3 )。 ①平均数②相对数③绝对数④指数 3.说明统计表名称的词句,在统计表中称为( 3 )。 ①横行标题②纵栏标题③总标题④主体栏 4.统计调查中的调查项目是( 2 )。 ①统计分组②统计标志 ③统计指标④统计数值 (说明:调查对象是被调查的总体;调查单位是被调查对象中的个体,总体单位;调查项目是标志;调查时间是收集资料的时间;调查时限是收集资料加上上报的时间)

5.调查单位就是( 2 )。 ①负责向上报告调查内容的单位 ②调查对象的全部单位 ③某项调查中登记其具体特征的单位 ④城乡基层企事业单位 6.统计调查的调查时间主要是指( 1 )。 ①调查资料所属的时间 ②调查工作的整个时限(期限) ③对调查单位的标志进行登记的时间 ④以上三个方面的时间概念的总称 7对某市占成交额比重大的7个大型集市贸易市场的成交额进行调查,这种调查组织方式是( 3 )。 ①普查②抽样调查③重点调查④典型调查 8.要了解我国农村经济的具体情况,最适合的调查方式是( 4 )。 ①普查②典型调查③重点调查④抽样调查 9.抽样调查与典型调查的主要区别是( 4 )。

①灵活机动的程度不同 ②涉及的调查范围不同 ③对所研究总体推算方法不同 ④确定所要调查的单位方法不同 10.对无限总体进行调查的最有效、最可行的方式通常采用( 1 )。 ①抽样调查②全面调查 ③重点调查④典型调查 11.工业企业生产设备普查中,工业企业的每一台生产设备是( 2 )。 ①调查对象②调查单位 12.调查项目④填报单位 12.统计分组的结果表现为( 1 )。 ①组内同质性,组间差异性 ②组内差异性,组间同质性 ③组内同质性,组间同质性 ④组内差异性,组间差异性 13.下面属于按品质标志分组的有( 3 )。

统计学课后思考练习汇编

医学统计学思考练习 第1章绪论思考与练习参考答案 一、最佳选择题 1. 研究中的基本单位是指 ( D )。 A.样本 B. 全部对象C.影响因素 D. 个体 E. 总体 2. 从总体中抽取样本的目的是(B )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例 D. 研究总体统计量E. 计算统计指标3. 参数是指(B )。 A.参与个体数 B. 描述总体特征的统计指标 C.描述样本特征的统计指标 D. 样本的总和 E. 参与变量数4. 下列资料属名义变量的是(E)。 A.白细胞计数 B.住院天数 C.门急诊就诊人数 D.患者的病情分级 E. ABO血型5.关于随机误差下列不正确的是(C)。 A.受测量精密度限制 B.无方向性 C. 也称为偏倚D.不可避免 E. 增加样本含量可降低其大小 第2章统计描述思考与练习参考答案 一、最佳选择题 1. 编制频数表时错误的作法是(E )。 A. 用最大值减去最小值求全距 B. 组距常取等组距,一般分为10~15组 C. 第一个组段须包括最小值 D. 最后一个组段须包括最大值 E. 写组段,如“1.5~3,3~5, 5~6.5,…” 2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是(A)。 A. 中位数 B. 几何均数 C. 调和均数 D. 算术均数 E. 众数 3. 比较5年级小学生瞳距和他们坐高的变异程度,宜采用(A)。 A. 变异系数 B. 全距 C. 标准差 D. 四分位数间距 E. 百分位数P2.5与P97.5的间距4. 均数和标准差S的关系是(A)。 A. S越小,对样本中其他个体的代表性越好 B. S越大,对样本中其他个体的代表性越好 C.越小,S越大 D.越大,S越小 E.必小于 5. 计算乙肝疫苗接种后血清抗-HBs的阳转率,分母为(B)。 A. 阳转人数 B. 疫苗接种人数 C. 乙肝患者数 D. 乙肝病毒携带者数 E. 易感人数 6. 某医院的院内感染率为5.2人/千人日,则这个相对数指标属于(C)。 A. 频率 B. 频率分布 C. 强度 D. 相对比 E. 算术均数 7. 纵坐标可以不从0开始的图形为(D)。 A. 直方图 B. 单式条图 C. 复式条图 D. 箱式图 E. 以上均不可 第3章概率分布思考与练习参考答案 一、最佳选择题 1. 某资料的观察值呈正态分布,理论上有(C)的观察值落在范围内。 A. 68.27% B. 90% C. 95% D. 99% E. 45% 2. 正态曲线下,从均数到的面积为(A)。 A. 45% B. 90% C. 95% D. 47.5% E. 99% 3. 若正常人的血铅含量X近似服从对数正态分布,则制定X的95%参考值范围,最好采用(其中,为Y的标准差)(C)。 A. B. C. D. E. 4. 在样本例数不变的情况下,若(D),则二项分布越接近对称分布。 A. 总体率越大 B. 样本率p越大 C. 总体率越小 D. 总体率越接近0.5 E. 总体率接近0.1或0.5 5. 铅作业工人周围血象点彩红细胞在血片上的出现数近似服从(D)。 A. 二项分布 B. 正态分布 C. 偏态分布 D. Poisson分布 E. 对称分布 6. Poisson分布的均数与标准差的关系是(E)。 A. B. C. D. E. 第4章参数估计 一、最佳选择题 1.关于以0为中心的t分布,错误的是(E) A. t分布的概率密度图是一簇曲线 B.t分布的概率密度图是单峰分布 C. 当ν→∞时,t分布→Z分布 D.t分布的概率密度图以0为中心,左右对称 E. ν相同时,值越大,P值越大 2.某指标的均数为,标准差为S,由公式计算出来的区间常称为(B)。 A. 99%参考值范围 B. 95%参考值范围 C. 99%置信区间 D. 95%置信区间 E. 90%置信区间 3.样本频率与总体概率均已知时,计算样本频率p的抽样误差的公式为(C)。 A. B. C. D. E. 4.在已知均数为, 标准差为的正态总体中随机抽样,(B)的概率为5%。 A. B. C. D. E. 5. (C)小,表示用样本均数估计总体均数的精确度高。 A. CV B. S C. D. R E. 四分位数间距 6.95%置信区间的含义为(C): A. 此区间包含总体参数的概率是95% B. 此区间包含总体参数的可能性是95% C. “此区间包含总体参数”这句话可信的程度是95% D. 此区间包含样本统计量的概率是95% E. 此区间包含样本统计量的可能性是95% 第5章假设检验思考与练习参考答案 一、最佳选择题 1. 样本均数比较作t检验时,分别取以下检验水准,以( E )所取Ⅱ类错误最小。 A. B. C. D. E. 2. 在单组样本均数与一个已知的总体均数比较的假设检验中,结果t= 3.24,t0.05,v =2.086,t0.01,v =2.845。正确的结论是(E )。 A. 此样本均数与该已知总体均数不同 B. 此样本均数与该已知总体均数差异很大 C. 此样本均数所对应的总体均数与该已知总体均数差异很大 D. 此样本均数所对应的总体均数与该已知总体均数相同 E. 此样本均数所对应的总体均数与该已知总体均数不同 3. 假设检验的步骤是(A )。 A. 建立假设,选择和计算统计量,确定P值和判断结果 B. 建立无效假设,建立备择假设,确定检验水准 C. 确定单侧检验或双侧检验,选择t检验或Z检验,估计Ⅰ类错误和Ⅱ类错误 D. 计算统计量,确定P值,作出推断结论 E. 以上都不对 4. 作单组样本均数与一个已知的总体均数比较的t检验时,正确的理解是 ( C )。 A. 统计量t越大,说明两总体均数差别越大

数据与统计图表知识点

数据与统计图表知识点-标准化文件发布号:(9556-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

数据与统计图表知识点 一、抽样: 人们在研究某个自然现象或社会现象时,往往会遇到不方便、不可能或不必要对所有的对象作调查的情况,于是从中抽取一部分对象作调查,这就是抽样。 在统计中,我们把所要考察的对象的全体叫做总体,把组成总体的每一个考察的对象叫做个体,从总体中取出的一部分个体的集体叫做这个总体的一个样本,样本中的个体的数目叫做样本的容量。 二、常见的统计图: 常见的统计图有条形统计图、折线统计图、扇形统计图三种,在解决实际问题时,具体选择用哪种统计图,要依据统计图的特点和问题的要求而定。 1.条形统计图: (1)条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按一定的顺序排列起来。条形统计图又分为条形统计图和复式条形统计图。 (2)特点:能够显示每组中的具体数据;易于比较数据间的差别;如果要表示的数据各自独立,一般要选用条形统计图。 (3)绘制方法: ①为了使图形大小适当,先要确定横轴和纵轴的长度,画出横轴和纵轴; ②确定单位长度,根据要表示的数据的大小和数据的种类,分别确定两个轴 的单位长度,在横纵、纵轴上从零开始等距离分段; ③用长短(或高低)不同的直条来表示具体的数量,直条的宽度要适当,每 个直条的宽度要相等,直条之间的距离也要相等; ④要注明各直条所表示的统计对象、单位和数量,写上统计图的名称、制图 日期,复式条形图还要有图例。 2.折线统计图: (1)折线统计图用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段顺次连接起来,以折线的上升或下降来表示统计数量增减变化。 (2)特点:折线统计图能够清晰地显示数据增减变化。如果表示的数据是想了解随时间变化而变化的情况,那么就采用折线统计图。 (3)绘制方法: ①根据统计资料整理数据; ②用一定单位表示一定的数量,画出纵、横轴; ③根据数量的多少,在纵、横轴的恰当位置描出各点; ④把各点用线段按顺序依次连接起来; ⑤统计图中的数据是不是统计资料整理的数据。 3.扇形统计图:

统计资料管理制度

统计资料管理制度 为妥善保存原始记录、统计台帐、统计报表,并规范原始记录、统计台帐、统计报表的标识、收集、编目、归档、贮存、保管和处理工作,特制订本制度。 第一章原始记录、统计台帐、统计报表管理制度第1条原始记录要全面、完整,主要包括: (1)企业基本情况类:企业及下属经营单位的营业执照、组织机构代码证、资质证书、税务登记证等相关证照或行政审批资料。 (2)审批文件类:各行政主管部门审批、备案、许可文件,包括:发改、建设、土地、环保、规划、银行等主管部门审批、备案、许可文件。 (3)施工类:施工合同、劳务合同、施工许可证、开工报告、项目形象进度,工程预算、结算、变更记录等; (4)竣工类:工程决算、质量验收、交付凭证等; (5)销售类:销售许可证,各小区(楼盘)的待售、销售、出租以及不可销售房屋记录等; (6)劳资类:人员的构成、技术结构及变动情况,工资、福利、津贴、奖金等; (7)投资资金类:投资资金来源记录与凭证; (8)安全类:工程事故、伤亡报告、索赔等; (9)财务类:企业资产负债,利润,营业税、管理税等完税证明,资金支付等。 (10)能源消耗类:电力、煤炭、成品油消耗等。

第2条统计台帐主要包括: (1)项目规划情况台帐; (2)房地产开发企业资金和土地情况; (3)房地产销售统计台帐; (4)房地产开发投资统计台帐; (5)房地产开发施工统计台帐 第3条原始记录、统计台帐、统计报表的形式由使用部门根据自身的需要制定,经经营副总审核其可行性后,由总经理审批其是否能正式使用。 第4条原始记录由档案室负责保管,统计台帐及统计报表由统计科负责保管。 第5条对于已超出保存期的原始记录,由档案管理员负责销毁。 第6条原始记录、统计台帐、统计报表的保管方式要便于存取和检索,保管设施应提供适宜的环境,以防止损坏、变质和丢失。 第7条各部门需查阅原始记录、统计台帐、统计报表时,需提出书面申请,经分管领导批准后,方可查阅,档案室或统计科做好查阅记录。 第8条各部门要做好原始记录、统计台帐、统计报表的填写和呈报及归档工作,原始记录、统计台帐、统计报表的填写应准确,干净。不得在原始记录、统计台帐、统计报表上随便涂写。如记录时出现错误,在错误处划一杠,再填写正确数据,任何人不得随意更改、

《XX市第三次全国农业普查数据资料汇编》印刷基本要求【模板】

附件1: 《**市第三次全国农业普查数据资料汇编》印刷基本要求 一、设计印刷要求 1.按照采购人提供的文档进行排版,本刊以统计表格为主,要求按国务院农普办标准“统计报表”格式排版,印刷装订。 2、印刷字迹清晰,黑色均匀适度,书页无黑点,无缺字,无指印; 3、纸质色泽一致,纸张平整光洁不翘; 4、装订精细,锁线要精准,密针,裱纸平滑,粘红黄布头; 5、彩色还原性好、套印准确,着墨均匀,彩页画面清晰亮丽。 6、成品包装,无破损; 7、整体印制质量要达到一定的质量标准。如印制质量不符合国家出版行业标准规定,印制质量属不合格的;或因整体设计中有一项不符合国家有关技术标准和规定,设计质量属不合格的,均由承印厂商免费负责重新印制。 二、《**市第三次全国农业普查数据资料汇编》印刷规格及要求 1.尺寸:21cm*29.7cm, 封面:铜版纸,过单面哑胶,四色彩色印刷,需由印刷方按我办要求设计;

内页:优质双胶纸,黑白印刷,页数:约600页; 彩插:优质双铜纸页数:约10页; 装订:锁线精装。 印刷内容采购方提供word、EXCEL电子文档,需由印刷方按我局要求电子排版。 2.数量:每册300本,册数1-2册,视印刷篇幅而定。 三、最高限价 以上印刷书刊最高限价60000元人民币,相关费用包含设计修改费、印刷、运费及税费。印刷商应在我局满意设计修改样式后才开始印刷。 四、供货时限 合同签订生效后,在接到印刷设计文件后15个工作日内提供成品设计稿,并根据采购人提出的修改意见修改完善设计稿;在收到采购人确认稿件之日起1个月内完成印刷并运送到采购人指定地点。 五、特别声明 因本书刊非公开资料,所以从设计开始到成品必须在同一厂房内完成以便我局人员监控,督查,起货后所有资料就地销毁。

数据资料的统计处理

数据资料的统计处理 ● 对数据的统计分析方法 一、s x -分析法 二、综合达标度 三、次数分布表和次数分布图 四、应答信息分析法 ● 相关关系分析 ● 数量标志的统计检验 ● 品质标志的统计检验 一、s x -分析法 1、平均值x : 描述样本的总体分值集中趋势的量,反映总体分值的一般水平。 n x x i ∑= n :样本的个数 2、标准差S : 描述样本的总体分值中各分值离散程度的量,反映总体中各分值的总体平均值离差(x ;-x ) 的平均水平。 s= n x x i ∑-2 )( 将x 和S 结合起来共同描述样本的整体水平比较科学。 一、分析方法:将x 和S 结合起来,分析整体学习水平 例1:某学科30名学生考试成绩如下表1,试分析30名学生整体学习水平。 表1 n=30 i

1.计算x =83 2. S= n x x i ∑-2 )(=7.73≈7.8 3 图1 x -s 分析图 二、综合达标度 采用综合加权的方法,对达标的程度进行分析 计算方法: 例2、抽取30份物理试卷,分析概念“力”的综合达标度 规定权重b : 知识=1、理解=2、应用=3、分析=4、综合=5、评价=6 总体目标系数K= 6321=++=∑i b 综合加权得分H= ∑i b ·i G =1×0.97+2×0.87+3×0.77=5.02 综合达标度84.06 02.5=== K H T

综合达标分析: 三、数据资料的次数分布表和次数分布图分析法 (一)数据资料的分类 1、计数资料: 指计数事物个数的数值,这个数值称次数 如:在某个分数段所对应得分的学生数 在向卷量表上,同意某种意见的人数。 2、测量资料: 指测量事物时产生的度量值,这个度量值叫量数,如:考试的分数。 (二)特点: 以最简单最直观的形式,最大限度的容纳数据信息。 如,数据的分布情况,集中趋势和离散程度等。 (三)次数分布表的制作方法 次数分布表是用表格的形式,表示数据在某些规定的组别中次数的分布情况,是整理,分析数据的第一步 下面以50名学生物理考试成绩为例,阐述编制次数分布表的方法和步骤。 1、求全距R R=最大数-最小数 =98-51 =47 2、定组数: 一般以10—20组为宜。太多了计算麻烦,太少了可能把很多不同事实归于一类,掩盖了分布特征。 本例分10组 表3 50名学生物理考试成绩次数分布表

分类汇编:统计与概率综合

2018中考全国100份试卷分类汇编 统计与概率综合 1、(2018达州)下列说法正确的是() 1 A .一个游戏中奖的概率是——,则做100次这样的游戏一定会中奖 100 B .为了了解全国中学生的心理健康状况,应采用普查的方式 C. 一组数据0, 1 , 2, 1, 1的众数和中位数都是1 D .若甲组数据的方差S甲=0.2,乙组数据的方差S乙=0.5,则乙组数据比甲组数据稳定 答案:C 解读:由概率的意义,知A错;全国中学生较多,应采用抽样调查,故B也错;经验证C 正确;方差小的稳定,在D中,应该是甲较稳定,故D错。 2、(2018?嘉兴)下列说法: ①要了解一批灯泡的使用寿命,应采用普查的方式; ②若一个游戏的中奖率是1%,则做100次这样的游戏一定会中奖; ③甲、乙两组数据的样本容量与平均数分别相同,若方差 -厂=0.1, 「? =0.2,则甲组数据比乙组数据稳定; ④“掷一枚硬币,正面朝上”是必然事件. 正确说法的序号是() A .① B .②C.③ D .④ 考 占:八、、?全面调查与抽样调查;方差;随机事件;概率的意义. 分析:: 了解一批灯泡的使用寿命,应采用抽样调查的方式,普查破坏性较强,不合适;根 据概率的意义可得②错误;根据方差的意义可得③正确;根据必然事件可得④错误. 解 〕 答:( 1解:①要了解一批灯泡的使用寿命,应采用抽样调查的方式; ②若一个游戏的中奖率是1%,则做100次这样的游戏一定会中奖,说法错误; ③甲、乙两组数据的样本容量与平均数分别相同,若方差.二=0.1 , . - =0.2,则甲组数据比乙组数据稳定,说法正确; ④“掷一枚硬币,正面朝上”是必然事件,说法错误,是随机事件. 故选:C. 点此题主要考查了抽样调查、随机事件、方差、概率,关键是掌握方差是反映一组数 评:据的波动大小的一个量?方差越大,则平均值的离散程度越大,稳定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好. 3、(2018?呼和浩特)下列说法正确的是() A . 打开电视剧,正在播足球赛”是必然事件 B . 1 甲组数据的方差「厂=0.24,乙组数据的方差■ =0.03,则乙组数据比甲组数据稳定 C. 一组数据2, 4, 5, 5, 3, 6的众数和中位数都是 5

统计学重点整理及复习资料

统计学重点整理及复习资料 第一章 统计有三个含义,即:统计工作、统计资料、统计学。 统计学的研究对象:社会经济现象数量的总体数量特征及数量关系。(学科性质:方法论) 统计学的特点:数量性、总体性、具体性、社会性、广泛性。 统计工作的过程:设计、调查、整理、分析。 统计的研究方法:统计分组法、大量观察法、综合指标法、统计模型法、统计推断法。 统计总体:客观性、同质性、差异性。组成统计总体的个别单位称为总体单位。 标志:统计学中总体单位所具有的属性或者特征;分为数量标志和品质标志(不可量性). 指标:反应总体某一综合数量特征的名称或范畴;可分数量指标和质量指标(率、平均)。 变异:指可变的品质标志;变量:指可变化的数量标志,变量的树枝也叫做变量值(标志值)。 第二章 统计调查:指根据统计研究的目的和要求,运用科学的调查方法有计划的、有组织的向社会实际搜集各项统计资料的过程。 统计调查的意义:是人们认识社会的基本方式、是统计的重要环节、在统计学中占有重要地位。统计调查的基本要求:准确、及时、系统、和完整性。 统计调查的种类:1、按组织方式可分为统计报表制和专门调查。2、按调查对象可分为全面调查和非全面调查。3、按登记事物的连续性可以分为经常性调查和一次性调查(时点状态)。4、按搜集资料的不同可分为直接观察法、报告法、采访法、问卷调查法。 统计方案的设计:一、确认调查任务和目的,二、确定调查对象和单位,三、确定调查项目和设计调查表,四、确定调查时间地点,五、制定调查的组织实施计划。 专门调查可分为:普查、重点调查、典型调查和抽样调查。 普查:为了特定的研究目的而专门组织的一次性全面调查;特点:1、一次性调查2、主要调查一定时点的情况3、普查的数据一般比较准确,规范化程度较高;原则:1、必须统一规定普查的时点2、正确选择普查的时期3、在普查范围内各调查单位或调查点应尽可能的同时进行4、同类普查的内容在各次普查中应尽可能的保持一致。

统计基础复习资料

统计学基础 项目1 基础知识 第1讲统计的基本问题 统计理论的产生和发展? 1. 国势学派:又称记述学派,产生于17世纪的德国,首先使用了“统计学”这个名词。(有统计学之名,无统计学之实) 2. 政治算术学派:起源于17世纪英国,主要代表人物是威廉.配第,著的《政治算术》,可以说是统计学的创始人。(无统计学之名,有统计学之实) 3. 数理统计学派:产生于19世纪比利时,主要代表人物凯特勒,他完成了统计学和概率论的结合,形成了数理统计学。 统计的含义? 有统计工作、统计资料和统计学三种含义,1. 统计工作:即统计实践,是对社会经济现象以及自然现象的总体数量进行搜集、整理和分析的活动过程。 2.统计资料:即统计数据,是统计工作的成果,是统计工作过程中所取得的反映社会经济实际情况和变化过程的数字资料,是社会经济信息的主体,也是国家制定政策、计划和实行科学管理的数字资料。 3.统计学:是研究统计工作的理论与方法的一门方法论科学,是长期统计工作实践经验和相关理论的科学概括和总结。 4.统计的三种含义之间有着密切的联系。统计资料是统计工作实践的成果,统计学来源于统计工作,是统计工作经验的理论概括,又用理论和方法指导统计工作,推动统计工作不断提高。随着统计工作的进一步发展,统计学不断地充实和提高,二者是理论和实践的关系。由于统计工作、统计资料、统计学联系紧密,所以习惯上把这三者统称为统计。 统计学的性质?统计学历经三百多年的发展,现在已经成为一门横跨社会科学,自然科学等领域的综合性学科。 第2讲统计学的研究对象和研究方法 1. 统计学的研究对象是统计研究所要认识的客体。研究对象为大量现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。2. 就性质来说,统计学是一门适用于自然现象和社会现象的方法论学科。3. 统计学研究对象的特点:数量性、总体性、变异性和具体性。4. 统计的工作过程:统计设计、统计调查、统计整理和统计分析。 5. 统计学的研究方法:大量观察法、统计分组法、综合指标法、动态数列分析法、指数分析法、抽样推断法、相关分析等。(其中大量观察法、统计分组法和综合指标法贯穿统计研究的全过程,是统计研究的基本方法。 6. 大量观察法:是对所研究的经济现象总体中的全部单位或足够量的单位进行调查研究,以认识社会经济现象发展变化的规律性的一种统计研究方法。7. 统计分组法:将总体各单位按照某种标志划分为若干组成部分,这种统计研究方法就是统计分组法。8. 综合指标法:是指运用各种综合指标,是大量社会经济现象的各个方面进行综合分析来反映总体一般数量特征的统计分析方法。 第3讲统计学的几个基本概念 1.统计总体:简称总体,就是我们要调查或统计的某一现象的全部数据的集合。 2.总体单位:是构成总体的各个个别单位,它是组成统计总体的基本单位,也是各项调查项目的直接承担者。 3.统计总体的特征:同质性、大量性、差异性。 4.同质性:是指总体中的每一个单位必须具有某种共同的性质。

社会统计资料的搜集

第二章社会统计资料的搜集 第一节调查的方法及种类 原始资料与次级资料·静态资料与动态资料·全面调查与非全面调查·经常性调查与一次性调查·问询法与观察法·报告法与实验法·文献法第二节统计调查的组织形式 普查·重点调查与典型调查·抽样调查·随机抽样与非随机抽样 第三节概念的操作化与测量 抽象定义和操作化定义·信度和效度·测量层次(定类测量、定序测量、定距测量、定比测量)社会学研究的科学性 第四节统计误差 登记性误差与代表性误差·抽样误差·无反应偏差 一、填空 1.()是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。()是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。 2.如果考虑到资料的时间过程,凡某一特定时刻的资料称为();凡某时期内变动累计的资料称为()。 3.()调查就是根据调查的目的和要求,在对所研究对象进行初步全面分析的基础上,从中选择有代表性的单位,做周密细致的调查。 4.()误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。()误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。 5.统计误差有()和()两类,其中()在全面调查和非全面调查中都可能发生。 6.对在全国钢产量中占很大比重的十大钢铁企业进行钢产量生产调查,这种调查方式属于()。 7.统计调查从调查范围上分,可分为()和()。 8.统计调查按调查登记时间是否连续,可分为()和()。 9.统计调查从调查目的上,可分为()和专项调查。 10.()误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。 二、单项选择 1.将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种抽样方式叫()。

《社会经济统计学》习题汇编及答案

练习一 一、单项选择:(在备选答案中,选择一个正确答案,将其番号写在括号。)。 1、标志是( 3 )。 ①说明总体数量特征的名称②都可用数量表现的特征的名称 ③说明总体单位特征的名称④不能用数量表现的特征的名称 2、社会经济统计的研究对象是( 1 )。 ①大量社会经济现象的数量方面②主要社会经济现象 ③大量社会经济现象的方面④个别典型事物 3、一般说来,统计报表的报送周期愈长,调查内容( 1 )。 ①愈多②愈少③准确性愈高④准确性愈低 4、重点调查的重点单位,是指(2 )。 ①各方面情况好的单位 ②单位数较少,但所研究标志值占总体标志总量绝大比重的单位 ③企业规模较大的单位④在国计民生中地位显赫的单位 5、考生《统计学原理》的考试成绩分别为:60分、68分、75分、82分、90分。这五个 数是( 4 )。 ①指标②标志③变量④标志值 6、统计调查表可分为(4)。 ①简单表和分组表②简单表和复合表 ③简单表和一览表④单一表和一览表 7、国有工业企业生产设备普查对象是(3)。 ①全部国有工业企业②每个国有工业企业 ③全部国有工业企业的所有生产设备④每台生产设备 8、某企业2001年4月1日至5日对该企业3月31日的生产设备进行普查,标准时间是( 2 )。 ①4月1日②3月31日③4月1日至5日④3月1日9、统计整理阶段的关键问题是(2)。 ①对调查资料的审核②统计分组③资料汇总④编制统计表10、对于离散型变量,在编制变量数列时( 3 )。 ①只能编制单项式变量数列②只能编制组距式变量数列 ③既可编制单项式又可编制组距式变量数列④不能编制组距式数列 11、相对指标是( 2 )。 ①两个总量度指标对比形成②两个有联系指标对比形成 ③两个绝对指标对比形成④两个相对指标或平均指标对比形成 12、调查某市国有工业企业的生产情况,下列调查项目属于不变标志的是(1)。 ①企业所有制形式②产品产量

资料的统计分析

第十二章资料的统计分析 第二节集中量数分析 一、集中量数也称集中趋势,它是一组数据的代表值,代表着现象的一般水平,别的数值围绕着它的周围。 常用的集中数有:算术平均数、中位数、众数。 二、算术平均数:是以总体各单位数值之和除以总体单位总数的商。即, 各单位的标志数值之和 算术平均数= 总体单位总数 (一)简单算术平均数法: X1+X2+…X n ∑X X = = n n 其中,符号X代表算术平均数;X1,X2,…X n分别代表各个具体的标志数值,n表示总体单位数(即总体中个案的数目),∑表示将各个具体的标志数值相加求和。 (二)加权算术平均数: X1f1+ X2f2+…X n f n ∑Xf X = = f1+ f2 +…f n∑f 其中,f为权数,即变量在总体中出现的次数。 1、由单项分组资料求算术平均数。 ∑Xf X = ∑f 2、由组距分组资料求算术平均数。 先计算出组中距,然后再使用加权算术平均数的公式进行计算。 组中值的符号为:X mid 下组限+上组限 X mid = 2 由组距分组资料计算算术平均数的公式就变为: ∑f X mid X = ∑f

三、中位数 中位数是把调查到的数据资料按照标志值大小顺序排列,处于中央位置的标志值表示中间位置的平均数,也称位置平均数。 (一)由原始资料计算中位数 原始资料是以单项标志值形式表现的。先把各个标志值按照大小顺序排列,然后用总体单位数加1除以2,即n+1 ,就可以求出中位数的位次。 2 (二)对经过资料计算中位数 1、由单项分组资料求中位数。 n+1 中位数的位次= 2 2、由组距分组资料计算中位数。 ∑f 由组距分组资料计算中位数,应先用 2 公式确定中位数所在组的位置,然后再用下限公式计算中位数的值。下限公式为: ∑f-cf m -1 M d= ×i+L f m 为中位数所在组以下的累计次其中,M d为中位数,f m为中位数所在组的次数,cf m -1 数,∑f为累计数,i为中位数所在组的组距,L为中位数所在组的下限。 四、众数 众数是指在一组数据中重复次数最多的标志值。 (一)从单项分组数据资料中计算众数 一般采用直接观察法即可。 (二)从组距分组资料中计算众数 一种是组中值法,另一种是摘补法。 L+U 其公式为:众数= 2 其中,L代表众数所在组的组下限,U代表众数所在组的组上限。

汇编分类统计字符个数

分类统计字符个数 一、实验目的 通过编程实现字符进行分类统计。 利用DOS功能调用INT 21H的10(0Ah)号功能,掌握进行键盘输入字符串的方法以及数据区设置。 掌握8086指令: CMP、JB、JA、SHL、INC、LEA、INT、JNZ、SCASB、LOOPE/LOOPNE等。 二、实验内容 1、编写一个程序实现将数据段中存储在STRING处到NUM处的字符串进行分类统计,然后将结果存入以letter、digit和other为名的存储单元中。查找字符串STRING中是否有空格,如有找出第一个出现的位置(先用十六进制显示,后修改为十进制显示),否则输出N。 2、修改前述1的程序,实现从键盘输入一个以回车键作为结束符的字符串(字符个数不超过80个),存入BUF中,分类统计BUF中字符串,将结果存入以letter、digit和other为名的存储单元中,屏幕输出大小写字母个数、数字个数和其它字符个数,并查找字符串BUF中是否有空格,如有找出第一个出现的位置(用十进制显示),否则输出N。(对有余力的同学) 实验结果: DEBUG 调试并查看结果的正确性。 对存储区STRING的内容“12ABCDE#!@Y(78)=(1).” 屏幕显示: N 对存储区STRING的内容“12ABCD E#! @Y(78)=(1).” 屏幕显示: Place=7 对第2部分,如键盘输入 12ABCDE# 3456789143!@Y(78)=(1).回车 输出结果: Letter=6 Digit=15 Other=9 Place=9 三、分析与体会 本次实验我花了较长的时间来完成。初略的程序花了5个多小时完成。后来遇到转换为十进制的时候就卡住了。后来在第六周周三的时候听了课以后才会做。

统计数据的搜集与整理

第二章统计数据的搜集与整理 一、教学目的与要求 通过本章的学习,了解统计数据的计量尺度和数据的类型,了解绝对数和相对数的意义及比例和比率的计算方法;了解各种统计调查方式的特点和适用场合;掌握统计调查方案设计的内容,了解数据预处理的意义;掌握统计数据的分组方法,能够对原始数据进行适当的分组并编制频数分布表,绘制频数分布的直方图和茎叶图。 二、教学重点 1、统计调查方案设计 2、统计数据的分组 3、变量数列的编制 三、教学难点 1、抽样调查、重点调查与典型调查的比较 2、调查方案的设计 3、次数分布的概念 4、变量数列的基本术语及编制 四、教学基本内容 第一节数据的计量与类型 一、数据的计量尺度 (一)定类尺度 按事物的某种属性对其进行平行的分类或分组。(只能测度事物之间的类别差,其他差别无法得知)例:按照性别将人口分为男、女两类。 (二)定序尺度 又称顺序尺度,是对事物之间等级差别和顺序差别的一种测度。它不仅可以测度类别差,还可以测度次序差。(不能测量类别之间的准确差值,只能比较大小,不能进行加、减、乘、除数学运算)例:考试成绩可分为优、良、中、及格、不及格。 (三)定距尺度 又称间隔尺度,是对事物类别或次序之间距离的测度。该尺度通常使用自然或物理单位作为计量尺度。例:考试成绩80分与90分之间相差10分。定距数据可以进行加、减运算,不能进行乘、除运算。其原因为定距尺度中没有绝对零点(定距尺度中的“0”表示水平,不表示没有)。 (四)定比尺度 又称比率尺度,由于定比尺度有绝对零点(定比尺度中的“0”表示没有,不存在)。因此,不仅可以加减运算,还可以乘除运算。例如,甲工资为600元,乙工资为1200元,则乙的工资为甲的2倍。二、数据的类型 统计数据大体上分为两种类型:定性的数据和定量的数据。 定性数据也称品质数据,它说明的是事物的品质特征,是不能用数值表示的,这类数据由定类尺度和定序尺度计量形成。 定量数据也称数量数据,它说明的是事物的数量特征,是能够用数值表示的,这类数据由定距尺度和定比尺度计量形成。 说明现象某种特征的概念称为变量,变量的具体表现称为变量值。变量可分为连续型变量和离散型变量。离散变量只能取有限个数,而且其取值都以整位数断开,如企业个数、职工人数等;连续变量可以取无穷个数值,其取值是连续不断的,不能一一列举,如零件尺寸、年龄、温度等。 三、统计数据的表现形式 数量型统计数据通常有两种基本的表现形式,即绝对数与相对数。 (一)总量指标(绝对数) 1、概念:反映客观现象总规模、总水平的指标。 2、种类 按反映现象总体内容的不同,可分为: 总体单位总量:反映总体所有单位总数的指标。 总体标志总量:反映总体中各单位标志值总和的指标。 按指标反映的时间状况不同 时期指标:反映现象在一段时期发展变化的总量指标。 时点指标:反映现象在某个时点所达总量的指标。 (二)相对指标 1、概念:两个相互联系的指标数值对比的比值(相对水平) 2、作用:用一个抽象化了的数值来反映两个有联系的事物之间的数量关系 3、种类 计划完成程度相对数、结构相对数、比例相对数、比较相对数、强度相对数、动态相对数 第二节统计数据的搜集

民国教育统计资料汇编

《民国教育统计资料汇编》目录 本书收录民国时期教育相关统计资料共计七十四种,包涵了全国性与地方性的、综合性与单一性的,涉及高等教育、中等教育、初等教育和社会教育等各个方面。基于资料连续性的考虑,本书对于清末的几种重要的相关统计资料也收入其中,如清光绪三十三年由学部总务司主持编制的《第一次教育统计图表》、宣统二年由直隶学务公所主持编制的《直隶教育统计图表》等。是研究当时教育状况的重要史料。 分册目录: 第一册 第一次教育統計圖表(1)〇〇一 第二册 第一次教育統計圖表(2)〇〇一 第三册 中华民国第四次教育统计图表:四年八月至五年七月〇〇一 第四册 中国教育统计概览〇〇一 全国教育统计简编〇七七 历年全国中等教育统计简编民国二十五至三十四学年度一〇三 全国高等教育概况统计民国二十一年度一二七 全国高等教育统计民国二十一年度二〇九 第五册 全国高等教育统计民国二十二年度〇〇一 全国高等教育统计民国二十三年度三一七 第六册 全国中等教育统计民国十九年度〇〇一 全国初等教育统计民国二十二年度二七九 第七册 全国社会教育概况民国十九年度〇〇一

全国社会教育概况统计民国二十年度一七七 全国社会教育概况统计民国二十一年度三六七 第八册 全国社会教育概况统计民国二十二年度〇〇一全国社会教育统计民国二十三年度一七五 全国社会教育统计简编民国三十五学年度四一三调查工人家庭生活及教育程度统计四一九 第九册 华北教育统计民国二十八年度〇〇一 华北社会教育概览民国三十年度一四五 第十册 直隶教育统计图表宣统二年〇〇一 直隶被灾各县教育状况一览表三七九 直隶教育统计表民国十二年度五四五 直隶教育统计表民国十四年度五七五 第十一册 河北省各县普通教育概览民国十七年度〇〇一河北省教育统计概要一四九 河北省教育概况二二一 京师教育概况三七一 第十二册 北平特别市初等教育统计民国十七年度〇〇一山西省第九次教育统计民国十三年度二〇九

现存统计资料分析的研究范例

课题:教育研究方法(现存统计资料分析)专业:高等教育学 姓名:季红波

现存统计资料分析 【本节学习目标】通过对以下内容的学习使学生掌握以下主要内容并且能够在实践中运用所学的知识。 1.现存统计资料分析的概念。 2.现存统计资料分析的主要步骤。 3.现存统计资料分析的效度和信度。 【教学流程】 一、现存统计资料分析的概述 在社会科学研究中,人们也常常运用各种现存的统计资料来进行自己的研究。这种现存的统计资料,既可以为研究提供历史背景材料,又可以成为研究本身的数据和资料的一种来源。后一种情况下,研究就被称作现存统计资料分析。 具体来说: 现存统计资料分析(analyzing existing statistics):是指利用官方或准官方的统计资料来进行研究的一种方式,它所用的资料是经过统计汇总的资料。 特点:现存统计资料分析所用的资料是经过统计汇总的资料 注意:现存统计资料的分析与二次分析有一个相似的方面,这就是他们所用的资料都是别人已收集好的。只是二次分析所用的是原始数据资料,而现存统计资料的研究者则是利用那种以频数、百分比等统计形式出现的聚集资料。 统计资料来源:官方统计资料,民间统计资料,其他(民意调查)

我国有价值的统计资料介绍: 我国最有价值的统计资料是由国家统计局编辑的《中国统计年鉴》、以及诸如《中国社会统计资料》、《中国人口统计年鉴》、《中国城市统计年鉴》、《中国教育统计年鉴》这样的分支统计资料,它们既包括各省和各主要城市的资料,也包括不同年代的资料。 美国有价值的统计资料介绍: 在美国,质量最佳的资料是由美国商业部每年出版的《美国统计摘要》。此外,《美国年鉴》以及联邦机构所公布的数据资料,对于社会科学研究来说也是十分有用的。 国际范围内的统计资料: 国际范围内的统计资料主要由联合国提供。它的《人口年鉴》每年都提供各国重大的统计资料。比如出生率、死亡率、人口自然增长率等有关人口的统计资料。而联合国的其他出版物则提供各种分类的统计资料。 此外,一些专门的研究机构,特别是调查研究及民意测验机构,也可以提供巨大的数据资料。比如,美国的盖洛普民意调查中心,每年都公布他们的各种调查结果。就是在各种社会科学的专业刊物以及学术著作中,也有各种各样的统计资料,利用他们同样也能进行社会科学研究。 使用官方统计资料应注意的问题: 一是应该对统计资料的内容、对象、范围、特点等等都具有清楚明确的认识。二是:对于各种统计指标、比率和数字的实际含义、他

第三章社会统计资料的整理

第三章社会统计资料的整理 原始资料杂乱无章,需加整理,才能为人所用。统计资料的整理,其基础是统计分组。所谓统计分组.就是按统计研究的目的和要求,将总体单位或全部调查数据按一定的标志划分成若干组,使组内差异尽量小,而组与组之间则有明显差异,从而使原本杂乱无章的资料有序化,以便为在统计分析中提炼各种有用信息打下基础。 第一节统计分组的原则与标准 统计分组的标志分为数量标志和品质标志两大类。按国际惯例,无论采用何种标志进行统计分组,都应遵循以下一般原则:(1)分组应使各类别构成之和等于总体;(2)分组设计应能反映统计总体的分布规律性。 在统计资料搜集的基础上,按分组原则,将总体中所有单位依一定顺序归类整理,即可得到能够表明总体单位总数在各组分配情况的频数(或次数)分布数列,简称数列。频数分布数列是统计分组工作的产物。显然,按品质标志进行分组,我们可以得到品质数列;按数量标志进行分组,我们可以得到变量数列。 统计分组的关键在于选择分组标志和划分各组界限。一般来讲,按品质标志来分组,其差别比较明确,区分也较容易。按数量标志来分组则不同,对于划分各组界限,变量数列有较大的任意性。如果划分不当,不仅容易混淆各组的差别,也可能无法反映变量的分布特征。在统计整理和统计分析中,广泛应用变量数列,借以观察某一数量标志的变动及其分布状况。因此,如何编制变量数列是我们重点需要掌握的。 第二节统计表 统计调查搜集来的资料往往是没有次序的原始资料,使原始资料有序化,列表和作图是两种基本方法,得到的分别就是统计表和统计图。变量数列是统计表的一种常用形式。 1.统计表的格式、内容与种类 统计表是表示统计资料的表格,在由横行、纵栏交叉结合而成的表格上,它能系统地组织和合理地安排大量数字资料。统计表的主要功用是汇总和积累统计资料,以简捷和有条理的方式表示统计资料的特征,从而使统计资料易于查对、比较、分析和记忆。 统计表通常有一定格式:总标题、横行标题(表侧)、纵栏标题(表头)、统计数值(表身)。统计表从内容上看,是由主词和宾词两部分构成的。主词是统计表所要说明的对象,它可以是总体各单位的名称、总体的各个组或总体单位的全部。宾词是用来说明主词的标志和标志值(或指标名称和指标数值)。主词通常列于表的左瑞,宾词通常列于表的上端。但有时为了编排合理和阅读方便,也可以互换位置,将主词置于表的上端,将宾词置于表的左瑞。

管理统计学复习资料

1、统计学方法可以解决的主要问题有哪些? 1)现状的客观描述(如不同状况的百分比、均值)2)均值、方差、百分比等统计值是否有本质区别(随机差异?本质差异?)3)依据样本推断总体的概率分布是什么4)依据数据找出问题的显著因素与关键因素5)寻找变量的相互关系(相关关系)6)寻找变量间的数量规律7)依据规律把变量分为具有某些共同特性的类别8)依据已有规律,判别新数据属于哪个类别等。 2、统计学的发展经历了哪些阶段?说明每个阶段的特点。 1)古典统计学时代:政治算术派国势学派2)近代统计学时代:数理统计学派社会统计学派3)现代统计学时代:区间估计理论假设检验理论 1、数据计量尺度分为哪几种?不同计量尺度各有什么特点? 答:一、定类尺度二、定序尺度三、定距尺度四、定比尺度 A定类尺度特点: (1)定类尺度是最粗略、计量层次最低的计量尺度。(2)定类尺度作为代码的数值不反映各类的优劣、量的大小或顺序,不可以区分大小或进行任何数学运算。(3)对定类尺度的计量结果,可以计算每一类或组中各元素或个体出现的频数。 B、定序尺度的特点:(1)定序尺度可以将研究对象分为不同的类别,而且可以反映各类的优劣、量的大小或顺序。(2)定序尺度比定类尺度精确一些,但只是测度了类别之间的顺序,而未测量出类别之间的精确差值。(3)计量结果只能比较大小,不能进行加、减、乘、除。 C、定距尺度特点: (1)定距尺度不但可以用数字表示现象各类别的不同和顺序大小的差异,还可以用确切的数值反映现象之间在量方面的差异。(2)反映现象规模水平的数据必须以定距尺度计量,例如产品产量、人口数、国内生产总值等(3)结果可以进行加减。 D、定比尺度的特点: (1)反映现象的结构、比重、速度、密度等数量关系(2)定比尺度的计量结果可以进行加、减、乘、除等数学运算 2、统计变量分类有哪些?统计数据有哪几种? 统计变量定类变量、定序变量、数字变量;统计数据有定类数据、定序数据、定距数据和定比数据。 定类变量的值就是定类数据;定序变量的值就是定序数据;数字变量的值即为定距数据或定比数据(这两者统称为定量数据)。 3、抽样调查分为哪两类?各有什么特点? 抽样调查分为随机抽样和非随机抽样。 随机抽样:在目标总体中不按任何规则抽取一定数量的样本。特点:总体中每个单位被抽中的概率是相同的,完全由许多随机因素综合作用来决定,既排除了抽样时人的主观随意性,也排除了人的主观能动性。当总体变异性大时,随机抽得的样本代表性差。误差可以估计且所需样本数量大,操作不灵活,成本较高。适合结论性调查 非随机抽样:在目标总体中按某种规则抽取一定数量的个体作为样本。特点:误差不可估计,使用与探索性研究。 4、简述企业数据收集过程 1)首先要弄清楚收集的目的,明确收集方向。一般来说,收集调研数据的用途可分为探测性调研、描述性调研和因果性调研三类; 2)制定数据收集计划。计划的制定要贴近现实情况,具备较强的可操作性; 3)实施数据收集计划。

相关文档