文档库 最新最全的文档下载
当前位置:文档库 › 统计学书单

统计学书单

统计学书单
统计学书单

一、统计学基础部分

1、《统计学》 David Freedman等著,魏宗舒,施锡铨等译中国统计出版社。据说是统计思想讲得最好的一本书,读了部分章节,受益很多。整本书

几乎没有公式,但是讲到了统计思想的精髓。

2、《Mind on statistics(英文版)》,机械工业出版社。

只需要高中的数学水平,统计的扫盲书。有一句话影响很深:Mathematics as to statistics is something like hammer, nails, wood as to a house, it's just the material and tools but not the house itself。

3、《Mathematical Statistics and Data Analysis(英文版.第二版)》,机械工业出版社。

看了就发现和国内的数理统计书有明显的不同。这本书理念很好,讲了很多新的东西,把很热门的Bootstrap方法和传统统计在一起讲了。Amazon上有书评。

4、《Business Statistics a decision making approach(影印版)》,中国统计出版社。

在实务中很实用的东西,虽然往往为数理统计的老师所不屑。

5、《Understanding Statistics in the behavioral science(影印版)》,中国统计出版社。

和上面那本是一个系列的。老外的书都挺有意思的。

6、《探索性数据分析》,中国统计出版社和第一本是一个系列的。

大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。

二、回归部分

1、《应用线性回归》,中国统计出版社。

还是著名的蓝皮书系列,有一定的深度,道理讲得挺透的。看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书。

2、《Regression Analysis by example (3rd Ed影印版)》

这是偶第一本从头到底读完的原版统计书,太好看了。那张虚拟变量写得比小说都吸引人。没什么推导,甚至说“假定你有统计软件可以算出结果”,主要就是怎么分析,怎么看图,怎么看结果。看完才觉得回归真得很好玩。

3、《Logistics回归模型——方法与应用》,王济川郭志刚,高等教育出版社。不多的国内的经典统计教材。两位都是社会学出身,不重推导重应用。每章都有详细的SAS和SPSS程序和输出的分析。两位估计洋墨水喝得比较多,中文写的书,但是明显老外写书的风格

三、多元

1、《应用多元分析(第二版)》,王学民,上海财经大学出版社。

现在好像就是用的这本书,但是请注意,这本书的亮点不是推导,而是后面和SAS结合的部分,以及其中的一些想法(比如P99 n对假设检验的影响,绝对是统计的感觉,不是推推公式就能感觉到的)。这是一本国内很好的多元统计教材。

2、《Analyzing Multivariate Data(英文版)》 Lattin等著机械工业出版社。这本书有很多直观的感觉和解释,非常有意思。对数学要求不高,证明也不够好,但的确是“统计书”,不是数学书。

3、《Applied Multivariate Statistical Analysis (5th Ed影印版)》 Johnson & Wichem 著中国统计出版社。

个人认为是国内能买到的最好的多元统计书了。Amazon 上有人评论,评价很高的。不过据王学民老师说,这本书的证明还是有不太清楚,老外实务可以,证明实在不咋的,呵呵。

四、时间序列

1、《商务和经济预测中的时间序列模型》弗朗西斯著。

Amazon 上五星推荐的书,讲了很多很新的东西也非常实用。我看完才知道,原来时间序列不知有AR(1) MA(1)啊,哈!

2、《Forecasting and Time Series an applied approach(third edition)》Bowerman & Connell 著。

本书的主讲Box-Jenkins(ARIMA)方法,附上了SAS和Minitab程序。

五、抽样

1、《抽样技术》科克伦著张尧庭译。

绝对是该领域最权威,最经典的书了。王学民老师说:这本书不是那么好懂的,数学系的人,就算看得懂每个公式,未必能懂它的意思(不是数学系的人,还是别看了吧)。

2、《Sampling: Design and Analysis(影印版)》 Lohr著中国统计出版社。讲了很多很新的方法,无应答,非抽样误差,再抽样,都有讨论。也很不好懂,当时偶是和《Advance Microeconomic Theory》一起看的,后者被许多人认为是梦魇,但是和前者一比,好懂多了。主要还是理念上的差距。我们的统计思想和数据感觉有待加强啊。

六、软件及其他

1、《SAS软件与应用统计分析》,王吉利、张尧庭主编。

好书啊!!!!

2、《SAS V8基础教程》,汪嘉冈编,中国统计出版社。

主要讲编程,没怎么讲统计。如果想加强SAS编程可以考虑。

3、《SPSS11统计分析教程(基础篇)(高级篇)》,张文彤,北京希望出版社。当初第一次看这本书,发现怎么几乎都看不懂,尤其是高级篇,现在终于搞清楚了:)

4、《金融市场的统计分析》,张尧庭著,广西师范大学出版社。

张老师到底是大家,薄薄的一本书,言简意言简意赅,把主要的金融模型都讲

清楚了。看完会发现,分析金融单单数学模型还是纸上谈兵,必须加上统计模型和统计方法才能真正应用。本书用的多元统计(代数知识)比较深。

生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 122 --∑∑n n x x )(

2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 三 填空 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 n /σx σ

统计学试题及答案分析-共20页

统计学考试题一 一、 单项选择题(请将正确答案的番号写在括号内,每小题1分,共20分) 1. 统计学名称来源于 A .政治算术学派 B .国势学派 C .数理统计学派 D .社会经济统计学派 2. 统计学是一门关于研究客观事物数量方面和数量关系的 A .社会科学 B .自然科学 C .方法论科学 D .实质性科学 3. 几位学生的统计学考试成绩分别为55,60,70,80,85,60,这几个数字是 A .指标 B .变量 C .标志 D .变量值 4. 重点调查中的重点单位就是 A .有关国际名声的单位 B .在总体中其单位数目占绝大比重的单位 C .特殊的单位 D .其单位数虽少,但被调查的标志值在总体标志值中占绝大比重的单位 5. 调查某大学学生学习情况,则总体是 A .该大学所有学生 B .该大学每一名学生的学习成绩C .该大学每一名学生 D .以上都不正确 6. 某公司员工的工资分为:(1)800元以下;(2)800~1500元;(3)1500~2019元;(4) 2019元以上,则第四组的组中值近似为 A .2019元 B .1750元 C . 2250元 D .2500元 7. 分配数列是 A .按数量标志分组的数列 B .按品质标志分组的数列 C .按指标分组的数列 D . 按数量标志或品质标志分组的数列 8. 统计表的形式构成由总标题、横行标题、纵栏标题 A .数据资料 B .主词 C .宾此 D .以上都不正确 9. 反映同类现象在不同时期发展变化一般水平的指标是 A .算术平均数 B .序时平均数 C .众数 D . 调和平均数 10. 某企业5月份计划要求成本降低3%,实际降低5%,其成本计划完成程度为 A .97.94% B .166.67% C .101.94% D .1.94% 11. 若两总体的计量单位不同,在比较两总体的离散程度时,应采用 A .全距 B .平均差 C .标准差 D .标准差系数 12. 下列指标中,属于强度相对数的是 A .某企业的工人劳动生产率 B .人均国民收入 C .某种商品的平均价格 D .某公司的平均工资 13. 拉氏指数所用的同度量因素是固定在 A .基期 B .报告期 C .固定时期 D .任意时期 14. 某市工业总产值增长了10%,同期价格水平提高了3%,则该市工业生产指数为 A .113.3% B .13% C .106.8% D .10% 15. 我国消费价格指数的编制方法 A .∑∑= 0q p q p K K p p B . ∑∑= 1 1111 q p K q p K p p C .∑∑= 1q p q p K p D .∑∑= 1 011q p q p K p

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

统计学调查分析报告

承诺 本报告由小组成员共同完成,所用数据与资料均已注明其来源,如使用了他人已经发表或撰写过的分析结果或观点均已进行了规范引用,特此声明。 小组成员1姓名与签字: 小组成员2姓名与签字: 小组成员3姓名与签字: 小组成员4姓名与签字:

目录 承诺...................................................................................................................... II ⑴问卷设计条理不够清晰 (14)

正文 通过一个学期对统计学原理的学习,我们学会了如何用利用数学分析来解决实际问题。在这次调查中,我们确定了以“学生缺课情况与原因分析”为主题的问卷调查。以下是我们小组这次调查分析的研究流程: 1、确定研究问题 背景分析 大学是一个培养人综合能力的地方,进大学相当于初步迈入社会。 大学生活,有更多属于自己的时间做自己想做的事,学校也会组织一些有意义的活动,使学生的业余生活更丰富;大学里有很多组织、社团等,学生会、团总支一类的是为学生服务,加入可以锻炼个人能力;还有许多可以根据兴趣爱好加入的社团;学校良好的学术氛围让你可以尽情遨游在知识的海洋中,享有埋头苦读的充实;偶尔勤工俭学,外出打工,体验生活;不能总想着玩,大学阶段是完善人的世界观人生观的阶段…… 大学生活多姿多彩,有丰富的课程、各色各样的社团活动、校外的缤纷生活、网罗天下的网络世界……“学习”仍然是大学生的最重要的任务,是大学生活里最核心的元素。但是,

作为离开父母的监督独立生活的第一站,大学里,学生们总是平衡不了学习和课余生活的关系,自主的管理生活反而使大学生们感到迷茫。 确定研究问题 大学生学习与课余生活最明显的冲突表现在“大学生缺课”这一环节,缺课的原因有很多种:社团活动、校外实习、课程设置、教室环境……我小组将就该问题展开调查与分析。让我们来分析一下其中的一个部分——大学生缺课情况与原因,从而为大学生平衡学习与课余生活的关系提供帮助。 2、选择统计分析方法 问卷设计 本次调查问卷的设计首先由要分析的数据出发,并结合实际,设计出一系列与该课题有关的问题。然后,在网上找到模板,设计出了一份问卷样本。接着,小组所有成员一起就问卷的问题用语、提问顺序进行了最后的讨论,最终拟定出我们要的调查问卷。 问卷内容 此次小组问卷的内容具体可以分为三个部分: 第一部分为基础信息,包括问题1和问题2。这部分涉及的信息包括被调查者的身份和性别。获得的数据主要是为了与后两阶段的数据一起做相关性分析。 第二部分为大学生缺课现状,即问题3缺课次数。 第三部分为相关原因调查,包括问题4到最后一问。这部分涉及的信息,便是被调查者缺课的各种原因,包括缺课原因、课程、缺课时间、地点、教师环境设施。这部分的数据,用于最终分析。 选择处理软件 这次的数据处理,我们采用了EXCEL统计软件进行综合统计分析。

调查问卷中的统计分析方法刘菊红

市场调研中调查问卷的统计分析方法 刘菊红 在市场经济日益发达的今天,企业占领市场的关键就是准确、快捷、有效地获得关于市场的信息。而市场调研则是获得这种信息最快捷的方式。市场调研就是科学地、系统地、客观地收集、整理和分析市场营销的资料、数据、信息,帮助管理人员制定有效的决策(政府决策也可作为企业决策来看)。 一个完整的市场调研包括四个方面:调研设计,即作出怎样达到调研目标或怎样得到信息的计划,数据资料的收集;现场作业主要包括访问所选样本中的每一个人或组织、并填写问卷;对问卷进行量化并进行统计分析;问卷的统计与分析是调查的重点,也是调研工作的难点。同样的统计数据,由于分析方法的不同以及对数据的理解不同,可能会得到完全相反的结果。 从统计分析的层次划分问卷的统计分析方法可分为两类:定性分析和定量分析。 一、定性分析 定性分析是一种探索性调研方法。目的是对问题定位或启动提供比较深层的理解和认识,或利用定性分析来定义问题或寻找处理问题的途径。但是,定性分析的样本一般比较少(一般不超过三十),其结果的准确性可能难以捉摸。实际上,定性分析很大程度上依靠参与工作的统计人员的天赋眼光和对资料的特殊解释,没有任何两个定性调研人员能从他们的分析中得到完全相同的结论。因此,定性分析要求投入的分析者具有较高的专业水平,并且优先考虑那些做数据资科收集与统计工作的人员。 二、定量分析 在对问卷进行初步的定性分析后,可再对问卷进行更深层次的研究——定量分析。同卷定量分析首先要对问卷数量化,然后利用量化的数据资料进行分析。问卷的定量分析根据分析方法的难易程度可分为定量分析和复杂定量分析。(一)简单的定量分析 简单的定量分析是对问卷结果作出一些简单的分析,诸如利用百分比、平均数、频数来进行分析。在此,我们可将问卷中的问题分为以下几类进行分析。 1、对封闭问题的定量分析。封闭问题是设计者已经将问题的答案全部给出,被调查者只能从中选取答案。例如: 您认为出入正式场合时,穿着重要吗?(限选一项) 一点也不重要……………………l 不重要 (2) 无所谓 (3) 重要 (4) 非常重要 (5) 对于全部45次访问的回答,我们可以简单地统计每种回答的数目:一点也不重要=2;不重要=5;无所谓=10;重要=15,可把结果整理成如表一所示:

地统计分析

实验五加利佛尼亚州的大气臭氧浓度的地统计分析 (综合实验) 实验目的: 通过对数据的具体分析,掌握ArcGIS下地统计分析模块的功能,了解完整的地统计分析过程,并能使用其解决科研问题中的实际问题。 实验内容: 美国环保局负责对加利佛尼亚州的大气臭氧浓度进行监测。利用地统计分析模块提供的许多工具,通过检测所有采样点之间的关系,对生成一个关于臭氧浓度值、预测标差(不确定性)的连续表面,从而使对其他点的浓度值进行最佳预测成为可能。 1、数据检查 2、模型拟合 3、模型精度比较 4、臭氧浓度制图 实验数据: 数据集描述 Ca_outline 加州轮廓图 Ca_ozone_pts 臭氧采样点数据(单位:ppm) Ca_cities 加州主要城市位置图 实验步骤: 一、数据加载 1、生成子集 将特定位置上的预测值同这些区域内的实测值相对比,是评价一个输出表面质量的最严格的方法。其方法是将原始数据集划分成两个部分:一个部分用于建立模型,也就是用来生成输出表面;另外一个部分用于测试,即验证输出表面。 (1)在Geostatistical Analyst 工具栏中单击Create Subsets命令; (2)Input Layer:选择要划分子集的图层; (3)拖动滑块到合适位置,来选择训练和测试数据的相对百分比; (4)单击完成,训练和测试数据集会在Personal Geodatabase中。 2、应用子数据集进行验证 (1)validation:input 选择测试数据集 (2)attribute:选择与生成表面时相同的属性 (3)打开验证图层 二、数据检查 你可以用三种方式对数据进行检验: (1)检测数据分布

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物统计学期末考试试题A

漳州师范学院 生物系_____________专业_____级本科_______班 《生物统计学》课程期末考试卷(A) (2011—2012学年度第一学期) 学号___________姓名________考试时间:2011-12-29 一、名词解释(6×2) 1统计数: 2小概率原理: 3无偏估计: 4准确性: 5纳伪错误: 6方差: 二、判断题:请在下列正确的题目后面打“√”,错误的打“×”。(12×1) 1 t分布曲线的平均数与中位数相等(√) 2众数是总体中出现最多个体的次数。(×) 3 正态分布曲线形状与样本容量n无关(√) 4 假设检验显著水平越高,检验效果越好(×) 5 样本频率假设检验如果需要连续性矫正时,矫正系数=0. 5(×) 6 样本标准差是总体标准差的无偏估计(×) 7计算相关系数的两个变量都是随机变量(√) 8 试验因素的任一水平就是一个处理(×) 9 在同一显著水平下,双尾检验的临界正态离差大于单位检验(√) 10 LSD检验方法实质上就是t检验(×) 11对多个样本平均数仍可采用t测验进行两两独立比较。(×)

12假设测验结果或犯α错误或犯β错误。( × ) 三、选择题(18×2) 1、某学生某门课成绩为75分,则其中的变量为[ ] A. 某学生 B. 某门课成绩 C. 75分 D. 某学生的成绩 2、算术平均数的重要特性之一是离均差之和[ ] A 、最小 B 、最大 C 、等于零 D 、接近零 3、在回归直线y=a+bx 中,若b <0,则x 与y 之间的相关系数[ ] A. r=0 B. r=1 C. 0<r <1 D. -1<r <0 4、假定我国和美国的居民年龄的方差相同。现在各自用重复抽方 法抽取本国人口的1%计算平均年龄,则平均年龄的标准误 [ ] A.两者相等 B.前者比后者大 C 前者比后者小 D.不能确定大小 5、1-α是[ ] A.置信限 B.置信区间 C.置信距 D 置信水平 6、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是[ ] A 、12 B 、10 C 、8 D 、2 7、两个二项成数的差异显著性一般用[ ]测验。 A 、t B 、F C 、u D 、卡方测验 8、测验回归截距的显著性时,()/a t a s α=-遵循自由度为[ ] 的学生氏分布。 A 、n -1 B 、n -2 C 、n -m -1 D 、n 9、对一批大麦种子做发芽试验,抽样1000粒,得发芽种子870粒,若规定发芽率达90%为合格,测验这批种子是否合格的差异显著性为[ ]。 A 、不显著 B 、显著 C 、极显著 D 、不好确定 10设容量为16人的简单随机样本,平均完成工作需时13分钟。 已知总体标准差为3分钟。若想对完成工作所需时间总体构 造一个90%置信区间,则[ ] A 应用标准正态概率表查出u 值 B.应用t 分布表查出t 值 C.应用卡方分布表查出卡方值 D.应用F 分布表查出F 值

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

统计学调查报告模板

西南财经大学天府学院 统计调查报告 报告题目:大学生每周吃水果店的情况调查报告调查小组:10班第9组 调查时间: 2014年6月10号-6月18号

大学生择业观现状情况的调查报告 目录 第一章调查方案设计 (1) (一)、大学生关于吃水果的相关调查问卷 (1) (二)、调查方案 (2) 1、调查目的 (2) 2、调查方案 (2) 3、报告说明: (2) 4、报告内容: (2) 第二章我校周边水果市场现状分析 (3) (一)、我校学生对周边水果市场的感受和认识。 (3) (二)、分析我校学生每周吃水果的重点......... 错误!未定义书签。 1、一周吃几次水果 (4) 2、购买水果最看重的因素 (5) 3、最喜欢的水果种类 (6) (三)、决定我校学生购买水果的因素 (4) (四)、我校学生选择什么地点购买水果及原因 (6) (五)、分析我校周边水果市场的竞争对手 (8) (六)、当季水果总结表 (8) (七)总结及建议 (9)

第一章调查方案设计(一)、大学生每周吃水果现状调查问卷 大学生择业观现状调查问卷表1、性别________ 专业___________ 年级_________ 出生地_________(农村、城市) 2、你一周吃水果的次数是_______ A、不吃 B、二次一下 C、三,四次 D、每天 3、你最喜欢吃的水果是_____ A、苹果 B、香蕉 C、猕猴桃 D、芒果 4、一般在什么地方买水果______ A、学校水果店 B、校外摊上 C、较远的大型超市 D、其他 5、购买水果最在意的因素______ A、价格 B、服务态度 C、质量 D、新鲜程度 E、包装 F、其他 6、每周购买水果的支出_______ A、10-20元 B、20-40元 C、40-50元 D、50元以上 7、为什么喜欢吃水果______ A、富含维生素 B、保养皮肤 C、为了身体健康 D、就是喜欢 E、其他 8、认为目前水果的价格_______ A、适中 B、偏高 C、偏低 D、没看法

《生物统计学-2019》复习题

《生物统计学》复习题 1.变量之间的相关关系主要有两大类:(因果关系),(平行关系) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生) 5.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(因变量) ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于 事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

统计学分析报告

. . . 统计学调查报告 (08级) 上海商学院学生消费状况调查报告 (奉浦校区) 徐伟杰,景宝龙,苏淳,张玮,贾金诚小组成员 指导教师姓名崔峰 物流管理系 系名称 论文提交日期2010.12.23

目录 一,调查目的: (3) 二,调查对象: (3) 三,调查项目: (3) 四,调查时间和时限 (3) 五,调查的组织工作 (4) 六,调查结果: (4) 七,调查问卷 (4) 上海市大学生消费状况调查问卷 (4) 八,调查分析: (6) (一)基本信息 (6) (二)消费结构状况分析: (7) (三)具体消费情况: (8) 九,预测分析 (14) 十,调查分析 (16) 十一,附录:调查统计汇总表 (17)

一,调查目的: 随着社会的发展,大学生的消费方式及消费状况引起了社会各界的极大关注,社会消费观念的转变和周围环境影响他们的消费观念和行为。大学生有着较为前卫的消费观念,消费来源主要有家庭父母供给,构成了一个比较特殊的消费群体,随着大学生数量的不断攀升,他们的消费行为在一定程度上形象着整个社会的消费观念和消费行为。而上海有拥有30所本科院校,大学生的数量比较庞大,并且有着更加前卫的消费观念。就此我们针对上海商学院学生的消费情况展开调查,了解我校学生的消费特征,进而探求更为科学的消费方式和行为,提高大学生的消费效益。 二,调查对象: 统计调查对象:上海上海商学院奉浦校区在读学生 统计调查单位:每一位在上海商学院奉浦校区就读的学生 统计填报单位:物流管理082班景宝龙、徐伟杰 三,调查项目: 统计标志:户籍所在地、就读年级、家庭月收入、个人月生活费、生活费来源、各方面的消费金额分配、是否满意目前的消费金额、期望月消费金额、消费计划、期望消费项目、超前消费的情况 四,调查时间和时限 调查时间:2010年10月 调查时限:两个月 五,调查分工: 问卷设计:徐伟杰 问卷校验:苏淳,张玮,景宝龙 问卷调查:景宝龙,张玮,苏淳,徐伟杰,贾金诚

《生物统计学》期末考试试卷

《生物统计学》期末考试试卷 一 单项选择(每题3分,共21分) 1.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选 择统计量________。 A. 2 (1)n S σ- B. 2 20(1)n S σ- X X 2.设123,,X X X 是总体2 ( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是_____。 A. 123X X X +- B. 41i i X μ=-∑ C. 2 1X σ+ D. 4 2 1 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μ μ- 5.在假设检验中,显著性水平α的意义是_______。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 6.单侧检验比双侧检验的效率高的原因是________。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.比较身高和体重两组数据变异程度的大小应采用_____。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数

统计学调查分析报告

承诺 本报告由小组成员共同完成,所用数据与资料均已注明其来源,如使用了他人已经发表或撰写过的分析结果或观点均已进行了规范引用,特此声明。 小组成员1姓名与签字: 小组成员2姓名与签字: 小组成员3姓名与签字:

小组成员4姓名与签字: 目录 承诺........................................................................................ 错误!未定义书签。正文........................................................................................ 错误!未定义书签。 1. 确定研究问题 .................................................................. 错误!未定义书签。 1.1 背景分析........................................................................................................... 错误!未定义书签。 1.2 确定研究问题................................................................................................... 错误!未定义书签。 2. 选择统计分析方法 .......................................................... 错误!未定义书签。 2.1 问卷设计........................................................................................................... 错误!未定义书签。 2.2 问卷内容........................................................................................................... 错误!未定义书签。 2.3 选择处理软件................................................................................................... 错误!未定义书签。 3. 收集样本数据 (2) 4. 数据分析 (2) 4.1 初步分析 (2) 4.2 男女生平均缺课次数相等的假设分析 (6) 4.3 年级与缺课次数的相关分析 (8) 4.4 学生缺课原因分析 (9) 4.5 年级与缺课原因直接的可重复双因素分析 (9) 4.6 上课环境对上课意愿的影响分析 (9) 5. 总结与建议 (12) 6. 调查优缺点分析 (13) 7. 参考文献 (14) 8. 附录 (14)

生物统计学期末复习资料(推荐文档)

第一章概论 1.1什么事生物统计学?生物统计学的主要内容和作用是什么? 答:生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括实验设计和统计分析两答部分的内容。其基本作用表现在以下四个方面:a.提供整理和描述数据资料的科学方法;确定某些性状和特性的数量特征;b.判断实验结果的可靠性;c.提供由样本推断总体的方法;d.提供实验设计的一些重要原则。 1.2解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、实验误差。 答:总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。 个体(individual)是组成总体的基本单元。 样本(sample)是从总体中抽出的若干个个体所构成的集合。 样本容量(sample size)是指样本个体的数目。 变量(variable)是相同性质的事物间表现差异性的某种特征。 参数(parameter)是描述总体特征的数量。 统计数(statistic是由样本计算所得的数值,)是描述样本特征的数量。 效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。 互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。 实验误差(experimental error)是指实验中不可控因素所引起的观测值偏离真值的差异,可以分为随机误差和系统误差。 1.3随机误差和系统误差有何区别? 答:随机误差(random)也称抽样误差或偶然误差,他是有实验中许多无法控制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完全消除随机误差。 系统误差(systematic)也称为片面误差,是由于实验处理以外的其他条件明显不一致所差生的倾向性的或定向性的偏差。系统误差主要有一些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得精细,在试验过程中是可以避免的。 1.4准确性与精确性有何区别? 答:准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或性状的观测值与其真值接近的程度。 精确性(precision)也称精确度,指调查或实验中同一实验指标或性状的重复观测值彼此接近程度的大小。 准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值的程度来衡量。精确性是反映多次测定值的变异程度,用样本间的各个变量间变异程度的大小来衡量。 第二章试验资料整理与特征数的计算 2.3平均数与标准差在统计分析中有什么作用?它们各有哪些特性? 答:平均数(mean)的用处:①平均数指出了一组数据资料内变量的中心位置,标志着资料所

相关文档