文档库 最新最全的文档下载
当前位置:文档库 › 统计计算第一次作业

统计计算第一次作业

统计计算第一次作业
统计计算第一次作业

第一次作业

1. 以下数据是调查15个学生是否学过四门课程(记为A、B、C、D)的资料,0表示没有学过,1表示已学过。

0 0 0 1 m 1 1 0 0 f

0 0 1 0 m 0 0 0 1 f

0 1 1 0 f 1 1 0 0 m

1 0 1 1 m 0 0 0 0 m

0 1 1 0 f 1 1 1 1 f

1 0 0 1 f 0 0 1 1 m

1 0 1 1 m 1 0 1 1 f

1 0 1 0 f

(1)对这组资料创建一SAS数据集,然后按男女分别生成两个SAS数据集。

(2)建立一新变量NEW:先把是否学过4门课程的资料看成4 个元素的向量,并作为一个4位二进制数,然后转换为十进制数

作为NEW的值。比如:(1011)可化为1*23+0*22+1*21+1*20=11。然后创建一个包含新变量和四门课得分的SAS数据集;并按NEW值从小到大的次序排列后输出。

(3)请统计一下15个学生中学过A、B、C、D四门课的各有多少人,并把结果存为SAS数据集后并打印输出。

程序:

data m f;/*将男女生的数据分别输入到数据集m、f*/

input A B C D S$@@;

if S='m'then output m;

if S='f'then output f;

cards;

0 0 0 1 m 1 1 0 0 f

0 0 1 0 m 0 0 0 1 f

0 1 1 0 f 1 1 0 0 m

1 0 1 1 m 0 0 0 0 m

0 1 1 0 f 1 1 1 1 f

1 0 0 1 f 0 0 1 1 m

1 0 1 1 m 1 0 1 1 f

1 0 1 0 f

;

run;

data a;/*产生数据集放NEW变量*/

set m f;

NEW=A*2**3+B*2**2+C*2**1+D*2**0;

proc sort data=a;by NEW;/*按NEW变量排序*/

proc print;

run;

data b;/*PA,PB,PC,PD分别表示分别通过A,B,C,D四门课的累积人数*/

set m f;

PA+A;PB+B;PC+C;PD+D;

drop A B C D;

proc print;

run;

(2)

(3)

则A B C D 各科通过人数分别为:8,5,9,8个人2. 试用概率函数计算正态分布N(3,9)的分布函数F(X)。

程序:

data a;

do x=0to3by0.1; y=probnorm((x-3)/3); file print;put y; end;

run;

3.试用分位数函数计算F

程序:

data a;

do ndf=1to5;

do ddf=1to10;

do a=0.05,0.025,0.005;

F=finv(1-a,ndf,ddf);

file print;put F;

end;end;end;

run;

4. 以下四行数据是四次记录下来的数据,每次从4 个厂家(用A,B,C,D代表)生产的同类食品中,每个厂家抽取三包测量每包的数量。每一行开头三个数值是厂家A生产,以后依次是B、C、D生产的。

72 74 69 61 61 65 62 65 70 85 76 61

67 52 62 60 55 59 64 65 64 67 72 60

57 66 72 72 43 43 63 66 72 56 75 92

57 56 78 60 63 58 61 79 68 73 86 71

(1)请按数据形式输入后生成外部数据文件DB25.TXT.

(2)用DATA步调入外部文件DB25.TXT(用INFILE和INPUT语句)生成包括变量:TIME(次数),N(包的序

号),FACTORY(厂家)和NUMBER(数量)的SAS数据集

(3)请按以下要求输出(2)产生的SAS数据集:

1.只包含变量TIME,FACTORY和NUMBER;

2.对每个厂家的资料分别输出报告,要求每包食品的数量按小到大的次序排好.

(4)计算每个厂家的12包食品的平均数量,标准差,极差和总和等描述统计量;然后存贮为一个SAS数据集(包含4 个观测)。

程序:

data test;/*输入数据到test数据集*/

do time=1to4;

do factory='A','B','C','D';

do n=1to3;

input number@@;

output;

end;

end;

end;

cards;

72 74 69 61 61 65 62 65 70 85 76 61

67 52 62 60 55 59 64 65 64 67 72 60

57 66 72 72 43 43 63 66 72 56 75 92

57 56 78 60 63 58 61 79 68 73 86 71

;

data_null_;/*将test数据集导出到外部文件DB25.TXT*/

set test;

file'D:\DB25.TXT';

put number;

data test2;/*导入外部文件的数据到test2数据集*/

infile'D:\DB25.TXT';

do time=1to4;

do factory='A','B','C','D';

do n=1to3;

input number @;

output;

end;

end;

end;

proc print;var time factory number; run;/*打印test2数据集中的数据,包含变量 time factory number*/

data a b c d;/*将A,B,C,D厂的数据分别输入到数据集a,b,c,d*/

set test2;

if factory='A'then output a;

if factory='B'then output b;

if factory='C'then output c;

if factory='D'then output d;

proc sort data=a;by number;proc print;

proc sort data=b;by number;proc print;

proc sort data=c;by number;proc print;

proc sort data=d;by number;proc print;

run;

proc summary data=a;var number;/*计算描述统计量*/

output out=aa mean=mean std=std range=range sum=sum; run;

proc summary data=b;var number;

output out=bb mean=mean std=std range=range sum=sum; run;

proc summary data=c;var number;

output out=cc mean=mean std=std range=range sum=sum; run;

proc summary data=d;var number;

output out=dd mean=mean std=std range=range sum=sum; run;

data factory;/*建立工厂名数据集*/

do factory='A','B','C','D';output;end;run;

data sta;/*将各个工厂的描述信息汇总到数据集sta*/

set aa bb cc dd;

data last;

merge factory sta;

proc print;run;

(3)1.

(3)2.A厂:

B厂

C厂

D厂

(4)

5、书上第28页,1.4题

说明:前四题给出SAS程序,并打印出来;第五题要求手写,直接写在打印出来的纸上,不要用本子写。

数理统计课后答案.doc

数理统计 一、填空题 1、设n X X X ,,21为母体X 的一个子样,如果),,(21n X X X g , 则称),,(21n X X X g 为统计量。不含任何未知参数 2、设母体 ),,(~2 N X 已知,则在求均值 的区间估计时,使用的随机变量为 n X 3、设母体X 服从修正方差为1的正态分布,根据来自母体的容量为100的子样,测得子样均值为5,则X 的数学期望的置信水平为95%的置信区间为 。 025.010 1 5u 4、假设检验的统计思想是 。 小概率事件在一次试验中不会发生 5、某产品以往废品率不高于5%,今抽取一个子样检验这批产品废品率是否高于5%, 此问题的原假设为 。 0H :05.0 p 6、某地区的年降雨量),(~2 N X ,现对其年降雨量连续进行5次观察,得数据为: (单位:mm) 587 672 701 640 650 ,则2 的矩估计值为 。 1430.8 7、设两个相互独立的子样2121,,,X X X 与51,,Y Y 分别取自正态母体)2,1(2 N 与 )1,2(N , 2 *2 2*1,S S 分别是两个子样的方差,令2*2222*121)(,S b a aS ,已知)4(~),20(~22 2221 ,则__________, b a 。 用 )1(~)1(22 2 * n S n ,1,5 b a 8、假设随机变量)(~n t X ,则 2 1 X 服从分布 。)1,(n F 9、假设随机变量),10(~t X 已知05.0)(2 X P ,则____ 。 用),1(~2 n F X 得),1(95.0n F

统计学第一次作业+参考答案

《统计学》第一次作业 一、单选题(共10个) 1.统计工作的成果是( C )。 A. 统计学 B. 统计工作 C. 统计资料 D. 统计分析和预测 2. 社会经济统计的研究对象是( C )。 A. 抽象的数量关系 B. 社会经济现象的规律性 C. 社会经济现象的数量特征和数量关系 D. 社会经济统计认识过程的规律和方法 3. 对某地区的全部产业依据产业构成分为第一产业、第二产业和第三产业,这里所使用的计量尺 度是( A )。 A. 定类尺度 B. 定序尺度 C. 定距尺度 D. 定比尺度 4.某城市工业企业未安装设备普查,总体单位是( D )。 A. 工业企业全部未安装设备 B. 工业企业每一台未安装设备 C. 每个工业企业的未安装设备 D. 每一个工业企业 5.统计总体的同质性是指( B )。 A. 总体各单位具有某一共同的品质标志或数量标志 B. 总体各单位具有某一共同的品质标志属性或数量标志值 C. 总体各单位具有若干互不相同的品质标志或数量标志 D. 总体各单位具有若干互不相同的品质标志属性或数量标志值 6.下列调查中,调查单位与填报单位一致的是(D ) A. 企业设备调查 B. 人口普查 C. 农村耕地调查 D. 工业企业现状调查 7.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应当选择( D) A. 统计报表 B. 重点调查 C. 全面调查 D. 抽样调查 8.重点调查中重点单位是指(A ) A. 标志总量在总体中占有很大比重的单位 B. 具有典型意义或代表性的单位 C. 那些具有反映事物属性差异的品质标志的单位 D. 能用以推算总体标志总量的单位 9.书籍某分组数列最后一组是500以上,该组频数为10,又知其相邻组为400-450,则最后一组 的频数密度为( A)

数理统计作业三

第一部分统计基础与概率计算(共10题,10分/题) 1.某人在每天上班途中要经过3个设有红绿灯的十字路口。设每个路口遇到红 灯的事件就是相互独立的,且红灯持续24秒而绿灯持续36秒。试求她途中遇到红灯的次数的概率分布及其期望值与方差、标准差。 解:读题可知每个路口遇到红灯的概率就是P=24/(24+36)=0、4 假设遇到红灯的次数为X,则,X~B(3,0、4),概率分布如下 0次遇到红灯的概率P0=(1-0、4)3=0、216 1次遇到红灯的概念P1=(1-0、4)2*0、4=0、432 2次遇到红灯的概念P2=(1-0、4)*0、42=0、288 3次遇到红灯的概念P3=0、43=0、064 期望:E(x)=nP=0、4*3=1、2 方差:D(X)=δ2=nPq=0、4*3*(1-0、4)=0、72 标准差: 2、一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。保险费每人50元。若一年中死亡,则保险公司赔付保险金额50000元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用): (1)至少获利50万元的概率; (2)亏本的概率; (3)支付保险金额的均值与标准差。 解:设被保险人死亡数为X,X~B(20000,0、0005) 2.总收入为2万×50=100万,要获利至少50万,则赔付的保险金额应该不超过50万,也就就 是被保险的人当中死亡人数不能超过10人,精确点就就是用二项分布来做,但就是由于20000这个数比较大,就可以用正态近似来做,就就是认为死亡人数服从与原二项分布的均值方差相同的正态分布,结用正态函数表示。概率为P(X≤10)=0、58304

重庆大学研究生数理统计大作业

NBA球员科比单场总得分与上场时间的线性回归分析 摘要 篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。 正文 一、问题描述 随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。 倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。 因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。 二、数据描述 抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:

数理统计学作业

数理统计学作业 专业:飞行器设计 姓名:刘炜华 学号: 20130302002 2013年9月

1.数据的采集及说明 1.1数据的搜集方法及说明 当复合材料结构开始大量应用之后,在实际使用中可以积累大量的故障统计数据,航空公司在对故障数据进行收集和统计之后,可以对故障数据作故障率直方图和故障频率分布图来进行故障频率信息的统计和分析。 表 1是一架飞机在某段时间内故障间隔飞行小时,下面以该数据集为基础简单估计该架飞机在该时间段内的故障率曲线分布。 表1某飞机一段时间内故障间隔飞行小时 1.2.数据整理 1.表中共有 100 个维修数据,找出其中的最大值为max 652L =小时,最小值为 min 1L =小时; 2.计算组数: 根据经验公式:1 3.32lg k n =+, 计算得1 3.32lg 1 3.32lg1008k n =+=+≈, 所以将数据分为8组; 3.计算组距: max min 6521 828 L L t k --?= =≈; 4.根据公式计算并将所得的结果列成表2: 频率:/j j W f n =

表2故障频率分析过程计算结果 5.计算得:202.98X =,167.0697S =; 根据公式3 1 13 () 1.1035(1)n i i X X V n S =-= =-∑ 6.计算峰度: 根据公式4 1 24 () 3.4853(1)n i i X X V n S =-= =-∑ 1.3.直方图与折线图 图1-1故障频数直方图

图1-2故障频率折线图 图1-3故障频率直方图 图1-4累计频率折线图

从频率直方图即图3中可以看出,靠近左侧的数据出现较多。通过比较频率曲线和指数分布曲线可以看出,该图显示故障呈现典型的指数分布,所以说明趋势方程是指数函数。趋势线方程代表故障频数随时间的发展趋势,据此可以预测未来某一时间段内的故障数,来实现故障相关维修成本的估算。 1.4.经验分布函数 根据定义得出,总体X 的经验分布函数为: 0,1 (),1652,1,2,...,991001,652 n x k F x x k x

北邮大统计学基础第一次阶段作业

一、单项选择题(共10道小题,共100.0分) 1.在下列调查中.调查单位与填报单位一致的是( )。 A.公司设备调查 B.农村耕地调查 C.学生学习情况调查 D.汽车养护情况调查 知识点: 第二章 学生答 案: [C;] 得分: [10] 试题分 值: 10.0 提示: 2.通过调查鞍钢、武钢等几个钢铁基地,了解我国钢铁生产的基本情况,这 种调查方式是( )。 A.典型调查 B.重点调查 C.抽样调查 D.普查 知识点: 第二章 学生答 案: [B;] 得分: [10] 试题分 值: 10.0 提示:

3.进行百货商店工作人员普查,调查对象是( )。 A.各百货商店 B.各百货商店全体工作人员 C.一个百货商店 D.每位工作人员 知识点: 第二章 学生答 [B;] 案:

得分: [10] 试题分 值: 10.0 提示: 4.变量数列中各组频率之和是( )。 A.不等于l B.大于1 C.小于1 D.等于l 知识点: 第三章 学生答 案: [D;] 得分: [10] 试题分 值: 10.0 提示: 5.统计表的结构,从其外形看,是由( )。 A.标题和数字资料两部分构成 B.标题、横行、纵栏标目三部分构成 C.横行和纵栏数字资料构成 D.标题、横纵、纵栏、数字资料等部分构成 知识点: 第三章 学生答 案: [D;] 得分: [10] 试题分 值: 10.0 提示: 6.在全距一定的情况下,组距的大小与组数多少( )。

A.成正比 B.成反比 C.无比例关系 D.有时成正比,有时成反比 知识点: 第三章 学生答 案: [B;] 得分: [10] 试题分 值: 10.0

统计学第1-2章作业参考答案

第1-2章作业参考答案 一、单项选择 1、政治算术学派的代表人物是(B)A.凯特勒B.威廉·配第C.康令D.阿亨瓦尔 2、统计学研究对象的重要特点是(A)A.数量性B.总体性C.社会性D.具体性 3、就总体单位而言(C)A.只能有一个标志B.只能有一个指标 C.可以有多个标志D.可以有多个指标 4、要了解某班50名学生的学习情况,则总体是(A)A.50名学生B.每一个学生 C.50名学生的学习成绩D.每一个学生的学习成绩 5、对某地区所有工业企业的职工情况进行研究,总体单位是(A)A.每个职工B.每个企业C.每个个数的职工D.全部工业企业 6、某生产班组四名工人月工资收入分别是3200元、3250元、3320元和3560元,这四个数字是(B)A.变量B.变量值C.数量标志D.数量指标 7、某工业企业工人的技术等级分为一级、二级、三级、四级和五级,这里的“技术等级”是(B)A.数量标志B.品质标志C.数量指标D.质量指标 8、职工人数是一个(A)变量。 A.离散型B.连续型C.有时是离散型有时是连续型D.无法判断 9、一项调查是否属于全面调查,关键看其是否(B)A.对调查对象的各方面都进行调查B.对组成调查总体的所有单位逐一进行调查C.制定统计调查方案D.采用多种调查方法 10、制定统计调查方案,首先要明确(D)A.统计调查对象B.统计调查单位C.统计调查项目D.统计调查目的11、经常调查与一时调查是按(B)来划分的。 A.调查组织形式B.登记事物连续性C.调查方法D.调查对象包括范围12、下列属于经常调查的是(D)A.对2011年大学毕业生就业状况的调查 B.对近几年来居民消费价格变动情况进行一次摸底调查 C.对全国人口每隔10年进行一次普查D.按月上报的钢铁产量 13、对某地区饮食业从业人员的身体状况进行调查,调查对象是该地区饮食业的(C)A.全部营业网点B.每个营业网点C.所有从业人员D.每个从业人员14、某市工商企业2011年生产经营成果的年报呈报时间规定在2012年1月31日,则调查期限为(B)A.一日B.一个月C.一年D.一年零一个月 15、调查时间的含义是(A)A.调查资料所属的时间B.进行调查的时间 C.调查工作期限D.调查资料报送的时间

2018年数理统计大作业题目和答案--0348

2018年数理统计大作业题目和答案--0348

1、设总体X 服从正态分布),(2 σμN ,其中μ已知,2 σ 未知,n X X X ,,,2 1 为其样本,2≥n ,则下列说法中正 确的是( )。 (A )∑=-n i i X n 1 2 2 ) (μσ是统计量 (B )∑=n i i X n 1 22 σ是统计量 (C )∑=--n i i X n 1 2 2 ) (1μσ是统计量 (D )∑=n i i X n 1 2μ 是统计量 2、设两独立随机变量)1,0(~N X ,) 9(~2 χY ,则Y X 3服从 ( )。 )(A ) 1,0(N )(B ) 3(t )(C ) 9(t )(D ) 9,1(F 3、设两独立随机变量)1,0(~N X ,2 ~(16) Y χ,则Y 服 从( )。 )(A )1,0(N )(B (4) t )(C (16) t )(D (1,4) F 4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下 列是μ的无偏估计的是( ). ) (A ∑-=-1 1 1 1 n i i X n )(B ∑=-n i i X n 1 11 )(C ∑=n i i X n 2 1 )(D ∑-=1 1 1n i i X n 5、设4 3 2 1 ,,,X X X X 是总体2 (0,)N σ的样本,2 σ未知,则下列随机变量是统计量的是( ).

() (1) D t n- 10、设 1,, n X X ???为来自正态总体2 (,) Nμσ的一个样本,μ,2σ未知。则2σ的置信度为1α-的区间估计的枢轴量为()。 (A) ()2 1 2 n i i Xμ σ = - ∑ (B) ()2 1 2 n i i Xμ σ = - ∑ (C) () ∑ = - n i i X X 1 2 2 1 σ (D) ()2 1 2 n i i X X σ = -∑ 11、在假设检验中,下列说法正确的是()。 (A) 如果原假设是正确的,但作出的决策是接受备择假设,则犯了第一类错误; (B) 如果备择假设是正确的,但作出的决策是拒绝备择假设,则犯了第一类错误; (C) 第一类错误和第二类错误同时都要犯; (D) 如果原假设是错误的,但作出的决策是接受备择假设,则犯了第二类错误。 12、对总体2 ~(,) X Nμσ的均值μ和作区间估计,得到置信度为95%的置信区 间,意义是指这个区间()。 (A)平均含总体95%的值(B)平 均含样本95%的值

数理统计第二次作业

数理统计第二次作业 ? 1. 某百货公司连续40 天的商品销售额如下(单位:万元): 41 46 35 42 25 36 28 36 29 45 46 37 47 37 34 37 38 37 30 49 34 36 37 39 30 45 44 42 38 43 26 32 43 33 38 36 40 44 44 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。(数据见练 习1 数据.xls —练习 1.1 )解:频数分布表及直方图如下:由直方图可以看出,该百货公司连续 40 天的销售额近似服从单峰对称的正态分布。 2. 为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100 只进行测试,所 得结果如下: 700 706 716 715 728 712 719 722 685 691 709 708 691 690 684 692

705 707 718 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 (1) 利用计算机对上面的数据进行排序; (2) 以组距为10 进行等距分组,整理成频数分布表,并绘制直方图;(3) 绘制茎叶图,并与直方图作比较. 解( 1)排序如下 (2)频数分布表及频数分布直方图如下:从直方图可以看出,灯泡的使用寿命近似服从单 峰对称的正态分布。 (3)茎叶图如下 与频数分布表比较可知:当频数分布表频数分布间隔为10,且从整10 开始,则茎叶 图各茎所含叶片数与对应频数区间所含项数相等。 3. 某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产 5 件产品全部达到优质。问该企业决策者会倾向于如何决策? 解:设A =优质率达95%, C =优质率为80%, B =试验所生产的5件全部优质。 P(A) = 0.4 , P(A ) = 0.6 , P(B|A)=0.955 , P(B|A )=0.85 ,所求概率为:P (A I B ) P(A) ?P(B I A) P(A) ?P(B II A)+P(A ) ?P(B I A ) 0.50612 0.30951 0.6115 决策者会倾向于采用新的生产管理流程。

川大2019《统计学》第一次作业-答案.docx

你的得分:100.0 完成日期:2019年07月28日14点47分 说明:每道小题选项旁的标识是标准答案。 一、单项选择题。本大题共20个小题,每小题2.5 分,共50.0分。在每小题给出的选项中,只有一项是符合题目要求的。 1.一个研究者应用有关车祸的统计数据估计在车祸中死亡的人数,在这个例子中使用的统计属于()。 A.推断统计学 B.描述统计学 C.既是描述统计学,又是推断统计学 D.既不是描述统计学,有不是推断统计学 2.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。这项 研究的总体是()。 A.2000个家庭 B.200万个家庭 C.2000个家庭的年人均收入 D.200万个家庭的总收入 3.对某地区5000个企业的企业注册类型、产值和利润总额等调查数据进行分析,下列说法中正确的是 ()。 A.企业注册类型是定序变量 B.利润总额是品质标志 C.产值是定类变量 D.产值和利润总额都是连续变量 4.为了了解居民对小区物业服务的意见和看法,管理人员随机抽取了50户居民,上门通过问卷进行调查。这 种数据收集方法称为()。 A.面访式问卷调查 B.实验调查 C.观察式调查 D.自填式问卷调查 5.对同一总体选择两个或两个以上标志重叠起来进行分组,称为()。 A.简单分组 B.平行分组 C.一次性分组 D.复合分组 6.统计表的横行标题表明()。 A.全部统计资料的内容 B.研究总体及其组成部分 C.总体特征的统计指标的名称 D.现象的具体数值 7.下列指标属于比例相对指标的是()。 A.2000年北京市失业人员再就业率为73% B.三项社会保险统筹基金收缴率95% C.北京人口性别比为103 D.北京每百户居民拥有电脑32台 8.一组数据排序后处于25%和75%的位置上的值称为()。 A.众数 B.中位数 C.四分位数

吉林大学2015概率论与数理统计大作业完整版

吉林大学网络教育 大作业 1.仪器中有三个元件,它们损坏的概率都是0.2,并且损坏与否相互独立.当一个元件损坏时, 仪器发生故障的概率为0.25,当两个元件损坏时,仪器发生故障的概率为0.6,当三个元件损坏时,仪器发生故障的概率为0.95, 当三个元件都不损坏时,仪器不发生故障.求:(1)仪器发生故障的概率;(2)仪器发生故障时恰有二个元件损坏的概率. (1)解:设A 表示事件“仪器发生故障”,i=1,2,3 P(A)= )/()(3 1 B B i i i A P P ∑=, P(B1)=3*0.2*0.80.2=0.384,P(B2)=3*0.22*0.8=0.096,P(B3)=0.23=0.008 所以P(A)=0.384*0.25+0.096*0.6+0.008*0.95+0.1612 (2) P(B 2/A)= ) ()(2A P A p B =0.96*0.6/0.1612=0.3573 2.设连续型随机变量X 的分布函数为 0, ,()arcsin ,,(0)1, ,x a x F x A B a x a a a x a ≤-??? =+-<<>?? ≥?? 求:(1)常数A 、B .(2)随机变量X 落在,22a a ?? - ??? 内的概率.(3)X 的概率密度函数. 解:(1)F (a+0)=A-2πB=0,F (a-0) =A+2πB=1 所以A=0.5 B=π 1 (2)P{-2a

西安交大数理统计作业(完整版)

第一章 1.1 X~N(μ,2 σ) 则X~N(μ, 2 n σ ),所以X-μ~N(0, 2 n σ ) P{X-μ <1}= P{ = 0.95 N(0,1),而(0.975) 1.96 Φ= 所以n最小要取[2 1.96x2σ]+1 1.2 (1)至800小时,没有一个元件失效 这个事件等价于P{ 123456 X X X X X X>800}的概率 由已知X服从指数分布,可求得P{ 123456 X X X X X X>800}=7.2 e-(2)至3000小时,所有六个元件都失效的概率 等价与P{ 123456 X X X X X X<3000}的概率 可求得P{ 123456 X X X X X X<3000}= 4.56 (1) e- - 1.5 2 1 () n i i X a = - ∑=2 1 [()()] n i i X X X a = -+- ∑ =22 111 ()2()()() n n n i i i i i X X X a X X X a === -+--+- ∑∑∑ 因为 1 () n i i X X = - ∑=0 所以2 1 () n i i X a = - ∑=22 11 ()() n n i i i X X X a == -+- ∑∑ =22 1 () n i nS X a = +- ∑ 所以当a=X时,2 1 () n i i X a = - ∑有最小值且等于2nS 1.6 (1)由 1 1n i i X X n= =∑

有等式的左边= 221 12n n i i i i X X n μμ==-+∑∑ 等式的右边= 22221122n n i i i i X X X nX nX nX n μμ==-++-+∑∑ = 22 2 2 211 22n n i i i i X nX nX nX X n μμ==-++-+∑∑ = 221 1 2n n i i i i X X n μμ==-+∑∑ 左边等于右边,结论得证。 (2) 等式的左边= 22 11 2n n i i i i X X X nX ==-+∑∑=221 n i i X nX =-∑ 等式的右边= 221 n i i X nX =-∑ 左边等于右边,结论得证。 1.7 (1)由11n n i i X X n ==∑ 及 22 1 1()n n i n i S X X n ==-∑ 有左边=1111111111()1111 n n n n n i i n i i i i X X X X X X n n n n ++++=====+=+++++∑∑∑ 111 ()111 n n n n n nX X X X X n n n ++= +=+-+++=右边 左边等于右边,结论得证。 (2)由 左边=12 21 11 1()1n n i n i S X X n +++==-+∑ 121111[()]11 n i n n n i X X X X n n ++==---++∑ 121111[()()]11 n i n n n i X X X X n n ++==---++∑ 12 2112 1121[()()()()]11(1) n i n i n n n n n i X X X X X X X X n n n +++==----+-+++∑

川大2019《统计学》第一次作业 答案

您得得分: 100、0 完成日期:2019年07月28日14点47分 说明:每道小题选项旁得标识就是标准答案。 一、单项选择题。本大题共20个小题,每小题2、5 分,共50、0分。在每小题给出得选项中,只有一项就是符合题目要求得。 1.一个研究者应用有关车祸得统计数据估计在车祸中死亡得人数,在这个例子中使用得统计属于( )。 A.推断统计学 B.描述统计学 C.既就是描述统计学,又就是推断统计学 D.既不就是描述统计学,有不就是推断统计学 2.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭得年人均收入。这项研 究得总体就是( )。 A.2000个家庭 B.200万个家庭 C.2000个家庭得年人均收入 D.200万个家庭得总收入 3.对某地区5000个企业得企业注册类型、产值与利润总额等调查数据进行分析,下列说法中正确得就是( )。 A.企业注册类型就是定序变量 B.利润总额就是品质标志 C.产值就是定类变量 D.产值与利润总额都就是连续变量 4.为了了解居民对小区物业服务得意见与瞧法,管理人员随机抽取了50户居民,上门通过问卷进行调查。这种 数据收集方法称为( )。 A.面访式问卷调查 B.实验调查 C.观察式调查 D.自填式问卷调查 5.对同一总体选择两个或两个以上标志重叠起来进行分组,称为( )。 A.简单分组 B.平行分组 C.一次性分组 D.复合分组 6.统计表得横行标题表明( )。 A.全部统计资料得内容 B.研究总体及其组成部分 C.总体特征得统计指标得名称 D.现象得具体数值 7.下列指标属于比例相对指标得就是( )。 A.2000年北京市失业人员再就业率为73% B.三项社会保险统筹基金收缴率95% C.北京人口性别比为103 D.北京每百户居民拥有电脑32台 8.一组数据排序后处于25%与75%得位置上得值称为( )。 A.众数 B.中位数 C.四分位数 D.算术平均数

管理统计计第一次作业

管理统计第一次作业 2.1 要求:(1) 绘制饼图、条形图和对比条形图; 表2.1-1 某公司2000年根据职业分类的劳动力数据饼图 表2.1-2 某公司2005年根据职业分类的劳动力数据饼图

表2.1-3 某公司2000年根据职业分类的劳动力数据条形图 表2.1-4 某公司2005年根据职业分类的劳动力数据条形图

表2.1-5 某公司2000年和2005年根据职业分类的劳动力数据条形对比图 (2)分析从2000年到2005年公司劳动力规模和结构的变化。 由以上数据看出,劳动力的规模从2000年的820人扩展到2005年底的1200人,内部结构也变化很多,非熟练工人大幅减少,占比由40%减少到24%;秘书人员的占比在增加,由14%增长到25%;管理人员的占比由10%占比到15%;专业和技术人员占比比较稳定,一直稳定在12%;熟练工人的占比也比较稳定,稳定在24%。 2.2 要求:(1) 整理数据,作一个频数分布表; 答:1. 通过考察数据集,确定最大值 87,最小值 24. 2.确定分组数,因为样本个数在50--100 之间,分组为 6--10 组。 3.计算组距。 R= 最大值—最小值= 63. 组距h= R/ 6-10 = 6.3 --10.5 , 因为 最好是5或10的倍数,所以 h 选择为 10. 4.根据最小值为24,最大值为87,所以分组如下 组号区间范围频数频率 1 [20,30) 2 4.00% 2 [30,40)10 20.00% 3 [40,50)8 16.00% 4 [50,60)17 34.00% 5 [60,70)9 18.00% 6 [70,80) 3 6.00% 7 [80,90) 1 2.00%

北航-数理统计大作业

对中国各地财政收入情况的聚类分析和判 别分析 应用数理统计第二次大作业 学院名称 学号 学生姓名 摘要 我国幅员辽阔,由于人才、地理位置、自然资源等条件的不同,各地区的财政收入类型各自呈现出不一样的发展趋势,通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。本文以中国各地财政收入情况为研究对象,从《中国统计年鉴》中选取2011年期间中国各地财政收入情况为因

变量,选取国内增值税、营业税、企业所得税、个人所得税、城市维护建设税、土地增值税、契税、专项收入、行政事业性收费收入、国有资本经营收入和国有资源(资产)有偿使用收入11个可能影响中国各地财政收入的因素为自变量,利用统计软件SPSS,对27个地区的财政收入进行了聚类分析,并对另外4个地区的财政收入进行了判别分析,并最终确定了中国各地区根据财政收入类型的分类情况。 关键词:聚类分析,判别分析,SPSS,中国各地财政收入类型 1、引言 财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。 本文利用统计软件SPSS,根据各地区的财政收入情况,对北京、天津、河北等27个地区进行聚类分析,并对青海、重庆、四川、贵州4个省市进行判别分析,判断属于聚类分析结果中的哪种财政收入类型。 1.1 聚类分析 聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称,它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。本文采用的是系统聚类分析,它又称集群分析,是聚类分析中应用最广的一种方法,其基本思想是:首先将每个聚类对象看作一类,然后根据对象间的相似程度,将相似程度最高的两类进行合并,并计算合并后的类与其他类之间的距离,再选择相近者进行合并,每合并一次减少一类,直至所有的对象都并为一类为止。 系统聚类分为Q型聚类和R型聚类两种:Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来;R型聚类是对变量进行聚类,它使差异性大的变量分离开来,相似的变量聚集在一起,这样就

最新数理统计大作业题目和答案--0348资料

1、设总体X 服从正态分布),(2 σμN ,其中μ已知,2 σ未知,n X X X ,,,21 为其样本, 2≥n ,则下列说法中正确的是( ) 。 (A ) ∑=-n i i X n 1 2 2 )(μσ是统计量 (B ) ∑=n i i X n 1 22 σ是统计量 (C ) ∑=--n i i X n 1 2 2 )(1μσ是统计量 (D ) ∑=n i i X n 1 2 μ 是统计量 2、设两独立随机变量)1,0(~N X ,)9(~2 χY ,则 Y X 3服从( )。 )(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F 3、设两独立随机变量)1,0(~N X ,2 ~(16)Y χ )。 )(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F 4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ). ) (A ∑ -=-1 1 1 1n i i X n )(B ∑=-n i i X n 1 11 )(C ∑=n i i X n 21 )(D ∑-=111n i i X n 5、设4321,,,X X X X 是总体2 (0,)N σ的样本,2 σ未知,则下列随机变量是统计量的是 ( ). (A )3/X σ; (B ) 4 1 4 i i X =∑; (C )σ-1X ; (D ) 4 221 /i i X σ=∑ 6、设总体),(~2 σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则 下列正确的是( ). 2() ~(,)A X N μσ 2() ~(,) B n X N μσ 222 1 1 () ()~()n i i C X n μχσ=-∑ () ~()D t n 7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ???是来自总体的简单随机样本,则下列随机变量不是统计量为( ) ( A ) . 12X X + ( B ) {}max ,15i X i ≤≤

统计学基础第一次作业

统计学基础第一次作业 一、填空题 1、按照所采用的计量尺度不同,可以将统计数据分为_分类数据_、_顺序数据_和_数值型 数据_。 2、按照数据的收集方法的不同,可将统计数据分为_观测数据_和__实验数据_。 3、按照被描述的对象与时间的关系,可将统计数据分为_截面数据__和_时间序列数 4、体重的数据类型是:clear all。 5、民族的数据类型是:CHAR。 6、空调销量的数据类型是:电器。 7、支付方式(购买商品)的数据类型是:分类变量。 8、学生对教学改革的态度(赞同、中立、反对)的数据类型是:顺序数据。 9、从总体中抽出的一部分元素的集合,称为___样本_____。 10、参数是用来描述_总体特征_______的概括性数字度量;而用来描述样本特征的概括 性数字度量,称为___统计量_____。 11、参数是用来描述_总体特征_的概括性数字度量;而用来描述样本特征的概括性数字 度量,称为_统计量_。 12、统计数据有两种不同来源:一是_直接来源__,二是__间接来源___。 13、统计数据的误差有两种类型,即__抽样误差_和_非抽样误差。 14、统计表由_数据__、__表头__、___行标题_和__列标题__四个部分组成。 15、统计分组应遵循“不____重_____不__漏_______”、“___上限______不在组内”的 原则。 16、按取值的不同,数值型变量可分为_离散型变量__和_连续型变量_。 17、在数据分组中,_离散型变量_______可以进行单变量值分组,也可以进行组距分组, 而___连续型变量_____只能进行组距式分组。 18、组距分组中,向上累积频数是指某组_上限以下_的频数之和。 19、将某地区100个工厂按产值多少分组而编制的频数分布中,频数是_各组的工厂数 __。 20、频数分布中,靠近中间的变量值分布的频数少,靠近两端的变量值分布频数多,这

数据统计研究分析-第一次作业

数据统计分析-第一次作业

————————————————————————————————作者:————————————————————————————————日期:

简答题: 1 什么是统计学?请结合自己的课题介绍统计学的内含 答:统计学是一门研究随机现象,以推断为特征的方法论科学,“由部分推及全体”的思想贯 穿于统计学的始终。具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法;是关于收集、整理、分析和解释统计数据的科学,是一门认识方法论性质的科学,其目的是探索数据内在的数量规律性,以达到对客观事物的科学认识。 我的研究课题是用生物信息学的方法来研究微卫星方面的问题。本课题的研究最初就是用统计学的方法对不同基因组中的微卫星进行统计,分析微卫星与物种的相关性及联系。进行本课题的研究,首先,收集数据,在NCBI中下载多条基因组数据,之后,根据生物不同的特征,对数据进行分类及整理,接下来,运用统计学的相关概念比如相对密度、相对风度、回归方程等进行基因组中微卫星的分布的计算,之后,运用R语言作图,将微卫星的分布可视化,更深入地进行研究分析分布规律与生物功能及进化的联系。 2 举例说明总体,样本,参数,统计量,变量这几个概念 答:总体是包含所研究的全部个体(数据)的集合。 样本是从总体中抽取的一部分元素的集合。 参数是用来描述总体特征的概括性数字度量。 统计量是用来描述样本特征的概括性数字度量。 变量是说明现象某种特征的概念。 比如欲调查某高校的2017届研究生毕业生就业率情况,那么该高校的所有2017届研究生毕业生则构成一个总体,其中的每一个研究生毕业生都是一个个体。 若从该高校的所有2017届研究生毕业生中按某种抽样规则抽出了100位毕业生,则这100位毕业生就构成了一个样本。 在这项调查中就业情况感兴趣,那么就业率就是一个变量。 通常关心某高校的2017届研究生毕业生平均就业率,这里这个平均值就是一个参数。 只有样本的有关就业率的数据,用此样本计算的平均值就是统计量。 3 比较概率抽样和非概率抽样的特点,指出各自适用情况 答:概率抽样:抽样时按一定的概率以随机原则抽取样本。每个单位别抽中的概率已知或 可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样:操作简单,时效快,成本低,而且对于抽样中的统计学专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。它同样使用市场调查中的概念测试(不需要调查结果投影到总体的情况)。 4 简述异众比率、四分位差、方差或标准差的适用场合 答:异众比率主要是衡量众数对一组数据的代表程度主要适合测度分类数据的离散程度; 四分位差主要适合于测度顺序数据的离散程度; 方差能够较好的反映出数据的离散程度,是实际中应用最广的离散程度测量值,标准差和方差基本上同时应用。

数理统计大作业

数理统计学大作业 学院航空航天工程学部专业飞行器设计 班级航宇二班 学号142103130228 姓名张立 指导教师姜永 负责教师 沈阳航空航天大学 2014年12月

目录 (2) 前言 (3) 一、采集样本数据整理及SPSS统计软件的实现 (4) 1.1、数据的收集方法及说明 (4) 1.2、数据整理:给出频数、频率分布表及偏度和峰度 (4) 1.3、画出直方图和折线图 (6) 1.4、经验分布函数和图形 (6) 1.5、各种概率分布 (7) 二、给出总体分布的参数估计 (12) 2.1、矩估计法 (12) 2.2、最大似然估计 (12) 2.3、参数区间估计 (13) 三、参数的假设检验 (16) 3.1. 样本统计数据的t检验 (16) 3.2样本统计数据的2χ检验 (17) 四、非参数假设检验( 2 χ拟合优度检验) (18) 4.1、2χ拟合优度检验 (18) 五、结论 (20) 参考文献 (21)

数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。 由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。了解数理统计能解决那些实际问题。对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。掌握了寻求估计的统计思想,具体寻求估计的步骤往往是“套路子”的,并不困难,然而如果没有从根本上理解,仅死背套路子往往会出现各种错误.

西南大学数理统计作业及答案

数理统计第一次 1、设总体X 服从正态分布),(2 σμN ,其中μ已知,2 σ未知,n X X X ,,,21Λ为其样本, 2≥n ,则下列说法中正确的是( ) 。 (A ) ∑=-n i i X n 1 2 2 )(μσ是统计量 (B ) ∑=n i i X n 1 2 2 σ是统计量 (C ) ∑=--n i i X n 1 2 2 )(1 μσ是统计量 (D ) ∑=n i i X n 1 2μ 是统计量 2、设两独立随机变量)1,0(~N X ,)9(~2 χY ,则 Y X 3服从( )。 )(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F 3、设两独立随机变量)1,0(~N X ,2 ~(16)Y χ )。 )(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F 4、设n X X ,,1Λ是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ). ) (A ∑ -=-1 1 1 1n i i X n )(B ∑=-n i i X n 111)(C ∑=n i i X n 2 1)(D ∑-=1 11n i i X n 5、设4321,,,X X X X 是总体2 (0,)N σ的样本,2 σ未知,则下列随机变量是统计量的是 ( ). (A )3/X σ; (B ) 4 1 4 i i X =∑; (C )σ-1X ; (D ) 4 221 /i i X σ=∑ 6、设总体),(~2 σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则 下列正确的是( ). 2() ~(,)A X N μσ2() ~(,)B nX N μσ 222 1 1 () ()~()n i i C X n μχσ=- ∑) () ~()X D t n S μ- 7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ???是来自总体的简单随机样本,则下列随机变量不是统计量为() ( A ).12X X +( B ){}max ,15i X i ≤≤

相关文档
相关文档 最新文档