文档库 最新最全的文档下载
当前位置:文档库 › 第二——第七章 SAS程序及习题

第二——第七章 SAS程序及习题

第二——第七章 SAS程序及习题
第二——第七章 SAS程序及习题

第二章习题

二、分析和计算题

1.某农村地区1999年14岁女孩的身高资料如下,请编制频数表和观察频数分布情况,计算集中和离散趋势指标,并估计参考值范围。

表某农村地区1999年14岁女孩的身高资料(c m)

142.3148.8142.7144.4144.7145.1143.3154.2152.3142.7156.6 137.9143.9141.2139.3145.8142.2137.9141.2150.6142.7151.3 142.4141.5141.9147.9125.9139.9148.9154.9145.7140.8139.6 148.8147.8146.7132.7149.7154.0158.2138.2149.8151.1140.1 140.5143.4152.9147.5147.7162.6141.6143.6144.0150.6138.9 150.8147.9136.9146.5130.6142.5149.0145.4139.5148.9144.5 141.8148.1145.4134.6130.5145.2146.2146.4142.4137.1141.4 144.0129.4142.8132.1141.8143.3143.8134.7147.1140.9137.4 142.5146.6135.5146.8156.3150.0147.3142.9141.4134.7138.5 146.6134.5135.1141.9142.1138.1134.9146.7138.5139.6139.2 148.8150.3140.7143.5140.2143.6138.7138.9143.5139.9134.4 133.1145.9139.2137.4142.3160.9137.7142.9126.8

解(计算机直接法计算结果,可能与加权法计算结果有所出入)

m e a n=143.217s=6.42969,m e d=142.75,m o d e=142.7

m a x=162.6m i n=125.9r=36.7

p75=147.1p25=139.3q=7.8

95%的参考值范围:(130.615,155.819)

2.有60人的血清抗体效价,分别为:7人1:1,11人1:20,22人1:40,12人1:80,8人1:160,求平均抗体效价。

解:G=31.66

平均抗体效价为1:31.66。

3.某传染性疾病的潜伏期(天)见下表,求平均潜伏期的中位数M和第95百分位数P95。

某传染性疾病的潜伏期(天)的中位数和百分位数计算表

潜伏期(天)

(1)人数f

(2)

累计频数 f

(3)

累计频率(%)

(4)

4~262624.07

12~259991.67

16~610597.22

20~3108100.00

解:M=10.33(天),P95=18.4(天)

第三章练习题

1.某厂男职工370人,女职工456人,慢性苯中毒人数男女分别为8和10人。

解:

(1)男女慢性苯中毒患病率各为多少?男:2.16%,女:2.19%

(2)男性患病率是女性的多少倍?0.99

(3)该厂男女平均患病率为多少? 2.18%

(4)该厂男职工占该厂职工总数的百分比是多少?44.79%

2.某地1956年婴儿死亡人数中死于肺炎者占总死亡数的16%,1976年则占18%,某医师认为该地20年来对婴儿肺炎的防治效果不明显。你同意他的观点吗?为什么?

解:不同意,因为各为构成比,不能说明严重程度,故不说明防治效果。

3.已知甲乙两矿总职工数分别为20856人和3911人,甲矿工龄<6年、6~9年、10年以上的职工数分别为14029、4285、2542人,乙矿三个工龄组的职工数分别为992、1905、1014人,甲乙两矿尘肺总人数分别为604人和127人。两矿的尘肺发病率能否直接比较?为什么?怎样才能得出正确结论?

解:

不能直接比较。

因为两矿工龄构成比不同。

需要计算标准化率后比较。

4.某医师用自拟药方治疗肿瘤患者,治疗了5人,均有明显疗效,该医生报告该配方的显效率为100%。你认为合适吗?为什么?怎样才能得出可靠的结论?

解:

不合适。

因为例数太少,结果不稳定;

增大样本含量。

5.某县医院1996~2000年门诊次均药品费用(元),见下表。请分析年发展速度和年增长速度。

表某县医院1996~2000年门诊次均药品费用(元)

年份门诊人均医

疗费用(元)

发展速度

定基环比

增长速度

定基环比

19967.16 1.001.00--

19979.28 1.301.300.300.30 199810.57 1.481.140.480.14 199912.99 1.811.230.810.23 200014.36 2.011.11 1.010.11

第四章习题

1.标准误与标准差的区别。(自己总结)

2.可信区间与医学参考值范围的区别。(自己总结)

3.随机抽取了128名一年级大学生,测得空腹血糖为

4.5m mo l/L,

标准差为0.62m mo l/L。试估计一年级大学生空腹血糖总体均数的95%可信区间。

解:代入公式4-5,总体均数的95%可信区间为(4.39, 4.61)

4.随机抽查了某地25名7岁儿童,测得其体重的均数为21.16k g,

标准差为 3.47k g。试估计该地7岁儿童体重总体均数及方差的95%可信区间。

解:总体均数95%可信区间(代入公式4-4)为(19.80,22.52)方差的95%可信区间(代入公式4-7)为(7.34,23.30)

5.欲了解某新药治疗心肌梗塞的效果,共治疗了24例,有效19例。

试估计该药有效率的95%可信区间。

解:查表:95%可信区间:(58%,93%)

6.调查某地蛲虫感染情况,随机抽样调查了270人,感染人数为

106。试估计该地蛲虫感染率的95%可信区间。

解:

感染率:p =106/270=0.3926,1-p =1-0.3926=0.6074,

s p =0.0297

感染率95%可信区间(代入公式4-10)为(33.44%, 45.08%)。

第五章

7. 成年男子血红蛋白的平均值为

155g /L ,为了检验高原地区居民的

血红蛋白增高的假设,某研究者随机抽取144名高原地区成年男性进行检查,其血红蛋白均数为165g /L ,标准差25g /L 。请检验此假设。

解:

H 0:高原地区成年男性血红蛋白均数与一般成年男子相同μ=μ0 H 1:高原地区成年男性血红蛋白均数高于一般成年男子μ>μ0 α=0.05 8.4144

25155

165=-=

u ,

单侧u 0.05=1.645,u 0.01=2.33, P <0.01. 拒绝H 0,接受H 1, 高原地区成年男性血红蛋白均数高于一般成年男

子。

8.24名志愿者随机分成两组,每组12人,接受降胆固醇试验,甲组为特殊饮食组,乙组为药物治疗组。受试者试验前后各测量一次血清胆固醇(m mo l /L ),数据如下:

甲组 乙组 受试者

试验前 试验后 受试者

试验前 试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.83 2 6.40 6.35 3 6.48 4.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7

9.17

8.42

7

9.10

9.05

87.337.0087.31 6.83

9 6.94 6.589 6.96 6.91

107.677.2210 6.81 6.73

118.15 6.57118.167.65

12 6.60 6.1712 6.98 6.52 (1)试判断两组受试者试验前血清胆固醇水平是否相等?

解:

方差齐性检验:

H0: 两组受试者试验前血清胆固醇水平方差齐同σ1=σ2

H1: 两组受试者试验前血清胆固醇水平方差不同σ1≠σ2

α=0.05

F=0.8232/0.7472=1.214,ν1=11,ν2=11,因分子的自由度11无法查到,用10代替。

F0.05(10,11)=3.53,F

P>0.05,不拒绝H0.两组方差齐同。

t检验:

H0: 两组受试者试验前血清胆固醇水平相同μ1=μ2

H1: 两组受试者试验前血清胆固醇水平不同μ1≠μ2

α=0.05

计算统计量t

代入公式5-5,5-6,t=0.227

P>0.05,不拒绝H0,两组受试者试验前血清胆固醇水平相同。

(2)分别判断两种降胆固醇措施是否有效?

解:

甲组:

实验前后差值的均值为0.559,差值的标准差分别为0.61

H0: 降胆固醇措施无效μd=0

H1: 降胆固醇措施无效μd≠0

α=0.05

计算统计量t

代入公式5-3得:t=3.17,

t0.05(11)=2.201,t0.01(11)=3.106,P<0.01

甲组(特殊饮食组)治疗效果有统计学意义。

乙组:

实验前后差值的均值为0.147,差值的标准差分别为0.211

H0: 降胆固醇措施无效μd=0

H1: 降胆固醇措施无效μd≠0

α=0.05

计算统计量t

代入公式5-3得:t=2.41,

t0.05(11)=2.201,t0.02(11)=2.718,0.02

乙组(药物治疗组)治疗效果有统计学意义。

(3)试判断两种降胆固醇措施的效果是否相同?

方差齐性检验:

H0: 两组受试者试验前后血清胆固醇水平差值的方差相同σ1=σ2

H1: 两组受试者试验前后血清胆固醇水平差值的方差不同σ1≠σ2

α=0.05

F=0.5852/0.2022=8.40,ν1=11,ν2=11,因分子的自由度11无法查到,用10代替。

F0.05(10,11)=3.53,F>>F0.05(10,11)

P<<0.05,拒绝H0.两组治疗前后差值的方差不齐同。

t’检验:

H0: 两组受试者试验前后血清胆固醇水平差值的均值齐同μd1=μd2

H1: 两组受试者试验前后血清胆固醇水平差值的均值不同μd1≠μd2

α=0.05

计算统计量t’,代入公式5-7,t’=2.208,

代入公式5-8,计算校正t’0.05=2.201,P<0.05.

代入公式5-9,计算校正自由度=13.6≈14,t’0.05(14)=2.145,P<0.05拒绝H0,接受H1,两组受试者试验前后血清胆固醇水平差值的均值不同两种降低胆固醇措施的效果不同,特殊饮食组好于药物组。

第六章习题及解答

1. 抽样调查了1999年某地区134名12岁男童的身高,资料整理成如下的频数表,试检验该样本是否来自正态总体?

组段

124~

128~

132~

136~

140~

144~

148~

152~

156~

160~

164~

168

频数

1

2

11

23

38

26

16

8

4

3

2

解:

H 0: 该样本资料来自正态总体。 H 1:该样本资料不是来自正态总体。 χ2=10.44,

ν=11-3=8,χ20.05(8)=15.51, P >0.05,不拒绝H 0. 该样本资料来自正态总体.

2.有人研究妊高症患者的剖宫产问题时,随机抽查阴道分娩318人,剖宫产169人,得到下表资料,问剖宫产产后出血率是否低于阴道分娩出血率?

阴道分娩与剖宫产产后出血率

生产方式 总例数 阳性例数 阳性率(%)

阴道分娩 318 68 21.38

剖宫产 169 24 14.20

解:

H o : 剖宫产产后出血率等于阴道分娩出血率π1=π2 H 1: 剖宫产产后出血率低于阴道分娩出血率π1<π2 α=0.05

927.116913181

8111.01889.01420.02138.0=?

?

? ??+?-=

u

u >1.645, P <0.05,拒绝H 0,接受H 1, 剖宫产产后出血率低于阴道分娩出血率.

*χ2检验,χ2=3.72, 接受H 0. (χ2检验结果为双侧不能单侧检验) 精确概率法,单侧P =0.0338,与u 检验单侧结果一致。

3.为了研究雷尼替丁不同服药方式资料十二指肠溃疡疗效,收集到下表资料。问三种不同服药方式的疗效是否相同?

三种服药方式治愈率的比较

组别总例数治愈例数

方式13026

方式23016

方式33021解:

H0: 三种不同服药方式的疗效相同.

H1: 三种不同服药方式的疗效不同.

α=0.05

χ2=7.94

χ2(0.05)=5.99,P<0.05,拒绝H0,接受H1。

4.抽样调查某市近10年来肺癌的组织类型,得到下表资料。问不同性别的肺癌的组织类型构成是否不同?

某市不同性别近10年来肺癌的组织类型

性别鳞癌腺癌小细胞癌其它

男27017858102

女601592293解:

H0:不同性别的肺癌的组织类型构成相同。

H1:不同性别的肺癌的组织类型构成不同。

α=0.05

χ2=78.24

χ2(3,0.005)=12.84,P<0.005,拒绝H0,接受H1。

5.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料整理如下。问两者之间是否存在一定的关系?

某厂职工冠心病与眼底动脉硬化普查结果

眼底动脉硬化级别

冠心病诊断结果

合计正常可疑冠心病

合计340116357 7313692 971818133 3216 5134431588

H0: 冠心病与眼底动脉硬化无关系

H1: 冠心病与眼底动脉硬化有关系

α=0.05

χ2=61.59

χ2(6,0.005)=18.55,P<0.005,拒绝H0,接受H1,冠心病与眼底动脉硬化有关系。

6.对410名钩端螺旋体病患者同时用间接免疫荧光抗体试验和凝溶试验进行诊断,间接免疫荧光抗体试验的阳性检出率为78.5%,凝溶试验的阳性检出率为70.0%,两法共同检出率为68.0%。问两种方法的阳性检出率有无关系?何者为优?

解:

(1) H0: 两种方法无关

H1: 两种方法有关

α=0.05

代入公式6-8,χ2=198,

χ20.05(1)=3.84,χ20.005(1)=7.88,P<0.005

拒绝H0,接受H1,两种方法有关,间接免疫荧光试验的阳性率高,凝溶实验阳性率也高。

(2) H0: 两种方法阳性率相同B=C

H1: 两种方法阳性率不相同B≠C

α=0.05

代入公式6-15,χ2=24,

χ20.05(1)=3.84,χ20.005(1)=7.88,P<0.005

拒绝H0,接受H1,两种方法阳性率不相同,间接免疫荧光抗体试验的阳性检出率较高.

7.抽样调查某地1993~1999年损伤与中毒的病死率,见下表,年度发病人数病死人数病死率(%)

19935808 1.38

199457112 2.10

199568016 2.35

199676030 3.95

199794230 3.18

1998110052 4.73

1999108551 4.70

问:该地的损伤与中毒病死率是否随时间变化而呈增加的趋势?

解:

H0: 损伤与中毒病死率不随时间变化而呈增加的趋势

H1: 损伤与中毒病死率随时间变化而呈增加的趋势

α=0.05

代入公式6-17,χ2=21.03,

χ20.05(1)=3.84,χ20.005(1)=7.88,P<0.005

拒绝H0,接受H1,损伤与中毒病死率随时间变化而呈增加的趋势.

8.在食道癌发病与饮酒关系的调查中,按年龄分层作病例对照研究,资料如下表,试估计调整年龄后饮酒与食道癌的关系。

三个年龄组的食道癌发病与饮酒关系

年龄饮酒病例对照

<35是813

否8146

35~是640

否8243

45~是3740

否30201解:

H0: 调整年龄后饮酒与食道癌的无关系

H1: 调整年龄后饮酒与食道癌的有关系

α=0.05

计算统计量

代入公式6-18,得O R=6.42,

代入公式6-19χ2M H=69.14>3.84,P<0.001.

拒绝H0,接受H1,调整年龄后饮酒与食道癌的有关系.

第七章习题及解答

二、计算题:

1.设某药副反应率为11%。请估计20人服用此药副反应人数超过1的概率。

解:

P(X≤1)=0.337573701,P(X≥2)=1-P(X≤1)=1-0.337574=0.662426

20人服用此药副反应人数超过1的概率为0.662426.

2.已知某药的治愈率为60%。现欲研究在用此药的同时加用维生素C是

否有增效作用,某医生抽取10名病人试用此药加用维生素C,结果8人治愈,请作统计推断。

解:

P(X≤7)=0.83,P(X≥8)=0.17

8人及8人以上治愈的概率为0.17。

3.为了解A、B两地妇女的乳腺癌患病率是否相同,两地各抽样调查1万妇女,结果A地患病人数80,B地102。请作统计分析。

解:

H0:A、B两地妇女的乳腺癌患病率相同

H1:A、B两地妇女的乳腺癌患病率不同

α=0.05,双侧检验

计算统计量:

采用二项分布应用公式7-9,7-10,u=1.638,

P>0.05,不拒绝H0。

采用P o is s o n分布应用公式7-14,u=1.631,

P>0.05,不拒绝H0。

4.若A地调查2万名妇女,160人患病,B地调查1万名妇女,102名患病,则统计结论是什么。

解:

H0:A、B两地妇女的乳腺癌患病率相同

H1:A、B两地妇女的乳腺癌患病率不同

α=0.05,双侧检验

计算统计量:

采用二项分布应用公式7-9,7-10,u=1.93,

P>0.05,不拒绝H0。

采用P o is s o n分布应用公式7-15,u=1.846,

P>0.05,不拒绝H0。

5.按规定平均每毫升饮用水中的细菌数不得超过100个,现从某水源随机抽取2毫升水测得细菌215个,问该水源是否符合饮用水的条件。

解:

H0:水源符合饮用水的条件μ=μ0

H1:水源符合饮用水的条件μ>μ0

α=0.05

计算统计量

代入公式7-13得

u=(215/2-100)/(100)1/2=0.75,u<1.645,P>0.05.

不拒绝H0,水源符合饮用水的条件。

6.某研究者收集了2000份血样欲检出其中的阳性标本。若已知此类血样的阳性率很低,为节省人力和物力,研究者将每个血样一分为二,然后将其中的一份采用混合样品分析法,将每10份血样混合后进行检验,结果在200份混合血样中测得9份阳性。

(1)请据混合血样的检出结果估计原2000个血样中的阳性个数。

统计界有争议,暂时不做。

(2)在混合样品分析法的基础上研究者欲找出原2000个样品中所有阳性样品。研究者还需要作几次检验?

9份阳性,每份含10个样品,故90次检验。

7.为研究某病在某地是否有家族集积性,某研究者在该地随机抽查200户3口之家,结果全家无病的142户,1个病人的家庭30户,2个病人的家庭19户,3人全患病的9户。请作统计推断。

解:

病人总数=30+38+27=95患病率=95/600=0.1583不患病率=0.8417

H0:某病在某地无家族集积性(服从二项分布,即个体是否患病相互独立),

H0:某病在某地有家族集积性(不服从二项分布,即个体患病与否不相互独立)α=0.05

代入公式6-6,χ2=113.49,ν=k-2=2

(注:计算概率时用到总体率的估计值,总户数)

χ20.005(2)=10.60,χ2=113.49>10.60,P<0.005,该资料不服从二项分布,家庭成员是否患病不是相互独立的,拒绝H0,接受H1认为该病有家族集积性。

相关文档