当前位置：文档库 › 第18章-Logistic回归思考与练习参考答案

第18章-Logistic回归思考与练习参考答案

第18章 Logistic 回归思考与练习参考答案

一、最佳选择题

1. Logistic 回归与多重线性回归比较，（ A ）。 A ．logistic 回归的因变量为二分类变量 B ．多重线性回归的因变量为二分类变量

C ．logistic 回归和多重线性回归的因变量都可为二分类变量

D ．logistic 回归的自变量必须是二分类变量

E ．多重线性回归的自变量必须是二分类变量 2. Logistic 回归适用于因变量为（ E ）。

A ．二分类变量

B ．多分类有序变量

C ．多分类无序变量

D ．连续型定量变量

E ．A 、B 、C 均可 3. Logistic 回归系数与优势比OR 的关系为（ E ）。

A ．>β0等价于OR ＞1

B ．>β0等价于OR ＜1

C ．β＝0等价于OR ＝1

D ．β＜0等价于OR ＜1

E ．A 、C 、D 均正确 4. Logistic 回归可用于（ E ）。

Ａ．影响因素分析 B ．校正混杂因素 C ．预测 D ．仅有A 和C E ．A 、B 、C 均可

5. Logistic 回归中自变量如为多分类变量，宜将其按哑变量处理，与其他变量进行变量筛选时可用（ D ）。

A ．软件自动筛选的前进法

B ．软件自动筛选的后退法

C ．软件自动筛选的逐步法

D ．应将几个哑变量作为一个因素，整体进出回归方程

E ．A 、B 、C 均可

二、思考题

1. 为研究低龄青少年吸烟的外在因素，研究者采用整群抽样，在某中心城区和远城区的初中学校，各选择初一年级一个班的全部学生进行调查，并用logistic 回归方程筛选影响因素。试问上述问题采用logistic 回归是否妥当

答：上述问题采用logistic 回归不妥当，因为logistic 回归中参数的极大似然估计要

求样本结局事件相互独立，而研究的问题中低龄青少年吸烟行为不独立。

2. 分类变量赋值不同对logistic回归有何影响分析结果一致吗

答：（1）若因变量交换赋值，两个logistic回归方程的参数估计绝对值相等，符号相反；优势比互为倒数，含义有所区别，实质意义一样；模型拟合检验与回归系数的假设检验结果相同。

（2）若改变自变量参照类或哑变量设置方法，logistic回归方程形式、参数含义虽有不同，但是模型实质与应用结果相同，可以根据研究需要选择不同赋值方法。Logistic回归结果报告中，一定要说明分类变量赋值方法及其参照，否则无法理解模型意义。

3. 例18-6研究性别对吸烟行为的影响，采用logistic回归校正了年龄对居民吸烟行为的影响，请考虑有无其他混杂因素需要校正

答：例18-6的主要目的是研究吸烟行为与性别的联系及其强度，例题采用logistic回归只校正了年龄对居民吸烟行为的影响。事实上，除年龄外，仍有其他因素会影响吸烟行为与性别的联系强度，如家庭人均年收入、受教育程度、主动获取保健知识等。建立回归模型时，首先应根据专业知识确定可能的影响因素，再采用logistic回归，将性别作为强制引入变量，对其他可能的影响因素进行变量筛选，最后将性别与筛选出的因素作为自变量建立logistic回归方程，从而正确回答校正混杂因素后吸烟行为与性别的联系及其强度。

4. 配对病例-对照研究资料若采用非条件logistic回归进行分析，对结果有何影响

答：采用配对（匹配）方法的目的是对可能的混杂因素加以控制，有助于提高研究效率和可靠性。配对设计的特点是对子内部控制的混杂变量一致，有较好的可比性。配对（匹配）资料若采用非条件logistic回归进行分析，则忽视了这种可比性，降低了分析方法的检验效能。

三、计算题

探讨肾细胞癌转移有关的因素研究中，收集了26例行根治性肾切除术患者的肾癌标本资料（教材表18-19），有关变量说明如下，试进行logistic回归分析。

X：确诊时患者的年龄（岁）。

X：肾细胞癌血管内皮生长因子，其阳性表达由低到高共3个等级，分别赋值1、2、3。

X：肾细胞癌组织内微血管数。

X：肾细胞癌细胞核组织学分级，由低到高共4级，分别赋值1、2、3、4。

5X ：肾细胞癌分期，由低到高共4期，分别赋值1、2、3、4。

Y ：肾细胞癌转移情况，有转移＝1，无转移＝0。

教材表18-19 26例行根治性肾切除术患者的肾癌标本资料

数据摘自倪宗瓒. 卫生统计学 4版，人民卫生出版社，2004。

解：

Logistic 回归分析结果显示：肾细胞癌转移与肾细胞癌血管内皮生长因子和肾细胞癌细胞核组织学分级有关。肾细胞癌血管内皮生长因子2X 和肾细胞癌细胞核组织学分级4X 的回归系数均为正值，说明两个变量取值越大，则肾细胞癌转移的危险性越大。在肾细胞癌细胞核组织学分级不变条件下，肾细胞癌血管内皮生长因子每增加一级，肾细胞癌转移的优势增至倍，增加倍；在肾细胞癌血管内皮生长因子不变条件下，肾细胞癌细胞核组织学分级每增加一级，肾细胞癌转移的优势增至倍，增加倍。

（毛宗福余红梅）

Logistic回归分析简介

Logistic回归分析简介 Logistic回归：实际上属于判别分析，因拥有很差的判别效率而不常用。1．应用范围： ①适用于流行病学资料的危险因素分析 ②实验室中药物的剂量-反应关系 ③临床试验评价 ④疾病的预后因素分析 2．Logistic回归的分类： ①按因变量的资料类型分：二分类多分类其中二分较为常用 ②按研究方法分：条件Logistic回归非条件Logistic回归两者针对的资料类型不一样，后者针对成组研究，前者针对配对或配伍研究。 3．Logistic回归的应用条件是： ①独立性。各观测对象间是相互独立的； ②LogitP与自变量是线性关系； ③样本量。经验值是病例对照各50例以上或为自变量的5-10倍（以10倍为宜），不过随着统计技术和软件的发展，样本量较小或不能进行似然

估计的情况下可采用精确logistic回归分析，此时要求分析变量不能太多，且变量分类不能太多； ④当队列资料进行logistic回归分析时，观察时间应该相同，否则需考虑观察时间的影响（建议用Poisson回归）。 4．拟和logistic回归方程的步骤： ①对每一个变量进行量化，并进行单因素分析； ②数据的离散化，对于连续性变量在分析过程中常常需要进行离散变成等级资料。可采用的方法有依据经验进行离散，或是按照四分、五分位数法来确定等级，也可采用聚类方法将计量资料聚为二类或多类，变为离散变量。 ③对性质相近的一些自变量进行部分多因素分析，并探讨各自变量（等级变量，数值变量）纳入模型时的适宜尺度，及对自变量进行必要的变量变换； ④在单变量分析和相关自变量分析的基础上，对P≤α（常取0.2，0.15或 0.3）的变量，以及专业上认为重要的变量进行多因素的逐步筛选；模型程序每拟合一个模型将给出多个指标值，供用户判断模型优劣和筛选变量。可以采用双向筛选技术：a进入变量的筛选用score统计量或G统计量或LRS(似然比统计量)，用户确定P值临界值如：0.05、0.1或0.2，选择统计量显著且最大的变量进入模型；b剔除变量的选择用Z统计量(Wald 统计量)，用户确定其P值显著性水平，当变量不显者，从模型中予以剔除。这样，选入和剔除反复循环，直至无变量选入，也无变量删除为止，选入或剔除的显著界值的确定要依具体的问题和变量的多寡而定，一般

SPSS—二元Logistic回归结果分析报告

SPSS—二元Logistic回归结果分析 2011-12-02 16:48 身心疲惫，睡意连连，头不断往下掉，拿出耳机，听下歌曲，缓解我这严重的睡意吧！今天来分析二元Logistic回归的结果分析结果如下： 1：在“案例处理汇总”中可以看出：选定的案例489个，未选定的案例361个，这个结果是根据设定的validate = 1得到的，在“因变量编码”中可以看出“违约”的两种结果“是”或者“否” 分别用值“1“和“0”代替，在“分类变量编码”中教育水平分为5类，如果选中“为完成高中，高中，大专，大学等，其中的任何一个，那么就取值为 1，未选中的为0，如果四个都未被选中，那么就是”研究生“ 频率分别代表了处在某个教育水平的个数，总和应该为489个

1：在“分类表”中可以看出：预测有360个是“否”（未违约）有129个是“是”（违约） 2：在“方程中的变量”表中可以看出：最初是对“常数项”记性赋值，B为 -1.026，标准误差为：0.103 那么wald =( B/S.E)2=(-1.026/0.103)2 = 99.2248, 跟表中的“100.029几乎接近，是因为我对数据进行的向下舍入的关系，所以数据会稍微偏小， B和Exp(B) 是对数关系，将B进行对数抓换后，可以得到：Exp(B) = e^-1.026 = 0.358, 其中自由度为1， sig为0.000，非常显著

1：从“不在方程中的变量”可以看出，最初模型，只有“常数项”被纳入了模型，其它变量都不在最初模型表中分别给出了，得分，df , Sig三个值, 而其中得分（Score)计算公式如下：（公式中（Xi- Xˉ) 少了一个平方）下面来举例说明这个计算过程：(“年龄”自变量的得分为例）从“分类表”中可以看出：有129人违约，违约记为“1”则违约总和为 129，选定案例总和为489 那么： yˉ = 129/489 = 0.16 xˉ = 16951 / 489 = 34.2 所以：∑(Xi-xˉ)2 = 30074.9979

logistic回归分析案例

1. 数据制备（栅格数据）（1）宝塔区基底图层.tif （2）居民点扩增.tif 、坡度.tif 、坡向.tif 等要素数据。在 environment settings ------ p rocessing extent ------ snap raster （选中基底图层），保证栅格数据像元无偏移，且行列的数量一致。化:Raster to ASCII Inyul r aiLtvl- 匚” k 『号樹 ± 如葡让也\1非*订kilt :f 10. 2 'iiStati EeiT-SlaT 14t L J. KT 2.通过CLUE-S 莫型中的fileconvert 模块，获得logistic 回归分析的数据集。（1）将上一步骤中的因变量 y 和影响因素x 的.txt 文档后缀改为.asc 格式，并将文件放在CLUE-S 模型所在的文件夹中。（2）打开FileCo nvert V2软件，按下图勾选，填写"file list "内容，点击start con version ， 3 田F1 曰 It:. （3）栅格数据转为 ASCII 码，生成txt 文档。匚onversion Tools Ejicel From GPS From KML From Raster 气 Raster to ASCII y Raster to Fist 声.Raster to Point

生成stat .txt文档。祥Fi le 荃 flFfijie? I1id J?1Ji w ■■ 1 ? 9><4 P t414 Tl ?J19 12词 ■M*￡LD|i4I# ■ Q电兀列心￡i k1lf\ 15?1 *■4JE RI7 <1- I 4 話M3 IS r擠uSstalB-^aG 齬￡淨珀bCMir 二i缶 pad... ■ 枝jfcsurrT^cM.a^t 炉 MBlOrtTIdH■: 护 xVcomr-.iic / rll asc 播Tann砂￡]T (2)logistic回归分析按图设置参数因变量、自变量；由于x3属于分类变量，点击分类按钮，按图设置参数。 >M!L4M|昨T祜lt?M? 曲唱-Hl'F1 wB-j' MtF M|T ffl￥ g： ZTStiRiiri SHilfi VTU '_'■ rt 舖C r TI薔色Z4d* ■i aa ■；? 1 iTdlfAflWVK4Wt4「利 E 呻■■} 1■ IdfcWM^U.一尉仇■臂H xlAftL lAMDf Jfit 1Q1?7r -iwns ■B-13磁MT 13 J 工 '-恫fl T l￡j v-IIHH M4Q J0W PW回沐神to 型 rwa： wm 1 H teiiy- 卩厲 4a13 4 ■ira 401?wa 70i-221 ?d'131fefl 加ifUnm 片nu t013*Ozmwkt他 w p1W址?囲血|淞：幽 11013 1 Qm Sft?t 121JJ V s? 014*」； 11 H?iKa； H013 5 *旳 ti a IM■ KK MS V；941 ti Q144T f 7W filwvjcfic OH