如何给网站做seo,电商平面设计工作内容,检察 门户网站建设,求网站建设方法一、问题与数据 研究者想调查人们对“本国税收过高”的赞同程度#xff1a;Strongly Disagree——非常不同意#xff0c;用“0”表示#xff1b;Disagree——不同意#xff0c;用“1”表示#xff1b;Agree--同意#xff0c;用“2”表示#xff1b;Strongly Agree--非常…一、问题与数据 研究者想调查人们对“本国税收过高”的赞同程度Strongly Disagree——非常不同意用“0”表示Disagree——不同意用“1”表示Agree--同意用“2”表示Strongly Agree--非常同意用“3”表示。 另外研究者也调查了一些其它情况包括是否是“雇主”biz_ownerYes——是用“0”表示No——否用“1”表示、年龄age和党派politicsLib——党派1用“1”表示Con——党派2用“2”表示Lab——党派3用“3”表示。部分数据如下图 二、对问题的分析 使用有序Logistic进行回归分析时需要考虑4个假设。 假设1因变量唯一且为有序多分类变量如城市综合竞争力等级可以分为高、中、低某病的治疗效果分为痊愈、有效、无效等。假设2存在一个或多个自变量可为连续、有序多分类或无序分类变量。假设3自变量之间无多重共线性。假设4模型满足“比例优势”假设。意思是无论因变量的分割点在什么位置模型中各个自变量对因变量的影响不变也就是自变量对因变量的回归系数与分割点无关。 有序多分类的Logistic回归原理是将因变量的多个分类依次分割为多个二元的Logistic回归例如本例中因变量“本国的税收过高”的赞同程度有4个等级分析时拆分为三个二元Logistic回归分别为(0 vs 123) 、(01 vs 23)、(012 vs 3)均是较低级与较高级对比。 在有序多分类Logistic回归中假设几个二元Logistic回归中自变量的系数相等仅常数项不等结果也只输出一组自变量的系数。因此有序多分类的Logistic回归模型必须对自变量系数相等的假设即“比例优势”假设进行检验又称平行线检验。如果不满足该假设则考虑使用无序多分类Logistic回归。 三、前期数据处理 对假设进行验证前我们需要将分类变量设置成哑变量。 1. 为什么要设计哑变量 若直接将分类变量纳入Logistic回归方程则软件会将分类变量按连续变量处理。例如如果把性别按“1”——男、“2”——女进行编码然后直接把性别纳入方程方程会认为“女”是“男”的2倍。为了解决这个问题需要用一系列的二分类变量“是”或“否”来表示原始的分类变量这些新的二分类变量被称为“哑变量”。 在SPSS软件的二项Logistic回归模型中将分类变量选入categorical软件会自动设置一系列的哑变量。由于验证假设3(自变量之间无多重共线性)需要通过线性回归实现而在线性回归中就需要手动设置哑变量。因此这里需要先手动设置哑变量。
2. 设置哑变量的思路 哑变量的数目是分类变量类别数减一。本例中党派1、党派2和党派3的原始编码为1、2和3。设置哑变量时需要对党派1和党派2进行重新编码。 建立新变量Lib党派1若调查对象选了党派1则Lib编为“1”代表是若未选党派1则Lib编为“0”代表否。同样建立新变量Con党派2将是否选党派2编为“1”或“0”。此时若既未选党派1又未选党派2则两个新变量Lib和Con的编码都为“0”代表党派3。此时党派3在模型中是参考类别Reference。 3. 在SPSS中设置哑变量 (1) 首先先创建新变量“Con”在主菜单下选择Transform→Recode into Different Variables... 如下图 (2) 在Recode into Different Variables对话框中将politics选入右侧Numeric Variable--Output Variable下在右侧Output Variable中填写“Con”。点击Change→Old and New Values。 (3) 出现Recode into Different Variables: Old and New Values对话框在左侧的Old Value下的Value中填入2在右侧的New Value下的Value中填入1点击Add。 (4) 将其它值变为“0”左侧点击All other values在右侧Value中填入“0”点击Add→Continue。 (5) 如果数据中有缺失值点击左侧System-missing右侧点击System-missing→Add保持缺失值 设置得到的结果如下图 本例中没有缺失值可省略这一步。 (6) 继续创建新变量“Lib”与以上步骤相似。两个变量创建完成后点击变量视图可以看到在最右侧已经生成了两个新变量“Con”和“Lib”如下图 四、对假设的判断 假设1-2都是对研究设计的假设需要研究者根据研究设计进行判断所以这里主要对数据的假设3-4进行检验。 1. 检验假设3自变量之间无多重共线性 (1) 在主菜单点击Analyze→Regression→Linear... (2) 将tax_too_high选入Dependent将biz_owner、age、Con、Lib选入Independent(s)。 (3) 点击Statistics出现Linear RegressionStatistics对话框点击Collinearity diagnostics→Continue→OK。 结果如下图 如果容忍度Tolerance小于0.1或方差膨胀因子VIF大于10则表示有共线性存在。 本例中容忍度均远大于0.1方差膨胀因子均小于10所以不存在多重共线性。如果数据存在多重共线性则需要用复杂的方法进行处理其中最简单的方法是剔除引起共线性的因素之一剔除哪一个因素可以基于理论依据。 2. 检验假设4模型满足“比例优势”假设 “比例优势”假设可以在后面结果部分的“平行线检验”中看到。 五、SPSS操作 SPSS中可以通过两个过程实现有序Logistic回归。分别是Analyze → Regression → Ordinal...和Analyze → Generalized Linear Models → Generalized Linear Models...。 其中Analyze → Regression → Ordinal模块可以检验 “比例优势”假设但无法给出OR值和95%CI。而Analyze → Generalized Linear Models → Generalized Linear Models模块可以给出OR值和95%CI但无法检验“比例优势”假设。 这里我们主要介绍Analyze → Regression → Ordinal过程。 (1) 在主菜单点击Analyze→Regression→Ordinal...