当前位置: 首页 > news >正文

芜湖网站建设网站制作公司公司装修报价表

芜湖网站建设网站制作公司,公司装修报价表,android开发工具手机版,在线设计平台设计师招募之前详细介绍了利用R语言进行统计描述#xff0c;详情点击#xff1a;R语言系列第三期#xff1a;①R语言单组汇总及图形展示、R语言系列第三期#xff1a;②R语言多组汇总及图形展示、R语言系列第三期#xff1a;③R语言表格及其图形展示从这个部分我们就开始为大家介绍统… 之前详细介绍了利用R语言进行统计描述详情点击R语言系列第三期①R语言单组汇总及图形展示、R语言系列第三期②R语言多组汇总及图形展示、R语言系列第三期③R语言表格及其图形展示从这个部分我们就开始为大家介绍统计推断的内容了我们将重点放到相关统计函数的特定参数及其输出的解释上。一些最基础的统计检验基本上都是比较连续数据之间的差异可能是两个组之间的比较也可能是单组与特定值或预设值之间的比较这便是本章的主题了。首先介绍两个函数用来进行t检验的t.test()和进行Wilcoxon检验的wilcox.test()。它们能够对单样本、两独立样本与配对样本进行检验。#Tips统计推断的部分我们不会把重点放到统计原理上如果对统计学原理感兴趣的朋友请查阅相关的统计书籍我们只会把部分必须解释的统计内容呈现出来。A. 单样本t检验适用条件满足正态分布的连续型数据数据之间保持随机性和独立性。适用范围比较当前数据总体与单个预期值的大小。实例11位女性的每日摄入能量记录存放到intake变量中 intakec(5260,5470,5640,6180,6390,6515,6805,7515,7516,8230,8770)我们可以先进行简单的描述再来作推断 mean(intake)[1] 6753.727 sd(intake)[1] 1142.19 quantile(intake)0%   25%   50%  75%  100%5260.0  5910.0   6515.0  7515.5  8770.0也许你想检验一下这些女性的摄入能量是不是与推荐值7725千焦相差甚远。首先我们需要检验一下正态性这里介绍一个最简单的正态性检验的方法用夏皮罗-威尔克(Shapiro-Wilk)法检验数据正态性即W检验,1965 年提出,适用于样本含量n ≤50 时的正态性检验。shapiro.test() shapiro.test(intake)Shapiro-Wilk normality testdata:  intakeW 0.95238, p-value 0.6744#Tips重点是p-value的结果这里的值是0.67440.05(检验水准也可以是0.1)满足正态性。如果P值过小的情况下就不满足正态性了可以先进行数据转换比如说对数转换平方根反正弦变换倒数变换等等方法如果都不能满足正态的话使用非参数的方式计算比如后文的Wilcoxon。另外检查数据正态性的方法有很多这里不一一列举其实前面作图的时候讲过的QQ图也可以用来检验正态性。我们通过W检验得知数据服从正态分布那么我们接下来的要做的就是检验这个分布是否满足μ7725。 t.test(intake,mu7725) One Sample t-testdata:  intaket -2.8203, df 10, p-value 0.01815alternative hypothesis: true mean is not equal to 772595 percent confidence interval:5986.394 7521.061sample estimates:mean of x6753.727结果解释One Sample t-test这里是对所做的检验类型的描述告诉我们是单样本的t检验在这个函数里如果一个向量参数和一个mu参数那么做的就是单组独立样本的t检验。t -2.8203, df 10, p-value 0.01815 结果显示中t-2.8203是统计量df代表自由度p-value是最终的p值p0.018150.05,于是在检验水准在0.05的条件下拒绝零假设认为数据显著地偏离了原假设中的均值7725千焦。alternative hypothesis: true mean is not equal to 7725  两个信息1.原假设里的均值是77252.这是一个双侧检验(not equal to)。95 percent confidence interval:5986.394  7521.061这个是均值的95%置信区间。置信区间也可以作为假设检验的一种方式查看设定均值在不在这个区间内如果不在则可拒绝零假设。sample estimates:mean of x6753.727这最后一部分就是观测值的均值是样本均值的点估计结果。#Tips这个函数还有几个可选的参数除了mu设立的零假设的均值还有alternative设定单侧检验还是双侧检验默认双侧如果设定成“greater”和“less”则成为单侧检验。还有一个conf.level0.99/0.90等来设定置信区间范围。也可以通过缩写的方式设定参数比如al“g”也是可以的。B. Wilcoxon符号秩和检验(单样本)t检验在数据来自正态分布时比较稳定在不满足正态分布的数据也不错尤其是大样本条件下把握度相对较高。而如果想要使用不依赖数据分布的方法就需要Wilcoxon这样的方法了它们往往把数据替换成相应的顺序统计量比较的是中位数。对Wilcoxon秩和检验的实际应用基本上与t检验一致(对分布无要求) wilcox.test(intake,mu7725)Wilcoxon signed rank testdata:  intakeV 8, p-value 0.02441alternative hypothesis: true location is not equal to 7725#Tips这里比t.test的输出短因为一个非参数检验不会出现类似于参数估计以及置信区间的概念。这里V代表正数对应的秩和。P0.02441同样拒绝零假设结论同t检验。#Tips除了跟t.test一样有mu和alternative两个参数外还有一个correct参数用于指示是否需要连续性校正默认是校正的(T)。还有exact用来指示是否精确计算。C. 两样本t检验我们以energy数据集作为例子来比较一下肥胖和消瘦的两组人群的能量消耗是否有差别 attach(energy) energy   expend stature1    9.21   obese2    7.53    lean3    7.48    lean4    8.08    lean5    8.09    lean...17   8.79   obese18   9.69   obese19   9.68   obese20   7.58    lean21   9.19   obese22   8.11    lean这个数据框的两列包含了我们所需要的信息分类变量stature包含了分组信息而数值变量expend包含了能量消耗情况。我们只要传递一个模型方程就能通过R中的t.test和wilcox.test来分析这样格式的数据。我们的目的是比较两组的能量消耗水平是否有差异所以我们使用如下的t检验(设定数据满足正态分布) t.test(expend~stature)Welch Two Sample t-testdata:  expend by staturet -3.8555, df 15.919, p-value 0.001411alternative hypothesis: true difference in means is not equal to 095 percent confidence interval: -3.459167 -1.004081sample estimates: mean in group lean         mean in group obese8.066154           10.297778这里“~”指明expend是通过stature来描述的。其它内容基本上跟之前的单样本t检验一致95%置信区间是均值之差的区间估计的检验结果与p值所得结果一致。#TipsR里t检验默认不假设两组方差相等。这样也导致了自由度非整数。上面的t检验在统计上叫做t’检验。为了进行平常我们所用的t检验需要明确方差相等这个参数可以通过使参数ver.equalT来达到这一点。 t.test(expend~stature,var.equalT) Two Sample t-test data:  expend by staturet -3.9456, df 20, p-value 0.000799alternative hypothesis: true difference in means is not equal to 095 percent confidence interval: -3.411451 -1.051796sample estimates: mean in group lean        mean in group obese8.066154           10.297778#Tips这个是我们平常使用的t检验其实差别不是很大。如果数据存储的形式不是向上述一样的数据框而是已经区分开来的两个向量。比如说如下的状态肥胖组和消瘦组的能量消耗情况分别存放在expob和exple两个变量里就可以通过“”分隔开两个变量的形式罗列到t.test()的参数里 expobsubset(energy$expend,energy$statureobese) explesubset(energy$expend,energy$staturelean) expob[1]  9.21 11.51 12.79 11.85  9.97  8.79  9.69  9.68  9.19 exple [1]  7.53  7.48  8.08  8.09 10.15  8.40 10.88  6.13  7.90  7.05  7.48[12]  7.58  8.11 t.test(expob,exple) Welch Two Sample t-test data:  expob and explet 3.8555, df 15.919, p-value 0.001411alternative hypothesis: true difference in means is not equal to 095 percent confidence interval: 1.004081 3.459167sample estimates:mean of x mean of y10.297778  8.066154#Tips这里的结果跟数据框存放的数据计算结果相同但是需要注意不同的数据存放形式需要不同的代码。同时wilcoxon检验当前存放方式也适用下文不赘述。D. 比较方差为了给上面的t检验做一个方差齐性的证据我们可以做一下两组方差检验的F检验 var.test(expend~stature) F test to compare two variances data:  expend by statureF 0.78445, num df 12, denom df 8, p-value 0.6797alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval: 0.1867876 2.7547991sample estimates:ratio of variances0.784446这里的计算结果的判断与正态性检验的类似都是p值大于0.05则满足正态性或者方差齐性。所以可以使用常规的t检验来比较。#Tips方差齐性检验不能用在配对的数据中只能用在独立的两组数据上。E. 两样本Wilcoxon检验使用wilcoxon检验和t.test相似 wilcox.test(expend~stature) Wilcoxon rank sum test with continuity correction data:  expend by statureW 12, p-value 0.002122alternative hypothesis: true location shift is not equal to 0Warning message:In wilcox.test.default(x  c(7.53, 7.48, 8.08, 8.09, 10.15, 8.4,  :无法精確計算带连结的p值这里不多解释适用所有分布类型的样本结果p-value与检验标准α比较得出结论。F. 配对t检验我们有时会遇到数据之间不独立两组之间的数据相互关联的情况比如说用药前用药后的数据或者一种样本被两种方式检测得出两组数据这样的数据就可以当成配对的数据进行分析。同时配对的数据要求两组的样本量是一致的需要一一对应。这部分的数据使用ISwR里的intake数据集(能量摄入数据)作为例子。#Tips本节前面的部分有一个与intake数据集重名的变量在索引intake的时候会优先找出变量intake而不是数据集intake因此我们可以通过 rm(intake)来先把intake变量删除方便准确使用intake数据集。 intake    pre post1  5260 39102  5470 42203  5640 38854  6180 51605  6390 56456  6515 46807  6805 52658  7515 59759  7515 679010 8230 690011 8770 7335我们可以计算下11位女性月经前后摄入能量的差值 post-pre [1] -1350 -1250 -1755 -1020  -745 -1835 -1540 -1540  -725 -1330 -1435我们可以看出它们都是负数相比于月经前所有女性都在月经后有更低的能量摄入。配对t检验可以通过下面代码实现 t.test(pre,post,pairedT) Paired t-test data:  pre and postt 11.941, df 10, p-value 3.059e-07alternative hypothesis: true difference in means is not equal to 095 percent confidence interval: 1074.072 1566.838sample estimates:mean of the differences1320.455#Tips这里注意pairedT的参数是必须的。然后这里的95%置信区间是差值的均值置信区间而两个独立样本的区间是均值的差值的置信区间这两个是有本质差别的。G. 配对Wilcoxon检验同样它的参数里pairedT也是必须的。 wilcox.test(pre,post,pairedT) Wilcoxon signed rank test with continuity correct data:  pre and postV 66, p-value 0.00384alternative hypothesis: true location shift is not equal to 0 Warning message:In wilcox.test.default(pre, post, paired  T) : 无法精確計算带连结的p值总结一下。本节介绍了两个方法t检验和wilcoxon检验这两个检验很类似最大区别在于参数检验t检验适用于小样本的正态分布数据而非参数检验wilcoxon检验对样本的分布无要求。t检验的检验效能高于wilcoxon检验。我们还介绍了正态性检验和方差齐性检验只有满足两种分布才能使用常规的t检验。随后我们介绍了三种情况分别是单组独立样本与预设值比较两组独立样本比较以及配对样本的比较。当然并不是所有数据分类都只有两种及以下当出现三组数据比较的时候我们有应该怎么处理呢且听下回分解。参考资料1. 《R语言统计入门(第二版)》 人民邮电出版社  Peter Dalgaard著2. 《R语言初学者指南》 人民邮电出版社  Brian Dennis著3. Vicky的小笔记本《blooming for you》by Vicky生信发文助手如需生信分析服务请加微信keyan-zhishi2多点好看少点脱发
http://www.pierceye.com/news/985213/

相关文章:

  • 想做网站多少钱wordpress数据连接失败1223
  • 株洲建设网站公司个人网站建设简历
  • 地方网站系统wordpress管理入口
  • 个人做网站开发指标开发板是什么东西
  • 国家住房与城乡建设部网站国内比较知名的大型门户网站
  • 网站怎么做音乐播放器大众公司网页设计
  • 网站开发地图导航页面广州公司网站建设公司
  • php网站怎么建设快速搭建网站的工具有哪些
  • 百度做的网站后台怎么更新网站要学什么
  • 做it人经常逛的网站国通快速建站
  • 网站标题会影响吗wordpress改域名修改哪里
  • 做音乐网站需要版权么工业设计图片产品
  • 外包网站问些什么问题浙江省信息港成绩查询
  • 手机网站怎么dw做官方网站下载打印机的驱动
  • 网站被攻击空间关了怎么办网站用的是什么语言
  • 欧亚专线快递查询商丘seo
  • 网站建设跟加入会员哪个效果好网站建设优化开发公司哪家好
  • 网站建设执行力wordpress php解密算法
  • 青岛网站设计皆挺青岛造价人员做兼职的网站
  • 潍坊cms建站系统wordpress 朴素
  • 网站建设方面的课程国外 图片网站
  • 网络哪里能接活做网站新浦网站制作网站建设
  • 新手自己做网站凡科网建设网站如何修改源代码
  • 做自媒体发视频用哪些网站贵州网站建设联系电话
  • 可以提供排版的网站友情链接怎么弄
  • 优秀网站建设空间海口 网站建设
  • 设计网站页面出现问题九江哪家网站建设公司好
  • 深圳做企业网站的公司成都公司展厅
  • 两学一做 网站t型布局网站怎么做
  • 论坛网站建设联系方式成都网站设计制作价格