一个虚拟主机多个网站,建设网站需要学什么程序,建设信用卡个人网站,通辽市网站建设文章目录 前言总体均值的检验总体均值的检验(一个总体均值的检验)两个总体均值之差的检验 总体比例的检验一个总体比例的检验 练习 前言
本篇将继续上篇文章进行介绍。 总体均值的检验
总体均值的检验(一个总体均值的检验)
小样本的检验 假定条件 小样本(n30) 总体服从正… 文章目录 前言总体均值的检验总体均值的检验(一个总体均值的检验)两个总体均值之差的检验 总体比例的检验一个总体比例的检验 练习 前言
本篇将继续上篇文章进行介绍。 总体均值的检验
总体均值的检验(一个总体均值的检验)
小样本的检验 假定条件 小样本(n30) 总体服从正太分布 检验统计量的选择与总体方差是否已知有关 已知样本均值经标准化后服从标准正态分布
单样本t检验的效应量通常使用 Cohen的d统计量来度量计算公式为
该效应量表示样本均值与假设的总体均值的差异是多少个标准差。根据 Cohen1988提出的标准单样本t检验的小、中、大效应量对应的d值分别为0.200.500.80。即当d0.20时效应量非常小几乎为0当0.20≤d0.50时为小的效应量当0.50≤d0.80时为中的效应量当d≥0.80时为大的效应量。0.20表示样本均值与假设的总体均值相差0.2个标准差0.50表示相差0.5个标准差0.80表示相差0.8个标准差。Cohen提供的标准只是近似结果
例题 数据 example6_4.RData一种建筑用砖的厚度要求为5cm高于或低于该标准均被认为是不合格的。现对一家生产企业提供的20块样本进行检测结果如表6-2所示 假定砖的厚度服从正态分布在0.05的显著性水平下检验该企业生产的砖的厚度是否符合要求。 t.testxyNULLmu0函数可以实现t检验。当不指定y时为单样本检验mu为检验的均值默认为0。 结论在该项检验中 4.8t-5.6273df191.998e-05由于P0.05拒绝H0有证据显示该企业生产的砖的厚度不符合要求。 检验结果表明该企业生产的砖的厚度与5cm有显著差异但要想知道差异的程度则需要计算效应量。有
结果表示样本砖的平均厚度与标准厚度相差1.258306个标准差。根据Cohen准则该检验结果属于大的效应量。计算效应量的R代码和结果如下所示 计算效应量
load(C:/example/ch6/example6_4.RData)
library(lsr)
cohensD(example6_4$厚度,mu5)两个总体均值之差的检验
根据获得样本的方式不同两个总体均值的检验分为独立样本和配对样本两种情形而且也有大样本与小样本之分。检验的统计量是以两个样本均值之差
的抽样分布为基础构造出来的。对于大样本和小样本两种情形由于两个样本均值之差经标准化后的分布不同检验统计量也有差异。
独立大样本的检验
例题 数据 example6_5. RData为分析男女学生上网时间是否有差异从男女学生中各随机抽取36人得到每天的上网时间数据如下表所示。在显著性水平0.05下检验男女学生上网的平均时间是否有显著差异 设μ1男生上网的平均时间μ2女生上网的平均时间。由于关心上网的平均时间是否有显著差异所以提出的假设为 H0:μ1-μ20; H1:μ1-μ2≠0 检验的R代码和结果如下所示
load(C:/example/ch6/example6_5.RData)
library(BSDA)
z.test(example6_5$男生上网时间,example6_5$女生上网时间,sigma.xsd(example6_5$男生上网时间),sigma.ysd(example6_5$女生上网时间),alternativetwo.sided)结论在该项检验中 3.058333, 2.830556z1.1188P0.2632由于P0.05不拒绝H0没有证据显示男女学生上网的平均时间有显著差异。
独立小样本的检验 这时两个样本均值之差经标准化后服从自由度为n1n2-2的t分布因而采用的检验统计量为
例题 数据 example6_6. RData为比较两家企业生产的灯泡平均使用寿命是否有显著差异质检人员对两家供货商提供的各20个样品进行检测得到的使用寿命数据如下表所示。检验两家企业灯泡的平均使用寿命是否有显著差异 0.05
(1) 假设两个总体方差相等 (2) 将设两个总体方差不相等 t.testxynull alternativec“two. sided”“less”,“greater”),mu0,pairedFALSE var. equalFALSEconf.level0.95函数中var. equaltrue和var. equalFALSE分别对应两总体方差相等和不相等的假设默认var. equalFALSE.默认 pairedFALSE为独立样本检验 pairedTRUE为配对样本检验。 解设μ1为甲企业灯泡的平均使用寿命μ2为乙企业灯泡的平均使用寿命。依题意提出如下假设 H0:μ1-μ20; H1:μ1-μ2≠0 检验的R代码和结果如下所示 (1) 假设两个总体方差相等 假设方差相等
load(C:/example/ch6/example6_6.RData)
t.test(example6_6$甲企业,example6_6$乙企业,var.equalTRUE)(2) 将设两个总体方差不相等
t.test(example6_6$甲企业,example6_6$乙企业,var.equalFALSE)结论在该项检验中 8487.5 8166.0假设总体方差相等时t3.4943df38P0.00122假设总体方差不等时t3.494333.683P0.001353。两种假设条件下检验的P值均小于0.05所以拒绝H0表明两家企业生产的灯泡平均使用寿命有显著差异。 检验结果显示两家企业生产的灯泡平均使用寿命差异显著但要想知道差异的程度则需要计算效应量。独立样本t检验的效应量的估计通常由 Cohen的d统计量给出计算公式为
该效应量表示总体1的均值 与总体2的均值 相差多少个标准差。根据 Cohen1988提出的标准独立样本检验的小、中、大效应量对应的d值分别为0.20, 0.50, 0.80。 计算效应量的R代码和结果如下所示 计算效应量
library(lsr)
cohensD(example6_6$甲企业,example6_6$乙企业)结果显示d1.104985表示甲企业和乙企业的灯泡平均使用寿命相差1.104985个标准差。根据 Cohen准则该检验结果属于大的效应量。
配对样本的检验 例题 数据 example6_7. Rdata某饮料公司研制出一款新产品为比较消费者对新旧产品口感的满意程度随机抽选一组消费者共10人让每个消费者先品尝一款饮料再品尝另一款饮料两款饮料的品尝顺序是随机的而后每个消费者要对两款饮料分别进行评分0~10分评分结果如下表所示。取显著性水平 0.05检验消费者对两款饮料的评分是否有显著差异。 解设 u1 消费者对旧款饮料的平均评分 u2消费者对新款饮料的平均评分依题意建立的原假设与备择假设为
检验的R代码和结果如下所示
load(C:/example/ch6/example6_7.RData)
t.test(example6_7$旧款饮料,example6_7$新款饮料,pairedTRUE)结论在该项检验中 -1.3t-2.7508df9P0.02245由于P0.05,拒绝H0消费者对新旧饮料的评分有显著差异。 拒绝原假设后可计算效应量来进一步分析配对样本差值的均值与假设的总体差值的均值之间的差异程度。配对样本t检验的效应量的估计由 Cohen的d统计量给出。计算公式为 根据 Cohen提出的标准配对样本检验的小、中、大效应量对应的d值分别为 0.20,0.50,0.80 计算效应量的R代码和结果如下所示
library(lsr)
cohensD(example6_7$旧款饮料,example6_7$新款饮料,methodpaired)总体比例的检验
总体比例的检验程序与总体均值的检验类似本小节只介绍大样本情形下一个总体比例的检验方法和两个总体比例之差的检验方法。
一个总体比例的检验 例题 一家电视台的影视频道制作人认为某电视连续剧如果在黄金时段播出收视率将会达到25%以上。经过一周的试播放后该制作人随机抽取了由2000人组成的一个样本发现有450个观众观看了该电视连续剧。取显著性水平a0.05检验收视率是否达到制作人的预期。 解制作人想支持的观点是收视率达到25%以上因此提出的假设为 H0: π ≤25%; H1: π25% 检验的R代码和结果如下所示
n-2000
p-450/2000
pi0-0.25
z-(p-pi0)/sqrt(pi0*(1-pi0)/n)
p_value-1-pnorm(z)
data.frame(z,p_value)在该项检验中z-2.581989P0.9950884由于P0.05不拒绝H0没有证据表明收视率达到了制作人的预期。 例题 一所大学准备采取一项新的上网收费措施为了解男女学生对这一措施的看法是否有差异分别抽取200名男生和200名女生进行调查。其中的一个问题是“你是否赞成采取新的上网收费的措施”其中男生表示赞成的比例为27%女生表示赞成的比例为35%。调查者认为男生中表示赞成的比例显著低于女生。取显著性水平 0.05样本提供的证据是否支持调查者的看法 解设π1男生中表示赞成的比例π2女生中表示赞成的比例。依题意提出如下假设解 H0: π1-π2 ≥0; H1: π1-π20 检验的R代码和结果如下所示
n1-200;n2-200
p1-0.27;p2-0.35
p-(p1*n1p2*n2)/(n1n2)
z-(p1-p2)/sqrt(p*(1-p)*(1/n11/n2))
p_value-pnorm(z)
data.frame(z,p_value)结论在该项检验中z-1.729755P0.04183703由于P0.05拒绝H0。样本提供的证据支持调査者的看法即男生中表示赞成的比例显著低于女生。
例题 有两种方法生产同一种产品方法1的生产成本较高而次品率较低方法2的生产成本较低而次品率则较高。管理人员在选择生产方法时决定对两种方法的次品率进行比较。如果方法1比方法2的次品率低8%以上则采用方法1否则就采用方法2。管理人员从采用方法1生产的产品中随机抽取300个发现有33个次品从采用方法2生产的产品中也随机抽取300个发现有84个次品。用显著性水平a0.01进行检验管理人员应决定采用哪种方法进行生产 解设π1方法1的次品率π2方法2的次品率。因为是要检验“方法1的次品率是否比方法2低8%”不是检验二者的差值是否等于0所以选择下式作为检验统计量 H0: π1-π2 ≥8%; H1: π1-π2 8% 检验的R代码和结果如下所示
n1-300;n2-300
p1-33/300;p2-84/300
d0-0.08
z-((p1-p2)-0.08)/sqrt(p1*(1-p1)/n1p2*(1-p2)/n2)
p_value-pnorm(z)
data.frame(z,p_value)结论在该项检验中z-7.91229P1.26348e-15由于P0.01拒绝H0。表示方法1的次品率显著地低于方法2达8%以上所以应采用方法1进行生产。 练习
1、数据exercise6_1.RData一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家准备采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低从新机床生产的零件中随机抽取50个进行检验。50个零件尺寸的绝对误差数据单位mm如下 1检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低0.01 解假定零件尺寸的绝对误差服从正态分布 这里关心的是零件尺寸的绝对误差的均值是否显著低于过去的误差均值也就是μ是否小于1.35mm因此提出如下假设
load(C:/exercise/ch6/exercise6_1.RData)
library(BSDA)
z.test(exercise6_1$零件误差,mu1.35,sigma.xsd(exercise6_1$零件误差),alternativeless,conf.level0.99)结论在该检验中z-2.6061P0.004579由于P0.01拒绝H0新机床加工的零件尺寸的平均误差与旧机床相比显著降低