jsp网站开发详解书籍,5188关键词挖掘工具,创建小型网站的步骤,点个赞科技 网站制作发现新天地,欢迎访问
介绍
典型相关分析#xff08;Canonical Correlation analysis#xff09;研究两组变量#xff08;每组变量中都可能有多个指标#xff09;之间相关关系的一种多元统计方法。它能够揭示出两组变量之间的内在联系。
例子 我们要探究观众和业内人士对…发现新天地,欢迎访问
介绍
典型相关分析Canonical Correlation analysis研究两组变量每组变量中都可能有多个指标之间相关关系的一种多元统计方法。它能够揭示出两组变量之间的内在联系。
例子 我们要探究观众和业内人士对于一些电视节目的观点有什么样的关系呢观众评分来自低学历(led)、高学历(hed)和网络(net)调查三种,它们形成第一组变量而业内人士分评分来自包括演员和导演在内的艺术家(arti)、发行(com)与业内各部门主管(man)三种形成第二组变量。 直接对这些变量的相关进行两两分析很难得到关于这两组变量观众和业内人士之间关系的一个清楚的印象。
解决思路:
把多个变量与多个变量之间的相关化为两个具有代表性的变量之间的相关。代表能较为综合、全面的衡量所在组的内在规律。一组变量最简单的综合形式就是该组变量的线性组合。
典型相关分析的定义
典型相关分析由Hotelling提出其基本思想和主成分分析非常相似。
首先在每组变量中找出变量的线性组合使得两组的线性组合之间具有最大的相关系数 然后选取和最初挑选的这对线性组合不相关的线性组合使其配对并选取相关系数最大的一对 如此继续下去直到两组变量之间的相关性被提取完毕为止。假设性检验
被选出的线性组合配对称为典型变量它们的相关系数称为典型相关系数。典型相关系数度量了这两组变量之间联系的强度。
思路 注意综合变量的组数是不确定的如果第一组就能代表原样本数据大部分的信息那么一组就足够了。假设第一组反映的信息不够我们就需要找第二组了并目为了让第二组的信息更有效需要保证两组的信息不相关 典型相关系数的分析步骤
数据的分布有假设两组数据服从联合正态分布。 首先要对两组变量的相关性进行检验构造似然比统计量。p值小于0.050.1表示在95%90%的置信水平下拒绝原假设即认为两组变量有关。 确定典型相关变量的个数直接看典型相关系数对应的P值即可 利用标准化后的典型相关变量分析问题 进行典型载荷分析 计算前r个典型变量对样本总方差的贡献 利用spss进行操作
导入数据 分析 分组 得到结果 个人公众号搜索:TinyCr 本文由博客一文多发平台 OpenWrite 发布