当前位置: 首页 > news >正文

人物设计网站内蒙古建设厅网站官网

人物设计网站,内蒙古建设厅网站官网,wordpress 调用微博内容,建设网站能赚钱数据降维不只存在于半导体数据中#xff0c;它是存在于各行各业的#xff0c;我们要分析的数据维数较多的时候全部输入维数较大这时就要采取降维的方法综合出主要的几列用于我们的分析。 PCA的哲学理念是要抓住问题的主要矛盾进行分析#xff0c;是将多指标转化为少数几个… 数据降维不只存在于半导体数据中它是存在于各行各业的我们要分析的数据维数较多的时候全部输入维数较大这时就要采取降维的方法综合出主要的几列用于我们的分析。 PCA的哲学理念是要抓住问题的主要矛盾进行分析是将多指标转化为少数几个综合指标进行分析。 以二维空间为例的话 n 个样本点无论是沿着X1轴方向或者X2轴方向都有很大的离散型因为我们看到此时二维空间中的这个形状是椭圆形的如果只选取X1和X2中的任何一个那么包含在原始数据中的信息都会有较大的损失如果将X1轴和X2轴先平移再同时按逆时针方向旋转一定角度便会得到新坐标轴。 得到的新的坐标轴F1和F2称为原始变量X1和X2的综合变量旋转变换后n个样品在F1轴方向上的离散程度最大即F1的方差最大变量F1代表了原始数据的绝大部分信息在研究某些问题时即使不考虑F2也无损大局。 以二维模型为例经过变换后的F1和F2的方向如图所示同时我们可以扩展到多维模型假如X是P维模型为例我们会依次找出第一主成分和第二主成分等但是找到的主成分的数量必然是远远小于P的。 求解之后我们可以得到各特征根对应的特征向量其中最大特征根的特征向量对应第一主成分的的系数向量第二大特征根的特征向量是第二大主成分的系数向量虽然我们知道最后要使用的主成分的数量是远远小于初始的数量那么最终应该选择几个主成分就是由方差累计贡献率决定我们要求的方差累计贡献率越高最终需要的主成分个数相应也越多。 step1 调用包 import pandas as pd from sklearn.preprocessing import MinMaxScaler from sklearn.decomposition import PCA import matplotlib.pyplot as plt step2 导入数据 datapd.DataFrame(pd.read_excel(data_secom.xlsx)) step3 数据预处理 # 查看各列缺失情况 data.isnull().sum() #缺失值填充 datanew data.fillna(0) #数据标准化消除特征量纲的影响 #将属性缩放到一个指定范围,即(x-min)/(max-min) scaler MinMaxScaler() scale_data pd.DataFrame(scaler.fit_transform(datanew)) step4 PCA降维 #选择保留85%以上的信息时自动保留主成分 pca PCA(0.85) data_pca pca.fit_transform(scale_data) #data_pca就是降维后的数据 data_pca_new pd.DataFrame(data_pca) print(保留主成分个数为,pca.n_components_) #显示保留主成分个数 #选取前两主成分作图 plt.scatter(data_pca[:,0], data_pca[:,1]) plt.xlabel(PC 1) plt.ylabel(PC 2) plt.show()一、调用必要的包 step1 调用包 import pandas as pd from sklearn.preprocessing import MinMaxScaler from sklearn.decomposition import PCA import matplotlib.pyplot as plt此时需要注意的是看PCA是从哪调用的 二、导入数据 datapd.DataFrame(pd.read_excel(data_secom.xlsx))此时我们可以看到我们读入的数据的行数和列数是非常大的。 三、数据预处理 step3 数据预处理 # 查看各列缺失情况 data.isnull().sum() #缺失值填充 datanew data.fillna(0) #数据标准化消除特征量纲的影响 #将属性缩放到一个指定范围,即(x-min)/(max-min) scaler MinMaxScaler() scale_data pd.DataFrame(scaler.fit_transform(datanew))查看各列的缺失值情况后用 0 进行填充同时再将属性进行标准化从而缩放到一个指定范围。 标准化后的数据如图所示 四、PCA降维 step4 PCA降维 #选择保留85%以上的信息时自动保留主成分 pca PCA(0.85) data_pca pca.fit_transform(scale_data) #data_pca就是降维后的数据 data_pca_new pd.DataFrame(data_pca) print(保留主成分个数为,pca.n_components_) #显示保留主成分个数这里我们可以看到选取不同的方差贡献率之后需要保留的主成分个数是不同的 这段代码使用PCA(Principal Component Analysis)对数据进行了降维处理。 具体步骤: 创建PCA对象pca,设置降维比例为0.95。调用PCA对象的fit_transform()方法,输入归一化后的数据scale_data。fit_transform()先拟合数据,找到主成分方向,然后进行降维转换。其中参数0.95表示保留95%的信息量进行降维。返回的data_pca就是降维处理后的结果数据。将其转换为DataFrame格式,存储在data_pca_new中。 这样就可以利用PCA对高维数据进行预处理,去除冗余信息,降低维度,减少特征间相关性。 降维比例需要根据实际情况来设置,一般0.9-0.99之间。保留越多信息,降维效果越小。 PCA降维是机器学习中常用的一种维数约简方法,可以有效简化模型,防止过拟合。 大家此时可以看到降维后的数据现在是有118列行数是没有变化的。 #选取前两主成分作图 plt.scatter(data_pca[:,0], data_pca[:,1]) plt.xlabel(PC 1) plt.ylabel(PC 2) plt.show()最后再选取前两个主成分作图进行可视化分析。
http://www.pierceye.com/news/93947/

相关文章:

  • 网站百度地图生成器建设一个网站可以做什么
  • 用阳寿做交易的网站建盏公司简介
  • 机械加工网站哪个好服装设计专业有前途吗
  • 深圳 企业 网站建设哪家好没有域名的网站需要备案吗
  • 深圳返利网站建设扁平化 手机网站首页
  • 郑州核酸点推vip服务网站优化标准
  • 建设银行河南分行网站邢台做网站哪里便宜
  • 网站收录原创文章wordpress新框架vue
  • 中工信融做网站怎么样凡科建站代理平台
  • 网站设计图能用ps做么dedecms 图片网站
  • 自己有服务器怎么做网站wordpress会员卡
  • 网站打不开 ...wordpress 评论表情插件
  • 网站开发框架 Wordpress网站整体设计流程
  • 深圳沙井网站建设网站建设管理工作
  • 网站广告条效果wordpress改关键词
  • 做移动网站首页软截获网站流量怎么做
  • 用dw做网站怎么添加背景图片大连网页制作培训
  • 新网站百度有审核期成都 网站建设培训班
  • 在线购物网站的设计成都网站seo费用
  • 访问国外的网站很慢wordpress 电商主题
  • 免费收录网站推广wordpress打开速度分析
  • 成都网站运营wordpress后台
  • 班级建设网站wordpress获取分类的文章
  • 北京建设官方网站常州做网站那家快
  • 网站建设源码包射阳网页设计
  • 做企业网站备案都需要什么织梦 安装网站
  • 查询网站收录命令用wordPress搭建图片库
  • 网站开发的验收标准给几个网址谢谢
  • 手表网站大全网络推广竞价
  • 中创高科官方网站wordpress 页面添加js