当前位置: 首页 > news >正文

微信红包网站制作服务好的扬中网站优化

微信红包网站制作,服务好的扬中网站优化,合肥建站免费模板,seo引擎优化工具数据归一化与标准化 数据预处理是机器学习和数据分析中非常重要的一环#xff0c;它能够有效地提高模型的性能和准确度。在数据预处理的过程中#xff0c;数据归一化和标准化是两个常用的技术#xff0c;它们可以将数据转换成一定的标准形式#xff0c;有助于模型更好地学…数据归一化与标准化 数据预处理是机器学习和数据分析中非常重要的一环它能够有效地提高模型的性能和准确度。在数据预处理的过程中数据归一化和标准化是两个常用的技术它们可以将数据转换成一定的标准形式有助于模型更好地学习数据的分布和特征。 1. 数据归一化 数据归一化也称为最大-最小缩放是一种线性转换方法将原始数据缩放到一个特定的范围通常是[0, 1]。其转换公式如下 X n o r m X − X m i n X m a x − X m i n X_{norm} \frac{X - X_{min}}{X_{max} - X_{min}} Xnorm​Xmax​−Xmin​X−Xmin​​ 其中 X n o r m X_{norm} Xnorm​ 是归一化后的数据 X X X 是原始数据 X m i n X_{min} Xmin​ 和 X m a x X_{max} Xmax​ 分别是原始数据的最小值和最大值。 优点 消除量纲影响数据归一化可以消除原始数据的量纲影响确保所有特征在相同的范围内。这有助于避免某些特征对模型训练产生过大的影响导致模型过于依赖某个特征。加速模型收敛数据归一化可以使模型更快地收敛特别是对于基于梯度的优化算法如梯度下降算法。由于所有特征都在相同的尺度上模型能够更快地找到最优解。 缺点 异常值敏感数据归一化容易受到异常值的影响。如果原始数据中存在异常值它们的缩放范围可能会显著影响归一化结果导致大部分数据集中在较小的范围内。边界效应数据归一化会将最大值和最小值映射到[0, 1]之间当新数据落在比训练集中的最大/最小值还大或还小时会导致数据无法正确归一化。 2. 数据标准化 数据标准化也称为零-均值标准化是一种将原始数据转换成均值为0标准差为1的标准正态分布的方法。其转换公式如下 X s t d X − μ σ X_{std} \frac{X - \mu}{\sigma} Xstd​σX−μ​ 其中 X s t d X_{std} Xstd​ 是标准化后的数据 X X X 是原始数据 μ \mu μ 是原始数据的均值 σ \sigma σ 是原始数据的标准差。 优点 消除量纲影响数据标准化能够消除原始数据的量纲影响确保所有特征都具有相同的尺度有助于避免某些特征对模型训练产生过大的影响。减少异常值影响由于数据标准化是基于数据的均值和标准差进行缩放因此对于存在异常值的数据集标准化能够减少异常值对模型训练的影响。 缺点 信息损失数据标准化会改变原始数据的分布将其转换为均值为0方差为1的正态分布。这可能导致一定程度的信息损失尤其在一些需要保留原始数据分布信息的场景下可能影响模型表现。不适用于稀疏数据对于稀疏数据由于大部分元素为0计算得到的标准差可能为0从而导致无法进行标准化。 3. 实战项目与代码演示 在这个实战项目中我们将使用Python和scikit-learn库来演示数据归一化和标准化的应用。 import numpy as np from sklearn.datasets import load_iris from sklearn.preprocessing import MinMaxScaler, StandardScaler from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score# 加载数据集 iris load_iris() X, y iris.data, iris.target# 将数据集分为训练集和测试集 X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42)# 使用数据归一化 scaler MinMaxScaler() X_train_normalized scaler.fit_transform(X_train) X_test_normalized scaler.transform(X_test)# 使用数据标准化 std_scaler StandardScaler() X_train_standardized std_scaler.fit_transform(X_train) X_test_standardized std_scaler.transform(X_test)# 使用逻辑回归模型 model LogisticRegression()# 拟合归一化后的数据并预测 model.fit(X_train_normalized, y_train) y_pred_normalized model.predict(X_test_normalized) accuracy_normalized accuracy_score(y_test, y_pred_normalized)# 拟合标准化后的数据并预测 model.fit(X_train_standardized, y_train) y_pred_standardized model.predict(X_test_standardized) accuracy_standardized accuracy_score(y_test, y_pred_standardized)print(Accuracy with normalization:, accuracy_normalized) print(Accuracy with standardization:, accuracy_standardized)在这个实例中我们使用了鸢尾花数据集对特征进行了数据归一化和标准化并分别使用了逻辑回归模型进行了测试。 结论 数据归一化和标准化都是常用的数据预处理技术它们能够消除特征之间的量纲影响加速模型收敛提高模型性能。在实际应用中我们需要根据数据的具体情况选择适合的方法。对于异常值较多的数据集数据标准化可能更合适而对于稀疏数据数据归一化可能更为有效。在进行特征工程时应该尝试不同的预处理方法并结合模型的表现来做出最佳选择。
http://www.pierceye.com/news/671417/

相关文章:

  • 深圳市南山区住房和建设局网站国内知名网站建设伺
  • 企业网站建设制作的域名费用做的网站怎么上传
  • c++可视化界面设计搜索引擎优化自然排名的区别
  • 网站开发工作网络营销的网站分类有
  • 校园网上零售网站建设方案网站建设中页面模板
  • 网站如何报备外贸网站设计风格
  • 网上的网站模板怎么用百度网站认证官网
  • 上饶企业网站建设免费制作小程序游戏
  • cps推广网站建e网卧室设计效果图
  • php支持大型网站开发吗南海最新消息
  • 多语言企业网站html网站素材
  • 网站建设留言板怎么做优必选网站
  • 深圳建网建网站南博网站建设
  • 如何做防水网站一般网站做响应式吗
  • 回收手机的网站哪家好学生个人网页
  • 优秀甜品网站最有前景的十大行业
  • 手册设计南宁seo网站排名优化公司
  • 国外做科普视频的网站郑州做营销型网站的公司
  • 雄安网站设计制作即时灵感网站
  • 自己怎么优化网站排名wordpress 自动超链接
  • 建设工程安全监督备案网站wordpress最简易主题
  • 集客营销软件官方网站如何开发微信微网站
  • 青岛谁优化网站做的好微营销工具
  • 怎么才能建立一个网站卖东西php做网站用html做吗
  • 西安公司网站设计费用免费外国网站浏览器
  • 如何加快网站打开速度浦东新区建设机械网站
  • 求网站制作焦作网站建设的公司
  • 用python做网站不常见久久建筑网外墙岩棉保温板施工工艺
  • 做刷票的网站广告牌的样式大全
  • 手机登录网站怎么建设网站风格和功能设计方案