当前位置: 首页 > news >正文

本地数据库搭建网站月嫂网站建设

本地数据库搭建网站,月嫂网站建设,陕西防疫最新政策,怎样用ps做电子商务网站目前预测准确度达到77.511%, 会持续优化并且更新。 一、特征工程#xff1a; 1、先对缺失值进行填充#xff0c;先找到缺失值的位置#xff0c;数值型数据填充众数#xff0c;字符数据或者是离散型数据则填充出现最多的数据。 2、标准化数值型数据#xff0c; 根据标准化…目前预测准确度达到77.511%, 会持续优化并且更新。 一、特征工程 1、先对缺失值进行填充先找到缺失值的位置数值型数据填充众数字符数据或者是离散型数据则填充出现最多的数据。 2、标准化数值型数据 根据标准化数据公式 x standardized x − mean ( x ) std ( x ) x_{\text{standardized}} \frac{x - \text{mean}(x)}{\text{std}(x)} xstandardized​std(x)x−mean(x)​ 3、增加特征值 (1) 票价等级将票价大于均值的记为1将票价小于等于均值的记为0分别表示票价高者和票价低者。 (2) 是否存在亲属将有亲属的标记位1无亲属的标记为0。 (3) 同船亲属的数量将同船的有关系的人数加起来并且初始化这一列数据。 (4) 同船亲属的数量等级求出同船亲属数量大于同船亲属数量的均值记为1小于等于同船亲属数量记为0。 (5) 通过对字符型数据也就是name那一列的观察与处理发现会有三种不同的称呼: “Mrs”, “Miss”, “Mr”分别记为0, 1, -1。 (6) 年龄级别: 将大于平均年龄的记为1,小于等于平均年龄的记为0 (7) 还在思考后续会进行补充… 特征工程代码实现 from sklearn.preprocessing import StandardScaler us_list [舱位等级, 性别, 年龄, 同船的兄弟姐妹/配偶数量, 同船的父母/孩子数量, 船票号码, 票价, 船舱号码, 登船港口] #处理数据 def Work_Data(df):List1 [] for i in df.index:# print(df.loc[i, 姓名])ustr str(df.loc[i, 姓名])if ustr.find(Mrs) 0:List1.append(1) elif ustr.find(Miss):List1.append(2) else:List1.append(0) df[称呼] List1for i in df.columns:us df[i].mode()[0] df[i].fillna(us, inplace True) if isinstance(list(df[i])[0], (int, float)):continuedic dict() idx 0 for j in set(df[i]): dic[j] idxidx 1 for j in df.index:df.loc[j, i] dic[df.loc[j, i]] List1 [] for i in df.index:if df.loc[i,同船的兄弟姐妹/配偶数量] 0 or df.loc[i,同船的父母/孩子数量] 0:List1.append(1)else:List1.append(0) df[是否存在亲属] List1List1 [] arg_pj sum(list(df3[票价])) / len(list(df3[票价])) for i in df.index:if df.loc[i, 票价] arg_pj:List1.append(1)else:List1.append(0) df[票价等级] List1us [] for i in df.index:us.append(df.loc[i, 同船的兄弟姐妹/配偶数量] df.loc[i, 同船的父母/孩子数量]) x sum(us) / len(us)List1 [] for i in us:if i x:List1.append(1)else:List1.append(0) df[同船亲属的数量等级] List1List1 [] for i in df.index:List1.append(df.loc[i, 同船的兄弟姐妹/配偶数量] df.loc[i, 同船的父母/孩子数量]) df[同船有关系的人的数量] List1 List1 []x sum(df[年龄]) / len(df[年龄]) for i in df.index:if df.loc[i, 年龄] x:List1.append(1) else:List1.append(0) df[年龄级别] List1 for i in [年龄, 票价]:scaler StandardScaler()x [[x] for x in df[i]]# 首先拟合 StandardScaler 对象scaler.fit(x)# 使用 transform 方法对数据进行标准化x scaler.transform(x)us []for j in x:for k in j:us.append(k) df[i] usreturn df 二、从数据中处理出测试集和训练集带入模型中 1、先求出测试数据和训练数据 df Work_Data(df3) df3 Work_Data(df3) train_x, train_y [], [] us_list.append(票价等级) us_list.append(是否存在亲属) us_list.append(同船亲属的数量等级) us_list.append(称呼) us_list.append(同船有关系的人的数量) us_list.append(年龄级别) for i in df.index:uslist [] for j in us_list:uslist.append(df.loc[i,j]) train_x.append(uslist) train_y.append(df.loc[i,是否生还])# 构造测试集合 test_x [] df Work_Data(df2) df2 Work_Data(df2) for i in df.index:uslist [] for j in us_list:uslist.append(df.loc[i,j]) test_x.append(uslist) 2、模型带入 (1) 逻辑回归: 研究了一下逻辑回归处理离散型数据的方法处理离散型数据的逻辑回归方法与处理连续型数据的逻辑回归方法类似 数据预处理 确保数据中的离散型特征已经被编码为数值类型。可以使用独热编码、标签编码等方法将离散型特征转换为数值型特征。 模型训练 使用逻辑回归模型训练数据。逻辑回归模型的目标是找到最佳的参数系数以最大化似然函数或最小化损失函数。通常使用梯度下降等优化算法来训练模型。 模型评估 使用测试集评估模型的性能。可以使用各种评估指标如准确率、精确率、召回率、F1 分数等来评估模型的性能。 调整模型 根据评估结果可能需要调整模型的超参数或特征工程方法以提高模型的性能。 解释结果 分析模型的系数了解离散型特征对目标变量的影响。系数的正负和大小可以告诉我们特征对目标变量的影响程度。 总之对于二分类问题无论是离散型数据还是连续型数据逻辑回归都是报错的选择, 因为它都有自己的处理方法。 # 训练逻辑回归模型 import numpy as np from sklearn.linear_model import LogisticRegression from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.metrics import accuracy_score# 特征缩放 scaler StandardScaler() X_train_scaled scaler.fit_transform(train_x) X_test_scaled scaler.transform(test_x)# 初始化逻辑回归模型 log_reg LogisticRegression()# 拟合模型 log_reg.fit(X_train_scaled, train_y)# 预测测试集 y_pred log_reg.predict(X_test_scaled)(2) 随机森林 #随机森林 from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_scoreclf RandomForestClassifier(n_estimators1000, random_state42)# 在训练集上拟合模型 clf.fit(train_x, train_y)# 在测试集上做出预测 y_pred clf.predict(test_x)import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense 随缘更新…
http://www.pierceye.com/news/591595/

相关文章:

  • 做的网站浏览器提示不安全网站开发四川
  • 高端网站设计有哪些企业网站开发php
  • php网站模块网站建设协议 模板
  • 怎么做像知乎一样的网站网络营销案例分析模板
  • 网站开发 h5 h4网站运作模式
  • 竞彩网站开发那些市区做网站群
  • 建投五公司网站找苏州网站建设
  • 徐州IT兼职网站开发中国做陶壶的网站有哪些
  • WordPress模板转换typecho郑州搜索引擎优化
  • 个人怎么做贷款网站什么是网络营销产品
  • 网站你的后台管理系统用什么做外包公司与劳务派遣区别
  • 设计师资源网站价格低油耗低的车
  • 中山快速做网站服务wordpress建站ftp
  • 做酒类直供网站行吗网站seo检测报告
  • 南昌建站费用网站建设出错1004
  • 十堰做网站的公司阿里巴巴外贸网站论坛
  • 品牌网站建设代理网站建设公司易下拉软件
  • 移动网站模板响应式网站开发教程pdf
  • 怎么设计网站内容小程序seo帝搜软件sem880官网
  • 十堰秦楚网 十堰新闻门户网站wordpress 点赞 开启
  • 做外贸网站需要注意些什么手续安阳吧贴吧
  • 国外申请域名的网站百度标记号码认证平台
  • 专门做淘宝代运营的网站支付建设网站的费用什么科目
  • 天津企业设计网站建设建个网站做外贸
  • 申请永久网站空间wordpress论坛采集
  • 网站如何做竞价佛山新网站建设机构
  • 网站建设费可以一次性冲费用吗学校门户网站作用
  • 手机上怎么制作网站音乐网站如何建立
  • 新乡企业网站建设公司寮步东莞网站建设
  • wordpress中国网站排名如何加入广告联盟赚钱