当前位置: 首页 > news >正文

pos机网站模板wordpress 微信授权

pos机网站模板,wordpress 微信授权,自己的网站在哪做的忘了,施工合同电子版在本次分析中#xff0c;我使用了随机森林回归#xff0c;并涉及数据标准化和超参数调优。在这里#xff0c;我使用随机森林分类器#xff0c;对好酒和不太好的酒进行二元分类。首先导入数据包#xff1a;importnumpy as npimportpandas as pdimportmatplotlib.pyplot as …在本次分析中我使用了随机森林回归并涉及数据标准化和超参数调优。在这里我使用随机森林分类器对好酒和不太好的酒进行二元分类。首先导入数据包importnumpy as npimportpandas as pdimportmatplotlib.pyplot as pltimport seaborn as sns导入数据data pd.read_csv(‘winequality-red.csv‘)data.head()data.describe()注释fixed acidity非挥发性酸volatile acidity  挥发性酸citric acid柠檬酸residual sugar 剩余糖分chlorides氯化物free sulfur dioxide 游离二氧化硫total sulfur dioxide总二氧化硫density密度pHpHsulphates硫酸盐alcohol酒精quality质量所有数据的数值为1599所以没有缺失值。让我们看看是否有重复值extra data[data.duplicated()]extra.shape有240个重复值但先不删除它因为葡萄酒的质量等级是由不同的品酒师给出的。数据可视化sns.set()data.hist(figsize(10,10), color‘red‘)plt.show()只有质量是离散型变量主要集中在5和6中下面分析下变量的相关性colormap plt.cm.viridisplt.figure(figsize(12,12))plt.title(‘Correlation of Features‘, y1.05, size15)sns.heatmap(data.astype(float).corr(),linewidths0.1,vmax1.0, squareTrue,linecolor‘white‘, annotTrue)观察:酒精与葡萄酒质量的相关性最高其次是各种酸度、硫酸盐、密度和氯化物。使用分类器将葡萄酒分成两组;“优质”5为“好酒”y data.quality #set ‘quality‘ as targetX data.drop(‘quality‘, axis1) #rest are featuresprint(y.shape, X.shape) #check correctness#Create a new y1y1 (y 5).astype(int)y1.head()# plot histogramax y1.plot.hist(color‘green‘)ax.set_title(‘Wine quality distribution‘, fontsize14)ax.set_xlabel(‘aggregated target value‘)利用随机森林分类器训练预测模型from sklearn.model_selection importtrain_test_split, cross_val_scorefrom sklearn.ensemble importRandomForestClassifierfrom sklearn.metrics importaccuracy_score, log_lossfrom sklearn.metrics import confusion_matrix将数据分割为训练和测试数据集seed 8 #set seed for reproducibilityX_train, X_test, y_train, y_test train_test_split(X, y1, test_size0.2,random_stateseed)print(X_train.shape, X_test.shape, y_train.shape, y_test.shape)对随机森林分类器进行交叉验证训练和评价#Instantiate the Random Forest ClassifierRF_clf RandomForestClassifier(random_stateseed)RF_clf#在训练数据集上计算k-fold交叉验证并查看平均精度得分cv_scores cross_val_score(RF_clf,X_train, y_train, cv10, scoring‘accuracy‘)print(‘The accuracy scores for the iterations are {}‘.format(cv_scores))print(‘The mean accuracy score is {}‘.format(cv_scores.mean()))执行预测RF_clf.fit(X_train, y_train)pred_RF RF_clf.predict(X_test)#Print 5 results to seefor i in range(0,5):print(‘Actual wine quality is‘, y_test.iloc[i], ‘and predicted is‘, pred_RF[i])在前五名中有一个错误。让我们看看指标。print(accuracy_score(y_test, pred_LR))print(log_loss(y_test, pred_LR))print(confusion_matrix(y_test, pred_LR))总共有81个分类错误。与Logistic回归分类器相比随机森林分类器更优。让我们调优随机森林分类器的超参数from sklearn.model_selection importGridSearchCVgrid_values {‘n_estimators‘:[50,100,200],‘max_depth‘:[None,30,15,5],‘max_features‘:[‘auto‘,‘sqrt‘,‘log2‘],‘min_samples_leaf‘:[1,20,50,100]}grid_RF GridSearchCV(RF_clf,param_gridgrid_values,scoring‘accuracy‘)grid_RF.fit(X_train, y_train)grid_RF.best_params_除了估计数之外其他推荐值是默认值。RF_clf RandomForestClassifier(n_estimators100,random_stateseed)RF_clf.fit(X_train,y_train)pred_RFRF_clf.predict(X_test)print(accuracy_score(y_test,pred_RF))print(log_loss(y_test,pred_RF))print(confusion_matrix(y_test,pred_RF))通过超参数调谐射频分类器的准确度已提高到82.5%日志损失值也相应降低。分类错误的数量也减少到56个。将随机森林分类器作为基本推荐器将红酒分为“推荐”(6级以上)或“不推荐”(5级以下)预测准确率为82.5%似乎是合理的。
http://www.pierceye.com/news/428413/

相关文章:

  • jsp页面如何做网站pv统计wordpress4.7.10
  • 澄海网站建设用asp做网站怎么美观
  • 未满18岁能申请网站备案吗网站做qq链接
  • 网络公司网站开发互联网技术专业学什么
  • 校园网站建设详细的设计方案php网站开发实战
  • 网站设计广州量计价格网站可信度建设
  • 门业网站 源码做企业网站必须要座机吗
  • 广东网站开发推荐wordpress快速加载
  • php网站开发外包北京网站建设迈程网络
  • 微信开发者平台取消授权seo资源网站排名
  • 将网站源码下载下来如何使用网站seo链接购买
  • 可信网站认证必须做苏州那里可以建网站
  • 手机网站底部代码有名的网站建设
  • 做一个网站需要多长时间网站制作有哪些种类
  • 做微信推送的网站小刘网站建设
  • 18款禁用软件app网站入口台州网站推广排名
  • 网站的服务内容济南网站制作方案
  • 微网站模板 phpwordpress 支付宝
  • wordpress dux主题破解安装全屏网站 图片优化
  • 一键建站公司做网站 怎么做留言
  • 制作的网站西安网页设计培训哪里有
  • 株洲市住房和城乡建设局门户网站中国建设银行官网站大同
  • 北京响应式网站制作公司wordpress邀请码注册
  • 衡阳网站开发有哪些公司怎么建设淘客自己的网站、
  • 国内扁平化网站欣赏什么站做咨询网站好
  • 评价校园网站建设范例wordpress插件获取数据库
  • 网站开发具体问题重庆装修公司排名前十名
  • 萝卜建站织梦网站采集如何做
  • 邢台在百度上做个网站河南营销网站建设联系方式
  • 电力建设科学技术进步申报网站教学工作总结