当前位置: 首页 > news >正文

深圳品牌网站建设公司有哪些网站怎么做双机房切换

深圳品牌网站建设公司有哪些,网站怎么做双机房切换,公司建设网站哪家好,seo网站基础建设基本路线#xff1a; 1.搭建环境/数据读入 2.数据分析 3.特征工程 4.建模调参 5.模型融合 异常处理#xff1a; 通过箱线图#xff08;或 3-Sigma#xff09;分析删除异常值#xff1b;BOX-COX 转换#xff08;处理有偏分布#xff09;#xff1b;长尾截断…基本路线 1.搭建环境/数据读入 2.数据分析 3.特征工程 4.建模调参 5.模型融合 异常处理 通过箱线图或 3-Sigma分析删除异常值BOX-COX 转换处理有偏分布长尾截断 特征筛选常用方法 过滤式filter先对数据进行特征选择然后在训练学习器常见的方法有 Relief/方差选择发/相关系数法/卡方检验法/互信息法包裹式wrapper直接把最终将要使用的学习器的性能作为特征子集的评价准则常见方法有 LVMLas Vegas Wrapper 嵌入式embedding结合过滤式和包裹式学习器训练过程中自动进行了特征选择常见的有 lasso 回归 调参三种方法 贪心 局部最优解 网格 def grid_search(command_dict, tmux_namesearch):server libtmux.Server()sess server.new_session(tmux_name)for i, (name, command_) in enumerate(command_dict.items()):if i 0:window sess.windows[-1]else:window sess.new_window()window.rename_window(name)pane window.panes[0]pane.send_keys(command_)def search_lr():搜索最优学习率devices [1, 3, 4]command_dict {} for i, lr in enumerate([1e-6, 1e-5, 1e-4]):name flr_{lr}command_dict[name] fCUDA_VISIBLE_DEVICES{devices[i]} python train.py train train.lr {lr} output_dir ../outputs/grid_attr_lr_{lr}grid_search(command_dict, search_lr)search_lr()贝叶斯 定义优化函数 def rf_cv_lgb(num_leaves, max_depth, bagging_fraction, feature_fraction, bagging_freq, min_data_in_leaf, min_child_weight, min_split_gain, reg_lambda, reg_alpha):# 建立模型model_lgb lgb.LGBMClassifier(boosting_typegbdt, bjectivebinary, metricauc,learning_rate0.1, n_estimators5000,num_leavesint(num_leaves), max_depthint(max_depth), bagging_fractionround(bagging_fraction, 2), feature_fractionround(feature_fraction, 2),bagging_freqint(bagging_freq), min_data_in_leafint(min_data_in_leaf),min_child_weightmin_child_weight, min_split_gainmin_split_gain,reg_lambdareg_lambda, reg_alphareg_alpha,n_jobs 8)val cross_val_score(model_lgb, X_train_split, y_train_split, cv5, scoringroc_auc).mean()return val定义优化参数并开始优化 from bayes_opt import BayesianOptimization 定义优化参数 bayes_lgb BayesianOptimization(rf_cv_lgb, {num_leaves:(10, 200),max_depth:(3, 20),bagging_fraction:(0.5, 1.0),feature_fraction:(0.5, 1.0),bagging_freq:(0, 100),min_data_in_leaf:(10,100),min_child_weight:(0, 10),min_split_gain:(0.0, 1.0),reg_alpha:(0.0, 10),reg_lambda:(0.0, 10),} )开始优化 bayes_lgb.maximize(n_iter10)根据优化后的参数建立新的模型降低学习率并寻找最优模型迭代次数 调整一个较小的学习率并通过cv函数确定当前最优的迭代次数 base_params_lgb {boosting_type: gbdt,objective: binary,metric: auc,learning_rate: 0.01,num_leaves: 14,max_depth: 19,min_data_in_leaf: 37,min_child_weight:1.6,bagging_fraction: 0.98,feature_fraction: 0.69,bagging_freq: 96,reg_lambda: 9,reg_alpha: 7,min_split_gain: 0.4,nthread: 8,seed: 2020,silent: True,verbose: -1, }cv_result_lgb lgb.cv(train_settrain_matrix,early_stopping_rounds1000, num_boost_round20000,nfold5,stratifiedTrue,shuffleTrue,paramsbase_params_lgb,metricsauc,seed0 )print(迭代次数{}.format(len(cv_result_lgb[auc-mean]))) print(最终模型的AUC为{}.format(max(cv_result_lgb[auc-mean])))迭代次数已经确定建立最终模型并对验证集进行验证 import lightgbm as lgb 使用lightgbm 5折交叉验证进行建模预测 cv_scores [] for i, (train_index, valid_index) in enumerate(kf.split(X_train, y_train)):print(************************************ {} ************************************.format(str(i1)))X_train_split, y_train_split, X_val, y_val X_train.iloc[train_index], y_train[train_index], X_train.iloc[valid_index], y_train[valid_index]train_matrix lgb.Dataset(X_train_split, labely_train_split)valid_matrix lgb.Dataset(X_val, labely_val)params {boosting_type: gbdt,objective: binary,metric: auc,learning_rate: 0.01,num_leaves: 14,max_depth: 19,min_data_in_leaf: 37,min_child_weight:1.6,bagging_fraction: 0.98,feature_fraction: 0.69,bagging_freq: 96,reg_lambda: 9,reg_alpha: 7,min_split_gain: 0.4,nthread: 8,seed: 2020,silent: True,}model lgb.train(params, train_settrain_matrix, num_boost_round14269, valid_setsvalid_matrix, verbose_eval1000, early_stopping_rounds200)val_pred model.predict(X_val, num_iterationmodel.best_iteration)cv_scores.append(roc_auc_score(y_val, val_pred))print(cv_scores)print(lgb_scotrainre_list:{}.format(cv_scores)) print(lgb_score_mean:{}.format(np.mean(cv_scores))) print(lgb_score_std:{}.format(np.std(cv_scores)))确定最后模型 并使用验证集进行模型预测 预测并计算roc的相关指标 val_pre_lgb final_model_lgb.predict(X_val) fpr, tpr, threshold metrics.roc_curve(y_val, val_pre_lgb) roc_auc metrics.auc(fpr, tpr) print(调参后lightgbm单模型在验证集上的AUC{}.format(roc_auc)) 画出roc曲线图 plt.figure(figsize(8, 8)) plt.title(Validation ROC) plt.plot(fpr, tpr, b, label Val AUC %0.4f % roc_auc) plt.ylim(0,1) plt.xlim(0,1) plt.legend(locbest) plt.title(ROC) plt.ylabel(True Positive Rate) plt.xlabel(False Positive Rate) # 画出对角线 plt.plot([0,1],[0,1],r--) plt.show()保存模型到本地 # 保存模型 import pickle pickle.dump(final_model_lgb, open(dataset/model_lgb_best.pkl, wb))模型融合 简单加权融合: 回归分类概率算术平均融合Arithmetic mean几何平均融合Geometric mean分类投票Voting)综合排序融合(Rank averaging)log融合 stacking/blending: 构建多层模型并利用预测结果再拟合预测。stacking个人理解第一层由多个基学习器组成其输入为原始训练集第二层的模型则是以第一层基学习器的输出作为特征加入训练集进行再训练从而得到完整的模型。Blending个人理解与stacking不同的是第一层取一部分第二层取另一部分 boosting/bagging: boosting 从原始样本集中抽取训练集。每轮从原始样本集中使用Bootstraping的方法抽取n个训练样本在训练集中有些样本可能被多次抽取到而有些样本可能一次都没有被抽中。共进行k轮抽取得到k个训练集。k个训练集之间是相互独立的 每次使用一个训练集得到一个模型k个训练集共得到k个模型。注这里并没有具体的分类算法或回归方法我们可以根据具体问题采用不同的分类或回归方法如决策树、感知器等 对分类问题将上步得到的k个模型采用投票的方式得到分类结果对回归问题计算上述模型的均值作为最后的结果。所有模型的重要性相同 bagging AdaBoosting方式每次使用的是全部的样本每轮训练改变样本的权重。下一轮训练的目标是找到一个函数f 来拟合上一轮的残差。当残差足够小或者达到设置的最大迭代次数则停止。Boosting会减小在上一轮训练正确的样本的权重增大错误样本的权重。对的残差小错的残差大 梯度提升的Boosting方式是使用代价函数对上一轮训练出的模型函数f的偏导来拟合残差。
http://www.pierceye.com/news/334246/

相关文章:

  • 分析影响网站排名的因素河南省住房和城乡建设厅网站文件
  • 宁城网站建设公司引流最好的推广方法
  • 辽宁省建设厅官方网站网站免费正能量直接进入浏览器下载安装
  • 怎么给公司建网站广州互联网营销师培训
  • 用阿里云做网站注意事项绵阳的网站建设公司哪家好
  • 电商网站设计工作内容深圳国际设计学院
  • 国内界面优秀的网站科技有限公司名字叫什么好
  • 网站底部悬浮代码搭建网站的主要风险
  • 长安网站建设公司常做网站首页的文件名
  • 学网站开发的能找什么工作赣州网站设计较好的公司
  • 网站建设接单微信营销软件收费排行榜
  • 佛山网站建设公司排名佛山微网站推广哪家专业
  • 招商网站建设网设备 光速东莞网站建设
  • 网站建设公司如何wordpress用多大主机
  • 东莞网站建设规范网页美工设计(第2版)素材
  • 论文 网站建设值得推荐的深圳app外包公司
  • 建网站的电脑可以换位置吗莆田建站培训
  • 外贸必看网站离职模板网
  • 内网网站建设正能量不良网站软件下载
  • 制作手机广告的网站吉林省建设厅网站评职称系统
  • 云南建设厅网站资质证书查询自动生成app
  • 柳州正规网站制作公司大连建设厅网站
  • 北京市保障房建设投资中心网站瘫痪广州大型网站建设公司排名
  • 做电池网站的引导页室内设计联盟效果图
  • 查询备案网站成绩查询系统网站开发
  • 网站后台编辑器上传不了图片建筑工程承包网app
  • wordpress多站点插件168工程信息网
  • 网站工信部备案号没有ftp wordpress
  • 家装公司网站建设网站建立网站有免费的吗
  • 网站后台添加投票系统wordpress mip改造