当前位置: 首页 > news >正文

化妆培训网站 源码网站维护中怎么解决

化妆培训网站 源码,网站维护中怎么解决,厦门网站建设公司推荐,郑州正规公司网站建设服务医学预测变量筛选的几种方法#xff08;R语言版#xff09; 预测变量筛选是机器学习中的一个重要环节#xff0c;它可以帮助我们识别出与目标变量最相关的特征#xff0c;从而提高模型的预测精度和解释性。在医学领域#xff0c;预测变量筛选可以用于疾病诊断、预后评估、…医学预测变量筛选的几种方法R语言版 预测变量筛选是机器学习中的一个重要环节它可以帮助我们识别出与目标变量最相关的特征从而提高模型的预测精度和解释性。在医学领域预测变量筛选可以用于疾病诊断、预后评估、个性化治疗等方面。 目前 多种预测变量筛选方法每种方法都有其特点。本文将介绍几种常用的R语言方法包括 线性模型相关的 逐步法Lasso回归法 树形模型相关的 Boruta法SHAP法 通用型 RFE 1. 线性模型相关方法 1.1 逻辑回归的逐步法 逐步法是一种经典的变量筛选方法它通过不断迭代的方式逐步加入或剔除变量最终找到一个最优的变量子集。逐步法有两种常见的形式 前向逐步回归从一个包含所有变量的模型开始每次迭代加入一个与目标变量最相关的变量直到达到停止条件。后向逐步回归从一个包含所有变量的模型开始每次迭代剔除一个与目标变量最不相关的变量直到达到停止条件。 逐步法的优点是简单易懂计算效率高。缺点是容易陷入局部最优并且不能很好地处理多重共线性问题。这里是用的是R语言的klaR包主要进行逻辑回归的逐步法其中又包括两种算法stepclass和greedy.wilks。 library(klaR) library(MASS) #criterion:A list with elements:CR:Correctness Rate;AC:Accuracy;AS:Ability to Seperate;CF:Confidence;CFvec:Confidence for each (true) class sc_obj - stepclass(class ~ ., data data, method qda,criterion AS) sc_obj1.2 Lasso回归法 Lasso回归法是一种基于L1正则化的回归方法它可以同时进行变量筛选和系数估计。Lasso回归的惩罚项会使部分系数变为0从而实现变量筛选。 Lasso回归的优点是能够有效地处理多重共线性问题并且具有较好的泛化能力。缺点是可能无法选择出所有重要的变量。 这里主要用到的包是glmnet。 library(glmnet) #glmnet要求的数据格式,释放出分类变量的各个类别 ydata_one_hot%%dplyr::select(contains(class))%%as.matrix() xdata_one_hot%%dplyr::select(!contains(class))%%as.matrix() #cv获取lambda的取值范围 lasso_cvcv.glmnet(x,y,familybinomial,type.measuredeviance) plot(lasso_cv) # tidy(lasso_cv) lassoglmnet(x,y,familybinomial,lambdac(lasso_cv$lambda.min,lasso_cv$lambda.1se)) plot(lasso,xvarlambda,labelTRUE) coef(lasso)2. 树形模型相关方法 2.1 Boruta法 Boruta法是一种基于随机森林的变量筛选方法。它通过构建多个随机森林模型并比较每个变量在不同模型中的重要性来判断该变量是否重要。 Boruta法的优点是能够有效地处理非线性关系并且可以用于处理高维数据。缺点是计算效率较低。 R语言中的Boruta包可以实现。 library(Boruta) set.seed(1) boruta_obj-Boruta(class ~.,datadata,doTrace0,ntree500,pValue0.001) print(TentativeRoughFix(boruta_obj))#分两类 print(boruta_obj)#三类包含怀疑的数据2.2 SHAP法 SHAP法是一种基于SHAP值SHapley Additive Explanations的变量解释方法。SHAP值可以解释每个变量对模型预测结果的贡献。 SHAP法可以用于变量筛选通过比较不同变量的SHAP值大小来判断该变量的重要性。SHAP法的优点是能够解释模型的预测结果并且具有较好的可解释性。缺点是计算效率较低。 R语言的shapviz包可以实现SHAP值的计算和可视化。 shp - shapviz(extract_fit_engine(lightgbm_final_fit), X_pred data.matrix(data[,-9]),Xdata) # svg(shap_plot_N_M.svg) sv_importance(shp,kindboth,show_numbers TRUE,number_size 5)theme(axis.textelement_text(size14),axis.title.x element_text(size14)) # dev.off()3. RFE 通过改变rfeControl函数中的functions参数可以选定各种模型 library(caret) # 设置rfe的选项 set.seed(1) rfeControl rfeControl(functions gamFuncs,method cv, # 默认自助法重采样 bootsaveDetails F, # 保存预测值和变量重要性number 5, # 重抽样次数allowParallel F # 允许多线程用这个之前你要先准备好多线程) set.seed(1) gamProfile - rfe(class~., data,sizes c(1:8),rfeControl rfeControl) gamProfile以上介绍了五种常用的预测变量筛选方法每种方法都有其优缺点。在实际应用中可以根据具体情况选择合适的方法。文中代码为部分代码完整的代码参见可一键运行。和鲸社区代码示例
http://www.pierceye.com/news/874557/

相关文章:

  • 建设网站基础医疗网站建设比较好的
  • 建个网站视频教程小程序开发是前端还是后端
  • 广州分享网站建设网站速度查询
  • 做电商网站价钱传奇类网页游戏大全
  • 如何选择南京网站建设网站制作能赚多少钱
  • 一站式网站设计已有域名如何在花生壳网站做二级域名托管
  • 哪个网站可以接图纸做返利网站怎么做的
  • 旅游网站建设国内外现状辽阳专业建设网站公司
  • 免费视频模板网站wordpress不写代码
  • 设计网站公司 露 联湖南岚鸿小程序网站开发公司
  • 聊城网站设计seo公司重庆
  • 网站布局技术厦门网站建设680元
  • 深圳物流公司网站建e网怎么做效果图
  • 做营销网站公司建个个人网站一年多少钱
  • 阆中网站网站建设代理网络服务器
  • 企业网站新模式seo排名推广工具
  • 山东做网站三五个人网页设计作品简单
  • 福州网站建设软件网站做了301怎么查看跳转前网站
  • 网站开发竞品分析网站开发与规划
  • 香山红叶建设有限公司网站网络营销方式落后的表现
  • 合肥百姓网网站建设263云通信官方网站
  • 深圳建设网站seo 手机电商数据分析师
  • 网站内外链怎么做公司建设包括哪些方面
  • 织梦网站环境搭建电子邮件怎么注册
  • 企业营销类专业网站app设计尺寸规范
  • 奈曼旗建设局网站建设旅游门户网站
  • 网站设计一般会遇到哪些问题wordpress文章关闭缩略图
  • 优质东莞网站制作公司thinkphp网站源码下载
  • 公司网站做一下多少钱最吉利旺财的公司名字
  • 网站建设维护及使用管理办法营销策划的步骤