ps网站设计怎么做,纯html5网站,WordPress手机写文章,网站的策划书机器学习项目的完整周期
第一步#xff0c;决定项目是什么。第二步#xff0c;收集数据。第三步#xff0c;训练模型#xff0c;进行错误分析并改进模型#xff0c;可能会回到第二步。第四步#xff0c;当模型足够好后#xff0c;部署在生产环境中#xff0c;继续监控…机器学习项目的完整周期
第一步决定项目是什么。第二步收集数据。第三步训练模型进行错误分析并改进模型可能会回到第二步。第四步当模型足够好后部署在生产环境中继续监控性能并维护模型以防性能下降可能会回到第二步或第三步。 部署在生产环境中的常见方法将模型部署在服务器中并在应用程序中通过API调用最后返回模型的预测根据生产环境是服务于少数几个用户还是几百万个用户软件工程的需求也有所不同确保可靠和有效的预测输出大量用户的扩展记录用户输入输出数据系统监控模型更新等。
精确度和召回率
对于倾斜数据集正面例子比反面例子不是5050我们通常不使用分类错误而使用其他错误度量精确度、召回率来衡量模型的表现如上图对于只有0.5%的人患有罕见病的情况如果我们的模型的分类错误率有1%而一个只会输出y0的模型的分类错误率却仅有0.5%这很明显我们的模型还是能判断出一些罕见病因此表现要比只会输出y0的模型要好但通过分类错误值却不容易判断 左图为混淆矩阵分别将真实分类和预测分类填入矩阵中四个区域分别为真阳性True positive真阴性True negative假阳性False positive假阴性False negative精确度为在所有我们预测y1的例子中真正为y1的概率有多少。即 True positive / Predicted Class召回率为在所有真正为y1的例子中我们预测y1的概率有多少。即True positive / Actual Class如果该模型一个y1的例子都预测不出来那我们说该模型的精确度为零虽然此时精确度为 0 / 0 无定义零召回率和零精确度都能表示该模型不是一个很好的模型所以我们要求召回率和精确度都很高Precision很高说话靠谱Recall很高遗漏很少 我们可以通过取不同的阈值来选择不同的精确度和召回率。通常对大多数学习算法来说当阈值越高精确度越高召回率越低当阈值越低精确度越低召回率越高。
F1分数
如果通过精确度和召回率不容易判断模型的好坏我们可以合并精确度和召回率即取它俩的调和平均数F1通过F1的值来判断模型的好坏调和平均数是强调较小值的平均数