上市公司网站建设要求,智慧团建官网登录口入口,温州营销网站制作联系电话,有的网站打不开 但别人电脑能打开一、背景问题 有时候会遇到这样一种情况#xff0c;构建异常检测系统的时候也使用了少量带标签的数据#xff0c;既然使用了带标签的数据#xff0c;那么就和监督学习有点类似#xff0c;那为什么不用监督学习呢#xff1f;
二、异常检测任务的特殊性 在构建异常检测系统…一、背景问题 有时候会遇到这样一种情况构建异常检测系统的时候也使用了少量带标签的数据既然使用了带标签的数据那么就和监督学习有点类似那为什么不用监督学习呢
二、异常检测任务的特殊性 在构建异常检测系统的过程中有时我们会面临这样的场景虽然仅采用了少量带标签的数据但这已经引入了某种程度上的监督信号这与纯无监督异常检测方法有所不同。尽管如此我们并未完全采用传统意义上的有监督学习方法原因在于
数据集不平衡 异常检测通常面对的是不平衡的数据集其中正常数据大量存在而异常数据相对稀缺。这种不平衡导致使用传统有监督学习方法变得不合理因为模型很可能会倾向于将大多数样本归类为主导的正常类别而忽略稀有的异常类别。
异常事件少见且多样 异常检测任务里很难获取到足够多且具有代表性的异常标签数据因为异常事件发生的频次低并且类型可能多种多样和未知。无法获取足够数量且全面覆盖各种异常类型的标签数据来实施严格的有监督学习。
三、异常检测与监督学习对比 一句话先把最重要的说出来“异常检测要检测出那些之前从来都没见过的异常有监督无法做到他只能识别出训练集中出现过的异常”
异常检测监督学习非常少量的正类异常数据y1大量的负类正常数据y0同时有大量的正类和负类遍历许多不同种类的异常非常难只能根据少量正类数据训练算法未来遇到的异常可能与已经掌握的异常十分不同有足够多的正类足以训练算法未来遇到的正类数据可能与训练集中的十分相似欺诈行为检测、工业缺陷检测等等天气预报、肿瘤分类等等