当前位置: 首页 > news >正文

中国e网网站建设重庆网站建设冒号

中国e网网站建设,重庆网站建设冒号,做网站小图片分类,深圳建网站哪个济南兴田德润有活动吗1. 简介 单类支持向量机#xff0c;简称One-Class SVM(One-Class Support Vector Machine)#xff0c;用于异常检测和离群点检测(无监督学习#xff0c;其他svm属于有监督的)#xff0c;可以在没有大量异常样本的情况下有效地检测异常。其目标是通过仅使用正常数据来建模简称One-Class SVM(One-Class Support Vector Machine)用于异常检测和离群点检测(无监督学习其他svm属于有监督的)可以在没有大量异常样本的情况下有效地检测异常。其目标是通过仅使用正常数据来建模识别出与正常模式不同的异常数据点。其在处理高维数据和非常稀疏的异常检测问题时非常有用。 严格来说OCSVM不是一种outlier detection而是一种奇异点检测(novelty detection)方法它的训练集不应该掺杂异常点因为模型可能会去匹配这些异常点。但在数据维度很高或者对相关数据分布没有任何假设的情况下OCSVM也可以用于outlier detection。 1. novelty detection: 当训练数据中没有离群点我们的目标是用训练好的模型去检测另外发现的新样本2. outlier detection: 当训练数据中包含离群点模型训练时要匹配训练数据的中心样本忽视训练样本中的其他异常点。 在one-class classification中仅仅只有一类的信息是可以用于训练其他类别的(总称outlier)信息是缺失的也就是区分两个类别的边界线是通过仅有的一类数据的信息学习得到的。对比与有正负样例的二分类SVMOCSVM可以训练出一个高维超球面把数据尽可能紧的包围起来。二分类不但能识别是否为目标类别还能输出样本具体类别而单分类只需判断是否为目标类别即可。 2. 基本原理 算法思路 就是寻找一个超平面将样本中的正例圈出来(该超平面将正常样本和异常样本分隔开)预测就是用这个超平面做决策在圈内的样本就认为是正样本。这个超平面被称为“分割超平面”并且由支持向量支持即最靠近分割超平面的正常样本点。具体算法描述:   没有类别标签如何寻找划分的超平面以及寻找支持向量机呢一种特别的思想SVDD我们期望所有不是异常的样本都是正类别同时它采用一个超球体而不是一个超平面来做划分该算法在特征空间中获得数据周围的球形边界期望最小化这个超球体的体积从而最小化异常点数据的影响。 它通过构造原点与单类训练数据之间的超平面进而可以判断测试数据与单类训练数据之间相似与否如果测试集数据与单类训练数据相似则可以将其归为相似样本记为1如果测试集数据与单类训练集数据不相似则记为-1。由于其可以通过超平面的构建发现待预测数据与训练集数据“相似与否”进而该模型可以用作异常点检测。 1. 数据映射 -- 核函数 OCSVM使用核函数来将数据映射到高维空间。常用的核函数包括线性核、多项式核和高斯核。这些核函数允许OCSVM在原始特征空间中找到非线性分割超平面。但由于核函数计算比较耗时数据量较大时不太适用。 2. 寻找最优超平面 其目标是找到一个分割超平面(通过最大化超平面与正常数据之间的间隔)使得正常数据点能够被该超平面所包围(正常样本远离该超平面而异常样本尽可能接近)这个超平面被称为决策边界。这个分割超平面的法向量和距离到原点的距离是训练过程中优化的参数。 支持向量是离分割超平面最近的正常样本点它们决定了分割超平面的位置和方向。在训练过程中OCSVM会选择最优的支持向量以使分割超平面最大化远离正常样本。 3. 异常检测 对于新的数据点通过计算其与超平面的距离来判断该数据点是否为异常。距离较大的数据点更有可能是异常点。 4. 总结 OCSVM的关键在于如何选择合适的超平面以使得正常数据被尽可能包围而异常数据则被远离。这是通过优化一个目标函数来实现的其中包括最小化超平面到最近正常数据点的距离和最大化超平面与正常数据之间的间隔。 3. 应用场景 在异常检测领域有广泛的应用 1. 网络安全 检测网络中的异常行为如入侵检测。它可以识别与正常网络流量不同的异常流量模式从而提高网络安全性。 2. 金融欺诈检测 检测信用卡欺诈、异常交易和洗钱行为。它可以识别与正常交易模式不符的异常交易。 3. 工业制造 监测工业制造中的设备异常和故障。它可以帮助预测设备可能出现的问题从而减少停机时间和维修成本。 4. 医疗诊断 检测医疗图像中的异常如肿瘤、病变和异常组织。它有助于提高医学诊断的准确性。 4. 异常检测实践 sklearn提供了一些ML方法其中OCSVM可以用于Novelty Dection(奇异点检测)IF(Isolation Forest)LOF(Local Outlier Factor)可用于Outlier Detection(异常点检测)。 4.1 API简介 1. 构造函数 oneClassSvm(cacheSize 100, kernel rbfKernel(), epsilon 0.001,nu 0.1, shrink TRUE, ...) 1kernel用于计算样本之间相似度的核函数 1. 径向基础函数内核rbfKernel() 2. 线性内核linearKernel() 3. 多项式内核polynomialKernel() 4. Sigmoid 内核sigmoidKernel() 2nu限制了在模型中允许存在的异常点的比例默认值为 0.1。其值必须介于 0 和 1 之间通常介于 0.1 和 0.5 之间。 3epsilon优化器收敛的阈值默认值为 0.001。 如果迭代间的改进小于阈值则算法将停止并返回当前模型。 4cacheSize存储训练数据的缓存的最大大小 默认值为 100 MB。 5shrink默认值是 TRUE表示使用缩减启发式。 在这种情况下某些样本将在训练过程中“缩减”这可能会加快训练速度 。 2. 其他 1fit(X)训练根据训练样本和上面两个参数探测边界注意是无监督 2predict(X)返回预测值(1:正常样本-1:异常样本) 3fit_predict(X[, y])在X上执行拟合并返回X的标签 4decision_function(X)返回各样本点到超平面的函数距离(signed distance)正的为正常样本负的为异常样本。 5set_params(**params)设置评估器的参数 6get_params([deep])获取评估器的参数。 4.2 demo import numpy as np import matplotlib.pyplot as plt from sklearn import svmrng np.random.RandomState(42) X 0.3 * rng.randn(200, 2) # 正常样本 X_train np.r_[X 2, X - 2] X_test np.r_[rng.uniform(low-6, high6, size(50, 2))] # 异常样本model svm.OneClassSVM(nu0.1, kernelrbf, gamma0.1) model.fit(X_train) y_pred_train model.predict(X_train) y_pred_test model.predict(X_test) # n_error_train y_pred_train[y_pred_train -1].size # 训练集异常样本个数# 绘制训练样本和测试样本的散点图 plt.scatter(X_train[:, 0], X_train[:, 1], colorblack, labeltrain_sample) plt.scatter(X_test[:, 0], X_test[:, 1], colorred, labeltest_sample)# 绘制异常样本的边界 xmin, xmax X_test[:, 0].min() - 1, X_test[:, 0].max() 1 ymin, ymax X_test[:, 1].min() - 1, X_test[:, 1].max() 1 xx, yy np.meshgrid(np.linspace(xmin, xmax, 500), np.linspace(ymin, ymax, 500)) Z model.decision_function(np.c_[xx.ravel(), yy.ravel()]) Z Z.reshape(xx.shape) plt.contour(xx, yy, Z, levels[0], linewidths2, colorsblue)# 设置图形标题和图例 plt.title(OneClassSVM) plt.legend() plt.show() 模型将正常样本点标记为1异常样本点标记为-1并将它们可视化出来。 5. 优缺点 5.1 优点 1. 不需要异常数据进行训练只需要正常数据即可     2. 对于高维数据和复杂的数据分布具有较好的适应性     3. 可以通过调整模型参数来控制异常点的检测灵敏度。 5.2 缺点 1. 在处理高维数据和大规模数据时计算复杂度较高     2. 对于数据分布不均匀或存在噪声的情况效果可能不理想     3. 需要谨慎选择模型参数以避免过拟合或欠拟合的情况。
http://www.pierceye.com/news/374721/

相关文章:

  • 网站砍价活动怎么做公司网站更新
  • 高要网站建设wordpress比织梦安全吗
  • 闵行网站建设多久能见效果城市建设模拟游戏网站
  • 誉铭摄影网站网页布局设计技术包括
  • 专门做定制化的网站成都网站推广技巧
  • 有啦域名网站怎么做北京织梦网站建设
  • 公司网站后台怎么添加内容asp网站gzip压缩
  • app浏览器源码大全网站广州网站建设 .超凡科技
  • 免费做网站的方法h5手机网站怎么做
  • 郑州营销型网站制作运营随州网站seo诊断
  • 怎么修改网站备案信息外国的网站是什么网站
  • 小企业网站建设多少钱软件免费下载的网站大全
  • 免费承接网站建设公司网站备案资料
  • 深圳微信网站制作免费加盟一件代发货源网站
  • 青岛外贸网站建站公司东莞市专业的网页设计制作报价
  • 长沙网站设计工作室wordpress手机分享插件下载地址
  • 网站开发用什么图片格式最好网站数据库搬家
  • 宜宾建设网站企业所得税税负率
  • 广州网站二级等保上海企业网站模板
  • 做任务赚话费的网站网站直播间 是怎么做的
  • 合肥住房城乡建设部的网站传媒公司是干嘛的
  • 网站建设公司盈利深圳保障性住房在哪里申请
  • 网站建设(信科网络)谷歌推广怎么开户
  • 活动策划网站有哪些温州网页设计美工
  • 网站描述代码怎么写做正规小说网站
  • 无锡外贸网站制作公司php网站开发薪资 深圳
  • 做卡盟网站赚钱吗为企业制定网络营销方案
  • lol视频网站模板网站定制案例
  • 海兴县网站建设郑州嵌入式培训机构
  • 网站建设怎么记账韩国 电商网站