当前位置: 首页 > news >正文

电子商务网站开发相关技术免费查询公司

电子商务网站开发相关技术,免费查询公司,wordpress 菜单大小,网络营销策划心得体会本系列文章md笔记#xff08;已分享#xff09;主要讨论机器学习算法相关知识。机器学习算法文章笔记以算法、案例为驱动的学习#xff0c;伴随浅显易懂的数学知识#xff0c;让大家掌握机器学习常见算法原理#xff0c;应用Scikit-learn实现机器学习算法的应用#xff0… 本系列文章md笔记已分享主要讨论机器学习算法相关知识。机器学习算法文章笔记以算法、案例为驱动的学习伴随浅显易懂的数学知识让大家掌握机器学习常见算法原理应用Scikit-learn实现机器学习算法的应用结合场景解决实际问题。包括K-近邻算法线性回归逻辑回归决策树算法集成学习聚类算法。K-近邻算法的距离公式应用LinearRegression或SGDRegressor实现回归预测应用LogisticRegression实现逻辑回归预测应用DecisionTreeClassifier实现决策树分类应用RandomForestClassifie实现随机森林算法应用Kmeans实现聚类任务。 全套笔记和代码自取地址 https://gitee.com/yinuo112/Technology/tree/master/机器学习/机器学习算法篇/1.md 感兴趣的小伙伴可以自取哦欢迎大家点赞转发~ 共 7 章44 子模块总字数52595 K-近邻算法 学习目标 掌握K-近邻算法实现过程知道K-近邻算法的距离公式知道K-近邻算法的超参数K值以及取值问题知道kd树实现搜索的过程应用KNeighborsClassifier实现分类知道K-近邻算法的优缺点知道交叉验证实现过程知道超参数搜索过程应用GridSearchCV实现算法参数的调优 1.3 距离度量 1 欧式距离**(Euclidean Distance)** 欧氏距离是最容易直观理解的距离度量方法我们小学、初中和高中接触到的两个点在空间中的距离一般都是指欧氏距离。 举例: X[[1,1],[2,2],[3,3],[4,4]]; 经计算得: d 1.4142 2.8284 4.2426 1.4142 2.8284 1.41422 曼哈顿距离(Manhattan Distance) 在曼哈顿街区要从一个十字路口开车到另一个十字路口驾驶距离显然不是两点间的直线距离。这个实际驾驶距离就是“曼哈顿距离”。曼哈顿距离也称为“城市街区距离”(City Block distance)。 举例: X[[1,1],[2,2],[3,3],[4,4]]; 经计算得: d 2 4 6 2 4 23 切比雪夫距离 (Chebyshev Distance) 国际象棋中国王可以直行、横行、斜行所以国王走一步可以移动到相邻8个方格中的任意一个。国王从格子(x1,y1)走到格子(x2,y2)最少需要多少步这个距离就叫切比雪夫距离。 举例: X[[1,1],[2,2],[3,3],[4,4]]; 经计算得: d 1 2 3 1 2 14 闵可夫斯基距离(Minkowski Distance) 闵氏距离不是一种距离而是一组距离的定义是对多个距离度量公式的概括性的表述。 两个n维变量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的闵可夫斯基距离定义为 其中p是一个变参数 当p1时就是曼哈顿距离 当p2时就是欧氏距离 当p→∞时就是切比雪夫距离。 根据p的不同闵氏距离可以表示某一类/种的距离。 小结 1 闵氏距离包括曼哈顿距离、欧氏距离和切比雪夫距离都存在明显的缺点: e.g. 二维样本(身高[单位:cm],体重[单位:kg]),现有三个样本a(180,50)b(190,50)c(180,60)。 a与b的闵氏距离无论是曼哈顿距离、欧氏距离或切比雪夫距离等于a与c的闵氏距离。但实际上身高的10cm并不能和体重的10kg划等号。 2 闵氏距离的缺点 ​ (1)将各个分量的量纲(scale)也就是“单位”相同的看待了; ​ (2)未考虑各个分量的分布期望方差等可能是不同的。 5 标准化欧氏距离 (Standardized EuclideanDistance) 标准化欧氏距离是针对欧氏距离的缺点而作的一种改进。 思路既然数据各维分量的分布不一样那先将各个分量都“标准化”到均值、方差相等。假设样本集X的均值(mean)为m标准差(standard deviation)为sX的“标准化变量”表示为 如果将方差的倒数看成一个权重也可称之为加权欧氏距离(Weighted Euclidean distance)。 举例: X[[1,1],[2,2],[3,3],[4,4]];假设两个分量的标准差分别为0.5和1 经计算得: d 2.2361 4.4721 6.7082 2.2361 4.4721 2.23616 余弦距离(Cosine Distance) 几何中夹角余弦可用来衡量两个向量方向的差异机器学习中借用这一概念来衡量样本向量之间的差异。 二维空间中向量A(x1,y1)与向量B(x2,y2)的夹角余弦公式 两个n维样本点a(x11,x12,…,x1n)和b(x21,x22,…,x2n)的夹角余弦为 即 夹角余弦取值范围为[-1,1]。余弦越大表示两个向量的夹角越小余弦越小表示两向量的夹角越大。当两个向量的方向重合时余弦取最大值1当两个向量的方向完全相反余弦取最小值-1。 举例: X[[1,1],[1,2],[2,5],[1,-4]] 经计算得: d 0.9487 0.9191 -0.5145 0.9965 -0.7593 -0.81077 汉明距离(Hamming Distance)【了解】 两个等长字符串s1与s2的汉明距离为将其中一个变为另外一个所需要作的最小字符替换次数。 例如: The Hamming distance between 1011101 and 1001001 is 2. The Hamming distance between 2143896 and 2233796 is 3. The Hamming distance between toned and roses is 3.随堂练习 求下列字符串的汉明距离1011101与 1001001  2143896与 2233796 irie与 rise汉明重量是字符串相对于同样长度的零字符串的汉明距离也就是说它是字符串中非零的元素个数对于二进制字符串来说就是 1 的个数所以 11101 的汉明重量是 4。因此如果向量空间中的元素a和b之间的汉明距离等于它们汉明重量的差a-b。 应用汉明重量分析在包括信息论、编码理论、密码学等领域都有应用。比如在信息编码过程中为了增强容错性应使得编码间的最小汉明距离尽可能大。但是如果要比较两个不同长度的字符串不仅要进行替换而且要进行插入与删除的运算在这种场合下通常使用更加复杂的编辑距离等算法。 举例: X[[0,1,1],[1,1,2],[1,5,2]] 注以下计算方式中把2个向量之间的汉明距离定义为2个向量不同的分量所占的百分比。经计算得: d 0.6667 1.0000 0.33338 杰卡德距离(Jaccard Distance)【了解】 杰卡德相似系数(Jaccard similarity coefficient)两个集合A和B的交集元素在AB的并集中所占的比例称为两个集合的杰卡德相似系数用符号J(A,B)表示 杰卡德距离(Jaccard Distance)与杰卡德相似系数相反用两个集合中不同元素占所有元素的比例来衡量两个集合的区分度 举例: X[[1,1,0][1,-1,0],[-1,1,0]] 注以下计算中把杰卡德距离定义为不同的维度的个数占“非全零维度”的比例 经计算得: d 0.5000 0.5000 1.00009 马氏距离(Mahalanobis Distance)【了解】 下图有两个正态分布图它们的均值分别为a和b但方差不一样则图中的A点离哪个总体更近或者说A有更大的概率属于谁显然A离左边的更近A属于左边总体的概率更大尽管A与a的欧式距离远一些。这就是马氏距离的直观解释。 马氏距离是基于样本分布的一种距离。 马氏距离是由印度统计学家马哈拉诺比斯提出的表示数据的协方差距离。它是一种有效的计算两个位置样本集的相似度的方法。 与欧式距离不同的是它考虑到各种特性之间的联系即独立于测量尺度。 **马氏距离定义**设总体G为m维总体考察m个指标均值向量为μμ1μ2… …μm,协方差阵为∑σij, 则样本XX1X2… …Xm与总体G的马氏距离定义为 马氏距离也可以定义为两个服从同一分布并且其协方差矩阵为∑的随机变量的差异程度如果协方差矩阵为单位矩阵马氏距离就简化为欧式距离如果协方差矩阵为对角矩阵则其也可称为正规化的欧式距离。 马氏距离特性 1.量纲无关排除变量之间的相关性的干扰 2.马氏距离的计算是建立在总体样本的基础上的如果拿同样的两个样本放入两个不同的总体中最后计算得出的两个样本间的马氏距离通常是不相同的除非这两个总体的协方差矩阵碰巧相同 3 .计算马氏距离过程中要求总体样本数大于样本的维数否则得到的总体样本协方差矩阵逆矩阵不存在这种情况下用欧式距离计算即可。 4.还有一种情况满足了条件总体样本数大于样本的维数但是协方差矩阵的逆矩阵仍然不存在比如三个样本点345678这种情况是因为这三个样本在其所处的二维空间平面内共线。这种情况下也采用欧式距离计算。 欧式距离马氏距离 举例 已知有两个类G1和G2比如G1是设备A生产的产品G2是设备B生产的同类产品。设备A的产品质量高如考察指标为耐磨度X其平均耐磨度μ180反映设备精度的方差σ2(1)0.25;设备B的产品质量稍差其平均耐磨损度μ275反映设备精度的方差σ2(2)4. 今有一产品G0测的耐磨损度X078试判断该产品是哪一台设备生产的 直观地看X0与μ1设备A的绝对距离近些按距离最近的原则是否应把该产品判断设备A生产的 考虑一种相对于分散性的距离记X0与G1G2的相对距离为d1d2,则 因为d21.5 d14按这种距离准则应判断X0为设备B生产的。 设备B生产的产品质量较分散出现X0为78的可能性较大而设备A生产的产品质量较集中出现X0为78的可能性较小。 这种相对于分散性的距离判断就是马氏距离。 未完待续 同学们请等待下一期
http://www.pierceye.com/news/628988/

相关文章:

  • 大型网站 网站建设做网站赔了8万
  • python官方网站建设网站要什么
  • 青海 网站开发 图灵如何创建自己的网页
  • 建设银行网站怎么登陆不做网站首页的尺寸
  • 谁能给我一个网站谢谢dedecms收费怎么办
  • dede 网站地图 模块青岛做网站服务商
  • 征信网站开发扬州市建设局网站
  • 教育网站建设 飞沐软件定制公司值得去吗
  • 金耀网站建设网站制作景观建筑人才网
  • 仿《爱美眉》网站 dede门户网站的主要功能
  • 外发加工网站深圳如何优化
  • 做设计在哪个网站上找高清图片大全网站建设风险分析
  • 做兼职哪个网站好哪些网站做免费送东西的广告6
  • 网站建设战略互动模板wordpress
  • 三原网站建设网易企业邮箱登录v
  • 为网站营销好处wordpress tar.xz
  • wordpress建站比较淘宝客网站怎么建设
  • 网站结构有哪些安徽省建设工程信息网官方网站
  • 如何查看网站是否备案直播网站怎么做啊
  • 广西做网站的公司投资融资理财网站模板
  • 做网站的颜色游戏推广员拉人犯法吗
  • 金融审核网站制作站长之家网址ip查询
  • 石家庄做家教网站网络营销网站建设
  • 怎么做淘宝网站赚钱吗怎样提高百度推广排名
  • 购物网站建设成本u9u8网站建设
  • 抚州市住房和城乡建设局网站手机网站素材
  • 用dw做音乐网站模板策划公司收费明细
  • 大气手机网站模板免费下载南昌seo排名
  • 做卖衣服网站源代码seo搜索引擎优化名词解释
  • 东营免费建网站网络运维必备知识