当前位置: 首页 > news >正文

低价网站建设行业现状产品营销策略包括哪些内容

低价网站建设行业现状,产品营销策略包括哪些内容,优化大师电脑版下载,H5响应式网站数据介绍 这是一篇2018年挂在arXiv上的文章#xff0c;是一篇针对FL中数据Non-IID的工作。 作者发现#xff0c;对于高度Non-IID的数据集#xff0c;FedAvg的准确性下降了55%。 作者提出了可以用权重散度#xff08;weight divergence#xff09;来解释这种性能下降#xff…介绍 这是一篇2018年挂在arXiv上的文章是一篇针对FL中数据Non-IID的工作。 作者发现对于高度Non-IID的数据集FedAvg的准确性下降了55%。 作者提出了可以用权重散度weight divergence来解释这种性能下降这个权重散度用各client上的数据类别分布与总体分布之间的EMDearth mover’s distance来量化。 关于什么是EMDgpt这样说 EMDEarth Mover’s Distance即地球搬运距离是一种度量两个分布之间差异的方法。其基本思想来源于土方工程即计算将一个堆土变成另一个堆土所需的最小工作量。 具体来说EMD用于度量两个概率分布之间的差异特别是在多维空间中。假设有两个概率分布P和Q它们分别由一组加权点组成EMD计算的是将分布P转换为分布Q所需的最小代价。 计算EMD的一般步骤如下 定义分布两个分布P和Q分别由若干个点和其对应的权重或质量组成。构建流量矩阵确定从分布P的每个点到分布Q的每个点的流量即将多少质量从一个点移动到另一个点。计算流动成本每个点的流动成本通常是两个点之间的距离乘以流量。优化流动方案通过优化算法如线性规划找到总流动成本最小的方案即EMD。 数学上EMD可以被表述为一个线性规划问题。其目标函数是 EMD ( P , Q ) min ⁡ ∑ i 1 m ∑ j 1 n f i j d i j \text{EMD}(P, Q) \min \sum_{i1}^m \sum_{j1}^n f_{ij} d_{ij} EMD(P,Q)min∑i1m​∑j1n​fij​dij​ 其中f_{ij}表示从分布P的第i个点到分布Q的第j个点的流量d_{ij}表示这两个点之间的距离。约束条件包括 从P的每个点流出的总流量不能超过该点的权重。到达Q的每个点的总流量不能超过该点的权重。所有流量的总和应等于两个分布总权重的较小值。 EMD在计算机视觉、图像处理和模式识别等领域中有广泛应用特别是在图像检索中用于比较不同图像的特征分布。 作者提出了一个策略用于解决Non-IID那就是server来创建一小部分共享数据集来提升模型acc。这显然是一种centralization-accuracy的trade-off。 实验 作者用了三个数据集MNIST、Cifar-10、Speech Commands dataset一个语音数据集划分出的KWS数据集。这三个数据集的output classes都是10。 数据集划分方面做了三种划分 iid均匀分配给10个clientnon-iid1每个client只有一类的数据总共10个clientnon-iid2每个client有两类的数据总共10个client 根据上图可知以下实验结论 1、 IID数据下联邦学习和正常中心式的SGD训练结果基本一致 2、 non-IID 会导致准确度下降而且Non-IID(1)相对Non-IID(2)下降的更多减少本地训练epoch增加通信频率可以一定程度降低损失但是作用不大 3、一个有意思的点是用SGD预训练的模型刚刚开始结果就不错但在CIFAR-10上在 non-IID 数据上训练还会降低精度 分析 作者给出了权重散度weight divergence的定义公式 weight divergence ∣ ∣ w FedAvg − w SGD ∣ ∣ ∣ ∣ w SGD ∣ ∣ \text{weight divergence}\frac{||w^{\text{FedAvg}}-w^{\text{SGD}}||}{||w^{\text{SGD}}||} weight divergence∣∣wSGD∣∣∣∣wFedAvg−wSGD∣∣​ 接下来作者分析weight divergence分歧的根本原因是client的数据分布与总体数据分布之间的距离这个距离可以用EMD来评估。 然后就是一顿数学推导得到这样一个公式 上图中圈出的两部分就是误差的两个来源分别是 之前累计的梯度误差本次迭代产生的分布误差 此外作者根据公式得出两个结论 开始训练时各client的初始化权重最好一样EMD被定义为。 接下来作者探究了EMD与weight divergence和test acc的关系 改进方法 作者提出让server创建一个全局可共享的小部分数据集给各client。实验表明仅用5%的全局数据可以提高test acc约30%。 此外server首次分发给client的模型可以是在这小部分数据集上预训练过的。 如上图所示整个过程涉及到两个trade-off test acc和 β ∣ ∣ G ∣ ∣ ∣ ∣ D ∣ ∣ × 100 % \beta\frac{||G||}{||D||}\times 100\% β∣∣D∣∣∣∣G∣∣​×100%的trade-off其中G为全局可共享数据集的样本量D为所有client的样本量和。test acc和 α \alpha α的tarde-off其中 α \alpha α为server分给client的样本量与server全局可共享数据集的比值。 作者表示这个策略只用于整个训练过程初始化的时候所以通信成本不是主要问题此外全局可共享的数据集和client数据集是分开了不会有隐私威胁。
http://www.pierceye.com/news/902396/

相关文章:

  • 南充市建设厅官方网站高州做网站
  • 自建网站的优缺点wordpress题库制作
  • 哪家公司做网站毕业设计心理评测网站开发
  • 建设电影网站数据库脚本问答网站如何优化
  • 嘉峪关建设路小学网站游戏网页链接
  • 阿里云 网站根目录广东建筑企业50强
  • 河北省网络科技网站装饰设计素描
  • 合肥网站建设索q479185700企业做网站公司哪家好
  • wordpress暂停网站兰州网站建设方法
  • 丰台网站制作html教程 菜鸟教程
  • 在那个网站做直播好赚钱吗重庆妇科医院排名大全
  • 在线教育网站建设投标书查询公司的网站备案信息查询
  • 俄文网站策划wdcp wordpress
  • 建设个人网站流程中国工程建设招聘信息网站
  • 电影网站设计说明书在原域名给公司建立网站
  • 小规模公司做网站成本是什么wordpress主题转html
  • seo做的比较好的网站的几个特征app网站建设教程视频教程
  • 网站建设规范优质高等职业院校建设网站
  • 国内做网站哪家公司好机票什么网站建设
  • 万盛经开区建设局官方网站高校校园网站建设的要求
  • 制作企业网站的实训报告防伪码查询网站怎么做的
  • 做网站会很忙吗网站 js 广告代码
  • 没有网站域名备案专业做书画推广的网站
  • 做app网站公司名称有没有做黑市网站
  • apache建设网站做网站页面代码
  • html5 单页网站网络运维从入门到精通
  • 联合建设官方网站银川网站seo
  • jsp网站开发与设计摘要网站开发是什么
  • 公司网站建设论文结束语谷歌建站多少钱
  • 陕西省建设工会网站漳州做网站最便宜