当前位置: 首页 > news >正文

网站制作过程中常见的问题沧州网站设计多少钱

网站制作过程中常见的问题,沧州网站设计多少钱,word可以做网页,河南工程建设信息网一体化平台介绍 这是一篇2018年挂在arXiv上的文章#xff0c;是一篇针对FL中数据Non-IID的工作。 作者发现#xff0c;对于高度Non-IID的数据集#xff0c;FedAvg的准确性下降了55%。 作者提出了可以用权重散度#xff08;weight divergence#xff09;来解释这种性能下降#xff…介绍 这是一篇2018年挂在arXiv上的文章是一篇针对FL中数据Non-IID的工作。 作者发现对于高度Non-IID的数据集FedAvg的准确性下降了55%。 作者提出了可以用权重散度weight divergence来解释这种性能下降这个权重散度用各client上的数据类别分布与总体分布之间的EMDearth mover’s distance来量化。 关于什么是EMDgpt这样说 EMDEarth Mover’s Distance即地球搬运距离是一种度量两个分布之间差异的方法。其基本思想来源于土方工程即计算将一个堆土变成另一个堆土所需的最小工作量。 具体来说EMD用于度量两个概率分布之间的差异特别是在多维空间中。假设有两个概率分布P和Q它们分别由一组加权点组成EMD计算的是将分布P转换为分布Q所需的最小代价。 计算EMD的一般步骤如下 定义分布两个分布P和Q分别由若干个点和其对应的权重或质量组成。构建流量矩阵确定从分布P的每个点到分布Q的每个点的流量即将多少质量从一个点移动到另一个点。计算流动成本每个点的流动成本通常是两个点之间的距离乘以流量。优化流动方案通过优化算法如线性规划找到总流动成本最小的方案即EMD。 数学上EMD可以被表述为一个线性规划问题。其目标函数是 EMD ( P , Q ) min ⁡ ∑ i 1 m ∑ j 1 n f i j d i j \text{EMD}(P, Q) \min \sum_{i1}^m \sum_{j1}^n f_{ij} d_{ij} EMD(P,Q)min∑i1m​∑j1n​fij​dij​ 其中f_{ij}表示从分布P的第i个点到分布Q的第j个点的流量d_{ij}表示这两个点之间的距离。约束条件包括 从P的每个点流出的总流量不能超过该点的权重。到达Q的每个点的总流量不能超过该点的权重。所有流量的总和应等于两个分布总权重的较小值。 EMD在计算机视觉、图像处理和模式识别等领域中有广泛应用特别是在图像检索中用于比较不同图像的特征分布。 作者提出了一个策略用于解决Non-IID那就是server来创建一小部分共享数据集来提升模型acc。这显然是一种centralization-accuracy的trade-off。 实验 作者用了三个数据集MNIST、Cifar-10、Speech Commands dataset一个语音数据集划分出的KWS数据集。这三个数据集的output classes都是10。 数据集划分方面做了三种划分 iid均匀分配给10个clientnon-iid1每个client只有一类的数据总共10个clientnon-iid2每个client有两类的数据总共10个client 根据上图可知以下实验结论 1、 IID数据下联邦学习和正常中心式的SGD训练结果基本一致 2、 non-IID 会导致准确度下降而且Non-IID(1)相对Non-IID(2)下降的更多减少本地训练epoch增加通信频率可以一定程度降低损失但是作用不大 3、一个有意思的点是用SGD预训练的模型刚刚开始结果就不错但在CIFAR-10上在 non-IID 数据上训练还会降低精度 分析 作者给出了权重散度weight divergence的定义公式 weight divergence ∣ ∣ w FedAvg − w SGD ∣ ∣ ∣ ∣ w SGD ∣ ∣ \text{weight divergence}\frac{||w^{\text{FedAvg}}-w^{\text{SGD}}||}{||w^{\text{SGD}}||} weight divergence∣∣wSGD∣∣∣∣wFedAvg−wSGD∣∣​ 接下来作者分析weight divergence分歧的根本原因是client的数据分布与总体数据分布之间的距离这个距离可以用EMD来评估。 然后就是一顿数学推导得到这样一个公式 上图中圈出的两部分就是误差的两个来源分别是 之前累计的梯度误差本次迭代产生的分布误差 此外作者根据公式得出两个结论 开始训练时各client的初始化权重最好一样EMD被定义为。 接下来作者探究了EMD与weight divergence和test acc的关系 改进方法 作者提出让server创建一个全局可共享的小部分数据集给各client。实验表明仅用5%的全局数据可以提高test acc约30%。 此外server首次分发给client的模型可以是在这小部分数据集上预训练过的。 如上图所示整个过程涉及到两个trade-off test acc和 β ∣ ∣ G ∣ ∣ ∣ ∣ D ∣ ∣ × 100 % \beta\frac{||G||}{||D||}\times 100\% β∣∣D∣∣∣∣G∣∣​×100%的trade-off其中G为全局可共享数据集的样本量D为所有client的样本量和。test acc和 α \alpha α的tarde-off其中 α \alpha α为server分给client的样本量与server全局可共享数据集的比值。 作者表示这个策略只用于整个训练过程初始化的时候所以通信成本不是主要问题此外全局可共享的数据集和client数据集是分开了不会有隐私威胁。
http://www.pierceye.com/news/448274/

相关文章:

  • 网站建设丂金手指科杰wordpress中logo大小
  • 微餐饮网站建设被老板抓到用公司产品做自己的网站
  • 软件公司网站模板下载定制搭建网站
  • 网站建设实训报告要求怎么做公司门户网站
  • 深圳规划建设局网站wordpress改变访问目录
  • dw怎么做购物网站o2o平台都有哪些
  • 阿里云备案多个网站吗应用商店下载app软件
  • 响应式网站手机端尺寸网站开发培训心得
  • 徐州手机网站开发公司电话江苏五星建设网站
  • 网站建设全包广做短视频素材哪里找
  • 做网站为什么每年都要续费企业官网建站步骤
  • 培训行业门户网站建设方案专业网站运营制作
  • 百度网站两两学一做心得体会江苏专业网站建设费用
  • 做企业网站的架构图网站上的销售怎么做
  • 网站开发思维导图内容淘宝客在百度推广网站么做
  • 国外美容网站crm开发
  • 辽宁建设资质申报网站wordpress提示插件安装
  • 做网站用什么软件语言wordpress绑定域名后乱码
  • 网站建设邀请函郑州网站搭建的公司
  • 网站制作论文优帮云广州网站设计首选柚米
  • 唐山建设厅官方网站我有一个网站怎么做外贸
  • 荣成城市规划建设局网站宁晋网站开发
  • 福州电子商务网站手机触屏版网站开发
  • 佛山网站建设骏域开发公司综合部内部管理章程
  • 网站建设 迅雷下载西安建设工程信息网网上招投标
  • 浅析个人网站的设计论文二本网络工程就业前景
  • 网站没有做301的后果是什么苏州工业园区两学一做教育网站
  • 品牌网站建设定位湖南做网站的公司有哪些
  • mvc做的网站郑州作网站
  • 门户网站栏目建设购物类网站开发