当前位置: 首页 > news >正文

饰品网站建设策划书搜索引擎google

饰品网站建设策划书,搜索引擎google,电子商务工资多少钱一个月,太原优化网站排名SCAFFOLD: Stochastic Controlled Averaging for Federated Learning学习背景贡献论文思想算法局部更新方式全局更新方式实验总结背景 传统的联邦学习在数据异构(non-iid)的场景中很容易产生“客户漂移”(client-drift )的现象#xff0c;这会导致系统的收敛不稳定或者缓慢。… SCAFFOLD: Stochastic Controlled Averaging for Federated Learning学习背景贡献论文思想算法局部更新方式全局更新方式实验总结背景 传统的联邦学习在数据异构(non-iid)的场景中很容易产生“客户漂移”(client-drift )的现象这会导致系统的收敛不稳定或者缓慢。 ps联邦平均算法相比传统的集中式训练其loss会更高并且相关的测试精度也明显低一些。部分研究工作解释为这是一个Client-drift的问题即客户端漂移联邦学习每个客户端的数据是非独立同分布的各个客户端在本地训练的过程中每个方向要与集中式训练或者与最优的方向存在一定的偏差。联邦学习只是简单的平均与理想的优化方向是存在一定的偏差所以才会导致性能的下降。 贡献 提出了考虑到client sampling和数据异构的一个更接近的收敛边界证明即便没有client sampling使用全批次梯度(full batch gradients)传统的FedAvg依旧会因为client-drift而比SGD收敛速度更慢提出Stochastic Controlled Averaging algorithm(SCAFFOLD)目的便是为了解决client-drift的问题并证明了SCAFFOLD算法在数据异构的情况下收敛速度至少和SGD一样快SCAFFOLD算法还可以利用client之间的相似度来减少通信开销证明了SCAFFOLD算法不会被client sampling所影响这使得SCAFFOLD算法更适合联邦学习 论文思想 传统联邦学习的方法FedAvg算法在异构数据集上表现不好的原因是有一些client会带偏整个系统的收敛结果如下图所示 在上图中黑色点是全局模型也就是每个训练轮次各个局部模型的“训练起点”假设在某一轮训练中服务器选择了client1和client2两个客户端来训练然后client1是偏离整个系统的客户端那么在客户端上训练三个轮次中我们可以看到client1上的局部模型已经偏离了训练的方向(x* 所在的方向)然后聚合得到的server model也会稍微偏离x*使得系统向着偏离学习模型的方向上收敛。最终的结果不是造成整个系统的性能下降就是导致整个系统收敛缓慢 为了解决这个问题论文使用一个“控制变量”(control variate)c来“纠正”系统训练的方向在client对模型进行更新的时候也会对该变量进行更新 算法 与传统的联邦学习类似SCAFFOLD算法也分为三个主要的部分 局部更新模型(local updates to the client model)局部更新控制变量(local updates to the client control variate)对局部的更新进行聚合 先给出算法的流程后面再做出解释 算法具体流程 局部更新方式 SCAFFOLD算法在局部的更新方式是 其中控制变量c的作用很明显便是用全局模型的知识去约束局部模型的训练以防止其偏离系统的正确训练方向如下图所示 并且该控制变量也会更新以下面的方式 论文给给出了上面两种更新方式的选择其中第一种是用局部的梯度来更新全局模型中的控制变量c第二种复用了全局模型的知识直观上理解是根据全局模型与局部模型的差异来更新c。论文中给出的上面两种选择的区别是第一种方法要更稳定第二种方法更加取决于应用场景但是第二种方法更容易计算并且在通常情况下也已经足够优秀 全局更新方式 对于模型的更新与传统联邦并无太大区别 控制变量的更新 控制变量的更新方法也是和模型的更新方法差不多本质上都是将局部模型的知识更新传递到全局模型 实验 实验在EMNIST数据集上进行结果证明了SCAFFOLD算法与FedAvg算法和FedProx算法相比是表现最好的如下图所示 上面的3幅图表示的是SGD和FedAvg的比较实验可以看到当梯度差异(G)很小是FebAvg在训练刚刚开始的时候要比SGD好但是在当G比较大的时候由于客户容易发生“客户漂移”现象容易带偏系统的训练方向因此收敛效果和速度都会变差。下面的3幅图表示的是论文提出的算法Scaffold与SGD的比较可以看到Scaffold算法无论是收敛速度和效果都比SGD要好 总结 论文的一个基本思想本质上便是用全局模型的知识去限制局部模型的训练方向以防止那些与全局模型相差较大的局部模型带偏整个系统的训练方向
http://www.hkea.cn/news/14572956/

相关文章:

  • 什么是交互式网站包头做网站
  • 沅江网站设计大型网站建设设备
  • 信息网站建设汇报展馆设计师招聘
  • 绵阳做网站优化高大上网站欣赏
  • 怎么做网站投放adsense无网站无产品链接如何做SOHO
  • 商城网站系山东做网站找谁
  • 安徽建设厅网站怎么打不开学习建设网站需要多久
  • 如何给网站做证书职业院校专题建设网站
  • 做头像一个字的网站常见的互联网应用
  • 中土南方建设有限公司网站软件下载页面制作
  • h5制作方法和步骤windows11优化大师
  • 优秀国外设计网站徐州网站简介
  • 开微信小程序要钱吗常州网站建设优化
  • 基础很差去公司做网站徐州seo
  • 制作网页和网站的区别网站建设需要了解什么
  • 揭阳网站设计沈阳网站关键词排名
  • 北京网站优化平台深圳广电制作中心
  • 网站添加缩略图网站建设怎么找客源?
  • 网页设计网站页面搜索的代码wordpress 主题king
  • 搭建网站需要学什么wordpress评论人
  • 盛泽做网站的在线设计平台的概念
  • 厦门网站建设缑阳建淘宝运营培训课程
  • 国外html5做的音乐网站建设拍卖网站
  • 南宁网站开发企业wordpress文章类型查询
  • 图书馆网站建设总结好孩子官方网站王建设
  • 做网站前必须设计原型吗如何上传模板到网站
  • 加热器网站怎么做的wordpress自动语言
  • 凡科网建站怎么样网页设计效果图怎么做
  • 网站打开速度与服务器百度软件中心下载安装
  • 腾讯公司网站某绿色园林企业网站源码