当前位置: 首页 > news >正文

在线培训网站宁波建设工程造价信息网地址

在线培训网站,宁波建设工程造价信息网地址,做关键词排名好的公司,搭建网站要什么配置《Dataset Condensation with Differentiable Siamese Augmentation》 在本文中#xff0c;我们专注于将大型训练集压缩成显著较小的合成集#xff0c;这些合成集可以用于从头开始训练深度神经网络#xff0c;性能下降最小。受最近的训练集合成方法的启发#xff0c;我们提…《Dataset Condensation with Differentiable Siamese Augmentation》 在本文中我们专注于将大型训练集压缩成显著较小的合成集这些合成集可以用于从头开始训练深度神经网络性能下降最小。受最近的训练集合成方法的启发我们提出了可微暹罗增强方法它可以有效地利用数据增强来合成更具信息的合成图像从而在使用增强方法训练网络时获得更好的性能。在多个图像分类基准上的实验表明该方法在CIFAR10和CIFAR100数据集上取得了较先进水平的显著提高提高了7%。结果表明该方法在MNIST、FashionMNIST、SVHN、CIFAR10上的相对性能分别为99.6%、94.9%、88.5%、71.5%数据量不到1%。 方法 1. 简单介绍DCData Condensation 假设我们有一个巨大的训练集 T \mathcal{T} T { ( x 1 , y 1 ) , … , ( x ∣ T ∣ , y ∣ T ∣ ) } \left\{\left(\boldsymbol{x}_1, y_1\right), \ldots,\left(\boldsymbol{x}_{|\mathcal{T}|}, y_{|\mathcal{T}|}\right)\right\} {(x1​,y1​),…,(x∣T∣​,y∣T∣​)} 其中有 ∣ T ∣ |\mathcal{T}| ∣T∣ 个图片和标签对. DC (Zhao et al., 2021)目标是学习一个更小的数据集 ∣ S ∣ |\mathcal{S}| ∣S∣ 生成图片和标签对。 S \mathcal{S} S { ( s 1 , y 1 ) , … , ( s ∣ S ∣ , y ∣ S ∣ ) } \left\{\left(\boldsymbol{s}_1, y_1\right), \ldots,\left(\boldsymbol{s}_{|\mathcal{S}|}, y_{|\mathcal{S}|}\right)\right\} {(s1​,y1​),…,(s∣S∣​,y∣S∣​)} 来自于通过学习 T \mathcal{T} T 并且在数据集 S \mathcal{S} S 上训练的神经网络效果和在 T \mathcal{T} T 上训练得到的神经网络效果接近。 用 ϕ θ T \phi_{\boldsymbol{\theta}^{\mathcal{T}}} ϕθT​ 和 ϕ θ S \phi_{\boldsymbol{\theta}^{\mathcal{S}}} ϕθS​ 表示深度神经网络其参数分别为 θ T \boldsymbol{\theta}^{\mathcal{T}} θT 和 θ S \boldsymbol{\theta}^{\mathcal{S}} θS分别在训练集 T \mathcal{T} T 和 S \mathcal{S} S 上训练得到。DC的目标是如下方程: E x ∼ P D [ ℓ ( ϕ θ τ ( x ) , y ) ] ≃ E x ∼ P D [ ℓ ( ϕ θ S ( x ) , y ) ] \begin{equation} \mathbb{E}_{\boldsymbol{x} \sim P_{\mathcal{D}}}\left[\ell\left(\phi_{\boldsymbol{\theta}^\tau}(\boldsymbol{x}), y\right)\right] \simeq \mathbb{E}_{\boldsymbol{x} \sim P_{\mathcal{D}}}\left[\ell\left(\phi_{\boldsymbol{\theta}^{\mathcal{S}}}(\boldsymbol{x}), y\right)\right] \end{equation} Ex∼PD​​[ℓ(ϕθτ​(x),y)]≃Ex∼PD​​[ℓ(ϕθS​(x),y)]​​ 在真实数据分布 P D P_{\mathcal{D}} PD​ 上的损失 ℓ \ell ℓ (i.e. cross-entropy loss)。 在浓缩数据集 S \mathcal{S} S 上训练得到的模型参数要尽可能接近原始数据集的结果, i.e. θ S ≈ θ T \boldsymbol{\theta}^{\mathcal{S}} \approx \boldsymbol{\theta}^{\mathcal{T}} θS≈θT。 然后作者就开始举例DC有哪些不好的地方。 例如 在每一轮都假设 θ t T \boldsymbol{\theta}^{\mathcal{T}}_t θtT​ 和 θ t S \boldsymbol{\theta}^{\mathcal{S}}_t θtS​相等继续训练。只对一个模型进行提取。 2. DSA 方法就是在DC前面套了一层数据增强可微的数据增强 进入正题那么本文提出的DSA可微暹罗增强我也不知道为什么是暹罗 2.1 暹罗增强 首先是暹罗增强在图片数据中基本就是裁剪旋转颜色变换等 min ⁡ S D ( ∇ θ L ( A ( S , ω S ) , θ t ) , ∇ θ L ( A ( T , ω T ) , θ t ) ) \min _{\mathcal{S}} D\left(\nabla_{\boldsymbol{\theta}} \mathcal{L}\left(\mathcal{A}\left(\mathcal{S}, \omega^{\mathcal{S}}\right), \boldsymbol{\theta}_t\right), \nabla_{\boldsymbol{\theta}} \mathcal{L}\left(\mathcal{A}\left(\mathcal{T}, \omega^{\mathcal{T}}\right), \boldsymbol{\theta}_t\right)\right) Smin​D(∇θ​L(A(S,ωS),θt​),∇θ​L(A(T,ωT),θt​)) 此处 ω T \omega^{\mathcal{T}} ωT和 ω S \omega^{\mathcal{S}} ωS分别代表了在两个数据集上进行的数据增强参数。然后作者指出如果使用随机分布的 ω T \omega^{\mathcal{T}} ωT和 ω S \omega^{\mathcal{S}} ωS会导致训练无法收敛因此在文中使用的 ω T ω S \omega^{\mathcal{T}} \omega^{\mathcal{S}} ωTωS。 那么因为浓缩数据集 S \mathcal{S} S和原始数据集 T \mathcal{T} T肯定是不一样的那就没有一个一对一的关系来进行同样的数据增强那么文中的方法就是一个batch的数据使用一样的数据增强。一个batch里 S \mathcal{S} S和 T \mathcal{T} T相互对应。 2.2 可微增强 要让这个过程可以BP训练那么这个数据增强必须是可以微分的即 ∂ D ( ⋅ ) ∂ S ∂ D ( ⋅ ) ∂ ∇ θ L ( ⋅ ) ∂ ∇ θ L ( ⋅ ) ∂ A ( ⋅ ) ∂ A ( ⋅ ) ∂ S \frac{\partial D(\cdot)}{\partial \mathcal{S}}\frac{\partial D(\cdot)}{\partial \nabla_{\boldsymbol{\theta}} \mathcal{L}(\cdot)} \frac{\partial \nabla_{\boldsymbol{\theta}} \mathcal{L}(\cdot)}{\partial \mathcal{A}(\cdot)} \frac{\partial \mathcal{A}(\cdot)}{\partial \mathcal{S}} ∂S∂D(⋅)​∂∇θ​L(⋅)∂D(⋅)​∂A(⋅)∂∇θ​L(⋅)​∂S∂A(⋅)​ Traditionally transformations used for data augmentation are not implemented in a differentiable way, as optimizing input images is not their focus. Note that all the standard data augmentation methods for images are differentiable and can be implemented as differentiable layers. 这里是不是有点自相矛盾传统数据增强变换实现不是可微的但是图像上的标准数据增强方法是可微的 2.3 训练过程 和DC基本一致最外层训练K负责训练不同的模型初始化以增强浓缩数据集适用性内层不断更新模型训练T-1步最内层是对每一个标签进行训练更新数据集。 3. 实验结果
http://www.hkea.cn/news/14274598/

相关文章:

  • 滨江网站建设公司南头外贸网站建设
  • 做电商怎么建网站建设网站都需要下载那些软件
  • 做gif图的网站dw对网站建设有哪些作用
  • 旅游网站的目的h5与wordpress
  • 中国风 网站模板做自己照片视频网站
  • 福建省百川建设发展有限公司网站国内域名注册商排行榜
  • 龙岗商城网站建设教程房屋装饰
  • 设计师对网站的意义网站建设 开题报告
  • 网站 建设产品营销方案策划书
  • 淮北哪有做网站的北京网站优化专家
  • 东莞网站建设实例推荐小程序会员系统开发
  • 上海网站优化案例百度指数有哪些功能
  • 番禺网站建设a2345域名代备案网站
  • 公网ip做网站大学生网站设计作业动画
  • 深圳做网站有哪些网站上面的水印怎么做的
  • 临沂网站建设培训班电子商务网站技术方案
  • 南宁网站建设醉懂网络新冠最新消息实时动态
  • 更合网站建设制作申请微官网的网站
  • 华润置地建设事业部网站php网站数据库怎样导入
  • 签订网站建设合同应注意个人做视频网站烧钱
  • 国内网站备案要多久建网站用什么系统好
  • 学校网站建设的意义成都网站优化步骤
  • 福州网站建设公司中小企业青岛网站域名备案查询
  • 国内响应式网站自建网站营销
  • 自己编辑网站怎么做的微信运营有前途吗
  • 宝塔做网站安全吗北京医疗网站建设
  • 海南网站建设哪家不错暗色系网站
  • 移动网站seo人寿保险网站
  • 自学网站建设推荐网站名申请
  • 长沙专业做网站公司做互联网的网站