当前位置: 首页 > news >正文

携程网站建设的基本特点wordpress怎么设置语言设置中文

携程网站建设的基本特点,wordpress怎么设置语言设置中文,汇鑫网站建设方便,陕西榆林市信息网站建设公司弱监督参考图像分割#xff1a;Learning From Box Annotations for Referring Image Segmentation论文阅读笔记一、Abstract二、引言三、相关工作A、全监督参考图像分割B、基于 Box 的实例分割C、带有噪声标签的学习四、提出的方法A、概述B、伪标签生成目标轮廓预测Proposal 选… 弱监督参考图像分割Learning From Box Annotations for Referring Image Segmentation论文阅读笔记一、Abstract二、引言三、相关工作A、全监督参考图像分割B、基于 Box 的实例分割C、带有噪声标签的学习四、提出的方法A、概述B、伪标签生成目标轮廓预测Proposal 选择对抗边界损失 Ladv\mathcal{L}_{\text{adv}}Ladv​ 和MIL损失C、从噪声标签中学习五、实验A、数据集和评估指标B、实施细节C、性能比较定量评估定性评估D、消融实验Ltight\mathcal{L}_{\text tight}Ltight​ 和 Lce\mathcal{L}_{\text ce}Lce​对抗边界损失的有效性:自训练策略 Self-T 和共同训练策略 Co-T:N1N2N_1 N_2N1​N2​ 的结果:与全监督算法的比较:参数敏感性:Bounding box 没有严格标注限制的结果:目标到 Box 区域的保留比例分析:E、失败的案例六、结论写在前面最近一直在找论文看咩奈何很多都是“花里胡哨”嗯就是结构设计的挺巧妙没法通用呀~   这是一篇弱监督 Box 监督下的参考图像分割论文最主要是提出了一个边界损失函数~ 论文地址Learning From Box Annotations for Referring Image Segmentation代码地址https://github.com/fengguang94/Weakly-Supervised-RIS尚未完全发布收录于 TNNLS 2022 一、Abstract 参考图像分割 Referring image segmentation (RIS) 的方法需要大量像素级别的标注数据而本文提出一种基于 Box 标注的弱监督 RIS 方法。首先设计一个边界对抗损失来提取 Bounding Box (BB) 中的目标轮廓而这些轮廓用于选择合适的区域 Proposal 来生成 Pseudoground-truth (PGT)其次设计一种共同训练 (Co-T) 策略来对伪标签进行过滤具体来说训练两个网络并迭代的引导彼此挑选出干净的标签目的是弱化噪声标签对模型训练的影响实验结果表明能以 63 帧/秒的速度来产生高质量的 masks。 二、引言 首先讲一下参考图像分割的定义接下来指出之前基于全监督的 RIS 方法耗时且费力因此提及弱监督实例分割方法但是 RIS 的弱监督方法还未被考虑因此本文着手解决这一任务。   接下来是对一些弱监督实例分割方法的介绍有基于 BB 的基于伪标签的但是基于伪标签的方法并不能捕捉目标区域的一般形状只能确保所选择的 Proposal 尽可能属于 BB。但由于目标尺寸、外观的不同因此很难选择类似 GT 的 BB。有一些基于全局限定的端到端模型缺乏对目标轮廓的描述因此可能会存在混淆的边界像素点。   好的 Proposals 能够提供重要的目标级别先验但是不能感知前景的具体形状。一个合理的假设是如果前景轮廓可以从 BB 中推理得出那么就能使用其作为一个强先验信息来滤除区域 Proposal。于是本文根据这一思想提出一种对抗边界损失其包含两个构件一个用于促进目标主干区域有着高度的激活值另外一个用于抑制高度激活值。在这种对抗作用下目标的主体部分被抑制而轮廓被突出接下来利用学习到的轮廓来挑选出少量的 Proposal 来生成 PGT (伪标签)。   伪标签包含有噪声信息会损坏模型的泛化能力因此本文设计一种基于共同训练 Co-T 策略来过滤噪声标签。具体来说使用 Cross-entropy 损失作为偏置来决定伪标签的置信度之后选择小损失的像素用于反向传播并且同时采用两个网络来相互引导彼此间的反向传播。本文主要贡献如下 设计了一种基于 Box 标注的对抗边界损失来捕捉前景目标轮廓这些轮廓用于过滤proposal从而获得精确的伪标签引入一种 Co-T 策略来过滤伪标签促进两个网络来引导彼此这能减小错误标签像素在反向传播中的影响实验效果很好速度很快。 三、相关工作 A、全监督参考图像分割 介绍下概念指出其难点列举之前的方法指出缺点获得像素级别的 masks 费时费力相比之下本文提出的方法只依赖 BB 的标注。 B、基于 Box 的实例分割 弱监督方法一般分为两类一类是采用无监督的方法生成伪标签然后来训练分割网络一类是利用 BB 来得出全局限制并直接建立一个新的损失函数。   接下来是举例。指出缺点所有的方法没有确切考虑目标的边界信息。相比之下本文提出的方法定义了一个对抗边界损失来预测粗糙的目标轮廓然后结合 BB 以及预测的轮廓作为先验来滤除候选的 Proposal这使得剩下的 Proposals 能够和目标有着高度的重合。 C、带有噪声标签的学习 一些基于 box 监督的方法将分割任务作为一个噪声标签的学习任务缺点由样本选择时的偏置导致的误差会一直积累下去。本文采用两个网络来迭代地挖掘出有用的标签来训练彼此能够提供不同的视角过滤不同类别的噪声及避免误差的积累。 四、提出的方法 A、概述 本文提出的框架建立在 BRINet 之上核心为 BCAM由一个视觉引导的语言注意力模块 VLAM 和一个语言引导的视觉注意力模块 LVAM 构成。   采用编码器融合策略以一种残差连接的方式将 BCAM 嵌入到 ResNet101 内解码器采用 FPN 结构。本文提出的方法主要分成两个阶段第一阶段采用对抗边界损失来捕捉目标轮廓之后联合 BB 选择合适的 Proposals 作为伪标签用于接下来的训练。第二阶段同时训练两个新的分割网络彼此间引导着来阻止虚假标签的反向传播从而缓解噪声伪标签的影响。 BRINet: Z. Hu, G. Feng, J. Sun, L. Zhang, and H. Lu, “Bi-directional relationship inferring network for referring image segmentation,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit., Jun. 2020, pp. 4424–4433. B、伪标签生成 讲述一下动机对于弱监督 RIS常规做法是利用无监督的区域提议方法和网格式的目标提议来生成一系列的分割 masks然后采用 box 级别的标注作为先验来选择高质量的候选 mask。然而 BB 仅仅能提供目标的位置信息而不能用来描述目标。因此对于目标边界来说目标 mask 和选择的 proposal 之间的匹配概率不能保证从而影响模型的训练。于是本文尝试捕捉目标的轮廓并将其作为先验从而选出高质量的 Proposal。步骤如下 目标轮廓预测 首先轮廓先验假设目标区域充分靠近 Box 标注的边缘因此至少 BB mask 的每一行或者每一列属于前景。对于 RIS 的前景/背景分类器来说设 C∈[0,1]H×WC\in{[0,1]^{H\times W}}C∈[0,1]H×W 为模型在第一阶段的输出特征图其中 01 分别表示非轮廓点和轮廓点CrowiC_{row}^{i}Crowi​ 和 CcoljC_{col}^{j}Ccolj​ 为预测特征图的第 iii 行和第 jjj 列。定义 Prow(i)max⁡(Crowi)P_{row}(i)\max(C_{row}^{i})Prow​(i)max(Crowi​) Pcol(j)max⁡(Ccolj)P_{col}(j)\max(C_{col}^{j})Pcol​(j)max(Ccolj​) 分别计算 CCC 上第 iii 行和第 jjj 列的最大值。   当 box 跨越第 iii 行或者第 jjj 列时这一行或列穿过了前景区域于是 Prow(i)P_{row}(i)Prow​(i) 或者 Pcol(j)P_{col}(j)Pcol​(j) 的预测值应该接近 1反之接近 0。基于这一先决条件定义损失函数如下 Ltight ∑Crow i,Ccol j∩B∉∅−[log⁡(Prow(i))log⁡(Pcol(j))]∑Cfow i,Ccol j∩B∈∅−[log⁡(1−Prow(i))log⁡(1−Pcol(j))]\mathcal{L}_{\text {tight }} \sum_{C_{\text {row }}^{i}, C_{\text {col }}^{j} \cap \mathcal{B} \notin \varnothing}-\left[\log \left(P_{\mathrm{row}}(i)\right)\log \left(P_{\mathrm{col}}(j)\right)\right] \sum_{C_{\text {fow }}^{i}, C_{\text {col }}^{j} \cap \mathcal{B} \in \varnothing}-\left[\log \left(1-P_{\mathrm{row}}(i)\right)\log \left(1-P_{\mathrm{col}}(j)\right)\right] Ltight ​Crow i​,Ccol j​∩B∈/∅∑​−[log(Prow​(i))log(Pcol​(j))]Cfow i​,Ccol j​∩B∈∅∑​−[log(1−Prow​(i))log(1−Pcol​(j))]其中 B\mathcal{B}B 为 BB 包围的矩形区域上式右边第一项和第二项确保了最大激活区域能够定位到与 BB 相交的行或列。因此这一损失函数 Ltight \mathcal{L}_{\text {tight }}Ltight ​能够驱动网络去预测 BB 内的前景。之后定义一个 0 限制条件目的是使得预测的特征图倾向于全为0 Laro ∑i1H∑j1W−log⁡(1−Ci,j)\mathcal{L}_{\text {aro }}\sum_{i1}^{H} \sum_{j1}^{W}-\log \left(1-C_{i, j}\right) Laro ​i1∑H​j1∑W​−log(1−Ci,j​)于是结合这两个损失来构成对抗边界损失 LadvLtightλ⋅Lzero\mathcal{L}_{\text{adv}}\mathcal{L}_{\text{tight}}\lambda\cdot\mathcal{L}_{\text{zero}} Ladv​Ltight​λ⋅Lzero​其中 λ\lambdaλ 设为 0.05目的是缩小比重Ltight\mathcal{L}_{\text{tight}}Ltight​ 为全局限制Lzero\mathcal{L}_{\text{zero}}Lzero​ 为局部限制。   下图展示了这些损失函数的可视化 Proposal 选择 首先选择一种无监督 proposal 方法来生成一些区域 proposals之后预测的轮廓 mask 可以用来选择一些合适的 proposals。定义目标函数如下 arg⁡max⁡y{C∩b(⋃pi∈Pyi⋅pi)}s.t. yi0or 1,P⊆box \arg \max _{y}\left\{\mathcal{C} \cap b\left(\bigcup_{p_{i} \in \mathcal{P}} y_{i} \cdot p_{i}\right)\right\} \text { s.t. } y_{i}0 \quad \text { or } \quad 1, \mathcal{P} \subseteq \text { box } argymax​⎩⎨⎧​C∩b​pi​∈P⋃​yi​⋅pi​​⎭⎬⎫​ s.t. yi​0 or 1,P⊆ box 其中 C\mathcal{C}C 为轮廓点像素的集合可以通过对预测的特征图 CCC 二值化获得。P\mathcal{P}P 为 proposals 的集合bbb 为边界提取器。   接下来利用膨胀和腐蚀操作分别处理得到的 mask然后就可以从膨胀后 mask 中抽取出腐蚀的 mask从而得到边界框。如果 proposal pip_ipi​ 被选择上那么设置其标签 yi1y_i1yi​1否则 yi0y_i0yi​0。所有被选择出的 proposal 都作为 PGT mask而 NP 难样本的构建可以通过下面的贪婪算法获得   首先以一个种子 proposal sp 开始其边界和目标轮廓 C\mathcal{C}C 有着最大的交集。接下来利用 sp 作为偏置来添加或移除集合 SSS 中的 proposal直到 SSS 中的边界有着和目标轮廓最大的交集。 对抗边界损失 Ladv\mathcal{L}_{\text{adv}}Ladv​ 和MIL损失 MIL 损失建立在局部交集之上并不会捕捉区域之外的信息而 Ladv\mathcal{L}_{\text{adv}}Ladv​ 建立在全局预测特征图之上从而避免采样正负样本的过程。MIL 损失直接用于训练分割网络而 Ladv\mathcal{L}_{\text{adv}}Ladv​Ltight\mathcal{L}_{\text{tight}}Ltight​ 和 Lzero\mathcal{L}_{\text{zero}}Lzero​ 损失一起来强制捕捉目标的轮廓信息。之后利用这些学习到的轮廓来得到一个更加精确的伪标签。 C、从噪声标签中学习 为了减轻伪标签中噪声对训练的影响本文提出选择高置信度的像素级标签来参与监督。思路来源一个模型容易积累误差而两个模型可以彼此监督从而减小误差。于是本文建立两个网络来迭代地决定哪些标签是有用的。 算法流程首先对于两个网络 N1N_1N1​ 和 N2N_2N2​基于伪标签 MMM 来计算一个 batch 内每个像素的 cross-entropy 损失然后基于损失值对这些像素进行排序。于是有着最小损失的像素很有可能是正确的标签。之后记录每个网络中最小 R(t)%R(t)\%R(t)% 比率损失的像素点索引最后根据这些索引来控制反向传播过程中彼此网络的对应位置。(注意两个网络仅仅在初始化参数上不同。)   保留比例模型一开始学习简单且通用的数据类型然后逐渐地拟合噪声数据。因此在训练开始时采用一个更大的保留比例 R(t)%R(t)\%R(t)%实际设置为R(t)1−η⋅(t/T)R(t)1-\eta\cdot(t/T)R(t)1−η⋅(t/T)其中 ttt 为迭代步最大迭代次数 TTT 设置为 50K噪声水平 η\etaη 设置为 0.1。 五、实验 A、数据集和评估指标 数据集UNC、UNC、Google-Ref、ReferIt   评估指标IoU、PrecX。 B、实施细节 SGD 优化器初始学习率 0.00250K 次迭代之后 ×10%\times 10\%×10%最大迭代 90Kbatch_size 16权重衰减 0.0005输入图像尺寸 320×320320\times 320320×320最大句子词数 20 C、性能比较 定量评估 定性评估 D、消融实验 消融实验在 UNC 数据集上进行。 Ltight\mathcal{L}_{\text tight}Ltight​ 和 Lce\mathcal{L}_{\text ce}Lce​ 对抗边界损失的有效性: 同表 Ⅲ。 自训练策略 Self-T 和共同训练策略 Co-T: 同表 Ⅲ。 N1N2N_1 N_2N1​N2​ 的结果: 同表 Ⅲ。 与全监督算法的比较: 同表 Ⅲ。 参数敏感性: 同表 Ⅲ 及表 Ⅳ。 Bounding box 没有严格标注限制的结果: 同表 Ⅲ。 目标到 Box 区域的保留比例分析: 同表 Ⅲ。 E、失败的案例 六、结论 本文提出一种两阶段训练方法用于 box 级别的 RIS 弱监督分割。第一阶段用对抗边界损失捕捉前景区域的轮廓然后利用这些轮廓作为先验挑选出合适的 proposal 作为伪标签。第二阶段采用 Co-T 策略来促进两个网络过滤包含噪声的伪标签以及避免误差积累。实验效果牛批。 写在后面   感觉下吧相比于三大顶会确实差了点意思而且作者的写作水平不敢恭维只能说可以做个 Baselinemark 一下 。
http://www.hkea.cn/news/14441394/

相关文章:

  • 东莞网站改版wordpress瀑布流
  • 游戏网站建设项目规划啥是东莞网站制作公司
  • 后缀的域名暂无法进行网站备案网站建设需要那些人
  • 网站式的公司记录怎么做网站建设下坡路
  • 提高企业网站的访问率专业做外贸的网站
  • 盐城专业做网站较好的公司戴尔公司网站建设的特点是什么
  • 在哪个网站做推广好c语言基础知识入门
  • 一个网站怎么做新闻模块wordpress企业免费国人主题
  • 校园网站建设调查问卷台州关键词优化哪家好
  • 南阳做网站纯水设备
  • 南昌建网站单位吉安网站建设公司
  • 一级a做爰片免费网站孕交视频教程wordpress图片博客
  • 惠州市网站开发滁州网站开发公司
  • 连云港企业网站建设公司企业品牌维护
  • 网站点击率代码移动互联网开发招人
  • 大型网站 开发语言企业营销型网站应该有哪些内容
  • 可以先做网站后备案吗苏州要服务网站建设
  • 网站开发支付宝提现网站美工做专题尺寸多少
  • 做网站建设公司crm在线工业产品设计名词解释
  • 济宁网站建设 济宁智雅微信公众平台小程序是什么
  • 鲜花团购网站建设wordpress编辑导航栏
  • 自己电脑做网站服务器小工具wordpress enter
  • 建网站需要什么设计专业触宝免费网络电话
  • 个人做广播网站需要注意什么wordpress悬浮窗安装
  • wordpress建立移动站win7版本的wordpress
  • 微课网站开发网站设计语言翻译
  • 响应式网站和传统网站异同广告公司起名字大全
  • 烟台环保网站建设太突然我国突然宣布
  • 石家庄红酒公司 网站建设wordpress varnish
  • 公司专业网站建设品牌代运营公司