当前位置: 首页 > news >正文

软件站手机vi设计公司

软件站,手机vi设计公司,网站手机端制作软件,个人网站主机选择一、前言 如何快速搭建图像分割网络#xff1f; 要手写把backbone #xff0c;手写decoder 吗#xff1f; 介绍一个分割神器#xff0c;分分钟搭建一个分割网络。 仓库的地址#xff1a; https://github.com/qubvel/segmentation_models.pytorch该库的主要特点是#…一、前言 如何快速搭建图像分割网络 要手写把backbone 手写decoder 吗 介绍一个分割神器分分钟搭建一个分割网络。 仓库的地址 https://github.com/qubvel/segmentation_models.pytorch该库的主要特点是 高级 API只需两行即可创建神经网络用于二元和多类分割的 9 种模型架构包括传奇的 Unet 124 个可用编码器以及 timm 的 500 多个编码器所有编码器都有预先训练的权重以实现更快更好的收敛训练例程的流行指标和损失 二、快速引入—使用 SMP 创建您的第一个分割模型 分割模型只是一个 PyTorch nn.Module创建起来很简单 import segmentation_models_pytorch as smpmodel smp.Unet(encoder_nameresnet34, # choose encoder, e.g. mobilenet_v2 or efficientnet-b7encoder_weightsimagenet, # use imagenet pre-trained weights for encoder initializationin_channels1, # model input channels (1 for gray-scale images, 3 for RGB, etc.)classes3, # model output channels (number of classes in your dataset) )三、Architectures 我们可以用到的 model 有 UnetUnetMAnetLinknetFPNPSPNetPANDeepLabV3DeepLabV3 3.1 UNet UNet是一种常用于图像分割任务的深度学习架构。它由Olaf Ronneberger、Philipp Fischer和Thomas Brox于2015年在他们的论文《U-Net: Convolutional Networks for Biomedical Image Segmentation》中提出。 UNet的名字来自其U形的网络结构。它的设计目标是从输入图像中捕获低层次和高层次特征然后利用这些信息生成像素级别的分割掩码。UNet在医学图像分析中特别受欢迎因为它对于分割器官、肿瘤和其他感兴趣的结构非常有效。 UNet架构主要由两个部分组成 收缩路径该部分类似于典型的卷积神经网络架构包含多个卷积和池化层。它被称为收缩路径因为每个卷积层减小空间维度同时增加特征通道数量。 扩展路径该部分涉及将特征映射进行上采样恢复原始空间维度。它被称为扩展路径因为它增加空间维度同时减少特征通道数量。 在U形架构的中心有一个瓶颈层它保留了局部和全局的上下文信息。 收缩路径和扩展路径是对称的并通过跳跃连接相连接。这些跳跃连接有助于在上采样过程中保留细粒度的空间信息使UNet特别适合图像分割任务。 在原始的UNet论文中作者将该架构应用于生物医学图像分割任务例如在电子显微镜数据中分割神经结构。然而自那时以来UNet架构已广泛应用于其他领域的图像分割任务如自然图像、卫星图像等。 由于其有效性UNet已成为各种扩展和改进的基础并且在深度学习领域仍然是图像分割任务的热门选择。 3.2 UNet Unet是对UNet进行改进和扩展的深度学习架构。它是由Zhou et al.于2018年在论文《UNet: A Nested U-Net Architecture for Medical Image Segmentation》中提出的。 Unet在原始UNet的基础上增加了一些重要的结构来提高图像分割的性能。主要的改进是引入了多层级的嵌套结构使得模型能够更好地捕获不同尺度下的特征信息。以下是Unet的主要特点 多层级嵌套Unet采用了一种层级嵌套的结构将UNet的每个阶段进行进一步细分。这样可以在不同的阶段获取更多的细节和语义信息从而提高了分割的准确性。 密集跳跃连接Unet引入了密集的跳跃连接将不同层级的特征图进行融合。这样可以使低层级的特征图能够直接参与到高层级的特征表示中有助于更好地整合多尺度的信息。 自适应选择性上采样在Unet的解码器部分采用了自适应选择性上采样技术根据不同特征图的重要性进行选择性地上采样。这样可以减少计算量并且避免了不必要的信息传递。 通过这些改进Unet在医学图像分割等任务中取得了较好的性能相对于原始UNet它能够更准确地定位和分割感兴趣的目标结构。 需要注意的是自从Unet的提出以来还可能有其他进一步的改进和扩展因为深度学习领域一直在不断发展和演进。 3.3 FPN **FPN是Feature Pyramid Network 的缩写是一种用于目标检测和语义分割任务的深度学习架构。它由Tsung-Yi Lin、Piotr Dollár、Ross Girshick和Kaiming He于2017年在论文《Feature Pyramid Networks for Object Detection》中提出。 FPN的目标是解决多尺度信息的问题。在许多计算机视觉任务中目标可能在图像的不同尺度下出现而且较小的目标可能在较低层级的特征图中丢失细节。FPN通过构建特征金字塔来解决这个问题。 FPN的主要思想是将不同层级的特征图进行融合以提取多尺度的特征信息。它包含以下主要组件 底层特征从卷积神经网络的底层获得的特征图。这些特征图具有高分辨率但缺乏语义信息。顶层特征从网络的顶层获得的特征图。这些特征图具有较低的分辨率但包含丰富的语义信息。 FPN的构建过程如下 首先通过一个卷积层将顶层特征图的通道数降低使其与底层特征图的通道数相同。 然后将降低通道数的顶层特征图与底层特征图相加产生一组新的特征图这些特征图在不同的层级上融合了多尺度的信息。 接下来将融合后的特征图通过上采样操作通常使用插值方法增加分辨率得到高分辨率的多尺度特征金字塔。 FPN的特征金字塔允许目标检测器或分割器在不同尺度下检测或分割目标从而显著提高了算法的性能。由于其有效性和简单性FPN已成为许多目标检测和语义分割任务的常用组件并被广泛应用于许多深度学习模型中。 3.4 DeepLabV3 DeepLabV3是用于图像语义分割的深度学习模型由Google于2018年推出。它是DeepLab系列模型的第三个版本是对前两个版本的改进和扩展。 DeepLabV3的目标是对输入图像的每个像素进行分类将每个像素标记为属于不同类别的某个目标或背景。该模型在图像分割任务中取得了很好的性能尤其在细粒度的分割和边界细化方面表现出色。 主要的改进点包括 空洞卷积Atrous ConvolutionDeepLabV3引入了空洞卷积来增大感受野允许模型在保持计算效率的同时获取更大范围的上下文信息。这有助于识别更大和更细微的目标。 多尺度信息融合为了解决多尺度信息的问题DeepLabV3使用了多尺度空洞卷积将不同尺度的信息进行融合从而提高了模型的语义分割性能。 引入特征金字塔池化ASPPASPP模块进一步增加了感受野帮助模型更好地理解图像中的上下文信息。ASPP模块由一组并行的空洞卷积层组成每个卷积层的空洞率不同从而捕获不同尺度的信息。 使用深度可分离卷积为了减少模型的参数量和计算量DeepLabV3采用了深度可分离卷积这是一种将标准卷积分解为深度卷积和逐点卷积的方法。 DeepLabV3模型在PASCAL VOC 2012和Cityscapes等图像分割数据集上取得了显著的性能提升成为当时图像语义分割领域的先进模型。其优秀的性能使得DeepLabV3被广泛应用于许多图像分割任务特别是在需要准确分割细节的场景中。 四、Encoders 以下是 SMP 中支持的编码器列表。 选择适当的编码器系列然后单击展开表格并选择特定的编码器及其预训练权重encoder_name 和encoder_weights 参数。 ResNetResNeXtResNeStRes2Ne(X)tRegNet(x/y)GERNetSE-NetSK-ResNe(X)tDenseNetInceptionEfficientNetMobileNetDPNVGGMix Vision TransformerMobileOne 我这里只展示其中一个以 ResNet 为例 更多权重详见我的kaggle数据集 https://www.kaggle.com/datasets/holmes0610/pretrained-resnet-resnexthttps://www.kaggle.com/datasets/holmes0610/timm-pretrainedPytorch 图像模型又名 timm有很多预训练模型和接口允许使用这些模型作为 smp 中的编码器但是并非所有模型都受支持。 并非所有 Transformer 模型都实现了编码器所需的 features_only 功能一些模型的步幅不合适 支持的编码器总数549 https://smp.readthedocs.io/en/latest/encoders_timm.html这个网址里面总结了所有可用的 Encoders。 五、Models API model.encoder预训练主干提取不同空间分辨率的特征model.decoder取决于模型架构Unet / Linknet / PSPNet / FPNmodel.segmentation_head最后一个块产生所需数量的掩模通道还包括可选的上采样和激活model.classification_head在编码器顶部创建分类头的可选块model.forward(x)按顺序将 x 通过模型的编码器、解码器和分段头以及分类头如果指定 六、安装 PyPI version pip install segmentation-models-pytorchLatest version from source pip install githttps://github.com/qubvel/segmentation_models.pytorch
http://www.hkea.cn/news/14406316/

相关文章:

  • 建网站一定要备案吗国外优秀设计网站有哪些
  • 个人网站系统网站值多少钱
  • 网站主页设计注意点彬县网站建设
  • 网站建设案例 算命网站免费设计房子的软件
  • 深圳市外贸网站建设多少钱cnzz统计代码如何添加到网站上去
  • 电商网站建设开发公司网站建设赚取流量费
  • 网站开发维护需要哪些岗位海外网络推广培训
  • 6做网站自己开网站能赚钱吗
  • 温州地区做网站百度会收录双域名的网站么
  • 自己做网站怎么别人怎么浏览唐山哪里建轻轨和地铁
  • 网站前置审批类型wordpress背景图片下载
  • 厦门网络推广建网站网站建设评审验收会议主持词
  • 稷山网站制作网站程序h5
  • 南阳集团网站建设网站建设预算表制作
  • 营销型网站建设价格是多少外贸平台有哪些知乎
  • 石家庄信息网官方网站wordpress自动alt
  • 建设电子票务系统的网站需要多少钱网址导航发布页
  • 江门学做网站课程国内企业邮箱哪家好
  • 选择建设网站公司要注意什么问题顺义手机网站建设
  • 网站没有icp备案上海网站建设品
  • 阿里云里面网站建设wordpress打开慢排查
  • 银川网站建设银川网站空间怎么收费
  • 深圳市做网站知名公司有哪些上海中高端网站建设
  • 百度网站公司信息推广怎么做域名 阿里云
  • 郑州企业网站优化哪家便宜黄山网站设计
  • 网络营销是什么专业的课seo全网营销的方式
  • 中山做营销型网站公司深圳个人做网站
  • 宁夏 网站制作淘宝店铺头像logo制作
  • 后台更新的内容在网站上不显示网上写作如何投稿赚钱
  • 茂名网站开发公司wordpress修改博客