网站有了订单邮箱提醒代码,网站建设是什么专业,把wordpress集成进,做网站需要写程序论文地址#xff1a;DOI: 10.11975/j.issn.1002-6819.2021.22.017 概要
环境信息感知是智能农业装备系统自主导航作业的关键技术之一。农业田间道路复杂多变#xff0c;快速准确地识别可通行区域#xff0c;辨析障碍物类别#xff0c;可为农业装备系统高效安全地进行路径规…论文地址DOI: 10.11975/j.issn.1002-6819.2021.22.017 概要
环境信息感知是智能农业装备系统自主导航作业的关键技术之一。农业田间道路复杂多变快速准确地识别可通行区域辨析障碍物类别可为农业装备系统高效安全地进行路径规划和决策控制提供依据。
本文提出了一种基于深度学习的田间非结构化道路场景语义分割模型旨在通过图像识别技术对农业田间道路进行高效、准确的语义分割。通过对不同环境条件下采集的田间道路图像进行处理模型能够识别动态和静态物体支持自动化农业导航系统的路径规划和动态避障。本文模型结合了轻量级卷积神经网络MobileNetV2、混合扩张卷积、通道注意力机制和金字塔池化模块优化了分割精度和运行效率适用于农业导航系统中复杂的田间道路场景。 关键词 机器视觉语义分割环境感知非结构化道路轻量卷积注意力机制特征融合 Motivation
随着农业自动化技术的发展田间道路识别成为农业自动导航系统中的一项关键技术。
传统的田间道路图像识别受限于复杂的环境条件如不同光照、天气、路面类型等导致识别效果不稳定。非结构化的农业道路如园区道路、乡村道路由于形态不规则、存在多种障碍物给传统算法带来较大挑战。
因此提出一种高效、鲁棒的田间道路场景语义分割模型能够准确识别各种动态和静态对象为农业自动化导航提供精准的场景理解和决策支持。
系统框架 本文的语义分割模型由编码器和解码器两部分组成采用轻量级卷积神经网络MobileNetV2进行特征提取辅以混合扩张卷积、通道注意力模块和金字塔池化模块以增强模型的分割能力和准确度。具体框架如下
编码器使用MobileNetV2作为轻量级特征提取网络通过卷积和池化操作提取图像的低级特征。混合扩张卷积引入混合扩张卷积来扩大感受野避免信息丢失确保细节恢复。
通道注意力机制结合低级和高级特征信息利用通道注意力机制提升特征融合效果提高预测准确性。
金字塔池化模块通过多个尺度的池化操作聚合不同区域的信息增强全局场景上下文信息提升分割性能。解码器上采样输出的特征图并进行像素级分类得到最终的语义分割结果。
技术细节
本文田间道路场景语义分割模型属于全监督学习类型需要使用人工精细标注的语义图像作为训练样本。采集的图像本身没有标签和语义利用 Lableme 工具对图像中需要训练的类别进行语义标注标注后的文件以.jason 格式存储然后通过批量转换文件将标注文件转换为.png 格式的标签图像。 轻量特征提取网络使用MobileNetV2网络进行图像特征提取改进了传统的深度卷积神经网络使得模型在保证准确率的同时具备较低的计算复杂度和较快的推理速度。MobileNetV2去除了全局池化和分类层仅使用卷积层提取图像特征。 混合扩张卷积采用混合扩张卷积Hybrid Dilated Convolution代替传统的扩张卷积通过设置不同扩张率1, 2, 3来避免信息丢失和感受野出现空间间隙。 通道注意力模块利用通道注意力机制结合低级和高级特征进行融合通过权重调整提升重要特征的权重减少无关特征对结果的干扰增强类内一致性。 金字塔池化模块采用金字塔池化模块结合不同尺度的信息来增强全局上下文信息提升模型在复杂场景中的分割精度。 损失函数结合交叉熵损失和Dice系数损失使得模型在进行像素级分类时既能够优化每个像素类别的准确性又能够提高整体分割质量特别是针对类别不平衡问题。
小结
根据表 1 的数据可以得出以下几点分析 静态物体识别道路、天空、建筑、植被、土壤、水域 这些对象具有明显的纹理、颜色和形状特征因此它们的识别准确率较高。由于静态物体在不同环境中的外观变化较小且在图像中通常具有较为稳定的特征这使得深度学习模型能够有效提取并识别这些物体。 动态物体识别车辆、行人 车辆和行人属于动态障碍物其识别准确率相对较低。动态物体的出现和运动会受到诸如距离、运动方向、速度等因素的影响这些因素使得它们的外观变化更加不稳定从而导致模型在分割时出现一定的困难。因此车辆和行人通常需要更多的上下文信息和动态建模才能提高识别准确度。 地面覆盖物识别 地面覆盖物如泥土、草地等的外观在不同季节和环境下变化较大特征信息复杂多样。随着环境条件的变化地面覆盖物的纹理、颜色、形状等特征会发生显著变化给模型带来挑战。因此这类物体的识别准确率通常较低。 小目标识别线杆 线杆等小目标在图像中的面积较小经过多次下采样操作后特征图的分辨率会显著降低导致部分像素的空间位置信息丢失。这些小目标在恢复时容易出现不完全的分割或目标丢失的情况。即使通过上采样方法恢复特征图模型仍难以恢复其准确的位置因而导致识别准确率较低。 各类对象的识别准确率受到不同因素的影响静态物体相对容易识别而动态物体、地面覆盖物及小目标的准确度较低。针对这些问题未来的研究可以在模型中加入更多的上下文信息、动态建模以及针对小目标的特征增强方法进一步提升这些对象的识别精度。 根据表 2 的数据分析可以得出以下结论 HDC 模块的影响 采用 HDC高效深度卷积模块替代普通扩张卷积显著提升了模型的 PA像素准确率和 MAP均值平均精度分别达到 89.82% 和 85.68%。这一提升表明HDC 模块通过增大感受野并保留更多的像素空间位置信息能够有效提高模型在像素预测方面的性能尤其在处理具有复杂背景的图像时尤为有效。尽管 HDC 模块增加了计算复杂度但其对模型的整体影响相对较小参数量增加了 5.35%检测速度降低了 10.70%。 CAB 模块的影响 引入通道注意力模块CAB后模型的 PA 和 MAP 分别提升至 92.46% 和 88.72%。CAB 模块利用高级阶段的强语义信息来引导低级阶段提取更具判别性的特征从而增强了类内预测的一致性并提升了分割效果。然而CAB 模块带来了较大的参数量增加模型的参数量增加了 39.28%检测速度下降了 22.25%。 PPM 模块的影响 添加金字塔池化模块PPM使模型的 PA 和 MAP 达到最高值分别为 94.85% 和 90.38%。PPM 模块通过聚合不同区域的信息增强了模型获取全局上下文的能力提升了像素级别的预测精度。然而PPM 模块对模型的计算开销影响较大模型参数量增加了 54.48%检测速度降低了 31.41%。 总结与对比 HDC 模块对模型的性能提升贡献最大但对计算效率的影响最小是最优的平衡点。CAB 模块虽然显著提高了分割效果但增加的计算成本较高影响了检测速度。PPM 模块对分割效果的提升作用最大但其引入的计算开销也最大导致检测速度下降明显。 因此综合考虑模型性能和计算效率HDC 模块的加入是最有效的而 CAB 和 PPM 模块则在提升性能的同时增加了较大的计算负担。在实际应用中需根据具体需求权衡性能和效率。
本文提出了一种基于深度学习的田间非结构化道路语义分割模型并在不同环境条件下进行数据采集和处理证明该模型能够在农业导航系统中有效识别和分割复杂的道路场景。通过融合轻量级卷积神经网络、混合扩张卷积、通道注意力机制和金字塔池化模块本文模型在保证较低计算复杂度的同时显著提升了分割精度。实验结果表明该模型能够实现高效的动态物体识别与路径规划为农业自动导航系统提供可靠的道路场景解析支持。