域名注册网站有哪些,超级优化还原,怎么做网站文字优化,邯郸专业做网站多少钱5.1 目标分类、检测与分割 在计算机视觉领域#xff0c;目标分类、检测与分割是常用计数。三者的联系与区分又在哪呢#xff1f;目标分类是解决图像中的物体是什么的问题#xff1b;目标检测是解决图像中的物体是什么#xff0c;在哪里的问题#xff1b;目标分割时将目标和…5.1 目标分类、检测与分割 在计算机视觉领域目标分类、检测与分割是常用计数。三者的联系与区分又在哪呢目标分类是解决图像中的物体是什么的问题目标检测是解决图像中的物体是什么在哪里的问题目标分割时将目标和背景分离出来找出目标的轮廓线。 衡量目标检测性能优劣的指标一方面要体现分类特性(准确度、精确率、召回率)另一方面要体现其定位特征对于定位特征通常用IoU来评价。交并比用来计算两个边界框交集和并集和并集之比它衡量了两个边界框的重叠程度如果重叠程度越高检测越准确
5.2 R-CNN目标检测算法原理与实现 R-CNN利用候选区域卷积神经网络的方法解决了图像中的定位问题对于小规模数据集的问题R-CNN利用AlexNet在ImageNet上预训练好的模型基于迁移学习的原理对参数进行微调。 第一步首先会有很多候选框区域这些区域是由图像分割的方法得到的原始区域然后进行合并得到的一个层次化的区域这些区域内就可能存在需要的内容 第二步因为使用的为AlexNet上一章我们很详细的说明了。将我们的候选区域压缩到 227*227输入到神经网络中获得4096维的矩阵每个候选区域都有一个矩阵。 第三步判断类别候选框个数*4096特征与20哥SVM支持向量机组成的全职矩阵 4096*20获得 2000 * 20维矩阵分别对上述2000×20维矩阵中每一列即每一类进行非极大值抑制剔除重叠建议框得到该列即该类中得分最高的一些建议框。 SVM是线性分类器相当于绘出一条线让两组不同的数据距离他的距离最远。 最后修正这个框得到得分最高的框 基于上面的过程下面给出步骤 首先通过Image Labeler App构建R-CNN目标检测器并导入图片 并利用标签对图像进行标志 标签完成后导出到工作空间内 trainingdateobjectDetectorTrainingData(gTruth); objectDetectorTrainingData函数可以将我们上面导出的图片转换为用于训练的数据就可以导入网络进行使用了给出完整代码如下
%% 进行数据类型的转化
trainingdateobjectDetectorTrainingData(gTruth);
%% 导入网络
netalexnet;
%% 设置训练策略参数并进行训练
% 设置训练策略参数
options trainingOptions(sgdm, ...MiniBatchSize, 128, ...InitialLearnRate, 1e-3, ...LearnRateSchedule, piecewise, ...LearnRateDropFactor, 0.1, ...LearnRateDropPeriod, 100, ...MaxEpochs,10, ...Verbose, true);% 训练网络.rcnn trainRCNNObjectDetector(trainingdate, net, options, ...NegativeOverlapRange, [0 0.3], PositiveOverlapRange,[0.5 1]) ;%% 显示测试结果
% 读取数据
I imread(E:\MATLAB_DeepLearning\chapter_9\stop_sign_ch\slowtest.jpg);
% 用检测器测试
[bboxes,scores] detect(rcnn,I);
% 标注测试结果并显示
I insertObjectAnnotation(I,rectangle,bboxes,scores);
figure
imshow(I)效果如下 111