网站搭建学什么专业,电商网站平台有哪些功能模块,聊城做网站最好的网络公司,闵行品划网站建设公司SVM恐怕大家即使不熟悉#xff0c;也听说过这个大名吧#xff0c;这一节我们就介绍这相爱相杀一段内容。
前言#xff1a;在介绍一个新内容之SVM前#xff0c;我们不觉映入眼帘的问题是为什么要引入SVM#xff1f;吃的香#xff0c;睡的着的情况下#xff0c;肯定不会是…SVM恐怕大家即使不熟悉也听说过这个大名吧这一节我们就介绍这相爱相杀一段内容。
前言在介绍一个新内容之SVM前我们不觉映入眼帘的问题是为什么要引入SVM吃的香睡的着的情况下肯定不会是没事干吧~首先SVM是一个二分类模型【图1】实质是定义在特征空间的判别模型其实我们大家应该比较熟悉感知机算法了我们前面有讲过也就是找一个超平面来划分特征空间可是满足该条件的超平面有无穷无尽呀我们需要的模型肯定是鲁棒性要超级棒的才好而SVM恰恰是为了完成这种使命而向阳而生的产物它的核心点便是寻找在特征空间中间隔最大的超平面。童鞋们一定在想间隔是啥最大又意味着什么接下来我们娓娓道来。 线性可分支持向量机
我们先来介绍比较低阶的线性可分支持向量机顾名思义给定的训练样本我们可以恰好的找一个超平面直接将数据分为正负两类形成了井水不犯河水的趋势。前面说了对于线性可分的情况下这种超平面有许多因此我们选择那个间隔最大的超平面【唯一的】。超平面长什么样呢
在二维空间下我们就把它理解为一条直线就好不失一般性该超平面定义为 图1 其中是一个多维向量和输入同维度那好了现在有决策超平面了你说的间隔最大的间隔是什么我们先看一下图一A,B,C三个样本都被分到了正类一侧但是A距离超平面较远C距离最近那么我们想想是不是A被分别正类的置信度比其它两个样本都要高因为A被分为正类的感觉很严格呀至于C是不是因为噪声或者什么因素它也很可能是属于负类的即使它被分为了正类。因此我们把样本到超平面的距离远近可以表示为分类预测的置信程度。那样本到平面的距离公式是啥这个我们应该最清楚的小学内容还是可以手拿把掐滴【公式1】。忽略分母常数项不看我们可以把相对的表示为点到超平面的远近而与类标签的符号是否一致就能够表示分类是否正确。因此我们用就可以表示为分类的正确性和置信度我们就把这个量称作函数间隔。 公式1其中A,B,C是平面的法向量系数 还没完这个是我们给出了单个样本到超平面的函数间隔表示。而我们在SVM中所说的函数间隔表示为 在所有样本的函数间隔中函数间隔最小的那个值是整个训练集的函数间隔。有点拗口对不对我们给出公式化的表达 根据我们对超平面的认识算了咱就说平面吧挂个超字总显的高大上描述一个平面其实就是确定w和b,不过平面是很大的一个物体呀经过同比例的扩大或缩小w,b其实表示的是一个平面。如果这样的话函数间隔就是一个变量了这对后续的处理很不友好。况且前面我们说了严格的点到平面的距离公式分母是有一个规范化的值的现在我们再把它完整的描绘出来就会得到公式2而它的专业描述称作几何间隔而我们后面要间隔最大化其实就是指最大化几何间隔。 公式2 SVM核心的概念我们大致介绍了一下剩下的就是用带约束的不等式求解参数拉格朗日乘子顶上等等这个我们后面再聊聊对了今年2023年的最后一天了就让SVM向量机划分时空区域对2023说拜拜~