当前位置: 首页 > news >正文

龙岩网站建设套餐服务广州制作网页设计

龙岩网站建设套餐服务,广州制作网页设计,手机网站注册页面,磁县网站制作公司1 有监督学习的损失函数 1.1 分类问题 对二分类问题#xff0c; Y{1,−1}#xff0c; 我们希望sign f(xi,θ)yi#xff0c; 最自然的损失函数是0-1损失#xff0c; 函数定义特点0-1损失函数非凸、非光滑#xff0c;很难直接对该函数进行优化Hinge损失函数当fy≥1时 Y{1,−1} 我们希望sign f(xi,θ)yi 最自然的损失函数是0-1损失 函数定义特点0-1损失函数非凸、非光滑很难直接对该函数进行优化Hinge损失函数当fy≥1时 该函数不对其做任何惩罚。 Hinge损失在fy1处不可导 因此不能用梯度下降法进行优化 而是用次梯度下降法Logistic损失函数该损失函数对所有的样本点都有所惩罚 因此对异常值相对更敏感一些交叉熵损失函数 1.2回归问题 希望 最常用的损失函数是平方损失函数 函数定义特点平方损失函数对异常点比较敏感绝对损失函数在fy处无法求导数Huber损失函数在 2 梯度下降法 梯度下降算法发展过程 3 L1正则化与稀疏性 稀疏性就是模型中的很多参数为0相当于对模型进行了特征选择只留下了重要的特征。提高了模型的泛化能力降低了过拟合的可能。 为什么L1正则化能让模型具有稀疏性 3.1 从解空间形状来看 黄色的部分是L2和L1正则项约束后的解空间 绿色的等高线是凸优化问题中目标函数的等高线L2正则项约束后的解空间是圆形 而L1正则项约束的解空间是多边形。显然 多边形的解空间更容易在尖角处与等高线碰撞出稀疏解。 3.2 从函数叠加来看 首先 考虑加上L2正则化项 目标函数变成L(w)Cw2 其函数曲线为黄色。此时 最小值点在黄点处 对应的w*的绝对值减小了 但仍然非0。 然后 考虑加上L1正则化项 目标函数变成L(w)C|w| 其函数曲线为绿色。此时 最小值点在红点处 对应的w是0 产生了稀疏性。 在一些在线梯度下降算法中 往往会采用截断梯度法来产生稀疏性 这同L1正则项产生稀疏性的原理是类似的。 3.3从贝叶斯实验来看 从贝叶斯的角度来理解L1正则化和L2正则化 简单的解释是 L1正则化相当于对模型参数w引入了拉普拉斯先验 L2正则化相当于引入了高斯先验 而拉普拉斯先验使参数为0的可能性更大。
http://www.hkea.cn/news/14447216/

相关文章:

  • 网站里面如何在新闻列表上显示hot公司注册步骤流程
  • 做外国网站百度搜到机械门户网站建设特点
  • 如何自己弄网站建设网站大概要花多少钱
  • 北京住房建设部网站wordpress文章添加媒体
  • 网站建设大作业有代码邢台做网站推广服务
  • 河北住房和城乡建设厅网站电话网站备案填写电话
  • 中山网站建设联系电话关于网站建设方案的案例
  • wordpress商品采集器沈阳seo网站推广
  • 网站出现500个人备案的网站可以卖东西么
  • Excel怎么做网站链接河北移动端网站制作
  • 网站建设论文参考文献人才市场招聘网站
  • 做门户网站需要什么广告设计公司品牌设计
  • 做网站后台系统的规范晚上国网app
  • 新沂做网站百度一下做网站
  • 全屏家居网站模板网站建设品牌推荐
  • 网站的性能需求国内新闻最新官方消息
  • 网站建设合同 域名南阳网站建设的公司
  • 做糕点的网站有哪些即将新款手机上市
  • 谁用腾讯风铃做网站的手机邮箱申请免费注册
  • 自己有云主机 怎么网站备案学院网站建设目标
  • 直接IP做访问我服务器的网站wordpress网站是什么意思
  • 如何做商业网站html网站建设基本流程图
  • 最大网站建设公司网站开发费属于无形资产那部分
  • 上海网站搜索排名进入官方网站
  • 邯郸有建网站吗哪个公司好些怎么做wap网站
  • 网站设计 尺寸网站访问拒绝
  • 张家口网站建设张家口网站内置字体
  • 拍卖网站模板下载什么是网络广告
  • 郑州网站运营专业乐云seo郑州seo外包顾问热狗
  • 湖南网站制作哪家好iis 多网站