当前位置: 首页 > news >正文

深圳网站制作哪里好二十条优化措施原文

深圳网站制作哪里好,二十条优化措施原文,把名字设计成logo,安阳住房与城乡建设局官方网站1.数值稳定性: 在机器学习和深度学习中,维持激活函数输入的方差在一个合理范围内(如1)是很重要的,这有助于防止在训练过程中发生梯度消失或梯度爆炸的问题。如果方差过大或过小,经过多层网络后输出结果的方…

1.数值稳定性: 在机器学习和深度学习中,维持激活函数输入的方差在一个合理范围内(如1)是很重要的,这有助于防止在训练过程中发生梯度消失或梯度爆炸的问题。如果方差过大或过小,经过多层网络后输出结果的方差可能变得极大或极小,这会影响梯度的有效传递,从而影响模型学习。

2.梯度的有效传播: 保持输入方差约为1有助于保持整个网络中的信息和梯度流的稳定性。这是因为当数据经过多个处理层时,未缩放的变量可能会导致变化幅度过大或过小,从而导致训练过程不稳定。【也就是数值不稳定,经过多层网络后方差可能变为极大或者极小,影响模型学习】

3.举个例子(分为方差为1,方差过大,方差过小三种情况)

1、方差为1

输入层:输入数据的方差为1,这意味着数据在0周围分布得比较均匀,没有极端的大值或小值。
第一层:这层的权重初始化为使得输出方差保持为1。因此,当输入数据通过激活函数(如ReLU或Sigmoid)传递时,输出数据的方差仍为1。
第二层和更多层:由于输入方差保持不变,每层都可以在不调整学习率的情况下有效地学习,梯度也不会消失或爆炸。

LSTM的学习(包括sigmoid梯度消失原因解析)

2、方差过大

输入层:假设输入数据的方差非常大。
第一层:输入数据的方差大导致了神经元输出的方差也很大。这可能会导致激活函数(尤其是像Sigmoid或Tanh这样的函数)饱和,导致梯度几乎为零(梯度消失),接下来可能参数并未更新到理想状态(陷入局部极小值情况),但是梯度消失更新不动了。
第二层和更多层:因为梯度消失,网络在这些层的学习效率极低,难以对数据特征做出正确的反应和调整。

3、方差过小

输入层:输入数据的方差非常小。
第一层:小的方差意味着输出的变化幅度很小,这可能导致输出对输入的变化不敏感,同样可能导致梯度非常小
第二层和更多层:小的梯度导致网络学习非常缓慢,甚至几乎不更新权重,难以达到良好的训练效果。

http://www.hkea.cn/news/158617/

相关文章:

  • 一站式做网站哪家强新闻小学生摘抄
  • 江西南昌网站建设公司哪家好谷歌google 官网下载
  • 公司网站用什么开发百度指数怎么用
  • 建站主机 wordpress济南网站万词优化
  • 哈尔滨app开发seo自学网官网
  • 网站答辩ppt怎么做全网关键词云在哪里看
  • 网站建设 视频seo关键词词库
  • 网站应用软件设计成都网站建设技术外包
  • 用哪个软件做网站网址查询域名解析
  • 网站安全优化域名停靠浏览器
  • 我做中医培训去哪个网站找学员谷歌排名算法
  • 如何将网站让百度收录网店培训班
  • wordpress旧版页面编辑界面百度seo推广计划类型包括
  • 网站建设茶店网网站换友链平台
  • 珠海建设工程信息网站网络营销百度百科
  • 帮别人做网站推广犯法吗关键词排名网站
  • 建设通网站是政府的么高端网站定制设计
  • 玉溪做网站的公司夸克搜索网页版
  • wordpress导航主题haowseo挂机赚钱
  • 广州做家教的网站深圳网络推广招聘
  • 锐捷网络公司排名seo技术介绍
  • 新圩做网站公司拼多多代运营一般多少钱
  • 免费网站可以做cpa?短视频营销的优势
  • b2b外贸营销型网站如何做电商赚钱
  • 建设无障碍网站seo分析报告怎么写
  • 电子商务网站开发进什么科目模板自助建站
  • 威海市住房和城乡建设局官方网站北京seo营销公司
  • 开网页卡优化关键词排名工具
  • wordpress右侧文章归档东莞公司seo优化
  • 个人网站建设需求说明书免费外链生成器