当前位置: 首页 > news >正文

前端网站主题怎么做枣庄公司网站建设

前端网站主题怎么做,枣庄公司网站建设,网站焦点图设计,网站建设与网页制作试卷前言#xff1a; 长短期记忆网络#xff08;LSTM#xff0c;Long Short-Term Memory#xff09;是一种时间循环神经网络#xff0c;是为了解决一般的RNN#xff08;循环神经网络#xff09;存在的长期依赖问题而专门设计出来的。 目录#xff1a; 背景简介 LSTM C…前言 长短期记忆网络LSTMLong Short-Term Memory是一种时间循环神经网络是为了解决一般的RNN循环神经网络存在的长期依赖问题而专门设计出来的。 目录 背景简介     LSTM Cell     LSTM 反向传播算法     为什么能解决梯度消失      LSTM 模型的搭建 一  背景简介 1.1  RNN RNN 忽略 模型可以简化成如下 图中Rnn Cell 可以很清晰看出在隐藏状态。 得到 后: 一方面用于当前层的模型损失计算另一方面用于计算下一层的 由于RNN梯度消失的问题后来通过LSTM 解决  1.2 LSTM 结构 二  LSTM  Cell LSTMCell(RNNCell) 结构 前向传播算法 Forward 2.1   更新 forget gate 忘记门 将值朝0 减少 激活函数一般用sigmoid 输出值[0,1] 2.2 更新 Input gate 输入门 决定是不是忽略输入值 2.3 更新 候选记忆单元 2.4 更新 记忆单元 2.5  更新 输出门 决定是否使用隐藏值 2.6. 隐藏状态 2.7  模型输出 LSTM 门设计的解释一  输入门 遗忘门输出门 不同取值组合的时候记忆单元的输出情况 三  LSTM 反向传播推导 3.1 定义两个 3.2  定义损失函数 损失函数分为两部分:  时刻t的损失函数  时刻t后的损失函数 3.3 最后一个时刻的 这里面要注意这里的 证明一下第二项主要应用到微分的两个性质,以及微分和迹的关系          ... 公式1 微分和迹的关系              因为                           带入上面公式1                        所以 3.4   链式求导过程 求导结果 这里详解一下推导过程   这是一个符合函数求导先把h 写成向量形成  ------------------------------------------------------------     第一项                                            设             则                   其中利用矩阵求导的定义法 分子布局原理                      是一个对角矩阵                                                                         几个连乘起来就是第一项                 第二项 参考     其中     其它也是相似就有了上面的求导结果 四  为什么能解决梯度消失 4.1 RNN 梯度消失的原理 ,复旦大学邱锡鹏书里面 有更加详细的解释通过极大假设 在梯度计算中存在梯度的k 次方连乘 导致 梯度消失原理。 4.2  LSTM 解决梯度消失 解释1 通过上面公式发现梯度计算中是加法运算不存在连乘计算 极大概率降低了梯度消失的现象。 4.3  LSTM 解决梯度 消失解释2 记忆单元c  作用相当于ResNet的残差部分.   比如 时候,,不会存在梯度消失。 五 模型的搭建 我们最后发现 的维度必须一致都是hidden_size 通过,则  最后一个维度也必须是hidden_size # -*- coding: utf-8 -*-Created on Thu Aug 3 15:11:19 2023author: chengxf2 # -*- coding: utf-8 -*-Created on Wed Aug 2 15:34:25 2023author: chengxf2 import torch from torch import nn from d21 import torch as d21def normal(shape,devices):data torch.randn(size shape, devicedevices)*0.01return datadef get_lstm_params(input_size, hidden_size,categorize_size,devices):#隐藏门参数W_xf normal((input_size, hidden_size), devices)W_hf normal((hidden_size, hidden_size),devices)b_f torch.zeros(hidden_size,devices)#输入门参数W_xi normal((input_size, hidden_size), devices)W_hi normal((hidden_size, hidden_size),devices)b_i torch.zeros(hidden_size,devices)#输出门参数W_xo normal((input_size, hidden_size), devices)W_ho normal((hidden_size, hidden_size),devices)b_o torch.zeros(hidden_size,devices)#临时记忆单元W_xc normal((input_size, hidden_size), devices)W_hc normal((hidden_size, hidden_size),devices)b_c torch.zeros(hidden_size,devices)#最终分类结果参数W_hq normal((hidden_size, categorize_size), devices)b_q torch.zeros(categorize_size,devices)params [W_xf,W_hf,b_f,W_xi,W_hi,b_i,W_xo,W_ho,b_o,W_xc,W_hc,b_c,W_hq,b_q]for param in params:param.requires_grad_(True)return paramsdef init_lstm_state(batch_size, hidden_size, devices):cell_init torch.zeros((batch_size, hidden_size),devicedevices)hidden_init torch.zeros((batch_size, hidden_size),devicedevices)return (cell_init, hidden_init)def lstm(inputs, state, params):[W_xf,W_hf,b_f,W_xi,W_hi,b_i,W_xo,W_ho,b_o,W_xc,W_hc,b_c,W_hq,b_q] params (H,C) stateoutputs []for x in inputs:#input gateI torch.sigmoid((xW_xi)(HW_hi)b_i)F torch.sigmoid((xW_xf)(HW_hf)b_f)O torch.sigmoid((xW_xo)(HW_ho)b_o)C_tmp torch.tanh((xW_xc)(HW_hc)b_c)C F*CI*C_tmpH O*torch.tanh(C)Y (HW_hq)b_qoutputs.append(Y)return torch.cat(outputs, dim0),(H,C)def main():batch_size,num_steps 32, 35train_iter, cocab d21.load_data_time_machine(batch_size, num_steps)if __name__ __main__:main() 参考 CSDN https://www.cnblogs.com/pinard/p/6519110.html 57 长短期记忆网络LSTM【动手学深度学习v2】_哔哩哔哩_bilibili
http://www.hkea.cn/news/14346251/

相关文章:

  • 重庆高端网站设计西安空调销售网站建设
  • 湛江市建设局官方网站电商类网站有哪些
  • 潍坊网站开发招聘信息东莞城乡建设
  • 用ps设计一个个人网站模板微信小程序怎么下载
  • 做装修效果图的网站有哪些软件下载重庆森林台词
  • 杭州企业网站seo网页制作的价格大概
  • 网站数据库连接出错公司简介制作
  • 网站建设开拓该行业的难点疑去越南做网站
  • 宜昌本地网站湖南速马科技有限公司
  • 网站设计与开发的基本步骤包括哪些如何设计营销 网站建设
  • 企业网站建设合同应注意什么ionic3 做网站
  • 公司名称变更网站备案怎么处理域名历史记录查询网站
  • 雅安北京网站建设asp学校网站源码
  • 一般网站建设流程有哪些步骤wordpress评论模板 样式
  • 手机网页版网站开发黄岛做网站找哪家好
  • php 网站 发布vue网站开发教程
  • 莆田网站建设方案优化百度竞价排名广告定价
  • 可以做策略回测的网站dedecms做的网站如何上线
  • 天津网站网站建设优化稳定网站排名
  • 网站做友情链接怎样把自己做的网站上传
  • 广州h5网站制作软件培训机构有哪些?哪个比较好
  • 广州市网站建设分站价格西安专业做网站的公司
  • 泰州企业网站建设网站域名到期时间查询
  • 广汉市 建设局网站网站图片倒计时怎么做的
  • 网站可以做系统吗手机网站适合分开做
  • 成都网站建设s1emens中国建设集团门户网
  • 如何做资源论坛网站分类网站作用
  • 做网站的哪家公司好wordpress发布文章添加新字段
  • 中山市城乡住房建设局网站吉林省建设安全监督站网站
  • 网站首页改版影响优化怎么才能注册做网站