当前位置: 首页 > news >正文

网站维护中模版WordPress dux修改

网站维护中模版,WordPress dux修改,建站专业定制,如何给网站增加内链人工智能例子汇总#xff1a;AI常见的算法和例子-CSDN博客 LSTM 通过 记忆单元#xff08;cell#xff09; 和 三个门控机制#xff08;遗忘门、输入门、输出门#xff09;来控制信息流#xff1a; 记忆单元#xff08;Cell State#xff09; 负责存储长期信息… 人工智能例子汇总AI常见的算法和例子-CSDN博客  LSTM 通过 记忆单元cell 和 三个门控机制遗忘门、输入门、输出门来控制信息流 记忆单元Cell State 负责存储长期信息并通过门控机制决定保留或丢弃信息。 遗忘门Forget Gate, ftf_tft​ 输入门Input Gate, iti_tit​ 输出门Output Gate, oto_tot​ 特性 传统 RNNLSTM记忆能力短期记忆长短期记忆计算复杂度低高解决梯度消失否是适用场景短序列数据长序列数据 LSTM 应用场景 自然语言处理NLP文本生成、情感分析、机器翻译时间序列预测股票预测、天气预报、传感器数据分析语音识别自动字幕生成、语音转文字ASR机器人与控制系统智能体决策、自动驾驶 例子 下面例子实现了一个 基于 LSTM 的强化学习智能体在 1D 网格环境 里移动并找到最优路径。 最终我们 绘制 5 条测试路径并高亮显示最佳路径红色 import torch import torch.nn as nn import torch.optim as optim import matplotlib.pyplot as plt# 1. 定义 LSTM 策略网络 class LSTMPolicy(nn.Module):def __init__(self, input_size, hidden_size, output_size, num_layers1):super(LSTMPolicy, self).__init__()self.hidden_size hidden_sizeself.num_layers num_layersself.lstm nn.LSTM(input_size, hidden_size, num_layers, batch_firstTrue)self.fc nn.Linear(hidden_size, output_size)self.softmax nn.Softmax(dim-1)def forward(self, x, hidden_state):batch_size x.size(0)# 确保 hidden_state 维度正确if hidden_state[0].dim() 2:hidden_state (hidden_state[0].unsqueeze(1).repeat(1, batch_size, 1),hidden_state[1].unsqueeze(1).repeat(1, batch_size, 1))out, hidden_state self.lstm(x, hidden_state)out self.fc(out[:, -1, :]) # 取最后时间步的输出action_prob self.softmax(out) # 归一化输出作为策略return action_prob, hidden_statedef init_hidden(self, batch_size1):return (torch.zeros(self.num_layers, batch_size, self.hidden_size),torch.zeros(self.num_layers, batch_size, self.hidden_size))# 2. 创建网格环境 class GridWorld:def __init__(self, grid_size10, goal_position9):self.grid_size grid_sizeself.goal_position goal_positionself.reset()def reset(self):self.position 0return self.positiondef step(self, action):if action 0:self.position max(0, self.position - 1)elif action 1:self.position min(self.grid_size - 1, self.position 1)reward 1 if self.position self.goal_position else -0.1done self.position self.goal_positionreturn self.position, reward, done# 3. 训练智能体 def train(num_episodes500, max_steps50):env GridWorld()input_size 1hidden_size 64output_size 2num_layers 1policy LSTMPolicy(input_size, hidden_size, output_size, num_layers)optimizer optim.Adam(policy.parameters(), lr0.01)gamma 0.99for episode in range(num_episodes):state torch.tensor([[env.reset()]], dtypetorch.float32).unsqueeze(0) # (1, 1, input_size)hidden_state policy.init_hidden(batch_size1)log_probs []rewards []for step in range(max_steps):action_probs, hidden_state policy(state, hidden_state)action torch.multinomial(action_probs, 1).item()log_prob torch.log(action_probs.squeeze(0)[action])log_probs.append(log_prob)next_state, reward, done env.step(action)rewards.append(reward)if done:breakstate torch.tensor([[next_state]], dtypetorch.float32).unsqueeze(0)# 计算回报并更新策略returns []R 0for r in reversed(rewards):R r gamma * Rreturns.insert(0, R)returns torch.tensor(returns, dtypetorch.float32)returns (returns - returns.mean()) / (returns.std() 1e-9)loss sum([-log_prob * R for log_prob, R in zip(log_probs, returns)])optimizer.zero_grad()loss.backward()optimizer.step()if (episode 1) % 50 0:print(fEpisode {episode 1}/{num_episodes}, Total Reward: {sum(rewards)})torch.save(policy.state_dict(), policy.pth)# 训练智能体 train(500)# 4. 测试智能体并绘制最佳路径 def test(num_episodes5):env GridWorld()input_size 1hidden_size 64output_size 2num_layers 1policy LSTMPolicy(input_size, hidden_size, output_size, num_layers)policy.load_state_dict(torch.load(policy.pth))plt.figure(figsize(10, 5))best_path Nonebest_steps float(inf)for episode in range(num_episodes):state torch.tensor([[env.reset()]], dtypetorch.float32).unsqueeze(0) # (1, 1, input_size)hidden_state policy.init_hidden(batch_size1)positions [env.position] # 记录位置变化while True:action_probs, hidden_state policy(state, hidden_state)action torch.argmax(action_probs, dim-1).item()next_state, reward, done env.step(action)positions.append(next_state)if done:breakstate torch.tensor([[next_state]], dtypetorch.float32).unsqueeze(0)# 记录最佳路径最短步数if len(positions) best_steps:best_steps len(positions)best_path positions# 绘制普通路径蓝色plt.plot(range(len(positions)), positions, markero, linestyle-, colorblue, alpha0.6,labelfEpisode {episode 1} if episode 0 else )# 绘制最佳路径红色if best_path:plt.plot(range(len(best_path)), best_path, markero, linestyle-, colorred, linewidth2,labelBest Path)# 打印最佳路径print(fBest Path (steps{best_steps}): {best_path})plt.xlabel(Time Steps)plt.ylabel(Agent Position)plt.title(Agents Movement Path (Best Path in Red))plt.legend()plt.grid(True)plt.show()# 测试并绘制智能体移动路径 test(5)
http://www.hkea.cn/news/14543275/

相关文章:

  • 番禺高端网站制作品牌营销策略有哪些方法
  • 企业网站推广工具静态网页设计制作实训报告摘要
  • 慈溪企业网站icp
  • 爱情网站设计网站模板功能
  • 做新网站推广的活动wordpress 微信分享h5
  • 网站开发外包项目网站网站建设项目总结
  • 电子商务网站建设与管理课程的感想jsp网站开发登陆
  • 宣传网站开发ih5做自适应网站
  • 常州网站建设方案外包软件技术职业生涯规划书
  • 做网站要执照吗传奇网页版在线玩
  • 全屏 网站 代码口碑好的做网站公司哪家好
  • 做国外商品的网站网站设计 推广
  • 网站建设费用报告上海比较好的服装外贸公司
  • 重庆平台网站推广音乐网站建设视频教程
  • 中企动力网站开发wordpress中dw是什么
  • 网站颜色正确搭配实例wordpress本地安装教程
  • 做免费网站教程国vs网站制作怎么样提供会员注册
  • 帮忙建设公司网站wordpress分类图片
  • 中国城市建设研究院深圳分院网站做网站什么系统简单
  • 有经验的郑州网站建设sem竞价托管多少钱
  • 网站邮件功能设计理论广东新闻频道
  • ui网页设计是什么seo推广优化费用
  • 四川成都网站建设如何免费创建网站平台
  • 广州企业网站公司安徽建设工程信息网安全三类人员考试成绩查询
  • 江苏省建设网站一号通wordpress积分等级
  • 介绍家乡的网站设计策划书定州哪里可以做网站
  • 山西cms建站系统哪家好廊坊网站建设公司费用
  • 网站个性化广州网站定做
  • 做网站公司联系方式页面wordpress query_posts()
  • 建立什么网站可以赚钱网站建设 佛山