当前位置: 首页 > news >正文

焦作 网站建设wordpress 首行缩进

焦作 网站建设,wordpress 首行缩进,高端建设网站,凡科建站提示网站建设中前言 SARAS#xff0c;假设环境状态和动作状态都是离散的。利用动作价值矩阵来进行行为的预测。其主要就是利用时序差分的思想#xff0c;对动作价值矩阵进行更新。 代码实现 import gymnasium as gym import numpy as npclass sarsa():def __init__(self, states_n, acti…前言 SARAS假设环境状态和动作状态都是离散的。利用动作价值矩阵来进行行为的预测。其主要就是利用时序差分的思想对动作价值矩阵进行更新。 代码实现 import gymnasium as gym import numpy as npclass sarsa():def __init__(self, states_n, action_n, greedy_e0.1):self.Q np.zeros((states_n, action_n)) #动作价值矩阵self.greedy_e greedy_e #随机探索的概率self.states_n states_n #环境状态个数self.action_n action_n #行动状态个数self.gamma0.9 #价值衰减值self.lr0.1 #学习率def predict(self, states):action_listself.Q[states]#先拿出对应的行#再取出对应价值最大的行为如果有重复则在重复项中随机选取返回索引actionnp.random.choice(np.flatnonzero(action_listaction_list.max()))return actiondef act(self, states):由对应环境产生对应的行动param states: 当前环境return: 行动动作if np.random.uniform() self.greedy_e:#是否采取随即探索action np.random.choice(np.arange(self.action_n))#随机探索else:action self.predict(states) # 根据行动价值矩阵进行预测return actiondef learning(self,state,action,reward,next_state,next_action,does):学习更新参数param state: 环境状态param action: 采取的行动param reward: 回报param next_state: 采取行动后的下一个环境状态param next_action: 下一个环境状态对应的行为param does: 游戏是否结束return:current_qself.Q[state,action] #取出对应的行动价值if does: #查看是否已经完成游戏完成则直接将当前回报作为下一个行动价值next_qrewardelse:# 计算当前回报和下一个环境状态和下一个行动对应的价值加和next_qrewardself.gamma*self.Q[next_state,next_action]self.Q[state,action]self.lr*(next_q-current_q) #时序差分更新行动价值矩阵def train():env gym.make(FrozenLake-v1, render_modehuman)#初始化游戏环境obs,infoenv.reset()#重置位置agentsarsa(env.observation_space.n,env.action_space.n)#初始化模型action agent.act(obs)#预测行为num0while True:num1# 由行为产生回报和下一个环境状态next_obs, reward, done, truncated, info env.step(action)#预测下一个动作next_actionagent.act(obs)# 更新参数agent.learning(obs,action,reward,next_obs,next_action,done)obsnext_obsactionnext_action# 判断游戏是否结束或者中断是则重置游戏if done or truncated:obs, info env.reset()if num % 100 0 :env.close()if __name__ __main__:train()
http://www.hkea.cn/news/14420339/

相关文章:

  • 网站开发和网络工程师百度电脑版下载
  • 桂林网站建设哪家好中国歼战斗机
  • 企业网站如何建设报告建设网站平台哪个好
  • 网站建设与运营的公司成都市区必去的景点
  • 为什么做网站比app便宜开通微信公众号流程需要什么
  • 91大神网站建设酒店网站建设与设计公司
  • 哈尔滨 建网站什么网站可以做图赚钱
  • 湖南企业网站青岛企业网站建设优化
  • 网站建设时程序的作用wordpress开发者文档下载
  • 做电商网站前端用什么框架福州核酸检测最新通知
  • 百度提交网站入口网址营销型网站建设的主要流程包括
  • 安徽电商网站建设wordpress 建商城
  • 哈尔滨大连工程建设信息网站签名设计网站
  • 建设网站浩森宇特手机功能网站案例
  • 少数民族网站建设临桂区住房和城乡建设局门户网站
  • 协会网站信息平台建设做家乡网站的素材
  • html5网站开发实战安溪网页定制
  • 课程网站开发背景和意义phonegap下载
  • 如何简单制作自己的网站wordpress解压
  • 做好网站维护管理抖音电商网站建设
  • 网站做3年3年包括什么青岛seo整站优化招商电话
  • 鞍山人才网官方网站百度公司销售卖什么的
  • 北京网站建设公司完美湖南岚鸿首 选wordpress 比特币行情
  • 花垣做网站网站售后维护
  • 苏州网站建设极简幕枫个人博客wordpress
  • wordpress制作培训网站wordpress ueditor 百度编辑器
  • 网站建设公司有哪些方面网站推广策划的思路包括哪些内容
  • asp.net 网站访问量linux做网站服务器
  • 大型电商网站开发成本品牌网页设计公司
  • 用记事本怎么做网页站长工具 seo综合查询