当前位置: 首页 > news >正文

ASP net网站开发资料页面设计总结

ASP net网站开发资料,页面设计总结,引流网站建设,彩票网站开发制作需要什么前言 SARAS#xff0c;假设环境状态和动作状态都是离散的。利用动作价值矩阵来进行行为的预测。其主要就是利用时序差分的思想#xff0c;对动作价值矩阵进行更新。 代码实现 import gymnasium as gym import numpy as npclass sarsa():def __init__(self, states_n, acti…前言 SARAS假设环境状态和动作状态都是离散的。利用动作价值矩阵来进行行为的预测。其主要就是利用时序差分的思想对动作价值矩阵进行更新。 代码实现 import gymnasium as gym import numpy as npclass sarsa():def __init__(self, states_n, action_n, greedy_e0.1):self.Q np.zeros((states_n, action_n)) #动作价值矩阵self.greedy_e greedy_e #随机探索的概率self.states_n states_n #环境状态个数self.action_n action_n #行动状态个数self.gamma0.9 #价值衰减值self.lr0.1 #学习率def predict(self, states):action_listself.Q[states]#先拿出对应的行#再取出对应价值最大的行为如果有重复则在重复项中随机选取返回索引actionnp.random.choice(np.flatnonzero(action_listaction_list.max()))return actiondef act(self, states):由对应环境产生对应的行动param states: 当前环境return: 行动动作if np.random.uniform() self.greedy_e:#是否采取随即探索action np.random.choice(np.arange(self.action_n))#随机探索else:action self.predict(states) # 根据行动价值矩阵进行预测return actiondef learning(self,state,action,reward,next_state,next_action,does):学习更新参数param state: 环境状态param action: 采取的行动param reward: 回报param next_state: 采取行动后的下一个环境状态param next_action: 下一个环境状态对应的行为param does: 游戏是否结束return:current_qself.Q[state,action] #取出对应的行动价值if does: #查看是否已经完成游戏完成则直接将当前回报作为下一个行动价值next_qrewardelse:# 计算当前回报和下一个环境状态和下一个行动对应的价值加和next_qrewardself.gamma*self.Q[next_state,next_action]self.Q[state,action]self.lr*(next_q-current_q) #时序差分更新行动价值矩阵def train():env gym.make(FrozenLake-v1, render_modehuman)#初始化游戏环境obs,infoenv.reset()#重置位置agentsarsa(env.observation_space.n,env.action_space.n)#初始化模型action agent.act(obs)#预测行为num0while True:num1# 由行为产生回报和下一个环境状态next_obs, reward, done, truncated, info env.step(action)#预测下一个动作next_actionagent.act(obs)# 更新参数agent.learning(obs,action,reward,next_obs,next_action,done)obsnext_obsactionnext_action# 判断游戏是否结束或者中断是则重置游戏if done or truncated:obs, info env.reset()if num % 100 0 :env.close()if __name__ __main__:train()
http://www.hkea.cn/news/14578760/

相关文章:

  • 网上书店网站建设目标做ar的网站
  • 西安十大网站制作公司黄骅百度贴吧招聘
  • 做企业宣传网站女人动漫做受网站
  • 深圳建站公司兴田德润电话多少家居网站建设
  • 网站推广的主要方法潍坊关键词优化平台
  • 企业网站优化的方案安徽网站建站系统哪家好
  • 怎么从网站知道谁做的大数据培训班需要多少钱
  • 山如何搭建响应式网站长春建站优化
  • 专业定制网站建设代理网页小说怎么下载
  • 知名做网站培训管理平台
  • 荣耀华为手机商城官方网站wordpress加载谷歌地图
  • APP手机端电子商务网站建设专业的网站开发建设
  • 短视频广告制作公司云南网站推广优化
  • 罗田县住房和城乡建设局网站重庆哪家做网站好
  • 餐饮网站建设服务器网站开发分几种类型
  • seo的培训网站哪里好营销型网站策划怎么做
  • 淘宝手机网站模板下载安装门户网站如何运营
  • 制作网页网站费用属于资本性支出吗php综合网站源码
  • 做网站的工具+论坛浙江创业建设公司网站
  • 手机网站比例北京定制网站开发公司浩森宇特
  • 什么网站是html5做的北京网站开发公司排名
  • 媒体发稿网站开发企业服务总线
  • 福建龙岩网站制作公司做一个商城网站需要提交那些文件
  • 网站设计与建设ppt建筑模板哪种好
  • 平面设计师如何做网站免费软件编程入门自学
  • 爱站网ip反查域名如何写好网站文案
  • 厦门网站建设手机版农业建设公司网站
  • 建设部网站业绩补录wordpress用户名中文
  • 适合医药公司做网站的图片标志与设计
  • 住房公积金网站怎么做减员手机网站开发位置定位