Posted 2024-04-29Updated 2024-04-29科研 / 强化学习10 minutes read (About 1566 words)手写DQN引用库文件1234567import torchimport torch.nn as nnimport torch.nn.functional as Fimport torch.optim as optimimport randomimport mathimport numpy as np 创建神经网络神经网络类以及初始化 初始化的输入是状态维度,动作维度,以及隐藏层。Read more
Posted 2024-03-10Updated 2024-04-29科研 / 强化学习an hour read (About 12568 words)强化学习强化学习(reinforcement learning,RL)讨论的问题是智能体(agent)怎么在复杂、不确定的环境(environment)里面去最大化它能获得的奖励。 强化学习概念智能体做出动作,并影响于环境 环境返回作用后的状态,和上一步的奖励 奖励是由环境给可显示智能体在某一步采取某个策略的表现如何?Read more