手写DQN

引用库文件

1
2
3
4
5
6
7
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import random
import math
import numpy as np

创建神经网络

神经网络类以及初始化

初始化的输入是状态维度,动作维度,以及隐藏层。

Read more

强化学习

强化学习(reinforcement learning,RL)讨论的问题是智能体(agent)怎么在复杂、不确定的环境(environment)里面去最大化它能获得的奖励。

强化学习概念

智能体

做出动作,并影响于环境

环境

返回作用后的状态,和上一步的奖励

奖励

是由环境给可显示智能体在某一步采取某个策略的表现如何?

Read more