Category: 科研

Posted 2024-12-30Updated 2024-04-29科研 / 强化学习10 minutes read (About 1442 words)

背景

目前的研究主要集中在变分量子算法，之前的研究提出了利用变分量子算法来增强有监督、无监督和强化学习(RL)算法的建议。在这项工作中，我们采用一种基于深度q -学习算法的**参数化量子电路(PQC)**训练方法，该方法可用于解决离散和连续状态空间的RL任务。实验结果表明体系结构选择和超参数比模型中使用的参数数量对智能体的成功贡献更大。

经典强化学习

Q-learning关注的不是状态值函数，而是对密切相关的动作值函数Q(s, a)。

然后通过充分探索状态和动作空间。这为智能体提供了足够的信息来区分给定特定状态下的好行为和坏行为。来学习Q函数学习方法

引用库文件

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import random
import math
import numpy as np

创建神经网络

神经网络类以及初始化

初始化的输入是状态维度，动作维度，以及隐藏层。

强化学习概念

智能体

做出动作，并影响于环境

环境

返回作用后的状态，和上一步的奖励

奖励

是由环境给可显示智能体在某一步采取某个策略的表现如何？

背景

经典强化学习

引用库文件

创建神经网络

神经网络类以及初始化

强化学习概念

智能体

环境

奖励

Links

Categories

Recents

Archives

Tags