跳到主要内容

强化学习 CartPole

用强化学习算法控制经典的倒立摆问题。

项目简介

CartPole 是强化学习中最经典的入门环境之一。通过这个项目,你将从零实现 DQN 算法,训练一个智能体学会平衡倒立摆。

你将学到

  • Gymnasium 环境的使用
  • DQN 算法原理与实现
  • 训练循环与超参数调优
  • 训练过程可视化

快速开始

pip install gymnasium torch
import gymnasium as gym

env = gym.make("CartPole-v1", render_mode="human")
obs, info = env.reset()

for _ in range(1000):
action = env.action_space.sample()
obs, reward, terminated, truncated, info = env.step(action)
if terminated or truncated:
obs, info = env.reset()

env.close()