Skip to main content

强化学习 CartPole

用强化学习算法控制经典的倒立摆问题。

项目简介

CartPole 是强化学习中最经典的入门环境之一。通过这个项目，你将从零实现 DQN 算法，训练一个智能体学会平衡倒立摆。

你将学到

Gymnasium 环境的使用
DQN 算法原理与实现
训练循环与超参数调优
训练过程可视化

快速开始

pip install gymnasium torch

import gymnasium as gym

env = gym.make("CartPole-v1", render_mode="human")
obs, info = env.reset()

for _ in range(1000):
    action = env.action_space.sample()
    obs, reward, terminated, truncated, info = env.step(action)
    if terminated or truncated:
        obs, info = env.reset()

env.close()

项目简介
你将学到
快速开始