强化学习 CartPole
用强化学习算法控制经典的倒立摆问题。
项目简介
CartPole 是强化学习中最经典的入门环境之一。通过这个项目,你将从零实现 DQN 算法,训练一个智能体学会平衡倒立摆。
你将学到
- Gymnasium 环境的使用
- DQN 算法原理与实现
- 训练循环与超参数调优
- 训练过程可视化
快速开始
pip install gymnasium torch
import gymnasium as gym
env = gym.make("CartPole-v1", render_mode="human")
obs, info = env.reset()
for _ in range(1000):
action = env.action_space.sample()
obs, reward, terminated, truncated, info = env.step(action)
if terminated or truncated:
obs, info = env.reset()
env.close()