自定义环境

XuanCe 支持用户在使用内置环境的同时,创建并运行 自定义环境(Custom Environments)。 通过这一功能,用户可以将自己开发的环境与 XuanCe 内置的强化学习算法无缝结合。

在 XuanCe 中,你可以:

  • 创建基于马尔可夫决策过程(MDP)的 单智能体环境(Single-Agent Environment)

  • 构建基于部分可观测马尔可夫决策过程(POMDP)的 多智能体环境(Multi-Agent Environment)

  • 使用 XuanCe 提供的算法(如 DQN、PPO、IPPO 等)直接运行这些自定义环境。

这一机制为研究者与开发者提供了极大的灵活性, 无论是机器人控制、金融交易、还是多智能体交互任务,都可以轻松集成和测试。

参阅以下小节以开始创建: