自定义环境¶
XuanCe 支持用户在使用内置环境的同时,创建并运行 自定义环境(Custom Environments)。 通过这一功能,用户可以将自己开发的环境与 XuanCe 内置的强化学习算法无缝结合。
在 XuanCe 中,你可以:
创建基于马尔可夫决策过程(MDP)的 单智能体环境(Single-Agent Environment);
构建基于部分可观测马尔可夫决策过程(POMDP)的 多智能体环境(Multi-Agent Environment);
使用 XuanCe 提供的算法(如 DQN、PPO、IPPO 等)直接运行这些自定义环境。
这一机制为研究者与开发者提供了极大的灵活性, 无论是机器人控制、金融交易、还是多智能体交互任务,都可以轻松集成和测试。
参阅以下小节以开始创建: