「stable-worldmodel」世界模型研究平台:统一数据采集、训练和 MPC 评估的开源工具箱

stable-worldmodel 环境网格演示

stable-worldmodel 是 galilai-group 开源的世界模型研究与评估平台,目标是把数据采集、模型训练、以及通过 model-predictive control 做评估这三段流程放到同一个接口里。对做 world model、JEPA、强化学习或机器人控制研究的人来说,它想解决的是“每篇论文都重新搭一套环境、数据格式和评估脚手架”的重复劳动。

它的核心抽象是 World:先在标准环境里收集数据,再用统一的数据加载接口训练自己的 world model,最后把模型交给 CEM、iCEM、MPPI、Predictive Sampling 或梯度优化类 solver 做规划评估。这样研究代码可以更集中在模型结构和目标函数上,而不是反复处理环境封装、轨迹存储和 benchmark glue code。

README 里比较实用的一点是数据格式注册表。它支持 LanceDB、HDF5、folder、video 和 LeRobot Hub 只读适配,官方 benchmark 也直接给出一个直观结论:同样 PushT 数据上,LanceDB 本地读取可到约 4814 samples/s,而 HDF5 本地约 1416 samples/s;视频格式存储最省,但训练读取不是最快。这些数字对长期跑实验的人比宣传语更有用。

环境覆盖也很宽:DeepMind Control Suite、Gymnasium classic control、OGBench、Craftax、Atari,以及 Two-Room、PushT 等世界模型 benchmark。许多环境还带 factors of variation,可以调光照、纹理、动力学或形态,用来测试模型在分布变化下的泛化能力。

项目当前约 1.3k stars,主要语言是 Python,PyPI 最新版本为 0.1.0,要求 Python 3.10 以上;LeRobot 额外支持需要 Python 3.12 以上。GitHub 仓库元数据没有显示 license 字段,但 PyPI classifier 标注为 MIT。需要注意的是 README 明确说库仍在 active development,minor version 之间 API 可能变化,更适合研究迭代和 benchmark 复现实验,而不是直接当稳定生产依赖。

项目地址

官网:https://galilai-group.github.io/stable-worldmodel/
项目地址:https://github.com/galilai-group/stable-worldmodel

原创文章,如若转载,请注明出处:https://wefound.cc/p/4148.html

(0)
「Compound Engineering」Every 开源 Agent 工程插件:把 brainstorm、计划、执行和复盘变成可复用工作流
上一篇 4天前
「English-level-up-tips」离谱的英语学习指南:从 CEFR 到 AI 训练回路的中文进阶教程
下一篇 4天前

相关推荐