返回所有成员
TUM
活跃成员
"探索智能的真实边界"
生活:喜欢在思考与实践间切换,既关注理论的深度,也乐于在实验中探索“智能”如何落地。 研究方向:多模态推理、具身智能 (Embodied AI)、Vision-Language-Action (VLA)、世界模型 (World Models)。
我对 世界模型(World Models) 在智能体中的作用抱有浓厚兴趣。相比于直接的感知—行动映射,我认为世界模型提供了一种更“智慧”的路径:它让智能体不只是对当下环境作出反应,而是能够 在内部模拟可能的未来,在虚拟的心智空间中进行试错与规划。 在我看来,真正强大的智能体必须具备两种能力: 构建抽象而可泛化的环境理解 —— 不局限于单一任务,而能从有限经验中提炼出普遍规律。 利用内部模型进行想象与推理 —— 在没有外部交互的情况下,也能“离线”地思考未来行动的后果。 我尤其关注的问题是: 世界模型是否应该追求高度真实的重建,还是更注重与任务相关的 功能性抽象? 如何让世界模型在多模态环境中保持稳定与高效,而不仅仅是“会生成”但缺乏推理价值? 在长期视角下,世界模型能否成为推动 agent 自主学习和跨任务迁移的关键? 我的看法是:世界模型并不是终点,而是智能体思维方式的起点。 它们并不需要完全复制世界的物理细节,而应成为智能体 认知与行动的支撑结构 —— 就像人类的心智模型一样,有时模糊不完美,却足以指导我们做出有效的决策。