(问题)近年来,生成式视频在内容创作、虚拟拍摄、游戏与仿真等领域体现出广阔空间,但行业仍被一个基础要求卡住——“镜头能动、世界要稳”;当虚拟摄像机在同一环境中转向、绕行或回到先前位置时,画面中的物体形态、空间结构和相对位置常会突然变化,出现“同一条街两次不一样”“同一房间回头布局变了”等问题,既影响观感与可信度,也限制了其在数字孪生、沉浸式训练等对一致性要求更高的场景落地。
从“能生成画面”到“能记住空间”,表面只是继续,实质关乎视频生成技术能否进入真实生产链条;面对更长时、更复杂、更可控的叙事需求,如何在几何约束与生成自由之间取得平衡,将决定下一轮技术演进的方向。此次围绕“马赛克记忆”的探索,为破解回访一致性提供了新思路,也为建立更贴近应用场景的训练与评测范式提供了参考。