本技术属于三维建模仿真技术领域,专注于一种依托于大型语言模型的多智能体协作三维场景构建技术与系统。该技术将三维场景构建任务细化为多个子任务,并为每个子任务指派特定的执行智能体,以实现高效的三维场景生成。
背景技术
3D场景是视频游戏的一个重要方面,通过具有空间深度和现实主义的详细视觉效果和环境,能够显著增强玩家沉浸感和整体游戏体验。随着现代游戏的复杂性和规模不断增加,特别是在开放世界游戏中,3D场景创建对于管理复杂的动态环境和提供广泛的交互式游戏体验至关重要。开放世界游戏尤其需要一种能够连续且大规模地生成内容的方法。手动场景创建虽然提供了高水平的场景并能够实现场景定制,但通常会限制此类游戏的开发过程。手动建模、纹理化和配置每个实体所需的时间会降低整体开发效率,并且场景的动态变化难以体现。
深度学习的进步,特别是最近的生成模型,促进了3D场景自动生成的发展。然而,这些方法大多以端到端的方式实现,在实际的游戏开发应用中面临着诸多挑战。首先,这些模型是海量数据驱动的,其性能在很大程度上取决于训练数据的质量和多样性,通常缺乏处理各种独特场景所需的泛化能力;其次,创建完整的3D场景(由多个元素和背景组成)的任务本质上是复杂的。目前的模型很难为这样一个多方面的任务产生令人满意的结果,这超出了生成单个3D对象,以创建有凝聚力和视觉吸引力的环境;再者,这些模型主要集中于创建几何上合理的可视化场景,但通常难以生成与游戏脚本一致的语义连贯的场景。
实现思路