首页 > 资讯百科 > 京东JoyAI-Image-Edit图像模子开源,空间智能打破引领AI图像编辑新变更

京东JoyAI-Image-Edit图像模子开源,空间智能打破引领AI图像编辑新变更

2026-04-08 16:12:32

在AI图像处理领域，传统模型长期面临空间逻辑混乱的瓶颈：当用户尝试移动画面中的杯子时，物体可能发生扭曲变形；调整视角时透视关系完全失真；改变物体前后位置时出现遮挡错乱。这些问题的根源在于，现有模型本质上是在二维平面上进行图像编辑，无法理解三维空间中的几何规律与物理关系。近日，京东探索研究院推出的JoyAI-Image-Edit开源模型，通过将空间智能深度融入图像生成流程，为行业带来了突破性解决方案。

该模型创新性地构建了完整的空间理解体系，从相机坐标系变换、物体空间位移到几何结构控制，实现了12项核心空间编辑技术的突破。通过深度建模真实世界的空间规律，模型能够精准解析物体间的位置关系、多视角一致性以及场景光照条件。实验数据显示，在物体移动精度和空间一致性等关键指标上，该模型已达到国际领先水平，彻底解决了传统模型在三维空间编辑中的几何失真问题。

三大核心能力构成了模型的技术壁垒：视角变换功能支持用户通过自然语言精确控制相机参数，在保持场景几何结构的前提下生成新视角图像；空间漫游技术可实现连续视角移动，生成逻辑连贯的多视角序列；物体空间关系操控能在保持场景整体稳定的前提下，对特定物体进行位移、旋转等操作，同时自动调整遮挡关系与光影效果。这些能力使模型能够稳定处理物体移动、视角切换等复杂操作，确保编辑后的图像符合物理世界的空间逻辑。

在通用编辑能力方面，模型兼容15类高频创作需求，包括物体替换、风格迁移、细节精修等。通过将空间智能与内容生成深度融合，模型在长文本渲染、多视角一致性等高难度任务中表现出色。例如在电商场景中，商家可快速调整商品展示角度而无需重新拍摄；在创意设计领域，设计师能自由重构三维场景而不破坏空间关系；在3D重建领域，模型可为机器人视觉系统提供精准的空间感知能力。

作为业内首个开源的空间智能图像模型，JoyAI-Image-Edit的推理代码已完全开放，开发者可直接调用其核心功能进行二次开发。这一举措不仅降低了空间编辑技术的应用门槛，更为AI与产业融合提供了新的可能性。在具身智能领域，该模型的空间理解能力可为机器人环境感知提供关键技术支持；在智能图像处理领域，其三维编辑能力将推动自动化内容生产进入新阶段。

京东近期在AI领域持续发力：基础大模型JoyAI-LLM Flash的开源打破了参数竞赛困局；云服务"龙虾"系列产品上线后token调用量周环比增长455%；全球最大具身数据采集中心的建设正在推进。这些布局彰显了京东以技术驱动产业升级的战略方向，通过将空间智能等前沿能力与供应链场景深度结合，正在重塑AI技术的商业价值实现路径。

京东JoyAI-Image-Edit图像模子开源