StochSync – AI图像生成技术，为360°全景图和3D网格纹理生成高质量图像-爱论文

StochSync是什么

StochSync（Stochastic Diffusion Synchronization）是创新的图像生成技术，专门用于在复杂空间（如360°全景图或3D表面纹理）中生成`。结合了扩散同步（DS）和分数蒸馏采样（SDS）的优势，通过在扩散模型的逆生成过程中引入最大随机性，兼顾图像细节与连贯性。StochSync无需额外训练，在全景图和3D纹理生成中表现出色，在没有图像条件的情况下，也能生成高质量图像。

StochSync的主要功能

零样本生成：无需对目标空间的数据进行额外训练，避免了过拟合问题。细节与连贯性兼顾：通过在扩散同步（DS）的逆扩散过程中引入最大随机性，结合多步去噪等方法，保留了DS的细节质量，实现分数蒸馏采样（SDS）的连贯性。360°全景图生成：在没有图像条件的情况下，StochSync能生成高质量的全景图，优于以往的微调方法。3D网格纹理生成：在提供深度图作为条件的情况下，StochSync能生成与现有方法相当的纹理。

StochSync的技术原理

扩散同步（DS）：DS通过在不同投影空间中联合执行反向扩散过程，在目标空间中同步中间输出，能生成高质量的图像。当缺乏足够的条件信息（如深度图或图像条件）时，DS在全局连贯性上表现不佳。分数蒸馏采样（SDS）：SDS通过梯度下降逐步更新目标空间数据，能生成更连贯的图像，但往往缺乏细节。结合两种方法：StochSync首次揭示了DS和SDS之间的联系，通过在DS的反向扩散过程中引入最大随机性（即在每一步将噪声水平σ_t设置为最高值），同时结合多步去噪等方法，实现了DS的细节质量和SDS的连贯性。