近似平均方向求解器(AMED-Solver)是浙江大学区块链与数据安全全国重点实验室人工智能数据安全团队在科技部科技创新2030-“新一代人工智能”重大项目、国家重点研发计划青年科学家项目、国家自然科学基金委区域创新发展联合基金重点项目、浙江省领雁计划项目等多个国家级/省部级项目以及浙江大学区块链与数据安全全国重点实验室的共同支持下,针对视觉大模型图像生成任务研发的加速采样算法。
扩散模型广泛应用于文生图、视频生成等任务,是当前火热的视觉大模型的核心技术。然而,扩散模型逐步去噪的特性导致其生成速度极其缓慢,现有研究工作利用高阶数值方法提升生成效率,会使样本质量在少步数生成下(例如5步)显著降低。针对这些挑战,该工作基于对扩散模型生成轨迹的观察,提出了近似平均方向求解器 AMED-Solver,通过直接学习快速扩散采样的均值方向来消除截断误差,在保证生成质量的情况下大幅提升生成效率。
详细介绍见如下链接:https://arxiv.org/abs/2312.00094
感兴趣的组织和个人可以通过下方提供的GitHub开源地址访问和下载相关代码。
GitHub地址:https://github.com/zju-pi/diff-sampler/tree/main/amed-solver-main