SVDQuant是什么
SVDQuant是MIT研究团队推出的后训练量化技术,针对扩散模型,将模型的权重和激活值量化至4位,减少内存占用加速推理过程。SVDQuant引入高精度的低秩分支吸收量化过程中的异常值,在保持图像质量的同时,实现在16GB 4090 GPU上3.5倍的显存优化和8.7倍的延迟减少。SVDQuant支持DiT架构,兼容UNet架构,能无缝集成现成的低秩适配器(LoRAs),无需重新量化,为在资源受限的设备上部署大型扩散模型提供有效的解决方案。

来源:爱论文 时间:2025-01-24 11:39:12
SVDQuant是MIT研究团队推出的后训练量化技术,针对扩散模型,将模型的权重和激活值量化至4位,减少内存占用加速推理过程。SVDQuant引入高精度的低秩分支吸收量化过程中的异常值,在保持图像质量的同时,实现在16GB 4090 GPU上3.5倍的显存优化和8.7倍的延迟减少。SVDQuant支持DiT架构,兼容UNet架构,能无缝集成现成的低秩适配器(LoRAs),无需重新量化,为在资源受限的设备上部署大型扩散模型提供有效的解决方案。
SVDQuant是MIT研究团队推出的后训练量化技术,针对扩散模型,将模型的权重和激活值量化至4位,减少内存占用加速推理过程。SVDQuant引入高精度的低秩分支吸收量化过程中的异常值,在保持图像质量的同时,实现在16GB 4090 GPU上3 5倍的显存优化和8 7倍的延迟减少。
AI教程资讯
2023-04-14
Meta Motivo 是 Meta 公司推出的AI模型,能提升元宇宙体验的真实性。Meta Motivo基于控制虚拟人形智能体的全身动作,模拟人类行为,增强用户互动。模型采用无监督强化学习算法,特别是FB-CPR算法,用大量动作数据进行预训练,无需额外训练即可执行动作轨迹跟踪、姿势到达等多种任务。
AI教程资讯
2023-04-14
Step-1o是阶跃星辰推出的国内首个千亿参数端到端语音大模型。模型支持语音、文本等混合形式的输入和输出,可以快速反应并随时打断,提供最便捷的互动体验;同时还可以通过自学和优化来不断进步。
AI教程资讯
2023-04-14
360gpt2-o1 是 360 自研的 AI 大模型,在推理能力上有显著提升,特别是在数学和逻辑推理任务上表现出色。模型通过合成数据优化、模型后训练和“慢思考”范式实现了技术突破,在多项权威评测中取得了优异成绩。
AI教程资讯
2023-04-14