Mini DALL·E 3是什么
Mini DALL·E 3 是北京理工大学、上海AI Lab、清华大学和香港中文大学联合推出的交互式文本到图像(iT2I)框架。基于自然语言与用户进行多轮对话,实现高质量图像的生成、编辑和优化。用户用简单的指令逐步细化图像要求,基于大型语言模型(LLM)和预训练的文本到图像模型(如 Stable Diffusion),无需额外训练生成与文本描述高度一致的图像。系统支持问答功能,为用户提供更连贯的交互体验,提升人机交互的便捷性和图像生成质量。

来源:爱论文 时间:2025-04-15 16:15:54
Mini DALL·E 3 是北京理工大学、上海AI Lab、清华大学和香港中文大学联合推出的交互式文本到图像(iT2I)框架。基于自然语言与用户进行多轮对话,实现高质量图像的生成、编辑和优化。用户用简单的指令逐步细化图像要求,基于大型语言模型(LLM)和预训练的文本到图像模型(如 Stable Diffusion),无需额外训练生成与文本描述高度一致的图像。系统支持问答功能,为用户提供更连贯的交互体验,提升人机交互的便捷性和图像生成质量。
Mini DALL·E 3 是北京理工大学、上海AI Lab、清华大学和香港中文大学联合推出的交互式文本到图像(iT2I)框架。基于自然语言与用户进行多轮对话,实现高质量图像的生成、编辑和优化。
AI教程资讯
2023-04-14
MoCha AI 是 Meta 和滑铁卢大学联合开发的端到端对话角色视频生成模型。能根据文本或语音输入生成带有同步语音和自然动作的完整角色动画。MoCha 采用语音-视频窗口注意力机制,解决了视频压缩时音频分辨率不匹配以及唇部动作错位的问题。
AI教程资讯
2023-04-14
DeepSeek-GRM是DeepSeek和清华大学研究者共同提出的通用奖励模型(Generalist Reward Modeling)。通过点式生成式奖励建模(Pointwise Generative Reward Modeling, GRM)和自我原则点评调优(Self-Principled Critique Tuning, SPCT)等技术,显著提升了奖励模型的质量和推理时的可扩展性。
AI教程资讯
2023-04-14
OlympicArena是上海交通大学、上海AI Lab、苏州大学和上海交通大学生成式人工智能实验室(GAIR Lab)联合推出的多学科认知推理基准测试框架。OlympicArena包含11,163道来自国际奥林匹克竞赛的双语题目,涵盖数学、物理、化学、生物、地理、天文学和计算机科学等7大领域。
AI教程资讯
2023-04-14