Dream-7B是什么
Dream-7B是香港大学和华为诺亚方舟实验室联合推出的扩散式推理模型,是目前最强大的开源扩散大语言模型。Dream-7B训练数据涵盖文本、数学和代码,预训练使用5800亿个标记,耗时256小时。Dream-7B在通用、数学、编程等任务上表现优异,与同尺寸的自回归模型(Qwen2.5 7B、LLaMA3 8B)性能相媲美,在某些情况下优于最新的 Deepseek V3 671B。模型用掩码扩散范式,基于双向上下文建模和灵活的可控生成能力,显著提升生成文本的全局连贯性。

来源:爱论文 时间:2025-04-14 15:00:19
Dream-7B是香港大学和华为诺亚方舟实验室联合推出的扩散式推理模型,是目前最强大的开源扩散大语言模型。Dream-7B训练数据涵盖文本、数学和代码,预训练使用5800亿个标记,耗时256小时。Dream-7B在通用、数学、编程等任务上表现优异,与同尺寸的自回归模型(Qwen2.5 7B、LLaMA3 8B)性能相媲美,在某些情况下优于最新的 Deepseek V3 671B。模型用掩码扩散范式,基于双向上下文建模和灵活的可控生成能力,显著提升生成文本的全局连贯性。
Dream-7B是香港大学和华为诺亚方舟实验室联合推出的扩散式推理模型,是目前最强大的开源扩散大语言模型。Dream-7B训练数据涵盖文本、数学和代码,预训练使用5800亿个标记,耗时256小时。
AI教程资讯
2023-04-14
Llama Nemotron是NVIDIA推出的一系列推理模型,专注于推理和多种智能代理(agentic AI)任务。模型基于Llama开源模型,经过NVIDIA的后训练,加入推理能力,在科学推理、高级数学、编程、指令遵循和工具调用等方面表现出色。
AI教程资讯
2023-04-14
Miracle F1 是美图 WHEE 推出的全新AI图像生成模型。具备强大的图像生成能力,能像摄影师、建筑师和画家一样精准地处理光影、空间和材质效果,生成的图像真实感强,质感细腻,告别了传统 AI 图像的“塑料感”。
AI教程资讯
2023-04-14
Lipsync-2 是 Sync Labs 推出的全球首个零-shot 嘴型同步模型。无需针对特定演讲者进行预训练,能即时学习并生成符合独特说话风格的嘴型同步效果。
AI教程资讯
2023-04-14