Mistral Small 3是什么
Mistral Small 3 是 Mistral AI 发布的开源大型语言模型,有240亿参数,基于 Apache 2.0 许可证开源。专为低延迟任务设计,支持多语言(包括英语、中文、日语等),在推理和多语言处理方面表现出色。模型采用 Transformer 架构,具有40层,上下文窗口为32k,支持长篇输入。优化了本地推理能力,可在 RTX 4090 GPU 或32GB RAM的笔记本上运行,适合对话式AI、自动化任务和专业领域应用。

来源:爱论文 时间:2025-03-25 09:53:49
Mistral Small 3 是 Mistral AI 发布的开源大型语言模型,有240亿参数,基于 Apache 2.0 许可证开源。专为低延迟任务设计,支持多语言(包括英语、中文、日语等),在推理和多语言处理方面表现出色。模型采用 Transformer 架构,具有40层,上下文窗口为32k,支持长篇输入。优化了本地推理能力,可在 RTX 4090 GPU 或32GB RAM的笔记本上运行,适合对话式AI、自动化任务和专业领域应用。
Mistral Small 3 是 Mistral AI 发布的开源大型语言模型,有240亿参数,基于 Apache 2 0 许可证开源。专为低延迟任务设计,支持多语言(包括英语、中文、日语等),在推理和多语言处理方面表现出色。
AI教程资讯
2023-04-14
CoA(Chain-of-Agents)是谷歌推出的多智能体协作框架,用于解决大语言模型(LLM)在处理长文本任务时面临的上下文限制问题。CoA框架将长文本分割成多个较短的片段,由多个工作智能体(worker agents)依次处理这些片段,通过链式通信将有用信息传递给下一个智能体。
AI教程资讯
2023-04-14
Oumi 是完全开源的 AI 平台,简化从数据准备、模型训练到评估和部署的整个生命周期。支持从 1000 万到 4050 亿参数的模型训练,涵盖文本和多模态模型(如 Llama、Qwen 等),提供零样板代码(Zero Boilerplate)的开发体验。
AI教程资讯
2023-04-14
IC-Portrait是新型的个性化肖像生成框架,解决用户资料图像多样性(如外观和光照条件差异)带来的挑战。通过将肖像生成任务分解为“光照感知拼接”和“视角一致性适应”两个子任务来实现高保真的身份保留和视角一致性。
AI教程资讯
2023-04-14