当前位置: 网站首页 >AI教程资讯 >正文

Mistral Small 3 – Mistral AI 推出的开源大语言模型

来源:爱论文 时间:2025-03-25 09:53:49

Mistral Small 3是什么

Mistral Small 3 是 Mistral AI 发布的开源大型语言模型,有240亿参数,基于 Apache 2.0 许可证开源。专为低延迟任务设计,支持多语言(包括英语、中文、日语等),在推理和多语言处理方面表现出色。模型采用 Transformer 架构,具有40层,上下文窗口为32k,支持长篇输入。优化了本地推理能力,可在 RTX 4090 GPU 或32GB RAM的笔记本上运行,适合对话式AI、自动化任务和专业领域应用。

Mistral Small 3

Mistral Small 3的主要功能

低延迟优化:Mistral Small 3 专为低延迟任务设计,适合需要快速响应的场景,如虚拟助手、自动化工作流和实时 AI 应用。在相同硬件上的推理速度比 Llama 3.3 70B 快 3 倍以上。高性能: 240 亿参数,性能可与 Llama 3.3 70B 和 Qwen 32B 等更大规模的模型媲美。在 MMLU 基准测试中,准确率超过 81%,延迟仅为 150 tokens/s。多语言支持:支持多种语言,包括英语、法语、德语、西班牙语、意大利语、中文、日语、韩语等。本地部署能力:适合对数据隐私要求较高的场景,可以在单块 NVIDIA RTX 4090 显卡或配备 32GB 内存的 MacBook 上运行。开源与可定制:基于 Apache 2.0 许可证开源,开发者可以自由修改和部署,适合企业级应用。指令跟随与推理能力:经过指令微调,能理解和执行各种任务,包括代码生成、数学计算和一般知识问答。

Mistral Small 3的项目地址

项目官网:https://mistral.ai/news/mistral-small-3/

Mistral Small 3的应用场景

虚拟助手:Mistral Small 3 可以作为虚拟助手,快速响应用户需求,提供自然语言交互。客服系统:集成到客服系统中,自动回答常见问题,提升用户体验。工作流程自动化:在自动化工作流程中快速执行任务,提高效率。医疗诊断:通过微调,可用于医疗诊断系统,快速生成诊断建议。法律咨询:在法律领域提供专业建议,帮助用户解答法律问题。
上一篇:CoA – 谷歌推出的多智能体协作框架
相关资讯 更多+
  • Mistral Small 3 – Mistral AI 推出的开源大语言模型
    Mistral Small 3 – Mistral AI 推出的开源大语言模型

    Mistral Small 3 是 Mistral AI 发布的开源大型语言模型,有240亿参数,基于 Apache 2 0 许可证开源。专为低延迟任务设计,支持多语言(包括英语、中文、日语等),在推理和多语言处理方面表现出色。

    AI教程资讯 2023-04-14

  • CoA – 谷歌推出的多智能体协作框架
    CoA – 谷歌推出的多智能体协作框架

    CoA(Chain-of-Agents)是谷歌推出的多智能体协作框架,用于解决大语言模型(LLM)在处理长文本任务时面临的上下文限制问题。CoA框架将长文本分割成多个较短的片段,由多个工作智能体(worker agents)依次处理这些片段,通过链式通信将有用信息传递给下一个智能体。

    AI教程资讯 2023-04-14

  • Oumi – 开源 AI 平台,支持 1000 万到 4050 亿参数模型训练
    Oumi – 开源 AI 平台,支持 1000 万到 4050 亿参数模型训练

    Oumi 是完全开源的 AI 平台,简化从数据准备、模型训练到评估和部署的整个生命周期。支持从 1000 万到 4050 亿参数的模型训练,涵盖文本和多模态模型(如 Llama、Qwen 等),提供零样板代码(Zero Boilerplate)的开发体验。

    AI教程资讯 2023-04-14

  • IC-Portrait – ETH联合浙大等推出的个性化肖像生成框架
    IC-Portrait – ETH联合浙大等推出的个性化肖像生成框架

    IC-Portrait是新型的个性化肖像生成框架,解决用户资料图像多样性(如外观和光照条件差异)带来的挑战。通过将肖像生成任务分解为“光照感知拼接”和“视角一致性适应”两个子任务来实现高保真的身份保留和视角一致性。

    AI教程资讯 2023-04-14

最新录入 更多+
确定