Pixtral Large是什么
Pixtral Large是法国Mistral AI开源的1240亿参数超大多模态模型,具备前沿级图像理解能力,支持128K上下文,能理解文本、图表和图像。Pixtral Large基于Mistral Large 2开发,拥有1230亿参数的多模态解码器和10亿参数的视觉编码器,在多个基准测试中表现超越其他模型(超过了GPT-4o、Gemini-1.5Pro、Claude-3.5Sonnet、Llama-3.290B等模型),成为目前最强的开源多模态模型。

来源:爱论文 时间:2025-02-06 14:25:35
Pixtral Large是法国Mistral AI开源的1240亿参数超大多模态模型,具备前沿级图像理解能力,支持128K上下文,能理解文本、图表和图像。Pixtral Large基于Mistral Large 2开发,拥有1230亿参数的多模态解码器和10亿参数的视觉编码器,在多个基准测试中表现超越其他模型(超过了GPT-4o、Gemini-1.5Pro、Claude-3.5Sonnet、Llama-3.290B等模型),成为目前最强的开源多模态模型。
Pixtral Large是法国Mistral AI开源的1240亿参数超大多模态模型,具备前沿级图像理解能力,支持128K上下文,能理解文本、图表和图像。Pixtral Large基于Mistral Large 2开发,拥有1230亿参数的多模态解码器和10亿参数的视觉编码器,在多个基准测试中表现超越其他模型(超过了GPT-4o、Gemini-1 5Pro、Claude-3 5Sonnet、Llama-3 290B等模型),成为目前最强的开源多模态模型。
AI教程资讯
2023-04-14
Qwen2 5-Turbo是阿里推出的先进语言模型,将上下文长度从 128k 扩展到了 1M ,相当于100万个英文单词或150万个汉字。扩展让模型能处理更长的文本,如长篇小说、演讲稿或代码。Qwen2 5-Turbo用高效的推理速度和经济实惠的价格(比 GPT4o-mini便宜),除了 Gemini 外成为目前上下文长度最高的模型,仅通过API接入,为用户提供强大的语言处理能力。
AI教程资讯
2023-04-14
LLaVA-o1是北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学(Lehigh University)组成的研究团队推出的开源视觉语言模型,基于Llama-3 2-Vision模型构建,能进行自主的多阶段“慢思考”推理。
AI教程资讯
2023-04-14
PixelWave Flux 1-dev 03是基于FLUX 1-dev模型在NVIDIA 4090上微调的AI图像生成模型,有卓越的模型泛化能力,模型在处理多种艺术风格、摄影和动漫图像方面表现出色,在审美、写实和动漫风格上有明显的提升。
AI教程资讯
2023-04-14