DeepSeek-V2 5-1210是DeepSeek 推出的 DeepSeek V2 系列收官AI模型,DeepSeek V2 5 的最终版微调模型。模型基于Post-Training迭代,在数学、编程、写作和角色扮演等方面实现能力提升(DeepSeek-V2 5-1210 在数学任务的完成率提升至82 8%,在实时编码得分提高至34 38%)。
AI教程资讯
2025-01-26
EXAONE 3 5是LG AI研究院推出的开源AI模型,包含24亿、78亿和320亿参数的三个版本。EXAONE 3 5擅长长文本处理,在基准测试中表现优异,特别是在实际应用、长文本处理和数学方面。模型采用检索增强生成技术和多步推理能力,有效降低错误信息,提高准确性。
AI教程资讯
2025-01-26
DrivingDojo是中国科学院自动化研究所与美团无人车团队合作推出的数据集,用在训练和研究复杂的自动驾驶交互式世界模型。数据集包含18,000个视频片段,覆盖完整的驾驶操作、多智能体交互以及丰富的开放世界驾驶知识,为开发下一代自动驾驶模型提供了坚实的基础。
AI教程资讯
2025-01-26
FineWeb 2是Hugging Face推出的多语言预训练数据集,覆盖超过1000种语言。FineWeb 2基于定制化的数据管道处理,包括语言识别、去重、内容过滤和PII匿名化,适应不同语言的特点。FineWeb 2数据集支持广泛的NLP任务,如机器翻译、文本分类等,帮助提升多语言模型的性能和泛化能力。
AI教程资讯
2025-01-26