OpenThinker-32B是什么
OpenThinker-32B 是斯坦福、UC 伯克利、华盛顿大学等机构联合开发的开源推理模型,拥有 328 亿参数,支持 16,000 token 的上下文长度。模型仅使用 114k 数据样本进行训练,在多个基准测试中表现出色,优于 DeepSeek-R1-32B。关键在于数据规模化、严格验证和模型扩展。OpenThinker-32B 完全开源,包括模型权重、数据集、数据生成代码和训练代码,为 AI 社区提供了宝贵的资源。

来源:爱论文 时间:2025-03-19 14:51:53
OpenThinker-32B 是斯坦福、UC 伯克利、华盛顿大学等机构联合开发的开源推理模型,拥有 328 亿参数,支持 16,000 token 的上下文长度。模型仅使用 114k 数据样本进行训练,在多个基准测试中表现出色,优于 DeepSeek-R1-32B。关键在于数据规模化、严格验证和模型扩展。OpenThinker-32B 完全开源,包括模型权重、数据集、数据生成代码和训练代码,为 AI 社区提供了宝贵的资源。
OpenThinker-32B 是斯坦福、UC 伯克利、华盛顿大学等机构联合开发的开源推理模型,拥有 328 亿参数,支持 16,000 token 的上下文长度。模型仅使用 114k 数据样本进行训练,在多个基准测试中表现出色,优于 DeepSeek-R1-32B。
AI教程资讯
2023-04-14
Social Media Agent是智能的社交媒体内容管理工具,基于输入的URL内容生成Twitter和LinkedIn帖子。Social Media Agent用人机交互 流程,处理社交媒体平台认证,支持用户修改或接受 拒绝生成的帖子。
AI教程资讯
2023-04-14
Matrix-Zero是昆仑万维推出的世界模型,包含两款子模型:3D场景生成大模型和可交互视频生成大模型。Matrix-Zero能将用户输入的图片转化为可自由探索的真实3D场景,支持不同风格的图片输入和风格迁移,具备全局一致性、动态场景生成等亮点。
AI教程资讯
2023-04-14
Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型,是SAM2和LLaVA结合而成,能实现对图像和视频的密集、细粒度理解。Sa2VA基于统一的任务表示,将图像或视频指代分割、视觉对话、视觉提示理解等任务整合到一个框架中,用LLM生成的空间-时间提示指导SAM2生成精确分割掩码。
AI教程资讯
2023-04-14