OpenCoder是什么
OpenCoder是墨尔本大学、复旦大学等高校研究人员联合无限光年推出的开源代码大型语言模型(LLM),能提升开源代码LLM的性能至专有模型水平,推动代码AI研究的透明化和可重复性。OpenCoder提供模型权重和推理代码,包括可复现的训练数据、完整的数据处理流程、严格的实验消融结果和详细的训练协议,助力研究社区构建和创新。

来源:爱论文 时间:2025-02-10 12:44:50
OpenCoder是墨尔本大学、复旦大学等高校研究人员联合无限光年推出的开源代码大型语言模型(LLM),能提升开源代码LLM的性能至专有模型水平,推动代码AI研究的透明化和可重复性。OpenCoder提供模型权重和推理代码,包括可复现的训练数据、完整的数据处理流程、严格的实验消融结果和详细的训练协议,助力研究社区构建和创新。
OpenCoder是墨尔本大学、复旦大学等高校研究人员联合无限光年推出的开源代码大型语言模型(LLM),能提升开源代码LLM的性能至专有模型水平,推动代码AI研究的透明化和可重复性。OpenCoder提供模型权重和推理代码,包括可复现的训练数据、完整的数据处理流程、严格的实验消融结果和详细的训练协议,助力研究社区构建和创新。
AI教程资讯
2023-04-14
Infinity-MM是智源研究院推出的千万级多模态指令数据集,包含4300万条样本,数据量达10TB。数据集经过质量过滤和去重,确保高质量和多样性,能提升开源视觉-语言模型(VLMs)的性能。智源推出基于开源VLMs的合成数据生成方法,进一步扩充数据集规模和多样性。
AI教程资讯
2023-04-14
FabricDiffusion是谷歌和卡内基梅隆大学共同推出的高保真度3D服装生成技术,能将现实世界中2D服装图像的纹理和印花高质量地转移到任意形状的3D服装模型上。FabricDiffusion基于去噪扩散模型和大规模合成数据集纠正输入纹理图像的失真,生成包括漫反射、粗糙度、法线和金属度在内的多种纹理贴图。
AI教程资讯
2023-04-14
HourVideo是斯坦福大学李飞飞和吴佳俊团队推出的长视频理解基准数据集,包含500个第一人称视角视频,时长20至120分钟,覆盖77种日常活动,能评估多模态模型对长视频的理解能力。
AI教程资讯
2023-04-14