当前位置: 网站首页 >AI教程资讯 >正文

Phi-4 – 微软开源的14B参数小语言模型,擅长数学等领域的复杂推理

来源:爱论文 时间:2025-01-24 12:25:53

Phi-4是什么

Phi-4是微软推出的14B参数小型语言模型,在数学等领域的复杂推理以及传统语言处理方面表现出色。Phi-4用数据质量为核心训练重点,大量融入合成数据,提升模型在STEM问答和数学竞赛问题上的表现。Phi-4引入新的训练范式midtraining,增强长文本处理能力,窗口长度可达16K。Phi-4在编程任务上表现出色,在HumanEval基准测试中以82.6%的准确率领先其他开源模型(如70B的Llama 3.3和72B的Qwen 2.5)。Phi-4已在Hugging Face上开源可下载使用。

Phi-4

Phi-4的主要功能

问答能力:能理解和回答各种问题,尤其在STEM(科学、技术、工程和数学)领域表现出色。数学问题解决:模型在美国数学竞赛AMC 10/12中得分超过90,显示强大的数学推理能力。编程任务:Phi-4在编程任务上表现出色,能理解和生成代码,解决编程问题。长文本处理:基于midtraining阶段,Phi-4能处理长达16K的上下文,保持高召回率。复杂推理:模型在多个基准测试中展现处理复杂推理任务的能力,如MMLU和GPQA。安全交互:Phi-4在后训练中进行安全对齐,确保与用户的交互符合负责任AI原则。

Phi-4的技术原理

合成数据训练:Phi-4的训练过程中大量使用合成数据,基于多代理提示、自我修订和指令反转等技术生成,提高模型的推理和问题解决能力。midtraining阶段:在预训练和后训练之间加入的midtraining阶段,提升模型处理长文本的能力。长上下文数据选择:从高质量非合成文本中筛选出长于8K tokens的样本,加权超过16K tokens的样本,匹配目标长度。对比学习:用枢轴tokens搜索(PTS)方法,识别对模型输出影响最大的关键tokens,生成高信噪比的对比学习数据。人类反馈:结合人类反馈对比学习(Human Feedback DPO),构造优质的正负样本对,让模型输出更符合人类偏好。

Phi-4的项目地址

项目官网:introducing-phi-4HuggingFace模型库:https://hf-mirror.com/microsoft/phi-4arXiv技术论文:https://arxiv.org/pdf/2412.08905

Phi-4的应用场景

教育辅助:作为教育辅助工具,帮助学生解答STEM领域的复杂问题,提供数学和编程作业的辅导。技术研究:在科学研究中,理解和生成研究论文中的概念和数据,辅助研究人员进行文献综述和数据分析。软件开发:辅助软件开发,包括代码生成、调试和功能实现。智能助手:作为智能助手,理解和响应用户的查询,提供信息检索、日程管理和其他个人助理服务。企业决策支持:分析大量数据,为企业提供市场趋势分析、风险评估和决策支持。
上一篇:Insight-V – 提升长链视觉推理能力的多模态模型
相关资讯 更多+
  • Phi-4 – 微软开源的14B参数小语言模型,擅长数学等领域的复杂推理
    Phi-4 – 微软开源的14B参数小语言模型,擅长数学等领域的复杂推理

    Phi-4是微软推出的14亿参数小型语言模型,在数学等领域的复杂推理以及传统语言处理方面表现出色。Phi-4用数据质量为核心训练重点,大量融入合成数据,提升模型在STEM问答和数学竞赛问题上的表现。Phi-4引入新的训练范式midtraining,增强长文本处理能力,窗口长度可达16K。

    AI教程资讯 2023-04-14

  • Insight-V – 提升长链视觉推理能力的多模态模型
    Insight-V – 提升长链视觉推理能力的多模态模型

    Insight-V是南洋理工大学、腾讯公司和清华大学的研究者们共同推出的多模态模型,能提升多模态大型语言模型在长链视觉推理方面的能力。基于可扩展的数据生成流程生产高质量的推理数据,采用多智能体系统将视觉推理任务分解为推理和总结两个步骤,结合两阶段训练流程,显著提高模型在视觉推理基准测试中的表现。

    AI教程资讯 2023-04-14

  • SVDQuant – MIT 推出的扩散模型后训练量化技术
    SVDQuant – MIT 推出的扩散模型后训练量化技术

    SVDQuant是MIT研究团队推出的后训练量化技术,针对扩散模型,将模型的权重和激活值量化至4位,减少内存占用加速推理过程。SVDQuant引入高精度的低秩分支吸收量化过程中的异常值,在保持图像质量的同时,实现在16GB 4090 GPU上3 5倍的显存优化和8 7倍的延迟减少。

    AI教程资讯 2023-04-14

  • Meta Motivo – Meta 推出控制数字智能体动作的人工智能模型
    Meta Motivo – Meta 推出控制数字智能体动作的人工智能模型

    Meta Motivo 是 Meta 公司推出的AI模型,能提升元宇宙体验的真实性。Meta Motivo基于控制虚拟人形智能体的全身动作,模拟人类行为,增强用户互动。模型采用无监督强化学习算法,特别是FB-CPR算法,用大量动作数据进行预训练,无需额外训练即可执行动作轨迹跟踪、姿势到达等多种任务。

    AI教程资讯 2023-04-14

最新录入 更多+
确定