当前位置: 网站首页 >AI教程资讯 >正文

Yi-Lightning – 零一万物最新推出的高性能高速度旗舰模型

来源:爱论文 时间:2025-02-19 16:07:25

Yi-Lightning是什么

Yi-Lightning 是零一万物公司最新发布的旗舰模型,在国际权威盲测榜单 LMSYS 上取得了显著成绩,超越了硅谷知名 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic Claude 3.5 Sonnet,排名世界第六,中国第一。这一成就标志着中国大模型在全球竞技场上首次超越了 OpenAI 的 GPT-4o,展现了中国在人工智能领域的实力和进步。

Yi-Lightning 模型在多个分榜上也展现了出色的性能,在中文分榜上,超越了其他国内外优质模型,与 o1-mini 等模型并列排名世界第二。在多轮对话分榜上,Yi-Lightning 排名第三,在数学和代码分榜上,分别取得了第三和第四名的成绩。

Yi-Lightning 在推理速度和成本方面也实现了突破。与上一代旗舰模型 Yi-Large 相比,Yi-Lightning 的最高生成速度提升了近四成,首包时间缩短了一倍。Yi-Lightning 的推理成本得到了进一步的降低,每百万 token 仅需 0.99 元,直逼行业最低价。

Yi-Lightning的主要功能

推理速度和成本:Yi-Lightning 在推理速度上相比上一代旗舰模型 Yi-Large 有显著提升,最高生成速度提升了近四成。推理成本也得到了进一步的降低,每百万 token 仅需 0.99 元。AI 2.0 数字人解决方案:零一万物推出了基于 Yi-Lightning 模型的 AI 2.0 数字人解决方案,聚焦零售和电商等场景。这套解决方案包括角色大模型、直播声音大模型、电商话术大模型等,具备动作训练、表情生成、多国语言和情感表达、智能对话等能力。在实际应用中,某酒旅企业接入后 GMV 较此前上升了 170%。全行业解决方案:Yi-Lightning 模型也被应用于零一万物的全行业解决方案中,这些解决方案除了基座模型外,还会搭配 RAG、Function Calling 等实用工具。已经在零售、医疗、教育、物流等领域内完成落地,涉及 AI 搜索、AI 生产力工具、AI 智能巡检等应用场景。模型架构创新:Yi-Lightning 采用了 Mixture of Experts(MoE)混合专家模型架构,在模型训练过程中引入了混合注意力机制和动态 Top-P 路由机制,创新尝试提供了更高起点的标准化基座模型,能更快速、高效、低成本地完成定制模型训练。极速推理:Yi-Lightning 的推理速度非常快,基于动态 Top-P 路由机制,能根据任务的难度动态自动选择最合适的专家网络组合,平衡推理成本和模型性能。多阶段训练:Yi-Lightning 的训练过程采用了多阶段训练模式,前期注重数据多样性,后期侧重于更丰富、知识性更强的数据,这种训练方法有助于模型吸收不同阶段的知识,通过调整 batch size 和学习率(LR)来保证训练速度和稳定性。

Yi-Lightning的技术原理

MoE混合专家模型架构:Yi-Lightning 采用了 Mixture of Experts(MoE)混合专家模型架构,这种架构通过结合多个专家网络(Experts)来处理不同的任务,使模型能根据任务的难度动态选择激活哪些专家网络,平衡推理成本和模型性能。在训练过程中,所有专家网络都被激活,在推理阶段,模型会选择性地激活更匹配的专家网络。混合注意力机制(Hybrid Attention):Yi-Lightning 优化了混合注意力机制,只在模型的部分层次中将传统的全注意力(Full Attention)替换为滑动窗口注意力(Sliding Window Attention),降低计算成本,同时保持对长序列数据的高效处理能力。跨层注意力(Cross-Layer Attention, CLA):Yi-Lightning 引入了跨层注意力机制,支持模型在不同的层次之间共享键(Key)和值(Value)头,减少对存储资源的需求,提高模型的推理效率。动态 Top-P 路由:Yi-Lightning 根据任务的难度动态自动选择最合适的专家网络组合,无需人工干预,使模型能更加智能地适应各种任务需求,实现极速推理。

Yi-Lightning的项目地址

项目官网:platform.lingyiwanwu.com

Yi-Lightning的应用场景

翻译场景:Yi-Lightning 在翻译领域表现出色,能处理语言理解和生成、跨语言能力、上下文感知能力等,提供高质量的翻译服务。在与多个模型的对比中,Yi-Lightning 的翻译能力得到了直观的展现,用词精准且具有文学色彩 。零售电商直播场景:零一万物推出的 AI 2.0 数字人方案聚焦于零售和电商等场景,基于Yi-Lightning 提供的技术支持,实现了弹幕互动、商品信息提取、实时话术生成等功能。接入 Yi-Lightning 后,数字人的实时互动效果更好,话术更流畅,回复也更准确。企业级解决方案:Yi-Lightning 也被应用于零一万物的 To B 战略下的企业级解决方案中,为企业提供定制化的 AI 服务,帮助企业提升效率和营收。多语言处理:在中文分榜上,Yi-Lightning 展现了强大的中文处理能力,与国际顶尖模型相比也毫不逊色 。数学和代码生成:在数学和代码分榜上,Yi-Lightning 分别取得了第三、第四名的成绩,显示了其在这些领域的强大能力 。长提问和艰难提问:Yi-Lightning 在处理长提问和艰难提问方面也表现出众,均取得世界第四的优异成绩,证明了其解决复杂问题的能力 。
上一篇:FunASR – 阿里开源的多功能语音识别工具包
相关资讯 更多+
  • Yi-Lightning – 零一万物最新推出的高性能高速度旗舰模型
    Yi-Lightning – 零一万物最新推出的高性能高速度旗舰模型

    Yi-Lightning 是零一万物公司最新发布的旗舰模型,在国际权威盲测榜单 LMSYS 上取得了显著成绩,超越了硅谷知名 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic Claude 3 5 Sonnet,排名世界第六,中国第一。

    AI教程资讯 2023-04-14

  • FunASR – 阿里开源的多功能语音识别工具包
    FunASR – 阿里开源的多功能语音识别工具包

    FunASR是由阿里巴巴达摩院开源的语音识别工具包,提供包括语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离及多说话人ASR等多种功能。FunASR工具包支持工业级语音识别模型的训练和微调,旨在帮助研究人员和开发者更高效地进行语音识别模型的研究和生产,推动语音识别技术的发展。

    AI教程资讯 2023-04-14

  • CleanS2S – 流式语音到语音交互智能体原型,同时进行听和说
    CleanS2S – 流式语音到语音交互智能体原型,同时进行听和说

    CleanS2S是一个流式语音到语音(S2S)交互智能体原型,提供高质量、实时的语音交互体验。CleanS2S项目基于单文件实现,简化配置和理解过程,便于用户和研究人员快速体验语言用户界面(LUI)的强大功能,探索S2S管道的潜力。

    AI教程资讯 2023-04-14

  • Hallo2 – 复旦、百度和南大共同推出的音频驱动视频生成模型
    Hallo2 – 复旦、百度和南大共同推出的音频驱动视频生成模型

    Hallo2是复旦大学、百度公司和南京大学共同推出的音频驱动视频生成模型。能将单张参考图片和持续几分钟的音频输入结合起来,基于可选的文本提示调节肖像表情,生成与音频同步的高分辨率4K视频。

    AI教程资讯 2023-04-14

最新录入 更多+
确定