当前位置: 网站首页 >AI教程资讯 >正文

TeleChat2-115B – 中国电信AI研究院推出的开源星辰语义大模型

来源:爱论文 时间:2025-02-24 15:47:07

TeleChat2-115B是什么

TeleChat2-115B是由中国电信人工智能研究院(TeleAI)研发的大型语言模型,属于星辰语义大模型系列。基于国产算力进行训练,采用10万亿Tokens的中英文高质量语料。与前代模型相比,TeleChat2-115B在通用问答、知识类、代码类和数学类任务上的性能显著提升。模型在多个评测榜单上取得优异成绩,如C-Eval评测Open Access模型综合榜单中排名第一。TeleChat2-115B的开源,标志着国产大模型训练技术的重要进步,有助于推动大模型技术的创新和产业应用。

智能客服:作为聊天机器人,提供客户咨询服务,解答用户问题。 内容创作:辅助写作,生成文章、故事、诗歌等文本内容。 语言翻译:实现高质量的中英文互译。 教育辅导:提供语言学习和作业辅导,帮助学生理解复杂概念。 编程辅助:生成代码片段,帮助开发者解决编程问题。 数据分析:处理和分析文本数据,提取有用信息。 智能搜索:增强搜索引擎,提供更准确的搜索结果。 自动文摘:生成文档或文章的摘要,节省阅读时间。

TeleChat2-115B的主要功能

文本生成:能生成高质量的中英文文本。多语言支持:支持中英文高质量语料的训练,处理两种语言的文本。多格式多平台:提供多格式、多平台的权重文件,方便在不同环境下部署和使用。高性能推理:支持单卡和多卡推理,以及长文推理优化。API和Web部署:提供API和Web部署方式,支持流式生成和多轮对话。

TeleChat2-115B的技术原理

Decoder-only结构:用标准的Decoder-only结构设计,用于生成文本任务。Rotary Embedding:用Rotary Embedding的位置编码方法,有助于模型更好地捕捉序列数据中的相对位置信息。SwiGLU激活函数:用SwiGLU激活函数替代传统的GELU激活函数,提升模型的性能。RMSNorm的Pre-Normalization:基于RMSNorm的Pre-Normalization进行层标准化操作,有助于模型训练的稳定性。词嵌入和输出层参数分开:将词嵌入层和输出层(lm head)参数分开,有助于增强训练稳定性和收敛性。GQA优化:选择GQA(Grouped Query Attention)节约attention部分的参数量和计算量,提升训练和推理速度。

TeleChat2-115B的项目地址

GitHub仓库:https://github.com/Tele-AI/TeleChat2

TeleChat2-115B的应用场景

智能客服:作为聊天机器人,提供客户咨询服务,解答用户问题。内容创作:辅助写作,生成文章、故事、诗歌等文本内容。语言翻译:实现高质量的中英文互译。教育辅导:提供语言学习和作业辅导,帮助学生理解复杂概念。编程辅助:生成代码片段,帮助开发者解决编程问题。数据分析:处理和分析文本数据,提取有用信息。智能搜索:增强搜索引擎,提供更准确的搜索结果。
上一篇:GroundingBooth – Adobe联合多所高校推出主题和文本到图像的定制框架
相关资讯 更多+
  • TeleChat2-115B – 中国电信AI研究院推出的开源星辰语义大模型
    TeleChat2-115B – 中国电信AI研究院推出的开源星辰语义大模型

    TeleChat2-115B是由中国电信人工智能研究院(TeleAI)研发的大型语言模型,属于星辰语义大模型系列。基于国产算力进行训练,采用10万亿Tokens的中英文高质量语料。与前代模型相比,TeleChat2-115B在通用问答、知识类、代码类和数学类任务上的性能显著提升。

    AI教程资讯 2023-04-14

  • GroundingBooth – Adobe联合多所高校推出主题和文本到图像的定制框架
    GroundingBooth – Adobe联合多所高校推出主题和文本到图像的定制框架

    GroundingBooth 是一个先进的文本到图像定制框架,由华盛顿大学圣路易斯分校、Adobe和普渡大学的研究团队共同推出。基于文本-图像对齐模块和遮罩交叉注意力层,实现对前景主体和背景对象的精确空间对齐。

    AI教程资讯 2023-04-14

  • markmap – 解析Markdown生成可视化思维导图的工具
    markmap – 解析Markdown生成可视化思维导图的工具

    markmap 是一个将 Markdown 文本转换为思维导图的工具。基于 Markdown 的语法结构,实时生成可视化的思维导图,帮助用户直观的组织和展示信息。markmap 轻量且功能强大,支持与多种代码编辑器如 VS Code、Vim Neovim、Emacs 集成,实现实时渲染和高度的可定制性。

    AI教程资讯 2023-04-14

  • OLMoE – 完全开源的大语言模型,基于混合专家(MoE)架构
    OLMoE – 完全开源的大语言模型,基于混合专家(MoE)架构

    OLMoE(Open Mixture-of-Experts Language Models)是一个完全开源的大型语言模型,基于混合专家(MoE)架构。OLMoE基于5万亿个token进行预训练,拥有70亿总参数和10亿活跃参数。

    AI教程资讯 2023-04-14

最新录入 更多+
确定