当前位置: 网站首页 >AI教程资讯 >正文

MEXMA – Meta推出的预训练跨语言句子编码器

来源:爱论文 时间:2025-02-18 17:30:04

MEXMA是什么

MEXMA是由Meta AI推出的一种新型的预训练跨语言句子编码器。基于结合句子级和词语级的目标提升句子表示的质量。在训练过程中,MEXMA用一种语言的句子表示预测另一种语言中被遮蔽的词语,支持直接更新编码器中的句子表示和所有词语。MEXMA在多个任务上展现优越的性能,超越现有的预训练跨语言句子编码器,如LaBSE和SONAR。MEXMA支持80种语言,在句子分类等下游任务中表现出色。

MEXMA

MEXMA的主要功能

跨语言句子编码:MEXMA将不同语言的句子编码成固定大小的向量,向量在一个共享的多语言空间中进行比较和操作。句子和词语级目标结合:基于同时考虑句子的整体含义和句子中各个词语的贡献,MEXMA提高句子表示的质量和对齐。多任务性能提升:MEXMA在多种下游任务中表现出色,包括句子分类、文本挖掘和语义文本相似度任务。80种语言支持:MEXMA支持多达80种语言,适用广泛的多语言应用场景。

MEXMA的技术原理

结合句子级和词语级目标:MEXMA用句子级目标训练模型,引入词语级目标。在训练过程中,模型学习句子的整体表示,和学习句子中每个词语的表示。交叉语言遮蔽任务:MEXMA用一种语言的句子表示预测另一种语言中被遮蔽(masking)的词语。交叉语言的遮蔽任务迫让模型学习能捕捉句子核心信息的句子表示,确保信息在不同语言之间是可对齐的。直接更新编码器:在MEXMA中,句子表示能更新编码器,每个词语的表示直接更新编码器。双向更新机制让模型更有效地学习到高质量的句子和词语表示。对称架构:MEXMA基于对称架构,同时对两种语言的句子进行遮蔽和预测,确保模型在两种语言之间是平衡的,能生成两个干净的句子向量,对于语言之间的对齐至关重要。非对比性损失函数:为避免模型崩溃(collapse)并提高表示的质量和对齐,MEXMA用非对比性损失函数,如均方误差(MSE)损失,加强不同语言中语义等价句子的空间接近性。

MEXMA的项目地址

GitHub仓库:https://github.com/facebookresearch/mexmaHuggingFace模型库:https://huggingface.co/facebook/MEXMAarXiv技术论文:https://arxiv.org/pdf/2409.12737

MEXMA的应用场景

跨语言信息检索:用MEXMA将不同语言的文档转换成相同的嵌入空间,进行跨语言的搜索和检索。机器翻译:MEXMA改善机器翻译系统,基于提供更准确的跨语言句子表示增强翻译质量。多语言文本分类:在处理多语言文本数据时,MEXMA能分类文本内容,如情感分析、主题分类等。语义文本相似度评估:MEXMA评估不同语言句子之间的相似度,适用比较和匹配相似的文本内容。跨语言问答系统:在多语言的问答系统中,MEXMA帮助理解不同语言的问题,在相应的语言中找到答案。
上一篇:Lingua – Meta推出的轻量级独立代码库
相关资讯 更多+
  • MEXMA – Meta推出的预训练跨语言句子编码器
    MEXMA – Meta推出的预训练跨语言句子编码器

    MEXMA是由Meta AI推出的一种新型的预训练跨语言句子编码器。基于结合句子级和词语级的目标提升句子表示的质量。在训练过程中,MEXMA用一种语言的句子表示预测另一种语言中被遮蔽的词语,支持直接更新编码器中的句子表示和所有词语。

    AI教程资讯 2023-04-14

  • Lingua – Meta推出的轻量级独立代码库
    Lingua – Meta推出的轻量级独立代码库

    Lingua 是 Meta AI推出的一个轻量级且独立的代码库,旨在助力大规模训练语言模型。基于易于修改的 PyTorch 组件,便于研究人员尝试新的模型架构、损失函数和数据集。Lingua 专注于端到端训练、推理和评估,提供工具优化速度和稳定性。

    AI教程资讯 2023-04-14

  • VideoAgent – 斯坦福联合多所研究机构推出自改进的视频生成系统
    VideoAgent – 斯坦福联合多所研究机构推出自改进的视频生成系统

    VideoAgent是一种自改进的视频生成系统,由斯坦福大学、滑铁卢大学、DeepMind等机构的研究人员共同推出。根据图像观察和语言指令生成视频计划,转换为机器人控制动作。VideoAgent基于自我条件一致性方法细化视频计划,用预训练的视觉-语言模型(VLM)反馈进行迭代优化。

    AI教程资讯 2023-04-14

  • Llama Tutor – 开源的AI学习平台,提供学习主题生成定制学习计划
    Llama Tutor – 开源的AI学习平台,提供学习主题生成定制学习计划

    Llama Tutor 是一个基于AI的个性化学习平台,由 Llama 3 1 和 Together AI 技术驱动,是一个完全开源的项目。支持用户输入想要学习的主题和教育水平,生成一个量身定做的学习计划。平台覆盖包括篮球、机器学习、个人理财和美国历史在内的多个学科领域,旨在为不同背景和需求的学习者提供支持。

    AI教程资讯 2023-04-14

最新录入 更多+
确定