当前位置: 网站首页 >AI教程资讯 >正文

MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统

来源:爱论文 时间:2025-03-29 15:53:53

MiniRAG是什么

MiniRAG是香港大学推出的新型检索增强型生成(RAG)系统,专为在资源受限的场景下高效部署小型语言模型(SLMs)设计。MiniRAG基于两个关键技术实现这一目标:一是语义感知的异构图索引机制,将文本片段和命名实体结合,减少对复杂语义理解的依赖;二是轻量级拓扑增强检索方法,用图结构进行高效知识发现,无需高级语言能力。MiniRAG在实验中展现出与大型语言模型(LLMs)方法相当的性能,同时仅需25%的存储空间。MiniRAG提供全面的基准数据集,评估轻量级RAG系统在现实设备场景下的表现,推动资源受限环境下高效、私密的RAG系统的发展。

MiniRAG

MiniRAG的主要功能

高效的知识检索:基于独特的异构图索引机制,快速准确地从大量数据中检索出与用户查询最相关的知识,为生成准确的回答提供支持。轻量级的模型兼容性:专为小型语言模型(SLMs)设计,在不牺牲太多性能的前提下,显著降低对计算资源和存储空间的需求,使其更适合在资源受限的设备上运行。强大的推理能力:借助查询引导的推理路径发现机制,MiniRAG能处理复杂的、多步骤的推理任务,即使在SLMs的语义理解能力有限的情况下,也能有效地找到正确的答案。适应性强:MiniRAG能适应不同的应用场景,包括即时通讯、个人内容管理、本地文档检索等,为用户提供个性化的信息检索和生成服务。

MiniRAG的技术原理

语义感知的异构图索引机制:文本块节点(Vc):保留原始文本的上下文完整性,直接参与检索阶段,确保识别出最相关的上下文内容。实体节点(Ve):从文本块中提取的关键语义元素,如事件、地点、时间引用和领域特定概念,用在锚定语义理解。实体-实体连接(Eα):捕捉命名实体之间的语义关系、层次结构和时空依赖关系。实体-文本块连接(Eβ):连接命名实体及其对应的上下文,保持上下文相关性和语义连贯性。边的语义描述:基于语言模型生成的描述,为连接的节点提供明确的关系上下文,增强图的语义理解能力。轻量级拓扑增强检索方法:查询语义映射:用实体提取和轻量级句子嵌入模型,将用户输入的查询与图索引数据进行对齐,识别与查询相关的文本块。查询驱动的推理路径发现:基于智能查询引导机制,在异构图中构建推理路径,综合考虑查询与实体节点的语义相关性和实体之间的结构连贯性。拓扑增强的图检索:结合基于嵌入的相似性搜索和图结构的拓扑信息,识别与查询相关的高质量实体-实体连接,基于路径发现机制提取逻辑相关的推理链。查询相关文本块的检索:基于实体-文本块连接,收集与推理路径相关的文本块,计算输入查询与文本块及其边描述的语义相似性,最终选择最相关的文本块用在后续的生成任务。融合增强生成:将检索到的关键关系和最优文本块与先前确定的答案节点基于设计的融合策略进行整合,构建全面且结构化的输入表示,用在最终的增强生成过程。

MiniRAG的项目地址

GitHub仓库:https://github.com/HKUDS/MiniRAG/arXiv技术论文:https://arxiv.org/pdf/2501.06713

MiniRAG的应用场景

即时通讯:快速检索历史聊天记录,生成智能回复,提供知识辅助。个人内容管理:检索个人笔记,生成内容总结和提醒,管理日程。本地文档检索:检索本地文档内容,整合多文档信息,生成智能摘要。隐私敏感应用:安全管理医疗和金融信息,保护隐私的问答服务。边缘设备应用:在智能手表、智能音箱等设备上提供快速响应和智能服务。
上一篇:Riona-AI-Agent – AI社交工具,可在社交媒体平台自动化交互点赞评论
相关资讯 更多+
  • MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统
    MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统

    MiniRAG是香港大学推出的新型检索增强型生成(RAG)系统,专为在资源受限的场景下高效部署小型语言模型(SLMs)设计。MiniRAG基于两个关键技术实现这一目标:一是语义感知的异构图索引机制,将文本片段和命名实体结合,减少对复杂语义理解的依赖;二是轻量级拓扑增强检索方法,用图结构进行高效知识发现,无需高级语言能力。

    AI教程资讯 2023-04-14

  • Riona-AI-Agent – AI社交工具,可在社交媒体平台自动化交互点赞评论
    Riona-AI-Agent – AI社交工具,可在社交媒体平台自动化交互点赞评论

    Riona-AI-Agent是Node js 和 TypeScript 构建的 AI 驱动的自动化工具,能与 Instagram、Twitter 和 GitHub 等社交媒体平台进行交互。Riona-AI-Agent能生成引人入胜的内容,自动化交互,高效管理社交媒体账户。Riona-AI-Agent主要功能包括每天在 Twitter 上发布 17 次推文、在 Instagram 上自动登录和点赞评论,及即将推出的 Twitter 和 GitHub 自动化功能。

    AI教程资讯 2023-04-14

  • Prometheus – 浙大联合蚂蚁等高校推出的3D感知潜在扩散模型
    Prometheus – 浙大联合蚂蚁等高校推出的3D感知潜在扩散模型

    Prometheus是创新的3D感知潜在扩散模型,专门用于快速生成文本到3D场景的内容。能在几秒钟内完成对象和场景级别的3D生成,同时保持高质量的输出和良好的泛化能力。核心在于基于2D先验知识来驱动高效且可泛化的3D合成过程。

    AI教程资讯 2023-04-14

  • MinMo – 阿里通义实验室推出的多模态语音交互大模型
    MinMo – 阿里通义实验室推出的多模态语音交互大模型

    MinMo是阿里巴巴通义实验室FunAudioLLM团队推出的多模态大模型,专注于实现无缝语音交互。MinMo拥有约80亿参数,基于多阶段训练,在140万小时多样化语音数据和广泛语音任务上进行学习。

    AI教程资讯 2023-04-14

最新录入 更多+
确定