当前位置: 网站首页 >AI教程资讯 >正文

ImBD – 复旦联合华南理工等机构推出的通用 AI 内容检测器

来源:爱论文 时间:2025-01-15 15:35:13

ImBD是什么

ImBD(Imitate Before Detect)是复旦大学、华南理工大学、武汉大学、Fenzi AI等推出的用在检测机器修订文本的方法。首先模仿大型语言模型(LLMs)生成文本的风格,基于风格偏好优化(SPO)调整评分模型,让其更符合机器修订文本的特征。然后,利用风格条件概率曲率(Style-CPC)量化原始文本与条件概率采样生成文本之间的对数概率差异,有效区分人类写作和机器修订内容。ImBD在多种场景下表现出色,包括不同LLMs的文本修订、多个文本领域和多种修订类型,显著提高检测性能,且仅需少量数据和较短的训练时间即可达到优越性能。

ImBD

ImBD的主要功能

检测机器修订文本:有效识别经过机器修订的文本,包括重写、扩展和润色等类型。捕捉文本中独特的机器风格特征,区分出人类写作和机器修订的内容,提高检测的准确性。适应多种场景:适用于多种文本领域和不同类型的机器修订任务。包括新闻、学术论文故事创作等不同领域,ImBD能准确检测出机器修订的痕迹,具有良好的泛化能力。高效训练与推理:ImBD在训练过程中仅需少量样本和较短的训练时间,达到优越的性能。在推理阶段快速处理文本数据,给出检测结果,满足实际应用中对效率的要求。

ImBD的技术原理

风格偏好优化(SPO):基于SPO调整评分模型,使其更符合机器修订文本的风格特征。基于成对的人类写作文本和机器修订文本,用优化模型的token分布,让其更倾向于机器修订文本的风格,增强模型对机器风格特征的识别能力。风格条件概率曲率(Style-CPC):在检测阶段,I用Style-CPC量化原始文本和条件概率采样生成文本之间的对数概率差异。基于计算这种差异,模型能有效区分人类写作和机器修订内容,因为机器修订文本在概率分布上通常会表现出与人类写作不同的特征。模仿与检测结合:ImBD的核心思想是先模仿机器的风格,再进行检测。基于模仿机器的风格特征,模型能更好地理解机器修订文本的特点,在检测时更准确地识别出机器修订的痕迹,提高检测的准确性和鲁棒性。

ImBD的项目地址

项目官网:machine-text-detection.github.io/ImBDGitHub仓库:https://github.com/Jiaqi-Chen-00/ImBDarXiv技术论文:https://arxiv.org/pdf/2412.10432在线体验Demo:https://ai-detector.fenz.ai/ai-detector

ImBD的应用场景

学术领域:帮助审稿人识别论文中机器修订部分,确保原创性和学术诚信.新闻媒体:检测新闻稿件中机器润色内容,保证报道真实性和准确性.出版行业:辅助编辑校对书稿,识别机器修订内容,确保图书质量.教育领域:检测学生作业中机器辅助部分,准确评估学生能力,提供针对性反馈.企业与商业:审核营销文案等,确保内容原创性和质量,避免版权和品牌问题.网络安全与信息验证:识别网络虚假信息中的机器生成或修订内容,维护网络安全和信息真实性.
上一篇:SocraticLM – 中科大和科大讯飞共同推出的苏格拉底教学大模型
相关资讯 更多+
  • ImBD – 复旦联合华南理工等机构推出的通用 AI 内容检测器
    ImBD – 复旦联合华南理工等机构推出的通用 AI 内容检测器

    ImBD(Imitate Before Detect)是复旦大学、华南理工大学、武汉大学、Fenzi AI等推出的用在检测机器修订文本的方法。首先模仿大型语言模型(LLMs)生成文本的风格,基于风格偏好优化(SPO)调整评分模型,让其更符合机器修订文本的特征。然后,利用风格条件概率曲率(Style-CPC)量化原始文本与条件概率采样生成文本之间的对数概率差异,有效区分人类写作和机器修订内容。

    AI教程资讯 2023-04-14

  • SocraticLM – 中科大和科大讯飞共同推出的苏格拉底教学大模型
    SocraticLM – 中科大和科大讯飞共同推出的苏格拉底教学大模型

    SocraticLM 是通过苏格拉底式的教学法来教授数学的创新人工智能模型,模型由中科大和科大讯飞共同开发,采用了“Thought-Provoking”教学范式,通过提问引导学生主动思考和解决问题。SocraticLM 在名为 SocraTeach 的数据集上进行了微调,该数据集包含 35,000 个精心设计的多轮教学对话,模拟了真实的教学场景。

    AI教程资讯 2023-04-14

  • VMix – 字节联合中科大推出增强模型生成美学质量的适配器
    VMix – 字节联合中科大推出增强模型生成美学质量的适配器

    VMix是创新的即插即用美学适配器,旨在提升文本到图像扩散模型生成图像的美学质量。通过解耦输入文本提示中的内容描述和美学描述,将细粒度的美学标签(如色彩、光线、构图等)作为额外条件引入生成过程。

    AI教程资讯 2023-04-14

  • smoltalk-chinese – OpenCSG 开源专为中文大型语言模型设计的合成数据集
    smoltalk-chinese – OpenCSG 开源专为中文大型语言模型设计的合成数据集

    smoltalk-chinese 是OpenCSG开源的专为中文大型语言模型(LLM)设计的合成数据集,该数据集包含超过 70 万条合成数据,涵盖了信息查询、推理、计划、编辑、编程、数学、角色扮演、数据分析、创意写作、咨询和头脑风暴等多种任务类型。

    AI教程资讯 2023-04-14

最新录入 更多+
确定