美图AI PPT是国内知名P图软件「美图秀秀」旗下的「美图设计室」推出的免费在线AI生成PPT设计工具,用户只需输入一句话,便可以轻松打造精美PPT。无论是什么类型风格的PPT,美图AI都可以帮你打造,如行业分析、工作汇报、创意设计方案、企业团建策划、部门工作总结等。
Spirit LM是由Meta AI团队推出的一种多模态语言模型,能无缝地混合文本和语音数据。Spirit LM基于一个预训练的文本语言模型,用持续在文本和语音单元上的训练扩展到语音模态。模型有两个版本:基础版(BASE)和表达版(EXPRESSIVE)
AI教程资讯
2025-02-19
Story-Adapter 是一种新型的长篇故事可视化框架,能在保持语义一致性的同时,生成高质量且具有细腻交互的故事图像序列。通过迭代方式,基于全局参考交叉注意力模块,优化图像生成过程,提升了长故事场景下的可视化效果。
AI教程资讯
2025-02-19
LOKI是由中山大学和上海AI Lab联合提出的合成数据检测基准,旨在全面评估大型多模态模型(LMMs)在识别视频、图像、3D、文本和音频等多种模态合成数据的能力。包含18,000多个问题,覆盖26个子类别,采用多层次标注,支持细粒度异常注释。
AI教程资讯
2025-02-19
NotesGPT是一款开源的AI驱动语音笔记工具,能将用户的语音笔记快速转录成文本,自动生成行动项。工具基于包括Convex数据库、Next js框架、Together推理模型、Replicate的Whisper转录服务等先进技术,确保转录的准确性和生成任务的效率。
AI教程资讯
2025-02-18