奇妙问是由出门问问推出的AI交互式数字员工生成平台,基于自研的“序列猴子”大模型,为政企、文旅等行业提供数字接待、客服、销售等服务,提供一站式交互数字人解决方案。该平台支持模型、形象、声音的定制,以及多种交互模式,能够实现个性化的数字人交互体验,适用于多种服务场景,提升企业服务效率和用户体验。
NotebookLlama是Meta推出的将PDF文档转换成播客内容的开源项目。项目基于一系列自动化步骤实现,用LLaMa模型进行PDF预处理、生成播客脚本、增加戏剧化元素及文本转语音合成。整个过程无需人工干预,产出专业水准的播客。
AI教程资讯
2025-02-14
WonderWorld是斯坦福大学和麻省理工学院共同推出的创新性3D场景生成框架,能从单张图片快速生成多样化且连贯的3D虚拟世界。基于核心的Fast LAyered Gaussian Surfels (FLAGS)表示法和引导深度扩散技术,框架在不到10秒的时间内完成场景的生成,极大地提高3D场景创建的速度,保证新旧场景之间的几何一致性。
AI教程资讯
2025-02-14
Meissonic是由阿里巴巴集团、Skywork AI等多所大学合作推出的文本到图像合成模型。基于掩蔽图像建模技术,结合多模态和单模态Transformer层、高级位置编码策略和优化的采样条件,提升图像生成的效率和性能。模型用1B参数,依赖高质量训练数据、微条件和特征压缩层,生成高质量、高分辨率图像,性能与大型扩散模型相当。
AI教程资讯
2025-02-14
Zamba2-7B是Zyphra公司推出的小型语言模型,基于创新的架构在保持输出质量的同时实现快速的推理速度和低内存占用。模型在处理图像描述等任务时表现出色,适合在边缘设备和消费级GPU上运行。Zamba2-7B采用Mamba2块替代Mamba1块,引入两个共享注意力块用ABAB模式排列,在MLP模块上应用LoRA投影器提高性能。
AI教程资讯
2025-02-14