PlayHT是一个人工智能驱动的语音生成网站,提供逼真的AI文本转语音工具,可以快速将文本转换为自然的、类似人类的音频,跨越任何语言和口音。你可以将其用于视频编辑、在线学习和培训、AI语音应答、创建音频文章朗读、自媒体视频旁白等各种应用场景。
Generative Omnimatte 是 Google DeepMind 等机构推出的视频编辑技术,能将视频智能分解为多个透明背景的RGBA图层,每个图层对应一个物体及其相关效果(如阴影、反射等)。这项技术无需绿幕或深度信息,能实现物体与背景的精确分离,甚至处理被遮挡的部分。
AI教程资讯
2025-01-31
GLM-PC是智谱AI基于CogAgent视觉多模态模型开发的通用Agent,能模拟人类操作计算机,实现“无人驾驶”PC的技术探索。GLM-PC能执行预定会议、文档处理、网页搜索总结等任务,并支持远程和定时操作。GLM-PC能模拟人眼看、脑规划、手执行的方式使用电脑,具备跨平台能力,不依赖HTML或API,有更高的能力上限。
AI教程资讯
2025-01-31
TryOffDiff(VTOFF)是基于扩散模型的新型虚拟试穿技术,用高保真服装重建实现虚拟试穿,专注于从单张穿着者照片生成标准化的服装图像。与传统的Virtual Try-On技术不同,TryOffDiff的目标是从参考图像中提取出规范的服装图像。
AI教程资讯
2025-01-31
GLM-Edge是智谱开源的一系列端侧部署优化的大语言对话模型和多模态理解模型,包含GLM-Edge-1 5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B。1 5B 2B模型主要面向手机、车机等平台、4B 5B 模型主要面向PC等平台。基于GLM-4系列技术积累,调整模型结构和尺寸,实现模型性能、实机推理效果和落地便利性之间的最佳平衡。
AI教程资讯
2025-01-31