Sketch2Code由微软AI Lab于2018年推出,旨在帮助开发人员轻松地将手绘草图转化成HTML代码的开源项目。使用Sketch2Code,开发人员可以绘制线框草图并将其导出为源代码。Sketch2Code使用人工智能和自动化从线框草图中开发代码,支持基本的网页视觉元素,包括标签、文本字段、文本段落、图像和按钮等。
2018年发布时,该项服务背后的模型已经用数百万张图像进行了训练,可以对各种类型的物体进行物体检测。有了这些信息,该工具可以生成设计中不同元素的HTML代码片段,然后可以根据识别的元素的位置推断设计的布局,并相应地生成最终的HTML代码。
而在GPT 4的演示中,也有一段将草图转换成网页的Demo演示,很可能微软已经将该技术与OpenAI合作并进行了迭代,而最新训练的图像数据也可能远超2018年。
JoyVASA是京东健康国际公司开源的音频驱动的数字人头项目,基于扩散模型技术,根据音频信号生成与音频同步的面部动态和头部运动。JoyVASA能实现人物的唇形同步和表情控制,还扩展到动物头像的动画生成,在多语种支持和跨物种动画化方面具有广泛的应用潜力。
AI教程资讯
2025-02-05
TIP-I2V是大规模真实文本和图像提示数据集,用在图像到视频生成领域。TIP-I2V包含超过170万独特的用户文本和图像提示,及五种SOTA图生视频模型生成的相应视频。数据集能推动更好、更安全的图像到视频模型的发展,帮助研究人员分析用户偏好,评估模型性能,解决图像到视频模型引起的错误信息问题。
AI教程资讯
2025-02-05
FLUX Tools是黑森林实验室推出的一套模型工具,能增强基础文本到图像模型FLUX 1的控制性和可操作性。FLUX Tools包括FLUX 1 Fill(图像修复和扩展)、FLUX 1 Depth(基于深度图的结构引导)、FLUX 1 Canny(基于Canny边缘的结构引导)和FLUX 1 Redux(图像混合和重新创造)。工具基于提供文本描述和掩码,支持用户精确编辑和扩展真实及生成的图像,增强图像变化和重构能力。
AI教程资讯
2025-02-05
SmoothCache 是用在Diffusion Transformers (DiT)模型的通用推理加速技术,是 Roblox 和女王大学的研究团队推出。基于分析相邻扩散时间步的层输出相似性,自适应地缓存和重用关键特征,减少计算需求。实验显示,SmoothCache 能实现8%到71%的加速,并保持或提升生成质量,适用于图像、视频和音频等多种模态,有助于推动 DiT 模型在实时应用中的广泛使用。
AI教程资讯
2025-02-04