Civitai是一个专注于AI图像绘画和艺术作品创作和分享的在线平台和社区,用户可以上传和共享他们使用自己的数据训练的自定义模型(主要基于Stable Diffusion),也可以浏览、下载和评论其他用户创建的模型,然后利用这些模型与AI图片生成软件一起使用创建独特的艺术品。该网站为艺术家、设计师和人工智能爱好者提供了一个探索、展示和协作人工智能生成的图像作品的空间。凭借其多样化的功能和不断增长的社区,Civitai 已成为那些对人工智能和创意艺术感兴趣的人的重要平台,每月超过1000多万用户访问和使用。
Leffa(Learning Flow Fields in Attention)是 Meta AI推出的用在可控人物图像生成框架,基于在注意力机制中引入流场学习,精确控制人物的外观和姿势。Leffa基于正则化损失函数,指导模型在训练时让目标查询聚焦于参考图像中的正确区域,减少细节失真,提升图像质量。
AI教程资讯
2025-01-23
LatentLM是微软研究院和清华大学共同推出的多模态生成模型,能统一处理离散数据(如文本)和连续数据(如图像、音频)。模型用变分自编码器(VAE)将连续数据编码为潜在向量,引入下一个词扩散技术自回归生成向量。
AI教程资讯
2025-01-23
Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言模型(MLLM),专注于提升语音、视觉和语言模态的交互能力。Lyra基于开源大型模型、多模态LoRA模块和潜在的多模态正则化器,减少训练成本和数据需求。
AI教程资讯
2025-01-23
Manga Image Translator是开源的漫画图片文字翻译工具,能一键翻译漫画和图片中的文字。Manga Image Translator基于OCR技术识别文本,结合机器翻译将文字转换成目标语言。工具支持多种语言,能将翻译后的文本无缝嵌入原图,保持漫画风格。
AI教程资讯
2025-01-23