DomoAI是由映刻科技推出的一款将照片和视频动漫化的AI工具,国际版名为DomoAI,国内版为滴墨AI(大画家Domo)。该工具可以将用户上传的图片和视频转绘为二次元风格的动漫,此外还支持文生图、图生图、动漫图真人化等功能。
DomoAI提供免费体验的配额,若需更快的生成速度,则需付费订阅,可以在Discord频道中输入/subscribe进行订阅
免费版:新用户注册后可获得100积分(约可生成100张图片或6个视频)基础版:9.99美元每月,提供每月500个快速生成的积分(约可生成500张图片或30个视频)标准版:19.99美元每月,提供每月1200个快速生成的积分(约可生成1200张图片或80个视频)专业版:49.99美元每月,提供每月3000个快速生成的积分(约可生成3000张图片或200个视频)SmolVLM是Hugging Face推出的轻量级视觉语言模型,专为设备端推理设计。以20亿参数量,实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同需求:SmolVLM-Base:适用于下游任务的微调。SmolVLM-Synthetic:基于合成数据进行微调。SmolVLM-Instruct:指令微调版本,可直接应用于交互式应用中。
AI教程资讯
2025-02-01
OneDiffusion是AI2推出的多功能大规模扩散模型,能无缝支持双向图像合成和理解,涵盖文本到图像生成、条件图像生成、图像理解等多种任务。基于将所有条件和目标图像建模为序列“视图”训练,实现在推理时任意帧作为条件图像的能力。
AI教程资讯
2025-02-01
LongAlign是香港大学研究团队推出的文本到图像(T2I)扩散模型的改进方法,能提升长文本输入的对齐精度。LongAlign用段级编码技术,将长文本分割处理,适应编码模型的输入限制。同时引入分解偏好优化,基于区分偏好模型中的文本相关和无关部分,应用不同权重减少过拟合,增强对齐度。
AI教程资讯
2025-02-01
ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式,如epub、pdf、mobi等,用Coqui XTTS技术实现高质量的文本到语音转换。工具支持16种语言,操作简便,提供命令行、Web界面和Docker容器等多种使用方式。
AI教程资讯
2025-02-01