PixWeaver是一款个性化视觉创意设计平台,由北京生数科技有限公司开发。该平台支持个性化的视觉创作,融合了多元风格,具备出色的语义理解和丰富的细节表现,达到了艺术级的美学水准。PixWeaver 提供了一系列功能,如文字生图、超分辨率、细节微调和3D生成等,旨在释放用户的无限想象。目前PixWeaver的AI绘画功能在免费公测中,AI视频生成功能在技术升级和优化中。
InfiMM-WebMath-40B 是字节跳动和中国科学院联合开源的超大规模多模态数据集,旨在提升多模态模型的图文混合推理能力,在数学领域。数据集从 Common Crawl 中提取,经过严格的筛选、清洗和标注,包含 2400 万个网页、8500 万个图像 URL 和 400 亿个文本标记,涵盖了丰富的数学和科学相关内容。
AI教程资讯
2025-01-31
SAM 2 1(全称Segment Anything Model 2 1)是Meta(Facebook的母公司)推出的先进视觉分割模型,用于图像和视频。基于简单的Transformer架构和流式记忆设计,实现实时视频处理。SAM 2 1在前代基础上引入数据增强技术,改善对视觉相似物体和小物体的识别,提升遮挡处理能力。
AI教程资讯
2025-01-31
Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参考生成高质量的图像。模型支持多种生成模式,包括变体生成、图像到图像转换、智能修复及ControlNet引导生成,具备深度估计和线条检测功能,实现更精确的图像控制。
AI教程资讯
2025-01-31
ShowUI是新加坡国立大学Show Lab和微软共同推出的视觉-语言-行动模型,能提升图形用户界面(GUI)助手的工作效率。模型基于UI引导的视觉令牌选择减少计算成本,用交错视觉-语言-行动流统一GUI任务中的多样化需求,并管理视觉-行动历史增强训练效率。
AI教程资讯
2025-01-31