讯飞虚拟人是科大讯飞推出的全栈式AI虚拟人应用服务平台,基于AI虚拟形象技术,结合语音识别、语义理解、语音合成、NLP、星火大模型等AI核心技术,提供包括虚拟人形象资产构建、AI驱动、多模态交互在内的多场景虚拟人产品服务。平台支持一站式虚拟人音视频内容生产,能实现快速的内容创作和输出,同时提供形象定制、声音克隆、多模态智能交互等服务。
购买讯飞智作会员权益,可享AI声音、虚拟形象使用及定制、AI视频制作等AI功能;智能交互机、虚拟人直播机、虚拟人能力开放的相关定价可进行商务合作咨询。
配音会员:¥45起,仅需配音制作;可使用合成配音VIP主播、导出合成配音80次/天、不限量多语种主播。普通会员:¥399起,全功能可用;可使用合成配音VIP主播、语音包主播、使用全网通用形象(媒体、企业形象不可用)、导出合成配音80次/天、制作虚拟主播视频60分钟/月起、AI生图(星火大模型)100张/月、AI搜图(图库)200张/月、赠送秒级声音&形象构建5次【年会员】尊享会员:¥2999起,高频制作;可使用合成配音VIP主播、语音包主播、使用全网通用形象(媒体、企业形象不可用)、导出合成配音150次/天、制作虚拟主播视频1000分钟/月起、AI生图(星火大模型)500张/月、AI搜图(图库)1000张/月、赠送秒级声音&形象构建10次【年会员】MagicDriveDiT是香港中文大学、香港科技大学、华为云和华为诺亚方舟实验室共同推出基于DiT架构的新型视频生成方法,专为自动驾驶应用设计,实现高分辨率和长视频的生成。基于流匹配增强模型的可扩展性,用渐进式训练策略处理复杂场景。
AI教程资讯
2025-01-29
EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,能解决SAM 2模型在移动设备上部署时的高计算复杂度问题。基于用简单的非层次化Vision Transformer(ViT)作为图像编码器,并引入高效的记忆模块降低计算复杂度,实现在保持分割质量的同时减少延迟和模型大小。
AI教程资讯
2025-01-29
Amazon Nova 是亚马逊云服务(AWS)推出的新一代AI基础模型系列,提供行业领先的性能和成本效益。该系列包括专门处理文本的Amazon Nova Micro、多模态的Amazon Nova Lite 和Amazon Nova Pro,及即将推出的Amazon Nova Premier。除此之外,还有图像生成模型Amazon Nova Canvas 和视频生成模型Amazon Nova Reel。
AI教程资讯
2025-01-29
HunyuanVideo是腾讯开源的视频生成模型,拥有130亿参数,是目前参数量最大的开源视频模型之一。HunyuanVideo具备物理模拟、高文本语义还原度、动作一致性和电影级画质等特性,并能生成带有背景音乐的视频。
AI教程资讯
2025-01-29