Lucidpic是一个快速生成不存在的人像的优质高清图库照片,允许用户调整服装、发型、风格,甚至年龄,以获得完美的人像照片。
WebRL是清华大学、智谱AI联合推出的自我进化的在线课程强化学习框架,训练使用开放大型语言模型(LLMs)的高性能网络代理。WebRL动态生成任务、结果监督奖励模型(ORM)评估任务成功与否,及自适应强化学习策略,解决训练任务稀缺、反馈信号稀疏和在线学习中的策略分布漂移等挑战。
AI教程资讯
2025-02-11
GameGen-X是香港科技大学、中国科学技术大学等机构研究人员推出的扩散变换器模型,用在生成和交互控制开放世界游戏视频。模型能模拟游戏引擎功能,如创新角色、动态环境、复杂动作和多样化事件,支持用户用文本指令和键盘控制等多模态信号影响游戏内容,实现游戏玩法的模拟。
AI教程资讯
2025-02-11
OuteTTS是开源的文本到语音(TTS)项目,基于纯语言建模的方法生成语音。OuteTTS项目基于LLaMa架构,用Oute3-350M-DEV基础模型,拥有3 5亿参数。OuteTTS具备音频标记化、CTC强制对齐技术和结构化提示创建等创新音频处理方法,支持语音克隆功能,及用户创建自定义说话人的声音。
AI教程资讯
2025-02-11
GTA(a benchmark for General Tool Agents)是上海交通大学和上海AI实验室共同推出的基准测试,评估大型语言模型(LLMs)在真实世界场景中调用工具的能力。GTA基于提供真实的用户问题、真实部署的工具和多模态输入输出,建立一个全面、细粒度的评估框架,有效衡量LLMs在复杂场景下的工具使用能力。
AI教程资讯
2025-02-11