TextToSpeech是完全免费的AI文字转语音工具,支持50多个国家的语言和8000多种音色。用户可以轻松输入文本,选择语言和语音风格,调整语速和音量,然后生成听起来自然的高质量语音。TextToSpeech无需登录,支持跨设备使用,包括PC端和手机端浏览器。生成的语音可以用于社交平台等任何地方,且目前完全免费,没有使用次数限制。
DiffSensei是北京大学、上海AI实验室及南洋理工大学的研究人员共同推出的漫画生成框架,能生成可控的黑白漫画面板。DiffSensei整合基于扩散的图像生成器和多模态大型语言模型(MLLM),实现对漫画中多角色外观和互动的精确控制。
AI教程资讯
2025-01-26
Maya是开源的多语言多模态模型,基于指令微调扩展模型在多种语言和文化背景下的能力。Maya基于LLaVA框架,包含新创建的包含八种语言的预训练数据集,提高视觉-语言任务中的文化和语言理解。Maya基于毒性分析和数据集过滤,确保训练数据的安全性和质量。
AI教程资讯
2025-01-26
千影 QianYing是巨人网络推出的有声游戏生成大模型,包含游戏视频生成大模型YingGame和视频配音大模型YingSound。YingGame面向开放世界游戏,是巨人网络AI Lab与清华大学SATLab联合推出的,能实现角色多样动作交互控制和物理仿真特性,与YingSound结合可生成匹配画面的复杂音效。
AI教程资讯
2025-01-26
Promptic是轻量级的LLM应用开发框架,提供高效且符合Python风格的开发方式。基于LiteLLM,Promptic支持开发者能轻松切换不同的LLM服务提供商,只需更改一行代码。Promptic支持流式响应、内置对话记忆、错误处理和重试,及可扩展的状态管理。
AI教程资讯
2025-01-26