MaskGCT是趣丸科技与香港中文大学(深圳)合作推出的语音合成大模型,基于掩码生成模型与语音表征解耦编码的技术,实现在声音克隆、跨语种合成、语音控制等任务上的显著效果。模型在多个TTS基准数据集上达到行业领先的水平,某些性能指标甚至超过人类。
AI教程资讯
2025-02-14
GLM-4-Voice是智谱AI推出的端到端情感语音模型,能直接理解和生成中英文语音,支持实时语音对话,能根据用户指令灵活调整语音的情感、语调、语速和方言等特征。模型由三个部分组成:GLM-4-Voice-Tokenizer负责将连续语音转换为离散token,GLM-4-Voice-Decoder将token转换回连续语音输出,GLM-4-Voice-9B基于GLM-4-9B模型进行预训练和对齐,理解和生成语音
AI教程资讯
2025-02-14
Unbounded是谷歌和北卡罗来纳大学教堂山分校共同推出的无限人生模拟游戏。游戏突破传统视频游戏的局限,用生成模型,如大型语言模型(LLM)和视觉生成模型,创造一个没有固定规则和边界的游戏体验。玩家与自己的虚拟角色互动,用自然语言指令引导角色在虚拟世界中探索、互动,形成连贯的故事线。
AI教程资讯
2025-02-14
AutoGLM是智谱AI团队最新推出的 “Phone Use” AI智能体,基于图形用户界面(GUI)实现自主任务完成。AutoGLM能模拟人类在手机操作,执行如社交媒体互动、在线购物、酒店预订等任务。AutoGLM能接收简单的文字或语音指令,自动完成复杂的操作流程,无需用户手动干预。
AI教程资讯
2025-02-14