Nova Sonic是什么
Nova Sonic 是亚马逊推出的新型生成式 AI 语音模型。将语音理解与生成能力整合到一个模型中,能根据说话者的语调、风格等声学上下文调整生成的语音响应,对话更自然。Nova Sonic 支持多语言,目前对美国英语和英国英语的语音理解表现出色,支持多种说话风格和不同口音。平均单词错误率低至4.2%,在多语言 LibriSpeech 基准测试中表现优于 OpenAI 的 GPT-4o-transcribe 模型。

来源:爱论文 时间:2025-04-14 15:50:20
Nova Sonic 是亚马逊推出的新型生成式 AI 语音模型。将语音理解与生成能力整合到一个模型中,能根据说话者的语调、风格等声学上下文调整生成的语音响应,对话更自然。Nova Sonic 支持多语言,目前对美国英语和英国英语的语音理解表现出色,支持多种说话风格和不同口音。平均单词错误率低至4.2%,在多语言 LibriSpeech 基准测试中表现优于 OpenAI 的 GPT-4o-transcribe 模型。
Nova Sonic 是亚马逊推出的新型生成式 AI 语音模型。将语音理解与生成能力整合到一个模型中,能根据说话者的语调、风格等声学上下文调整生成的语音响应,对话更自然。Nova Sonic 支持多语言,目前对美国英语和英国英语的语音理解表现出色,支持多种说话风格和不同口音。
AI教程资讯
2023-04-14
DeepCoder-14B-Preview 是 Agentica 和 Together AI 联合开源的大型代码生成模型,基于 Deepseek-R1-Distilled-Qwen-14B 微调而成。DeepCoder-14B-Preview基于分布式强化学习(RL)训练,在代码生成任务上表现出色。
AI教程资讯
2023-04-14
Dream-7B是香港大学和华为诺亚方舟实验室联合推出的扩散式推理模型,是目前最强大的开源扩散大语言模型。Dream-7B训练数据涵盖文本、数学和代码,预训练使用5800亿个标记,耗时256小时。
AI教程资讯
2023-04-14
Llama Nemotron是NVIDIA推出的一系列推理模型,专注于推理和多种智能代理(agentic AI)任务。模型基于Llama开源模型,经过NVIDIA的后训练,加入推理能力,在科学推理、高级数学、编程、指令遵循和工具调用等方面表现出色。
AI教程资讯
2023-04-14