当前位置：网站首页 >AI教程资讯 >正文

SpeechGPT 2.0-preview – 复旦大学推出的端到端实时语音交互模型

来源：爱论文时间：2025-03-25 11:56:25

SpeechGPT 2.0-preview是什么

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队推出的拟人化实时交互系统，基于百万小时级中文语音数据训练，采用端到端架构，实现了语音与文本模态的高度融合。模型具有拟人口语化表达、百毫秒级低延迟响应，支持自然流畅的实时打断交互。能精准控制语速、情感、风格和音色，实现智能切换。SpeechGPT 2.0-preview 具备多种语音才艺，如诗歌朗诵、故事讲述、说方言等。

SpeechGPT 2.0-preview的主要功能

情感与风格控制：支持多情感（如虚弱、欢快）、多音色（男女切换）及多风格（诗歌朗诵、方言模仿）的精准控制，角色扮演能力突出。

上一篇：LalaEval – 港中文联合货拉拉推出面向特定领域的模型评估框架

相关资讯更多+

SpeechGPT 2.0-preview – 复旦大学推出的端到端实时语音交互模型
SpeechGPT 2 0-preview 是复旦大学 OpenMOSS 团队推出的拟人化实时交互系统，基于百万小时级中文语音数据训练，采用端到端架构，实现了语音与文本模态的高度融合。模型具有拟人口语化表达、百毫秒级低延迟响应，支持自然流畅的实时打断交互。

AI教程资讯 2023-04-14
LalaEval – 港中文联合货拉拉推出面向特定领域的模型评估框架
LalaEval是香港中文大学和货拉拉数据科学团队共同推出的面向特定领域大语言模型（LLMs）的人类评估框架，框架通过一套完整的端到端协议，涵盖领域规范、标准建立、基准数据集创建、评估规则构建以及评估结果的分析和解释。

AI教程资讯 2023-04-14
Aligner – 北大推出的残差修正模型对齐技术
Aligner是北京大学团队提出的大语言模型对齐技术，通过学习对齐答案与未对齐答案之间的修正残差来提升模型性能。采用自回归的 seq2seq 模型，在问题-答案-修正后的答案（Query-Answer-Correction, Q-A-C）数据集上训练，无需依赖复杂的强化学习从人类反馈（RLHF）流程。

AI教程资讯 2023-04-14
OpenAI o3-mini – OpenAI 推出的全新推理模型
OpenAI o3-mini是OpenAI正式发布的全新推理模型。是OpenAI推理系列中最新、成本效益最高的模型，专为科学、数学和编程等技术领域优化。支持三种推理强度（低、中、高），用户可以根据需求调整，平衡速度和准确性。

AI教程资讯 2023-04-14