当前位置：网站首页 >音频编辑 >正文

Audiobox

AI类型：音频编辑

4 分

访问次数

欢迎程度

关注程度

阅读次数

推荐次数

访问官网

简介

Audiobox是Meta于2023年11月30日推出的免费开源的AI语音和声音生成模型，12月11日上线在线网页版本，用户可免费体验该模型的能力。Audiobox是Meta继Voicebox后推出的最新一代的音频生成模型，可以结合使用语音输入和自然语言文本提示来生成语音和音效，从而可以轻松地为各种用例创建逼真的自定义音频。

Audiobox的主要功能

克隆用户声音：录制声音按照用户的声音风格或以任意音频样本的风格生成语音文本描述生成人声：使用文本描述声音风格的特征以及声学环境生成人声更改声音风格：可结合声音和文本描述更改现有的声音风格本文描述生成音效：根据输入的声音特征文本描述生成声音效果噪音消除：提供Magic Eraser功能消除录音中的瞬态噪声声音填充：根据文本描述用新的声音替换音频中的一部分音频故事制作器：结合以上功能，利用Audiobox Maker制作原创有趣的音频故事

相关资讯更多+

Micro LLAMA – 教学版 LLAMA 3模型实现，用于学习大模型的核心原理
Micro LLAMA是精简的教学版LLAMA 3模型实现，能帮助学习者理解大型语言模型架构。整个项目仅约180行代码，便于理解和学习。Micro LLAMA用的是LLAMA 3中最小的8B参数模型，模型本身需15GB存储空间，运行时约需30GB内存。

AI教程资讯 2025-01-28
GenCast – 谷歌DeepMind推出的AI气象预测模型
GenCast是DeepMind推出的革命性AI气象预测模型，基于扩散模型技术，提供长达15天的全球天气预报。GenCast在97 2%的预测任务中超越全球顶尖的中期天气预报系统ENS，尤其在极端天气事件的预测上表现突出。与传统模型相比，GenCast能在8分钟内生成预报，显著提高预测效率。

AI教程资讯 2025-01-28
FullStack Bench – 字节豆包联合M-A-P社区开源的全新代码评估基准
FullStack Bench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准，专注于全栈编程和多语言编程能力评估。FullStack Bench覆盖超过11种真实编程场景，包含3374个问题，涉及16种编程语言，能更有效地衡量大模型在现实世界中的代码开发能力。

AI教程资讯 2025-01-28
Motion Prompting – 谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型
Motion Prompting是 Google DeepMind、密歇根大学和布朗大学联合推出的视频生成技术，基于运动轨迹（motion trajectories）控制和引导视频内容的生成。Motion Prompting用点轨迹作为灵活的运动表示，能编码从单个点到全局场景的任意复杂度的运动。用户能设计“运动提示”（motion prompts），类似于文本提示，激发视频模型的不同能力，包括对象控制、相机控制、物理现象模拟等。

AI教程资讯 2025-01-28