当前位置: 网站首页 >音频编辑 >正文

ChatTTS

ChatTTS

AI类型:音频编辑

4

访问次数

欢迎程度

关注程度

阅读次数

推荐次数

简介

突破开源语音天花板

最近,一个名为 ChatTTS 的文本转语音工具爆火出圈,在 GitHub 上短短 3 天斩获 9k Star 数,截止目前获得高达 22.9k Star。

这个 ChatTTS 是专门为对话场景设计的文本转语音模型,特别适用于大语言模型 LLM 助手对话任务。

不但支持中英文混合文本合成自然流畅语音,同时支持多说话人;还能够预测和进行韵律特征细粒度控制,允许你加入笑声、说话间的停顿,还有语气词等;生成音色效果更是能达到真假难辨程度,远超大部分开源 TTS 模型!

ChatTTS
相关资讯 更多+
  • 星火纪要 – 科大讯飞推出的会议交流总结和分析平台
    星火纪要 – 科大讯飞推出的会议交流总结和分析平台

    星火纪要是科大讯飞推出的集转录、总结、翻译、分析为一体的音视频处理平台,广泛应用于通用会议、访谈、销售、培训等场景。能帮助个人高效总结会议重点内容,提升工作学习效率;辅助企业从众多会议中洞察趋势与共性问题,进行更准确的组织决策。

    AI教程资讯 2025-01-13

  • Hallo3 – 复旦联合百度开源的高动态与真实感肖像动画生成框架
    Hallo3 – 复旦联合百度开源的高动态与真实感肖像动画生成框架

    Hallo3是复旦大学和百度公司联合推出的,基于扩散变换器网络(Diffusion Transformer Networks)的肖像图像动画技术,能生成高度动态和逼真的视频。Hallo3基于预训练的变换器视频生成模型,有效解决现有方法在处理非正面视角、动态对象渲染和生成沉浸式背景方面的挑战。

    AI教程资讯 2025-01-13

  • rStar-Math – 微软推出的小模型复杂推理与自进化SLMs的创新技术
    rStar-Math – 微软推出的小模型复杂推理与自进化SLMs的创新技术

    rStar-Math是微软亚洲研究院推出的创新研究项目,基于蒙特卡洛树搜索(MCTS)驱动的深度思考,使小型语言模型(SLMs)在数学推理方面达到甚至超越OpenAI大型模型的水平。rStar-Math不依赖于从更高级模型的数据蒸馏,而是用自我进化的深度思考提升模型性能。

    AI教程资讯 2025-01-13

  • SPAR3D – Stability AI等机构推出的单试图重建 3D 网络模型
    SPAR3D – Stability AI等机构推出的单试图重建 3D 网络模型

    SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量的3D对象。SPAR3D基于两阶段设计,第一阶段用点扩散模型生成稀疏的3D点云,第二阶段结合采样的点云和输入图像生成高度详细的网格。SPAR3D结合回归模型和生成模型的优势,能准确重建图像中的可见表面,又能合理生成被遮挡部分的几何和纹理细节。

    AI教程资讯 2025-01-13

确定