当前位置：网站首页 >音频编辑 >正文

ChatTTS

AI类型：音频编辑

4 分

访问次数

欢迎程度

关注程度

阅读次数

推荐次数

访问官网

简介

突破开源语音天花板

最近，一个名为 ChatTTS 的文本转语音工具爆火出圈，在 GitHub 上短短 3 天斩获 9k Star 数，截止目前获得高达 22.9k Star。

这个 ChatTTS 是专门为对话场景设计的文本转语音模型，特别适用于大语言模型 LLM 助手对话任务。

不但支持中英文混合文本合成自然流畅语音，同时支持多说话人；还能够预测和进行韵律特征细粒度控制，允许你加入笑声、说话间的停顿，还有语气词等；生成音色效果更是能达到真假难辨程度，远超大部分开源 TTS 模型！

相关资讯更多+

星火纪要 – 科大讯飞推出的会议交流总结和分析平台
星火纪要是科大讯飞推出的集转录、总结、翻译、分析为一体的音视频处理平台，广泛应用于通用会议、访谈、销售、培训等场景。能帮助个人高效总结会议重点内容，提升工作学习效率；辅助企业从众多会议中洞察趋势与共性问题，进行更准确的组织决策。

AI教程资讯 2025-01-13
Hallo3 – 复旦联合百度开源的高动态与真实感肖像动画生成框架
Hallo3是复旦大学和百度公司联合推出的，基于扩散变换器网络（Diffusion Transformer Networks）的肖像图像动画技术，能生成高度动态和逼真的视频。Hallo3基于预训练的变换器视频生成模型，有效解决现有方法在处理非正面视角、动态对象渲染和生成沉浸式背景方面的挑战。

AI教程资讯 2025-01-13
rStar-Math – 微软推出的小模型复杂推理与自进化SLMs的创新技术
rStar-Math是微软亚洲研究院推出的创新研究项目，基于蒙特卡洛树搜索（MCTS）驱动的深度思考，使小型语言模型（SLMs）在数学推理方面达到甚至超越OpenAI大型模型的水平。rStar-Math不依赖于从更高级模型的数据蒸馏，而是用自我进化的深度思考提升模型性能。

AI教程资讯 2025-01-13
SPAR3D – Stability AI等机构推出的单试图重建 3D 网络模型
SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的，先进的单图生成3D模型方法，能从单张图像中高效重建出高质量的3D对象。SPAR3D基于两阶段设计，第一阶段用点扩散模型生成稀疏的3D点云，第二阶段结合采样的点云和输入图像生成高度详细的网格。SPAR3D结合回归模型和生成模型的优势，能准确重建图像中的可见表面，又能合理生成被遮挡部分的几何和纹理细节。

AI教程资讯 2025-01-13