Amphion:一个开源的音频、音乐和语音生成项目。由大名鼎鼎的 OpenMMLab 联合香港中文大学(深圳)联合推出的。硅谷大佬也给这个项目带货,打了 A+++级: https://www.bilibili.com/video/BV18w411V7iq/
支持如下功能:
- 文本转语音( TTS ):高性能,支持主流模型及架构,可生成自然的声音。
- 歌声转换( SVC ):可将某人歌声转换成其他人歌声,内置张学友、陈奕迅、王菲等已训练好的声音。
- 文本转音频( TTA ):可通过文本提示,生成逼真的声效、语音以及音乐,类似于 AudioLDM 。
GitHub:github.com/open-mmlab/Amphion
以上功能均可在 HuggingFace 上使用。