早年玩过 Live2d 那类方案,最近虚拟人 tts 对口型之类的好像井喷式发展,就想搞了玩玩,请教几个问题。
- 风格想要偏真人一些的,二次元和 3D 风格也想试试。
- 现在是需要预生成语音预渲染视频,还是已经可以实时了?大概延迟多久? (实时指 LLM 出文字,然后实时生成语音和视频。服务端还是客户端完成?)
- 分别有啥轮子好用,或者现成的组合方案有啥?
有了解这方面的朋友可以指点以下,谢谢。
早年玩过 Live2d 那类方案,最近虚拟人 tts 对口型之类的好像井喷式发展,就想搞了玩玩,请教几个问题。
有了解这方面的朋友可以指点以下,谢谢。
1
MoRanjiang Apr 29, 2024
需要一整句话才能分析出语调情绪,实时不太行
|
2
JCZ2MkKb5S8ZX9pq OP @MoRanjiang 类似京东那个直播是咋搞的?好像没有需要太带情绪?
|
3
JCZ2MkKb5S8ZX9pq OP 自己顶顶,都是收藏的,没人回复的[捂脸]
|