Clustering model/feature retrieval mixing ratio 是控制基调的方式。 使用 0.1 可以获得最清晰的语音,使用 0.9 可以获得最接近模型的语气。 shallow diffusion steps 应设置在 50 左右,它可以在 30-100 步时增强结果。 音频编辑 此过程是可选的。 只为创作出更好的歌曲。