2024.09.23
介绍了对偶学习和GAN的概念,强调了循环一致性和身份一致性损失的作用,指出其只能在两种风格之间进行迁移,且无法添加风格迁移模块。
与CycleGAN类似,但允许添加风格迁移模块,介绍了CIN、AdaIN和WadaIN等技术,并提到相关的论文和开源代码。
讨论了AdaIN在语音和图像风格迁移中的经典应用,如语音的AdaIN-VC和图像的StyleGAN-1,强调其灵活性和在大规模数据训练下的表现。
提到在语音和图像中的应用,如WIN-VC和StyleGAN-2、3。
介绍了对自注意力矩阵进行风格迁移的方法,确保图像的高质量。
探讨了ControlNet的风格迁移思想,指出其公式与代码可能不符,并讨论了Control变量和样本来源。
简要提及了与大语言模型相关的风格生成