Research/Disentanglement
FactorVAE
업무외시간
2021. 10. 16. 18:36
[1] 논문에서는 reconstruction과 disentanglement 사이의 tradeoff 관계를 개선시킬 수 있는 방법을 제안하고 있다. 문제는 VAE loss에서 KL term을 minimize하면 x와 z 간의 mutual information이 줄어들어 reconstruction이 어렵게 된다. 게다가 beta 값을 크게 하면 할수록 이 현상이 심해진다. FactorVAE는 beta 값을 조절하지 않고 새롭게 total correlation term을 추가하는 것을 제안한다.

여기서 q(z)는 encoder를 통과한 batch 단위의 latent feature로 볼 수 있고, tilda q(z)는 batch dim과 feature dim으로 permutation한 분포라고 할 수 있다. 즉, permutation을 통해 z에 대한 independence를 만든 것이다. 위 total correlation은 adversarial training으로 학습하였다.
References
[1] H. Kim et al., Disentangling by Factorizing, ICML, 2018