VAE를 통해 nonlinear한 expression representation이 가능함
Avatar character별 각각의 VAE network train 필요. 이때, expressions은 랜덤하게 생성된 것으로 함. 이를 통해 avatar expression에 대한 latent space를 얻게 됨
Human faces는 identity와 expression로 분해하기 위해 disentangled 3D face representation learning[1]을 사용
[1] Z.-H. Jiang, Q. Wu, K. Chen, and J. Zhang, “Disentangled representation learning for 3d face shape,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2019, pp. 11 957–11 966.