Paper Review/Generative models
2023. 11. 22.
WaveNet : A Generative Model for Raw Audio (DeepMind)
WaveNet : A Generative Model for Raw Audio, DeepMind딥러닝 기반 음성합성방법 등장 전 음성 생성, 합성 방법1. concatenative TTS 방식 : 다량의 음성 데이터를 음소로 분리,조합하여 새로운 음성 생성2. parametric TTS 방식 : 은닉 마르코프 모델 기반 음성 합성 방식, 즉 통계적 모델 활용 but, 위 방법들은 음편 사이 경계가 매끄럽지 않아 자연스럽지 X 2016, DeepMind, 딥러닝 기반 음성 생성 모델 WaveNet 공개- 자연스러운 음성 파형 생성- 긴 음성 파형 학습, 생성할 수 있는 새로운 구조 제시- 학습된 모델은 컨디션 모델링으로 인해 다양한 특징적 음성 생성 가능- 음악을 포함한 다양한 음성 생성 분야에서도 좋은 성..