반응형 분류 전체보기10 [논문] HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesis 리뷰 하기 HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesis Several recent work on speech synthesis have employed generative adversarial networks (GANs) to produce raw waveforms. Although such methods improve the sampling efficiency and memory usage, their sample quality has not yet reached that of autoregressive a arxiv.org HiFi-GAN은 카카오에서 발표된 논문으로 MelGAN의 구조를 베이스.. 2023. 11. 6. [논문] MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis (NeurIPS 2019) 리뷰 하기 리뷰해볼 논문은 MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis으로 연구실 세미나를 위해서 준비했던 논문이다. HIFI-GAN이나 SoundStream같은 뉴럴 코덱쪽에서 뛰어난 성능을 보이는 모델들에서 사용된 뉴럴코덱의 기본이 되는 논문이다. 코드도 공개되어 있으니 함께 보시면 코드 공부하기도 좋고 기초 쌓기도 좋은 논문이었던 거 같다. 논문 리뷰는 내가 세미나를 발표했던 순으로 진행해보도록 하겠다. Introduction raw audio를 모델링하는 것은 어려운 task라고 말할 수 있다. 여러 가지 이유가 있겠지만 크게 2가지 정도를 생각해 볼 수 있다. 첫 번째는 data의 높은 temporal resoluti.. 2023. 10. 29. 이전 1 2 3 다음 반응형