Torch로 librosa Mel-spectrogram이랑 똑같이 만들기

11 Jan 2024 in Coding on Pytorch

librosa.filters.mel는 기본 옵션으로 htk=False, norm="slaney"로 설정되어있다.
torchaudio.transforms.MelScale는 기본 옵션으로 norm=None, mel_scale="htk"로 설정되어있다.
torchaudio의 옵션을 norm="slaney", mel_scale="slaney"로 바꿔주면 librosa 전처리와 같은 Mel-spectrogram을 만들 수 있다.

CLAPSpeech: Learning Prosody from Text Context with Contrastive Language-Audio Pre-training

10 Jan 2024 in Seminar on Text-to-Speech

CLAPSpeech 논문 요약

Zhenhui Ye, Rongjie Huang, Yi Ren, Ziyue Jiang, Jinglin Liu, Jinzheng He, Xiang Yin, Zhou Zhao
Accepted by ACL2023 (Main Conference)
[Paper][Demo]

P-Flow

10 Jan 2024 in Seminar on Text-to-Speech

P-Flow 논문 요약

Sungwon Kim, Kevin J Shih, Rohan Badlani, Joao Felipe Santos, Evelina Bhakturina, Mikyas Dest, Rafael Valle, Sungroh Yoon, Bryan Catanzaro
“P-Flow: A Fast and Data-Efficient Zero-Shot TTS through Speech Prompting”
Accepted by NeurIPS2023
[Paper][Demo]

Wake On LAN (WOL)로 원격 부팅하기

05 Jan 2024 in Post on Post

wakeonlan 설치
```
sudo apt-get install wakeonlan
```

Matcha-TTS

04 Jan 2024 in Seminar on Text-to-Speech

Matcha-TTS 논문 요약

S. Mehta, “MATCHA-TTS: A Fast TTS Architecture with Conditional Flow Matching”, 2023

Torch로 librosa Mel-spectrogram이랑 똑같이 만들기

CLAPSpeech: Learning Prosody from Text Context with Contrastive Language-Audio Pre-training

P-Flow

Wake On LAN (WOL)로 원격 부팅하기

Matcha-TTS

PRML Lab. Speech Team

Error

Pagination

Templates (for web app):

Error