HiFi++: a Unified Framework for Neural Vocoding, Bandwidth Extension and Speech Enhancement

Last update: Dec 29, 2022

Related tags

Overview

HiFi++ : a Unified Framework for Neural Vocoding, Bandwidth Extension and Speech Enhancement

This is the unofficial implementation of Vocoder part of HiFi++ : a Unified Framework for Neural Vocoding, Bandwidth Extension and Speech Enhancement.

Currently, this repo is WIP but you can start your training without any error.

Training:

python train.py --config config_v2.json

Citations:

@misc{https://doi.org/10.48550/arxiv.2203.13086,
  doi = {10.48550/ARXIV.2203.13086},
  
  url = {https://arxiv.org/abs/2203.13086},
  
  author = {Andreev, Pavel and Alanov, Aibek and Ivanov, Oleg and Vetrov, Dmitry},
  
  keywords = {Sound (cs.SD), Machine Learning (cs.LG), Audio and Speech Processing (eess.AS), FOS: Computer and information sciences, FOS: Computer and information sciences, FOS: Electrical engineering, electronic engineering, information engineering, FOS: Electrical engineering, electronic engineering, information engineering},
  
  title = {HiFi++: a Unified Framework for Neural Vocoding, Bandwidth Extension and Speech Enhancement},
  
  publisher = {arXiv},
  
  year = {2022},
  
  copyright = {arXiv.org perpetual, non-exclusive license}
}

References:

https://github.com/jik876/hifi-gan

HiFi++: a Unified Framework for Neural Vocoding, Bandwidth Extension and Speech Enhancement

Related tags

Overview

HiFi++ : a Unified Framework for Neural Vocoding, Bandwidth Extension and Speech Enhancement

Training:

Citations:

References:

Owner

Rishikesh (ऋषिकेश)

BabelCalib: A Universal Approach to Calibrating Central Cameras. In ICCV (2021)

Language Models Can See: Plugging Visual Controls in Text Generation

make ASCII Art by Deep Learning

DEEPAGÉ: Answering Questions in Portuguese about the Brazilian Environment

tsai is an open-source deep learning package built on top of Pytorch & fastai focused on state-of-the-art techniques for time series classification, regression and forecasting.

Code for "Unsupervised State Representation Learning in Atari"

Learning Dynamic Network Using a Reuse Gate Function in Semi-supervised Video Object Segmentation.

Virtual hand gesture mouse using a webcam

【CVPR 2021, Variational Inference Framework, PyTorch】 From Rain Generation to Rain Removal

Pytorch implementation for DFN: Distributed Feedback Network for Single-Image Deraining.

Learning RGB-D Feature Embeddings for Unseen Object Instance Segmentation

Code for our EMNLP 2021 paper “Heterogeneous Graph Neural Networks for Keyphrase Generation”

MLSpace: Hassle-free machine learning & deep learning development

Lava-DL, but with PyTorch-Lightning flavour

RuleBERT: Teaching Soft Rules to Pre-Trained Language Models

Pgn2tex - Scripts to convert pgn files to latex document. Useful to build books or pdf from pgn studies

an implementation of Revisiting Adaptive Convolutions for Video Frame Interpolation using PyTorch

Semantic Segmentation with Pytorch-Lightning

Face recognition. Redefined.

OpenIPDM is a MATLAB open-source platform that stands for infrastructures probabilistic deterioration model