GitHub - HY-Wong/VAR

Dataset

Assume the ImageNet is in /path/to/imagenet. It should be like this:

/path/to/imagenet/:
    train/:
        n01440764: 
            many_images.JPEG ...
        n01443537:
            many_images.JPEG ...
    val/:
        n01440764:
            ILSVRC2012_val_00000293.JPEG ...
        n01443537:
            ILSVRC2012_val_00000236.JPEG ...

Installation

Install pytorch_wavelets for the PyTorch implementation of 2D discrete wavelet transforms.
You can find it here: pytorch_wavelets.

Training Scripts

Training:

CUDA_VISIBLE_DEVICES=0,1 python3 train_wav.py --data_path=/path/to/imagenet --bs 128 --wandb_name stage_1 --disc_loss_fn cross_entropy --rec_loss_fn focal

Evaluating:

CUDA_VISIBLE_DEVICES=0 python3 evaluator_vae_wav.py --data_path=/path/to/imagenet --bs 200 --load_ckpt_path=/path/to/checkpoint --rec_filename=/path/to/output/recon.png

Parameters

--ep (default: 150)
Number of training epochs.
--bs (default: 64)
Batch size for training.
--vae_blr (default: 1e-4)
Base learning rate for the VAE.
--lc (default: 1.0)
Weight of the commitment loss.
--lp (default: 0.5)
Weight of the LPIPS loss.
--ld (default: 1.0)
Weight of the Discriminator loss.
--rec_loss_fn (default: l1)
Reconstruction loss function. Supported options: l1, l2, and focal.
--disc_loss_fn (default: hinge)
Discriminator loss function. Supported options: hinge and cross_entropy.
--disc_blr (default: 1e-4)
Base learning rate for the Discriminator.
--disc_start_ep
Epoch at which Discriminator training begins. Training starts at 0.2 * ep by default.
--pn (default: '1_2_3_4_5_6_8_10_13_16')
Multi-scale patch size.
--ch (default: '1_2_4')
Autoencoder channel multiplication

Relevant Files

train_wav.py
Script for training the VQVAE.
trainer_wav.py
PyTorch Lightning trainer module.
evaluator_vae_wav.py
Calculates the reconstruction loss of VQVAE on wavelet data.
models/__init__.py
Builds and initializes models.
models/basic_vae.py
Basic VAE model (no description provided).
models/vqvae_wav.py
VQVAE implementation for wavelet data.
models/loss.py
Defines the loss functions for training.
models/discriminator.py
Discriminator module, primarily based on VQGAN.
models/lpips.py
Implements VGG16 for calculating LPIPS.
models/quant.py
Quantization module (no description provided).
utils/arg_util.py
Handles argument parsing and configuration.
utils/data_wav.py
PyTorch Lightning DataModule for wavelet data.

Name		Name	Last commit message	Last commit date
Latest commit History 59 Commits
models		models
slurm_scripts		slurm_scripts
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
analysis.py		analysis.py
demo_sample.ipynb		demo_sample.ipynb
dist.py		dist.py
requirements.txt		requirements.txt
sample_var_wav.py		sample_var_wav.py
train.py		train.py
train_wav.py		train_wav.py
trainer.py		trainer.py
trainer_wav.py		trainer_wav.py
trainer_wav_adv.py		trainer_wav_adv.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Dataset

Installation

Training Scripts

Parameters

Relevant Files

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Dataset

Installation

Training Scripts

Parameters

Relevant Files

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages