Unsupervised Neural Network for Multi-Genre Music Generation

<<<<<<< HEAD

Unsupervised Neural Network for Multi-Genre Music Generation

This repository implements all four assignment tasks for CSE425/EEE474:

Task 1: LSTM Autoencoder
Task 2: Variational Autoencoder (VAE)
Task 3: Transformer Decoder (autoregressive)
Task 4: RLHF-style preference tuning (policy gradient with human or simulated rewards)

Project Structure

data/raw_midi/: raw MIDI files grouped by genre subfolders
data/processed/: tokenized sequences and vocabulary
data/train_test_split/: optional split metadata
src/preprocessing/: parsing, tokenization, piano-roll conversion
src/models/: AE, VAE, Transformer, optional diffusion placeholder
src/training/: training entrypoints for each task
src/evaluation/: metrics and comparisons
src/generation/: sequence sampling and MIDI export
outputs/generated_midis/: generated samples
outputs/plots/: loss/perplexity plots
outputs/survey_results/: human feedback CSV and summaries

Setup

pip install -r requirements.txt

Data Format

Place MIDI files inside genre folders:

data/raw_midi/
  classical/*.mid
  jazz/*.mid
  rock/*.mid
  pop/*.mid
  electronic/*.mid

End-to-End Workflow

Preprocess and tokenize MIDI files

python -m src.preprocessing.midi_parser --input data/raw_midi --output data/processed

Train Task 1 (LSTM Autoencoder)

python -m src.training.train_ae --data data/processed/sequences.npz --out outputs

Train Task 2 (VAE)

python -m src.training.train_vae --data data/processed/sequences.npz --out outputs

Train Task 3 (Transformer)

python -m src.training.train_transformer --data data/processed/sequences.npz --out outputs

Run Task 4 (RLHF fine-tuning)

python -m src.training.train_rlhf --model-checkpoint outputs/checkpoints/transformer.pt --data data/processed/sequences.npz --out outputs

Evaluate

python -m src.evaluation.metrics --real data/processed/sequences.npz --generated outputs/generated_tokens.npz --out outputs

Export generated tokens to MIDI

python -m src.generation.generate_music --checkpoint outputs/checkpoints/transformer.pt --vocab data/processed/vocab.json --out outputs/generated_midis

Baselines

Random note generator: src/evaluation/metrics.py (random_baseline)
Markov chain baseline: notebooks/baseline_markov.ipynb and utility in src/generation/sample_latent.py

Notes

Task 4 supports both real human scores (CSV) and a simulated reward function for debugging.
Replace simulated rewards with survey results to complete final deliverables. =======

cse425

b207f2421144af4e5effb0d93a442703bf18aed7

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
outputs/plots		outputs/plots
report		report
src		src
.gitignore		.gitignore
README.md		README.md
baseline_metrics.py		baseline_metrics.py
plot_losses.py		plot_losses.py
plot_transformer.py		plot_transformer.py
requirements.txt		requirements.txt
survey_results.csv		survey_results.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Unsupervised Neural Network for Multi-Genre Music Generation

Project Structure

Setup

Data Format

End-to-End Workflow

Baselines

Notes

cse425

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Unsupervised Neural Network for Multi-Genre Music Generation

Project Structure

Setup

Data Format

End-to-End Workflow

Baselines

Notes

cse425

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages