neural-processing-lab
diff --git a/‎README.md‎
Lines changed: 41 additions & 4 deletions b/‎README.md‎
Lines changed: 41 additions & 4 deletions
diff --git a/‎docs/_toc.yml‎
Lines changed: 9 additions & 0 deletions b/‎docs/_toc.yml‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎docs/api/generated/pnpl.datasets.armeni2022.dataset.Armeni2022.rst‎
Lines changed: 63 additions & 0 deletions b/‎docs/api/generated/pnpl.datasets.armeni2022.dataset.Armeni2022.rst‎
Lines changed: 63 additions & 0 deletions
diff --git a/‎docs/api/generated/pnpl.datasets.gwilliams2022.dataset.Gwilliams2022.rst‎
Lines changed: 69 additions & 0 deletions b/‎docs/api/generated/pnpl.datasets.gwilliams2022.dataset.Gwilliams2022.rst‎
Lines changed: 69 additions & 0 deletions
diff --git a/‎docs/api/generated/pnpl.datasets.libribrain2025.compat.LibriBrainPhoneme.rst‎
Lines changed: 60 additions & 0 deletions b/‎docs/api/generated/pnpl.datasets.libribrain2025.compat.LibriBrainPhoneme.rst‎
Lines changed: 60 additions & 0 deletions
diff --git a/‎docs/api/generated/pnpl.datasets.libribrain2025.compat.LibriBrainSpeech.rst‎
Lines changed: 60 additions & 0 deletions b/‎docs/api/generated/pnpl.datasets.libribrain2025.compat.LibriBrainSpeech.rst‎
Lines changed: 60 additions & 0 deletions
@@ -2,12 +2,16 @@
 
 > The current primary use of the PNPL library is for the LibriBrain competition. [Click here](https://neural-processing-lab.github.io/2025-libribrain-competition/) to learn more and get started!
 
-Welcome to PNPL — a Python toolkit for loading and processing brain datasets for deep learning. The package ships the LibriBrain 2025 dataset family plus shared preprocessing and task utilities.
+Welcome to PNPL — a Python toolkit for loading and processing brain
+datasets for deep learning. The package now ships four MEG dataset
+loaders (LibriBrain, MEG-MASC, Armeni 2022, MOUS) plus a composable
+preprocessing pipeline and shared task abstractions.
 
 ## Features
 - Friendly dataset APIs backed by real MEG recordings
-- Batteries‑included standardization, clipping, and windowing
-- LibriBrain 2025 dataset support with optional on‑demand download
+- Composable preprocessing pipeline (`bads+headpos+sss+notch+bp+ds`, etc.)
+- On-demand download from Hugging Face (LibriBrain), OSF (MEG-MASC), and Radboud WebDAV (Armeni, MOUS)
+- Task-based API: pick a task object, get `(x, y)` (or `(x, y, info)`) windows
 - Works with PyTorch `DataLoader` out of the box
 - Clean namespace and lazy imports to keep startup fast
 
@@ -44,11 +48,36 @@ speech_ds = LibriBrainSpeech(data_path="./data/LibriBrain", partition="train")
 phoneme_ds = LibriBrainPhoneme(data_path="./data/LibriBrain", partition="train")
 ```
 
+The same task-based pattern works for the other corpora:
+
+```python
+from pnpl.datasets import Gwilliams2022, Armeni2022, Schoffelen2019
+from pnpl.tasks.gwilliams2022 import PhonemeClassification
+
+meg_masc = Gwilliams2022(
+    data_path="./data/meg_masc",
+    task=PhonemeClassification(tmin=-0.2, tmax=0.6),
+    include_subjects=["01"], include_sessions=["0"], include_tasks=["0"],
+    preprocessing="notch+bp+ds",
+)
+```
+
 ## Included Datasets
-- `pnpl` includes the `libribrain2025` dataset family together with shared preprocessing and task utilities.
+
+| Class | Source | Auth |
+| --- | --- | --- |
+| `LibriBrain` (+ `LibriBrainSpeech`/`Phoneme`/`Word`/`Sentence`) | Hugging Face `pnpl/LibriBrain` | none |
+| `Gwilliams2022` (MEG-MASC) | OSF `ag3kj` | none |
+| `Armeni2022` | Radboud `DSC_3011085.05_995_v1` | Radboud credentials |
+| `Schoffelen2019` (MOUS) | Radboud `DSC_3011020.09_236_v1` | Radboud credentials |
+
+For the Radboud-hosted datasets, set `RADBOUD_USERNAME` and
+`RADBOUD_PASSWORD` (an approved data-sharing agreement is required
+before access is granted).
 
 ## Support
 In case of any questions or problems, please get in touch through [our Discord server](https://discord.gg/Fqr8gJnvSh).
+
 ## Quickstart
 
 Load a single run of the LibriBrain Speech dataset and iterate samples:
@@ -79,6 +108,14 @@ We publish documentation with Jupyter Book and GitHub Pages.
 - Local preview: `pip install -r docs/requirements.txt && jupyter-book build docs/` then open `docs/_build/html/index.html`.
 - GitHub Pages: when made public, enable Pages via repo settings to publish automatically from the existing workflow.
 
+The docs cover:
+
+- Per-dataset pages (`docs/libribrain.md`, `docs/gwilliams2022.md`,
+  `docs/armeni2022.md`, `docs/schoffelen2019.md`)
+- The preprocessing pipeline (`docs/preprocessing.md`) and tasks
+  (`docs/tasks.md`)
+- Tutorials for the LibriBrain competition tracks
+
 ## Contributing
 We welcome contributions from the community!
 
 
@@ -6,7 +6,16 @@ parts:
       - file: install
       - file: quickstart
       - file: datasets
+  - caption: Datasets
+    chapters:
       - file: libribrain
+      - file: gwilliams2022
+      - file: armeni2022
+      - file: schoffelen2019
+  - caption: Pipelines
+    chapters:
+      - file: preprocessing
+      - file: tasks
   - caption: Tutorials
     chapters:
       - file: LibriBrain_Competition_Speech_Detection.ipynb
 
@@ -0,0 +1,63 @@
+pnpl.datasets.armeni2022.dataset.Armeni2022
+===========================================
+
+.. currentmodule:: pnpl.datasets.armeni2022.dataset
+
+.. autoclass:: Armeni2022
+
+   
+   .. automethod:: __init__
+
+   
+   .. rubric:: Methods
+
+   .. autosummary::
+   
+      ~Armeni2022.__init__
+      ~Armeni2022.calculate_standardization_params
+      ~Armeni2022.clip_sample
+      ~Armeni2022.close_h5_files
+      ~Armeni2022.ensure_directory
+      ~Armeni2022.ensure_file
+      ~Armeni2022.get_bids_raw_path
+      ~Armeni2022.get_calibration_files
+      ~Armeni2022.get_derivatives_path
+      ~Armeni2022.get_events_path
+      ~Armeni2022.get_h5_dataset
+      ~Armeni2022.get_h5_path
+      ~Armeni2022.get_headpos_path
+      ~Armeni2022.get_meg_dir
+      ~Armeni2022.get_preprocessed_path
+      ~Armeni2022.get_sfreq_from_h5
+      ~Armeni2022.init_continuous_h5
+      ~Armeni2022.load_continuous_window
+      ~Armeni2022.load_continuous_window_from_sample
+      ~Armeni2022.load_head_positions
+      ~Armeni2022.load_preprocessed_bids
+      ~Armeni2022.load_raw_bids
+      ~Armeni2022.prefetch_files
+      ~Armeni2022.raw_bids_exists
+      ~Armeni2022.resolve_remote_file
+      ~Armeni2022.setup_standardization
+      ~Armeni2022.standardize
+   
+   
+
+   
+   
+   .. rubric:: Attributes
+
+   .. autosummary::
+   
+      ~Armeni2022.RADBOUD_DATASET_URL
+      ~Armeni2022.RADBOUD_PASSWORD_ENV
+      ~Armeni2022.RADBOUD_USERNAME_ENV
+      ~Armeni2022.broadcasted_means
+      ~Armeni2022.broadcasted_stds
+      ~Armeni2022.channel_means
+      ~Armeni2022.channel_stds
+      ~Armeni2022.label_info
+      ~Armeni2022.n_channels
+      ~Armeni2022.n_times
+   
+   
@@ -0,0 +1,69 @@
+pnpl.datasets.gwilliams2022.dataset.Gwilliams2022
+=================================================
+
+.. currentmodule:: pnpl.datasets.gwilliams2022.dataset
+
+.. autoclass:: Gwilliams2022
+
+   
+   .. automethod:: __init__
+
+   
+   .. rubric:: Methods
+
+   .. autosummary::
+   
+      ~Gwilliams2022.__init__
+      ~Gwilliams2022.calculate_standardization_params
+      ~Gwilliams2022.clip_sample
+      ~Gwilliams2022.close_h5_files
+      ~Gwilliams2022.ensure_file
+      ~Gwilliams2022.get_bids_raw_path
+      ~Gwilliams2022.get_calibration_files
+      ~Gwilliams2022.get_dataset_manifest
+      ~Gwilliams2022.get_derivatives_path
+      ~Gwilliams2022.get_elp_path
+      ~Gwilliams2022.get_events_path
+      ~Gwilliams2022.get_h5_dataset
+      ~Gwilliams2022.get_h5_path
+      ~Gwilliams2022.get_headpos_path
+      ~Gwilliams2022.get_hsp_path
+      ~Gwilliams2022.get_markers_path
+      ~Gwilliams2022.get_meg_dir
+      ~Gwilliams2022.get_preprocessed_path
+      ~Gwilliams2022.get_sfreq_from_h5
+      ~Gwilliams2022.init_continuous_h5
+      ~Gwilliams2022.list_remote_files
+      ~Gwilliams2022.load_continuous_window
+      ~Gwilliams2022.load_continuous_window_from_sample
+      ~Gwilliams2022.load_head_positions
+      ~Gwilliams2022.load_preprocessed_bids
+      ~Gwilliams2022.load_raw_bids
+      ~Gwilliams2022.prefetch_files
+      ~Gwilliams2022.raw_bids_exists
+      ~Gwilliams2022.resolve_remote_file
+      ~Gwilliams2022.setup_standardization
+      ~Gwilliams2022.standardize
+   
+   
+
+   
+   
+   .. rubric:: Attributes
+
+   .. autosummary::
+   
+      ~Gwilliams2022.OSF_API_BASE
+      ~Gwilliams2022.OSF_FILES_BASE
+      ~Gwilliams2022.OSF_PROJECT_FALLBACKS
+      ~Gwilliams2022.OSF_PROJECT_ID
+      ~Gwilliams2022.OSF_TOKEN_ENV
+      ~Gwilliams2022.broadcasted_means
+      ~Gwilliams2022.broadcasted_stds
+      ~Gwilliams2022.channel_means
+      ~Gwilliams2022.channel_stds
+      ~Gwilliams2022.label_info
+      ~Gwilliams2022.n_channels
+      ~Gwilliams2022.n_times
+   
+   
@@ -0,0 +1,60 @@
+pnpl.datasets.libribrain2025.compat.LibriBrainPhoneme
+=====================================================
+
+.. currentmodule:: pnpl.datasets.libribrain2025.compat
+
+.. autoclass:: LibriBrainPhoneme
+
+   
+   .. automethod:: __init__
+
+   
+   .. rubric:: Methods
+
+   .. autosummary::
+   
+      ~LibriBrainPhoneme.__init__
+      ~LibriBrainPhoneme.calculate_standardization_params
+      ~LibriBrainPhoneme.clip_sample
+      ~LibriBrainPhoneme.close_h5_files
+      ~LibriBrainPhoneme.ensure_file
+      ~LibriBrainPhoneme.ensure_file_download
+      ~LibriBrainPhoneme.get_bids_raw_path
+      ~LibriBrainPhoneme.get_calibration_files
+      ~LibriBrainPhoneme.get_derivatives_path
+      ~LibriBrainPhoneme.get_events_path
+      ~LibriBrainPhoneme.get_h5_dataset
+      ~LibriBrainPhoneme.get_h5_path
+      ~LibriBrainPhoneme.get_headpos_path
+      ~LibriBrainPhoneme.get_preprocessed_path
+      ~LibriBrainPhoneme.get_sfreq_from_h5
+      ~LibriBrainPhoneme.init_continuous_h5
+      ~LibriBrainPhoneme.load_continuous_window
+      ~LibriBrainPhoneme.load_continuous_window_from_sample
+      ~LibriBrainPhoneme.load_head_positions
+      ~LibriBrainPhoneme.load_preprocessed_bids
+      ~LibriBrainPhoneme.load_raw_bids
+      ~LibriBrainPhoneme.prefetch_files
+      ~LibriBrainPhoneme.raw_bids_exists
+      ~LibriBrainPhoneme.setup_standardization
+      ~LibriBrainPhoneme.standardize
+   
+   
+
+   
+   
+   .. rubric:: Attributes
+
+   .. autosummary::
+   
+      ~LibriBrainPhoneme.HUGGINGFACE_FALLBACK_REPOS
+      ~LibriBrainPhoneme.HUGGINGFACE_REPO
+      ~LibriBrainPhoneme.broadcasted_means
+      ~LibriBrainPhoneme.broadcasted_stds
+      ~LibriBrainPhoneme.channel_means
+      ~LibriBrainPhoneme.channel_stds
+      ~LibriBrainPhoneme.label_info
+      ~LibriBrainPhoneme.n_channels
+      ~LibriBrainPhoneme.n_times
+   
+   
@@ -0,0 +1,60 @@
+pnpl.datasets.libribrain2025.compat.LibriBrainSpeech
+====================================================
+
+.. currentmodule:: pnpl.datasets.libribrain2025.compat
+
+.. autoclass:: LibriBrainSpeech
+
+   
+   .. automethod:: __init__
+
+   
+   .. rubric:: Methods
+
+   .. autosummary::
+   
+      ~LibriBrainSpeech.__init__
+      ~LibriBrainSpeech.calculate_standardization_params
+      ~LibriBrainSpeech.clip_sample
+      ~LibriBrainSpeech.close_h5_files
+      ~LibriBrainSpeech.ensure_file
+      ~LibriBrainSpeech.ensure_file_download
+      ~LibriBrainSpeech.get_bids_raw_path
+      ~LibriBrainSpeech.get_calibration_files
+      ~LibriBrainSpeech.get_derivatives_path
+      ~LibriBrainSpeech.get_events_path
+      ~LibriBrainSpeech.get_h5_dataset
+      ~LibriBrainSpeech.get_h5_path
+      ~LibriBrainSpeech.get_headpos_path
+      ~LibriBrainSpeech.get_preprocessed_path
+      ~LibriBrainSpeech.get_sfreq_from_h5
+      ~LibriBrainSpeech.init_continuous_h5
+      ~LibriBrainSpeech.load_continuous_window
+      ~LibriBrainSpeech.load_continuous_window_from_sample
+      ~LibriBrainSpeech.load_head_positions
+      ~LibriBrainSpeech.load_preprocessed_bids
+      ~LibriBrainSpeech.load_raw_bids
+      ~LibriBrainSpeech.prefetch_files
+      ~LibriBrainSpeech.raw_bids_exists
+      ~LibriBrainSpeech.setup_standardization
+      ~LibriBrainSpeech.standardize
+   
+   
+
+   
+   
+   .. rubric:: Attributes
+
+   .. autosummary::
+   
+      ~LibriBrainSpeech.HUGGINGFACE_FALLBACK_REPOS
+      ~LibriBrainSpeech.HUGGINGFACE_REPO
+      ~LibriBrainSpeech.broadcasted_means
+      ~LibriBrainSpeech.broadcasted_stds
+      ~LibriBrainSpeech.channel_means
+      ~LibriBrainSpeech.channel_stds
+      ~LibriBrainSpeech.label_info
+      ~LibriBrainSpeech.n_channels
+      ~LibriBrainSpeech.n_times
+   
+