neural-processing-lab
diff --git a/‎.gitignore‎
Lines changed: 5 additions & 1 deletion b/‎.gitignore‎
Lines changed: 5 additions & 1 deletion
diff --git a/‎pnpl/datasets/__init__.py‎
Lines changed: 6 additions & 0 deletions b/‎pnpl/datasets/__init__.py‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎pnpl/datasets/libribrain100/__init__.py‎
Lines changed: 88 additions & 0 deletions b/‎pnpl/datasets/libribrain100/__init__.py‎
Lines changed: 88 additions & 0 deletions
@@ -3,4 +3,8 @@
 *.egg-info/
 scripts/*
 .DS_Store
-.idea
+.idea
+.claude/
+
+# Dataset paper draft — local only.
+/libribrain100-paper/
@@ -20,6 +20,12 @@
     "LibriBrainWord": ("pnpl.datasets.libribrain2025.compat", "LibriBrainWord"),
     "LibriBrainSentence": ("pnpl.datasets.libribrain2025.sentence_dataset", "LibriBrainSentence"),
 
+    # LibriBrain100 — union of pnpl/LibriBrain + pnpl/LibriBrain2
+    "LibriBrain100": ("pnpl.datasets.libribrain100.dataset", "LibriBrain100"),
+    "LibriBrain100Speech": ("pnpl.datasets.libribrain100.compat", "LibriBrain100Speech"),
+    "LibriBrain100Phoneme": ("pnpl.datasets.libribrain100.compat", "LibriBrain100Phoneme"),
+    "LibriBrain100Word": ("pnpl.datasets.libribrain100.compat", "LibriBrain100Word"),
+
     # MEG-MASC (Gwilliams et al., 2022) — auto-downloads from OSF
     "Gwilliams2022": ("pnpl.datasets.gwilliams2022.dataset", "Gwilliams2022"),
 
 
@@ -0,0 +1,88 @@
+"""
+LibriBrain100 — unified loader for LibriBrain + LibriBrain2.
+
+LibriBrain100 is the user-facing PyTorch Dataset wrapping the full
+LibriBrain release: a virtual union of the original
+``pnpl/LibriBrain`` Hugging Face dataset and the
+``pnpl/LibriBrain2`` extension. The deep component (~80h, sub-0)
+covers the entire Sherlock Holmes canon plus TIMIT, MOCHA-TIMIT, and
+30 'The Moth' podcasts; the broad component (~44 min × 32 subjects)
+covers Sherlock book 1 chapters 11 and 12.
+
+Public API:
+
+    from pnpl.datasets import (
+        LibriBrain100,
+        LibriBrain100Speech,
+        LibriBrain100Phoneme,
+        LibriBrain100Word,
+    )
+"""
+
+from __future__ import annotations
+
+from .compat import LibriBrain100Phoneme, LibriBrain100Speech, LibriBrain100Word
+from .constants import (
+    CORPORA,
+    CORPUS_MOCHA,
+    CORPUS_PODCASTS,
+    CORPUS_SHERLOCK,
+    CORPUS_TIMIT,
+    DEEP_SUBJECT,
+    NEW_SUBJECTS,
+    PARTITION_TEST,
+    PARTITION_TRAIN,
+    PARTITION_VALIDATION,
+    PARTITIONS,
+    SUBJECTS,
+)
+from .dataset import LibriBrain100
+from .manifest import (
+    RUN_KEYS,
+    RUN_RECORDS,
+    RunRecord,
+    TEST_RUN_KEYS,
+    VALIDATION_RUN_KEYS,
+    get_record,
+    select_records,
+)
+from .selectors import (
+    normalize_corpus,
+    normalize_partition,
+    normalize_subjects,
+    validate_selector_combination,
+)
+
+__all__ = [
+    # Dataset classes
+    "LibriBrain100",
+    "LibriBrain100Speech",
+    "LibriBrain100Phoneme",
+    "LibriBrain100Word",
+    # Manifest
+    "RunRecord",
+    "RUN_RECORDS",
+    "RUN_KEYS",
+    "VALIDATION_RUN_KEYS",
+    "TEST_RUN_KEYS",
+    "get_record",
+    "select_records",
+    # Selectors / normalisation
+    "normalize_subjects",
+    "normalize_corpus",
+    "normalize_partition",
+    "validate_selector_combination",
+    # Constants
+    "DEEP_SUBJECT",
+    "SUBJECTS",
+    "NEW_SUBJECTS",
+    "CORPORA",
+    "CORPUS_SHERLOCK",
+    "CORPUS_TIMIT",
+    "CORPUS_MOCHA",
+    "CORPUS_PODCASTS",
+    "PARTITIONS",
+    "PARTITION_TRAIN",
+    "PARTITION_VALIDATION",
+    "PARTITION_TEST",
+]