Fix demo config num_cpus error

Donglai Wei · Donglai Wei · commit 0400e640619b · 2026-02-20T10:29:40.000-05:00
diff --git a/connectomics/training/lit/utils.py b/connectomics/training/lit/utils.py
@@ -201,8 +201,9 @@ def setup_config(args) -> Config:
 
     # Override config for fast-dev-run mode
     if args.fast_dev_run:
+        fast_dev_num_gpus = 1 if torch.cuda.is_available() else 0
         print("🔧 Fast-dev-run mode: Overriding config for debugging")
-        print(f"   - num_gpus: {cfg.system.training.num_gpus} → 1")
+        print(f"   - num_gpus: {cfg.system.training.num_gpus} → {fast_dev_num_gpus}")
         print(
             f"   - num_workers: {cfg.system.training.num_workers} → 0 "
             "(avoid multiprocessing in debug mode)"
@@ -212,9 +213,9 @@ def setup_config(args) -> Config:
         )
         print("   - input patch: 64^3 for lightweight debug")
         print("   - MedNeXt size: S for lightweight debug")
-        cfg.system.training.num_gpus = 1
+        cfg.system.training.num_gpus = fast_dev_num_gpus
         cfg.system.training.num_workers = 0
-        cfg.system.inference.num_gpus = 1
+        cfg.system.inference.num_gpus = fast_dev_num_gpus
         cfg.system.inference.num_workers = 0
         if hasattr(cfg.model, "input_size"):
             cfg.model.input_size = [64, 64, 64]
@@ -230,19 +231,6 @@ def setup_config(args) -> Config:
     # Resolve -1 sentinels (auto-max resources for current runtime allocation).
     cfg = resolve_runtime_resource_sentinels(cfg, print_results=True)
 
-    # CPU-only fallback: avoid multiprocessing workers when no CUDA is available
-    if not torch.cuda.is_available():
-        if cfg.system.training.num_workers > 0:
-            print(
-                "🔧 CUDA not available, setting training num_workers=0 to avoid dataloader crashes"
-            )
-            cfg.system.training.num_workers = 0
-        if cfg.system.inference.num_workers > 0:
-            print(
-                "🔧 CUDA not available, setting inference num_workers=0 to avoid dataloader crashes"
-            )
-            cfg.system.inference.num_workers = 0
-
     # Apply inference-specific overrides if in test/tune mode
     if args.mode in ["test", "tune", "tune-test"]:
         if cfg.inference.num_gpus >= 0:
@@ -255,6 +243,25 @@ def setup_config(args) -> Config:
             print(f"🔧 Inference override: num_workers={cfg.inference.num_workers}")
             cfg.system.inference.num_workers = cfg.inference.num_workers
 
+    # CPU-only fallback after all overrides: ensure no CUDA-only settings remain.
+    if not torch.cuda.is_available():
+        if cfg.system.training.num_gpus > 0:
+            print("🔧 CUDA not available, setting training num_gpus=0")
+            cfg.system.training.num_gpus = 0
+        if cfg.system.inference.num_gpus > 0:
+            print("🔧 CUDA not available, setting inference num_gpus=0")
+            cfg.system.inference.num_gpus = 0
+        if cfg.system.training.num_workers > 0:
+            print(
+                "🔧 CUDA not available, setting training num_workers=0 to avoid dataloader crashes"
+            )
+            cfg.system.training.num_workers = 0
+        if cfg.system.inference.num_workers > 0:
+            print(
+                "🔧 CUDA not available, setting inference num_workers=0 to avoid dataloader crashes"
+            )
+            cfg.system.inference.num_workers = 0
+
     # Optional convenience toggle to enable nnU-Net preprocessing via CLI
     if getattr(args, "nnunet_preprocess", False):
         print("🔧 Enabling nnU-Net preprocessing from CLI flag")
diff --git a/scripts/demo.py b/scripts/demo.py
@@ -111,13 +111,11 @@ def create_demo_config():
             seed=42,
             training=SystemTrainingConfig(
                 num_gpus=1 if torch.cuda.is_available() else 0,
-                num_cpus=2,
                 batch_size=2,
                 num_workers=0,  # 0 for demo to avoid multiprocessing issues
             ),
             inference=SystemInferenceConfig(
                 num_gpus=1 if torch.cuda.is_available() else 0,
-                num_cpus=2,
                 batch_size=2,
                 num_workers=0,
             ),
@@ -142,7 +140,8 @@ def create_demo_config():
             stride=[16, 32, 32],
             iter_num_per_epoch=10,  # Just 10 iterations per epoch
             use_cache=False,
-            use_preloaded_cache=False,
+            use_preloaded_cache_train=False,
+            use_preloaded_cache_val=False,
             pin_memory=False,
             persistent_workers=False,
         ),
@@ -187,7 +186,6 @@ def create_demo_config():
         ),
         inference=InferenceConfig(
             num_gpus=-1,
-            num_cpus=-1,
             batch_size=-1,
             num_workers=-1,
         ),
@@ -403,4 +401,3 @@ def run_demo():
 
 if __name__ == "__main__":
     run_demo()
-
diff --git a/scripts/main.py b/scripts/main.py
@@ -15,7 +15,7 @@
     # Testing mode
     python scripts/main.py --config tutorials/mito_lucchi++.yaml --mode test --checkpoint path/to/checkpoint.ckpt
 
-    # Fast dev run (1 batch for debugging, auto-sets num_gpus=1, num_cpus=1, num_workers=1)
+    # Fast dev run (1 batch for debugging, auto-sets num_workers=0 and uses GPU only if CUDA is available)
     python scripts/main.py --config tutorials/mito_lucchi++.yaml --fast-dev-run
     python scripts/main.py --config tutorials/mito_lucchi++.yaml --fast-dev-run 2  # Run 2 batches