Vishal-sys-code
diff --git a/‎ablation_studies/all_commands.txt‎
Lines changed: 37 additions & 160 deletions b/‎ablation_studies/all_commands.txt‎
Lines changed: 37 additions & 160 deletions
diff --git a/‎ablation_studies/configs/phase2/dsformer.yaml‎
Lines changed: 6 additions & 0 deletions b/‎ablation_studies/configs/phase2/dsformer.yaml‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎…tudies/logs/ablation_studies_dry_run.log‎ ‎…random_logs/ablation_studies_dry_run.log‎ablation_studies/logs/ablation_studies_dry_run.log renamed to ablation_studies/random_logs/ablation_studies_dry_run.log b/‎…tudies/logs/ablation_studies_dry_run.log‎ ‎…random_logs/ablation_studies_dry_run.log‎ablation_studies/logs/ablation_studies_dry_run.log renamed to ablation_studies/random_logs/ablation_studies_dry_run.log
diff --git a/‎…on_studies/logs/run_ablation_studies.log‎ ‎…ies/random_logs/run_ablation_studies.log‎ablation_studies/logs/run_ablation_studies.log renamed to ablation_studies/random_logs/run_ablation_studies.log b/‎…on_studies/logs/run_ablation_studies.log‎ ‎…ies/random_logs/run_ablation_studies.log‎ablation_studies/logs/run_ablation_studies.log renamed to ablation_studies/random_logs/run_ablation_studies.log
diff --git a/‎ablation_studies/logs/verify_datasets.log‎ ‎…_studies/random_logs/verify_datasets.log‎ablation_studies/logs/verify_datasets.log renamed to ablation_studies/random_logs/verify_datasets.log b/‎ablation_studies/logs/verify_datasets.log‎ ‎…_studies/random_logs/verify_datasets.log‎ablation_studies/logs/verify_datasets.log renamed to ablation_studies/random_logs/verify_datasets.log
diff --git a/‎ablation_studies/run_grouped_ablation.py‎
Lines changed: 131 additions & 0 deletions b/‎ablation_studies/run_grouped_ablation.py‎
Lines changed: 131 additions & 0 deletions
diff --git a/‎ablation_studies/scripts/run_ablations.py‎
Lines changed: 22 additions & 23 deletions b/‎ablation_studies/scripts/run_ablations.py‎
Lines changed: 22 additions & 23 deletions
diff --git a/‎snn-dt/src/models/iql.py‎
Lines changed: 1 addition & 1 deletion b/‎snn-dt/src/models/iql.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎verify_iql.py‎
Lines changed: 2 additions & 1 deletion b/‎verify_iql.py‎
Lines changed: 2 additions & 1 deletion
@@ -0,0 +1,6 @@
+phase_encoder:
+  enabled: true
+routing:
+  enabled: true
+local_plasticity:
+  enabled: true
@@ -0,0 +1,131 @@
+import argparse
+import subprocess
+import sys
+import numpy as np
+import json
+from pathlib import Path
+
+# --- Configuration ---
+DEFAULT_SEEDS = 5
+DEFAULT_CONTRACT = "experiment_contract_light.yaml"
+
+def run_single_seed(variant, env, seed, contract, device=None):
+    """
+    Runs a single experiment seed using run_experiment.py via subprocess.
+    Returns the result dictionary (or None if failed).
+    """
+    cmd = [
+        sys.executable,
+        "ablation_studies/run_experiment.py",
+        "--variant", variant,
+        "--env", env,
+        "--seed", str(seed),
+        "--contract", contract
+    ]
+    
+    print(f"  > Starting Seed {seed}...")
+    try:
+        # Run the command and capture output
+        result = subprocess.run(cmd, capture_output=True, text=True, check=True)
+        
+        # Parse the output to find the final metrics (jsonl or stdout)
+        # We assume run_experiment.py logs the final metrics in a way we can grab,
+        # but since it saves to runs/.../metrics.jsonl, we can also read that file.
+        
+        return True
+        
+    except subprocess.CalledProcessError as e:
+        print(f"  !!! Error running seed {seed} !!!")
+        print(e.stderr)
+        return False
+
+def get_run_metrics(variant, env, seed):
+    """
+    Reads the metrics.jsonl file for a specific run to get the final performance.
+    """
+    # Structure: runs/{variant}/seed_{seed}/{env}/metrics.jsonl
+    # Note: run_experiment.py logic for run_name:
+    # run_name = cfg.model.name if cfg.model.name != 'ablation_dsformer' else args.variant
+    # This might need some adjustment if the variant name != model name mapping is complex.
+    # Based on run_experiment.py:
+    # model_name = cfg.get('model', {}).get('name', args.variant if args.variant in ['dt', 'snn_dt', 'iql', 'cql'] else 'ablation_dsformer')
+    # run_name = cfg.model.name if cfg.model.name != 'ablation_dsformer' else args.variant
+    
+    # We will try to reconstruct the path.
+    project_root = Path(__file__).parent
+    
+    # Determine directory name based on variant logic from run_experiment.py
+    # If variant is simple, dir is variant. If dsformer, it's the variant name.
+    # To be safe, we check both possible paths.
+    
+    possible_run_names = [variant]
+    # Add mapped names if necessary, but 'snn_dt', 'iql' etc map to themselves usually unless configured otherwise.
+    
+    metrics_file = None
+    for r_name in possible_run_names:
+        p = project_root / "runs" / r_name / f"seed_{seed}" / env / "metrics.jsonl"
+        if p.exists():
+            metrics_file = p
+            break
+            
+    if not metrics_file:
+        # Fallback check for model-based names if variant was just a config name
+        # E.g. variant 'no_plasticity' might map to model 'ablation_dsformer' -> run_name 'no_plasticity'
+        # It seems consistent.
+        print(f"    [Warning] Could not find metrics file for {variant} seed {seed}")
+        return None
+
+    final_return = None
+    try:
+        with open(metrics_file, 'r') as f:
+            for line in f:
+                if not line.strip(): continue
+                data = json.loads(line)
+                if 'val/mean_return' in data:
+                    final_return = data['val/mean_return']
+    except Exception as e:
+        print(f"    [Error] Reading metrics file: {e}")
+        
+    return final_return
+
+def main():
+    parser = argparse.ArgumentParser(description="Run a group of ablation experiments (multiple seeds) and report Mean +/- Std.")
+    parser.add_argument("--variant", required=True, help="Experiment variant (e.g., snn_dt, no_plasticity)")
+    parser.add_argument("--env", required=True, help="Environment (e.g., CartPole-v1)")
+    parser.add_argument("--num_seeds", type=int, default=DEFAULT_SEEDS, help="Number of seeds to run (0 to N-1)")
+    parser.add_argument("--contract", default=DEFAULT_CONTRACT, help="Experiment contract YAML")
+    
+    args = parser.parse_args()
+    
+    print(f"\n=======================================================")
+    print(f"  Running Ablation Group: {args.variant} | {args.env}")
+    print(f"  Seeds: 0 to {args.num_seeds - 1}")
+    print(f"=======================================================\n")
+    
+    returns = []
+    
+    for seed in range(args.num_seeds):
+        success = run_single_seed(args.variant, args.env, seed, args.contract)
+        if success:
+            val_return = get_run_metrics(args.variant, args.env, seed)
+            if val_return is not None:
+                returns.append(val_return)
+                print(f"  > Seed {seed} Finished. Return: {val_return:.2f}")
+            else:
+                print(f"  > Seed {seed} Finished but no return found.")
+        else:
+            print(f"  > Seed {seed} FAILED.")
+            
+    print(f"\n=======================================================")
+    if returns:
+        mean_ret = np.mean(returns)
+        std_ret = np.std(returns)
+        print(f"  FINAL RESULT [{args.variant} / {args.env}]:")
+        print(f"  Mean Return: {mean_ret:.2f} ± {std_ret:.2f}")
+        print(f"  (Based on {len(returns)}/{args.num_seeds} successful runs)")
+    else:
+        print(f"  NO SUCCESSFUL RUNS.")
+    print(f"=======================================================\n")
+
+if __name__ == "__main__":
+    main()
@@ -4,7 +4,7 @@
 from pathlib import Path
 
 # Configuration
-VARIANTS = ["no_plasticity", "no_routing", "no_phase", "dt", "snn_dt", "iql", "cql", "full"]
+VARIANTS = ["no_plasticity", "no_routing", "no_phase", "dt", "snn_dt", "iql", "cql", "full", "dsformer"]
 ENVS = ["CartPole-v1", "Acrobot-v1", "Pendulum-v1", "MountainCar-v0"]
 SEEDS = [0, 1, 2, 3, 4]
 CONTRACT = "experiment_contract_light.yaml"
@@ -24,33 +24,32 @@ def main():
     print(f"Contract: {CONTRACT}")
     print(f"---------------------------------")
 
-    total_jobs = len(VARIANTS) * len(ENVS) * len(SEEDS)
+    # Remove seed loop, run_grouped_ablation handles it
+    total_jobs = len(VARIANTS) * len(ENVS)
     current_job = 0
 
     for env in ENVS:
         for variant in VARIANTS:
-            for seed in SEEDS:
-                current_job += 1
-                cmd = [
-                    sys.executable,
-                    str(run_script),
-                    "--variant", variant,
-                    "--env", env,
-                    "--seed", str(seed),
-                    "--contract", CONTRACT
-                ]
+            current_job += 1
+            cmd = [
+                sys.executable,
+                "ablation_studies/run_grouped_ablation.py",
+                "--variant", variant,
+                "--env", env,
+                "--contract", CONTRACT
+            ]
 
-                print(f"\n--- [{current_job}/{total_jobs}] Running: Variant={variant}, Env={env}, Seed={seed} ---")
-                
-                if args.dry_run:
-                    print(f"  Command: {' '.join(cmd)}")
-                else:
-                    try:
-                        subprocess.run(cmd, check=True)
-                        print(f"--- Finished: Variant={variant}, Env={env}, Seed={seed} (Success) ---")
-                    except subprocess.CalledProcessError as e:
-                        print(f"  Error running job: {e}")
-                        print(f"--- Finished: Variant={variant}, Env={env}, Seed={seed} (Failed) ---")
+            print(f"\n--- [{current_job}/{total_jobs}] Running: Variant={variant}, Env={env} ---")
+            
+            if args.dry_run:
+                print(f"  Command: {' '.join(cmd)}")
+            else:
+                try:
+                    subprocess.run(cmd, check=True)
+                    print(f"--- Finished: Variant={variant}, Env={env} (Success) ---")
+                except subprocess.CalledProcessError as e:
+                    print(f"  Error running job: {e}")
+                    print(f"--- Finished: Variant={variant}, Env={env} (Failed) ---")
 
     print("\n--- All targeted experimental runs complete! ---")
 
 
@@ -112,7 +112,7 @@ def __init__(self, cfg):
         self.tau = cfg.iql.tau
         self.temperature = cfg.iql.temperature
         self.expectile = cfg.iql.expectile
-        self.is_discrete = cfg.dataset.is_discrete
+        self.is_discrete = 'CartPole' in cfg.env or 'Acrobot' in cfg.env or 'MountainCar' in cfg.env
 
         self.actor = Actor(cfg.dataset.state_dim, cfg.dataset.act_dim, cfg.iql.hidden_size, is_discrete=self.is_discrete).to(self.device)
         self.critic1 = Critic(cfg.dataset.state_dim, cfg.dataset.act_dim, cfg.iql.hidden_size, is_discrete=self.is_discrete).to(self.device)
 
@@ -32,7 +32,8 @@ def __getattr__(self, name):
 cfg.dataset = AttrDict()
 cfg.dataset.act_dim = 2
 cfg.dataset.state_dim = 4
-cfg.dataset.is_discrete = True
+cfg.dataset.state_dim = 4
+# cfg.dataset.is_discrete = True # Removed to verify the fix works without this setting
 
 try:
     model = IQL(cfg)