henryspatialanalysis
diff --git a/‎config.yaml‎
Lines changed: 9 additions & 1 deletion b/‎config.yaml‎
Lines changed: 9 additions & 1 deletion
diff --git a/‎scripts/exploratory/bench_random_by_type.py‎
Lines changed: 304 additions & 0 deletions b/‎scripts/exploratory/bench_random_by_type.py‎
Lines changed: 304 additions & 0 deletions
diff --git a/‎scripts/models/osm_turnover.py‎
Lines changed: 32 additions & 3 deletions b/‎scripts/models/osm_turnover.py‎
Lines changed: 32 additions & 3 deletions
@@ -138,7 +138,13 @@ osm_turnover_model:
   group_key: shared_label
   group_values: null
   min_value_count: 5
-  n_draws: 250
+  # NUTS warmup (window adaptation) and retained-sample counts. Warmup should
+  # generally be >= n_samples for hierarchical models.
+  n_warmup: 500
+  n_samples: 500
+  # Number of independent chains (vmapped in parallel). n_chains > 1 enables
+  # R-hat and bulk ESS diagnostics at roughly linear wall-time cost on CPU.
+  n_chains: 4
   save_full_model: true
 
 # Directory definitions (used with config.get_dir_path())
@@ -172,6 +178,8 @@ directories:
       fitted_params: fitted_params.csv
       param_draws: param_draws.csv
       predictions: predictions.csv
+      diagnostics: diagnostics.csv
+      inference_data: inference_data.nc
       fitted_model: fitted_model.pkl
   snapshot_foursquare:
     versioned: true
 
@@ -0,0 +1,304 @@
+"""
+Benchmark harness for the JAX hierarchical turnover model.
+
+Runs ``RandomByTypeModel`` (and optionally ``ConstantModel``) at several data
+sizes and reports:
+
+* Wall time for warmup and sampling (seconds)
+* NUTS diagnostics: mean acceptance, divergent count, mean integration steps,
+  final step size
+* Per-parameter effective sample size (via ``blackjax.diagnostics``)
+* Log-density at the posterior mean (proxy for MAP)
+
+Results are dumped to JSON so they can be diffed across commits. Run this
+BEFORE changing the model code to capture a baseline, then again after each
+phase to attribute effects.
+
+Usage:
+    python scripts/exploratory/bench_random_by_type.py \\
+        --sizes small medium [large] [real] \\
+        --out ~/data/openpois/bench/baseline.json \\
+        [--num-draws 250]
+
+Size presets:
+    small  — n = 10 000, K = 20
+    medium — n = 1 000 000, K = 91
+    large  — n = 4 200 000, K = 91  (slow; ~matches production scale)
+    real   — reads real osm_observations.csv via config.yaml
+"""
+
+from __future__ import annotations
+
+import argparse
+import json
+import subprocess
+import time
+from datetime import datetime, timezone
+from pathlib import Path
+
+import jax
+import jax.numpy as jnp
+import jax.random as jrd
+import numpy as np
+import pandas as pd
+
+from blackjax.diagnostics import effective_sample_size
+
+from openpois.models.jax_core import jax_rng
+from openpois.models.model_fitter import ModelFitter
+from openpois.models.osm_models import RandomByTypeModel
+from openpois.models.setup import prepare_data_for_model
+
+
+SIZE_PRESETS = {
+    "small":  dict(n = 10_000,    k = 20,  min_per_group = 5),
+    "medium": dict(n = 1_000_000, k = 91,  min_per_group = 5),
+    "large":  dict(n = 4_200_000, k = 91,  min_per_group = 5),
+}
+
+
+def _simulate(
+    key: jrd.KeyArray,
+    n: int,
+    k: int,
+    min_per_group: int = 5,
+    true_log_lambda_0: float = -5.3,
+    true_log_sigma: float = 0.8,
+) -> pd.DataFrame:
+    """Simulate an observations DataFrame from the RandomByTypeModel likelihood."""
+    k_eps, k_grp, k_dt, k_y = jrd.split(key, 4)
+    # Simulate group epsilons from N(0, exp(log_sigma))
+    eps = np.asarray(
+        jrd.normal(k_eps, (k,)) * np.exp(true_log_sigma)
+    )
+    log_lam = true_log_lambda_0 + eps
+
+    # Group assignment with a power-law-ish imbalance so we test uneven fits.
+    # Weights ~ 1/(i+1); renormalised. Then enforce min_per_group per group.
+    weights = 1.0 / (np.arange(k) + 1.0)
+    weights = weights / weights.sum()
+    # Sample (n - k*min_per_group) according to weights, then add min_per_group per group
+    assert n > k * min_per_group, "n too small for requested min_per_group"
+    n_weighted = n - k * min_per_group
+    g_rand = np.asarray(
+        jrd.categorical(k_grp, jnp.log(jnp.asarray(weights)), shape = (n_weighted,))
+    )
+    g = np.concatenate([
+        g_rand,
+        np.repeat(np.arange(k), min_per_group),
+    ]).astype(np.int32)
+    rng = np.random.default_rng(int(jrd.randint(k_grp, (), 0, 2**31 - 1)))
+    rng.shuffle(g)
+
+    # dt ~ Uniform(0.1, 10)
+    dt = np.asarray(jrd.uniform(k_dt, (n,), minval = 0.1, maxval = 10.0))
+
+    lam_per_obs = np.exp(log_lam[g])
+    p = 1.0 - np.exp(-lam_per_obs * dt)
+    y = np.asarray(jrd.bernoulli(k_y, jnp.asarray(p))).astype(np.int32)
+
+    # Use string group labels so the category encoding exercises the real code path.
+    group_names = np.array([f"grp_{i:03d}" for i in range(k)])
+    return pd.DataFrame({
+        "tag_years": dt,
+        "changed": y,
+        "shared_label": group_names[g],
+    })
+
+
+def _load_real_observations() -> pd.DataFrame:
+    """Load the real OSM observations via config.yaml."""
+    from config_versioned import Config
+    cfg = Config("~/repos/openpois/config.yaml")
+    path = cfg.get_file_path("osm_data", "osm_observations")
+    min_value_count = cfg.get(
+        "osm_turnover_model", "min_value_count", fail_if_none = False
+    )
+    group_key = cfg.get(
+        "osm_turnover_model", "group_key", fail_if_none = False
+    )
+    df = pd.read_csv(path)
+    prepared = prepare_data_for_model(
+        data = df,
+        group_key = group_key,
+        group_values = None,
+        min_value_count = min_value_count,
+        t1_col = "last_tag_timestamp",
+        t2_col = "obs_timestamp",
+    )
+    return prepared
+
+
+def _ess_per_param(param_draws: dict[str, jnp.ndarray]) -> dict[str, float]:
+    """Minimum ESS across elements of each pytree leaf."""
+    out = {}
+    for name, arr in param_draws.items():
+        a = jnp.asarray(arr)
+        if a.ndim == 1:
+            ess = float(effective_sample_size(a[None, :]))
+            out[name] = ess
+        else:
+            # Multiple elements: report min ESS (worst-case)
+            flat = a.reshape(a.shape[0], -1).T            # (n_elem, n_draws)
+            esss = np.asarray(
+                jax.vmap(lambda row: effective_sample_size(row[None, :]))(flat)
+            )
+            out[f"{name}__min"] = float(esss.min())
+            out[f"{name}__median"] = float(np.median(esss))
+    return out
+
+
+def _log_density_at_mean(
+    fitter: ModelFitter,
+    param_draws: dict[str, jnp.ndarray],
+) -> float:
+    """Evaluate log-density at the element-wise posterior mean."""
+    post_mean = {
+        name: jnp.mean(jnp.asarray(arr), axis = 0)
+        for name, arr in param_draws.items()
+    }
+    return float(fitter.calculate_lp(post_mean))
+
+
+def _git_sha() -> str:
+    try:
+        return subprocess.check_output(
+            ["git", "rev-parse", "--short", "HEAD"],
+            cwd = str(Path(__file__).resolve().parents[2]),
+        ).decode().strip()
+    except Exception:
+        return "unknown"
+
+
+def _run_one(
+    tag: str,
+    df: pd.DataFrame,
+    num_draws: int,
+    group_key: str = "shared_label",
+) -> dict:
+    """Build the model, fit it, collect timings and diagnostics."""
+    n = len(df)
+    model = RandomByTypeModel(
+        dataset = df,
+        metadata = {
+            "dt_col": "tag_years",
+            "group": group_key,
+            "var_prior": (-1.0, 5.0),
+        },
+    )
+    k = model.group_lookup.shape[0]
+    print(f"[{tag}] n={n:,} k={k} — building fitter")
+
+    fitter = ModelFitter(
+        event_rate_fun = model.event_rate_fun,
+        starting_params = model.starting_params,
+        data = model.data,
+        target = model.target,
+        num_warmup = num_draws,
+        num_samples = num_draws,
+        param_likelihood = model.param_likelihood,
+        derive_draws = model.derive_draws,
+        log_likelihood_fun = model.log_likelihood_fun,
+        verbose = False,
+    )
+
+    t_fit_start = time.perf_counter()
+    fitter.fit()
+    # Ensure the draws are realised on device before we stop the clock.
+    jax.tree_util.tree_map(lambda x: x.block_until_ready(), fitter.param_draws)
+    t_fit_end = time.perf_counter()
+
+    info = fitter.sampler_info
+    mean_accept = float(jnp.mean(info.acceptance_rate))
+    divergences = int(jnp.sum(info.is_divergent))
+    mean_steps = float(jnp.mean(info.num_integration_steps))
+    step_size = float(fitter.warmup_params["step_size"])
+
+    ess = _ess_per_param(fitter.param_draws)
+    log_density_at_mean = _log_density_at_mean(fitter, fitter.param_draws)
+
+    return {
+        "tag": tag,
+        "n": int(n),
+        "k": int(k),
+        "num_draws": int(num_draws),
+        "wall_fit_s": round(t_fit_end - t_fit_start, 3),
+        "mean_acceptance": round(mean_accept, 4),
+        "divergences": divergences,
+        "mean_integration_steps": round(mean_steps, 3),
+        "final_step_size": round(step_size, 6),
+        "log_density_at_post_mean": round(log_density_at_mean, 3),
+        "ess": {k: round(v, 2) for k, v in ess.items()},
+    }
+
+
+def main():
+    parser = argparse.ArgumentParser(description = __doc__)
+    parser.add_argument(
+        "--sizes",
+        nargs = "+",
+        default = ["small"],
+        choices = ["small", "medium", "large", "real"],
+        help = "Which size presets to run.",
+    )
+    parser.add_argument(
+        "--num-draws",
+        type = int,
+        default = 250,
+        help = "Draws for both warmup and sampling (matches current default).",
+    )
+    parser.add_argument(
+        "--out",
+        type = str,
+        default = "~/data/openpois/bench/bench_latest.json",
+        help = "JSON output path.",
+    )
+    parser.add_argument("--seed", type = int, default = 0)
+    args = parser.parse_args()
+
+    out_path = Path(args.out).expanduser()
+    out_path.parent.mkdir(parents = True, exist_ok = True)
+
+    rng = jrd.PRNGKey(args.seed) if args.seed else jax_rng()
+
+    runs = []
+    for size in args.sizes:
+        if size == "real":
+            df = _load_real_observations()
+            runs.append(_run_one("real", df, num_draws = args.num_draws))
+            continue
+        preset = SIZE_PRESETS[size]
+        key, rng = jrd.split(rng)
+        df = _simulate(
+            key,
+            n = preset["n"],
+            k = preset["k"],
+            min_per_group = preset["min_per_group"],
+        )
+        runs.append(_run_one(size, df, num_draws = args.num_draws))
+
+    payload = {
+        "created_at": datetime.now(timezone.utc).isoformat(),
+        "git_sha": _git_sha(),
+        "jax_version": jax.__version__,
+        "platform": jax.default_backend(),
+        "num_draws": args.num_draws,
+        "seed": args.seed,
+        "runs": runs,
+    }
+
+    with open(out_path, "w") as f:
+        json.dump(payload, f, indent = 2)
+    print(f"Wrote {out_path}")
+    for r in runs:
+        print(
+            f"  {r['tag']:>6s}: n={r['n']:>9,} k={r['k']:>3} "
+            f"fit={r['wall_fit_s']:>7.2f}s "
+            f"accept={r['mean_acceptance']:.3f} "
+            f"div={r['divergences']:>4} "
+            f"step={r['final_step_size']:.4f}"
+        )
+
+
+if __name__ == "__main__":
+    main()
@@ -24,7 +24,9 @@
     osm_turnover_model.default_model_type   — "constant" or "random_by_type"
                                               (overridable via --model-type)
     osm_turnover_model.var_prior            — (loc, scale) hyperprior on log_sigma
-    osm_turnover_model.n_draws              — number of posterior draws
+    osm_turnover_model.n_warmup             — NUTS warmup steps (adaptation)
+    osm_turnover_model.n_samples            — posterior draws retained
+    osm_turnover_model.n_chains             — number of NUTS chains (vmapped)
     osm_turnover_model.save_full_model      — save param_draws and pickled fitter
 
 Prerequisites:
@@ -33,6 +35,8 @@
 Output files (in ``model_output`` directory):
     fitted_params.csv   — posterior summaries per parameter
     predictions.csv     — P(change) at t = 0.0..10.0 years per group
+    diagnostics.csv     — per-parameter R-hat / bulk-ESS (multi-chain only)
+    inference_data.nc   — ArviZ InferenceData (optional, if arviz installed)
     param_draws.csv     — posterior draws (if save_full_model = true)
     fitted_model.pkl    — pickled ModelFitter (if save_full_model = true)
 """
@@ -60,7 +64,19 @@
 MIN_VALUE_COUNT = config.get(
     "osm_turnover_model", "min_value_count", fail_if_none = False
 )
-N_DRAWS = config.get("osm_turnover_model", "n_draws")
+N_WARMUP = config.get("osm_turnover_model", "n_warmup", fail_if_none = False)
+N_SAMPLES = config.get("osm_turnover_model", "n_samples", fail_if_none = False)
+N_CHAINS = config.get("osm_turnover_model", "n_chains", fail_if_none = False)
+# Back-compat: older configs used `n_draws` for both warmup and sampling.
+_LEGACY_N_DRAWS = config.get(
+    "osm_turnover_model", "n_draws", fail_if_none = False
+)
+if N_WARMUP is None:
+    N_WARMUP = _LEGACY_N_DRAWS if _LEGACY_N_DRAWS is not None else 1_000
+if N_SAMPLES is None:
+    N_SAMPLES = _LEGACY_N_DRAWS if _LEGACY_N_DRAWS is not None else 1_000
+if N_CHAINS is None:
+    N_CHAINS = 1
 SAVE_FULL_MODEL = config.get("osm_turnover_model", "save_full_model")
 
 
@@ -137,8 +153,12 @@ def flatten_param_draws(
         starting_params = model.starting_params,
         data = model.data,
         target = model.target,
-        num_draws = N_DRAWS,
+        num_warmup = N_WARMUP,
+        num_samples = N_SAMPLES,
+        num_chains = N_CHAINS,
         param_likelihood = model.param_likelihood,
+        derive_draws = model.derive_draws,
+        log_likelihood_fun = model.log_likelihood_fun,
         verbose = True,
     )
     fitter.fit()
@@ -176,6 +196,15 @@ def flatten_param_draws(
     # Save ----------------------------------------------------------------->
     config.write(fitted_params, "model_output", "fitted_params")
     config.write(predictions, "model_output", "predictions")
+    if fitter.diagnostics is not None:
+        config.write(fitter.diagnostics, "model_output", "diagnostics")
+    try:
+        idata = fitter.to_inference_data()
+        idata.to_netcdf(
+            str(config.get_file_path("model_output", "inference_data"))
+        )
+    except ImportError:
+        print("arviz not installed — skipping inference_data.nc")
     if SAVE_FULL_MODEL:
         config.write(
             flatten_param_draws(fitter.get_parameter_draws()),