PolicyEngine
diff --git a/‎.github/scripts/modal-run-integ-tests.sh‎
Lines changed: 6 additions & 1 deletion b/‎.github/scripts/modal-run-integ-tests.sh‎
Lines changed: 6 additions & 1 deletion
diff --git a/‎.github/workflows/modal-deploy.reusable.yml‎
Lines changed: 8 additions & 1 deletion b/‎.github/workflows/modal-deploy.reusable.yml‎
Lines changed: 8 additions & 1 deletion
diff --git a/‎changelog_entry.yaml‎
Lines changed: 0 additions & 4 deletions b/‎changelog_entry.yaml‎
Lines changed: 0 additions & 4 deletions
diff --git a/‎projects/policyengine-api-simulation/fixtures/gateway/test_endpoints.py‎
Lines changed: 8 additions & 1 deletion b/‎projects/policyengine-api-simulation/fixtures/gateway/test_endpoints.py‎
Lines changed: 8 additions & 1 deletion
diff --git a/‎projects/policyengine-api-simulation/pyproject.toml‎
Lines changed: 1 addition & 1 deletion b/‎projects/policyengine-api-simulation/pyproject.toml‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎projects/policyengine-api-simulation/src/modal/budget_window_results.py‎
Lines changed: 70 additions & 37 deletions b/‎projects/policyengine-api-simulation/src/modal/budget_window_results.py‎
Lines changed: 70 additions & 37 deletions
diff --git a/‎projects/policyengine-api-simulation/src/modal/budget_window_scheduler.py‎
Lines changed: 8 additions & 8 deletions b/‎projects/policyengine-api-simulation/src/modal/budget_window_scheduler.py‎
Lines changed: 8 additions & 8 deletions
diff --git a/‎projects/policyengine-api-simulation/src/modal/budget_window_state.py‎
Lines changed: 4 additions & 4 deletions b/‎projects/policyengine-api-simulation/src/modal/budget_window_state.py‎
Lines changed: 4 additions & 4 deletions
@@ -1,13 +1,14 @@
 #!/bin/bash
 # Run simulation integration tests
-# Usage: ./modal-run-integ-tests.sh <environment> <base-url> [us-version]
+# Usage: ./modal-run-integ-tests.sh <environment> <base-url> [us-version] [uk-version]
 # Environment: beta runs all tests, prod excludes beta_only tests
 
 set -euo pipefail
 
 ENVIRONMENT="${1:?Environment required (beta or prod)}"
 BASE_URL="${2:?Base URL required}"
 US_VERSION="${3:-}"
+UK_VERSION="${4:-}"
 
 truthy() {
   case "${1:-}" in
@@ -115,6 +116,10 @@ if [ -n "$US_VERSION" ]; then
   export simulation_integ_test_us_model_version="$US_VERSION"
 fi
 
+if [ -n "$UK_VERSION" ]; then
+  export simulation_integ_test_uk_model_version="$UK_VERSION"
+fi
+
 if [ "$ENVIRONMENT" = "beta" ]; then
   echo "Running all simulation integration tests (including beta_only)"
   uv run pytest tests/simulation/ -v
 
@@ -15,6 +15,12 @@ on:
       simulation_api_url:
         description: 'The deployed simulation API URL'
         value: ${{ jobs.deploy.outputs.simulation_api_url }}
+      us_version:
+        description: 'The deployed policyengine-us package version'
+        value: ${{ jobs.deploy.outputs.us_version }}
+      uk_version:
+        description: 'The deployed policyengine-uk package version'
+        value: ${{ jobs.deploy.outputs.uk_version }}
 
 jobs:
   deploy:
@@ -24,6 +30,7 @@ jobs:
     outputs:
       simulation_api_url: ${{ steps.get-url.outputs.simulation_api_url }}
       us_version: ${{ steps.versions.outputs.us_version }}
+      uk_version: ${{ steps.versions.outputs.uk_version }}
 
     steps:
     - name: Checkout repo
@@ -114,4 +121,4 @@ jobs:
         GATEWAY_AUTH_CLIENT_ID: ${{ secrets.GATEWAY_AUTH_CLIENT_ID }}
         GATEWAY_AUTH_CLIENT_SECRET: ${{ secrets.GATEWAY_AUTH_CLIENT_SECRET }}
         GATEWAY_AUTH_REQUIRED: ${{ vars.GATEWAY_AUTH_REQUIRED }}
-      run: .github/scripts/modal-run-integ-tests.sh "${{ inputs.environment }}" "${{ needs.deploy.outputs.simulation_api_url }}" "${{ needs.deploy.outputs.us_version }}"
+      run: .github/scripts/modal-run-integ-tests.sh "${{ inputs.environment }}" "${{ needs.deploy.outputs.simulation_api_url }}" "${{ needs.deploy.outputs.us_version }}" "${{ needs.deploy.outputs.uk_version }}"
@@ -2,6 +2,8 @@
 
 import pytest
 
+from tests.fixtures.budget_window_outputs import make_single_year_macro_output
+
 
 class MockDict:
     """Mock for Modal.Dict to simulate version registry."""
@@ -34,7 +36,12 @@ class MockFunctionCall:
 
     def __init__(self, object_id: str = "mock-job-id-123"):
         self.object_id = object_id
-        self.result = {"budget": {"total": 1000000}}
+        self.result = make_single_year_macro_output(
+            tax_revenue_impact=1000000,
+            state_tax_revenue_impact=0,
+            benefit_spending_impact=0,
+            budgetary_impact=1000000,
+        )
         self.error = None
         self.running = False
         self.__class__.registry[object_id] = self
 
@@ -18,7 +18,7 @@ dependencies = [
     "policyengine-fastapi",
     "policyengine==4.4.3",
     "policyengine-core>=3.26.1",
-    "policyengine-uk==2.88.0",
+    "policyengine-uk==2.88.14",
     "policyengine-us==1.690.7",
     "tables>=3.10.2",
     "modal>=0.73.0",
 
@@ -1,14 +1,14 @@
-"""Budget-window annual result extraction and aggregation helpers."""
+"""Budget-window result validation and aggregation helpers."""
 
 from __future__ import annotations
 
 from decimal import Decimal
 from typing import Any
 
 from src.modal.gateway.models import (
-    BudgetWindowAnnualImpact,
     BudgetWindowResult,
     BudgetWindowTotals,
+    SingleYearMacroOutput,
 )
 
 # The UK microsimulation has no state/province fiscal layer, so worker child
@@ -20,7 +20,10 @@
     "benefit_spending_impact",
     "budgetary_impact",
 )
-OPTIONAL_BUDGET_KEYS = ("state_tax_revenue_impact",)
+
+
+def _is_number(value: Any) -> bool:
+    return isinstance(value, int | float) and not isinstance(value, bool)
 
 
 def _as_decimal(value: float | int) -> Decimal:
@@ -32,46 +35,60 @@ def _as_decimal(value: float | int) -> Decimal:
     return Decimal(str(value))
 
 
-def extract_annual_impact(
+def validate_single_year_output(
     *,
     simulation_year: str,
     child_result: dict[str, Any],
-) -> BudgetWindowAnnualImpact:
+) -> SingleYearMacroOutput:
+    """Validate and normalize a child macro result.
+
+    UK worker results can omit ``state_tax_revenue_impact`` because there is
+    no state/province fiscal layer. The canonical output still includes that
+    field, defaulted to zero, so downstream clients receive one stable shape.
+    """
+
+    if not isinstance(child_result, dict):
+        raise ValueError(
+            "Malformed budget-window child result: expected object for "
+            f"{simulation_year}"
+        )
+
     budget = child_result.get("budget", {})
     if not isinstance(budget, dict):
         raise ValueError("Malformed budget-window child result: missing budget object")
 
     missing_keys = [
-        key
-        for key in REQUIRED_BUDGET_KEYS
-        if not isinstance(budget.get(key), int | float)
+        key for key in REQUIRED_BUDGET_KEYS if not _is_number(budget.get(key))
     ]
     if missing_keys:
         missing = ", ".join(f"budget.{key}" for key in missing_keys)
         raise ValueError(
             f"Malformed budget-window child result: missing numeric {missing}"
         )
 
-    tax_revenue_impact = budget["tax_revenue_impact"]
-    # UK worker results omit the state fiscal layer entirely; coerce to 0.0
-    # so the parent aggregator can still report federal/state splits with a
-    # uniform shape across countries.
-    state_tax_revenue_impact = budget.get("state_tax_revenue_impact")
-    if not isinstance(state_tax_revenue_impact, int | float):
-        state_tax_revenue_impact = 0.0
-
-    return BudgetWindowAnnualImpact(
-        year=simulation_year,
-        taxRevenueImpact=tax_revenue_impact,
-        federalTaxRevenueImpact=tax_revenue_impact - state_tax_revenue_impact,
-        stateTaxRevenueImpact=state_tax_revenue_impact,
-        benefitSpendingImpact=budget["benefit_spending_impact"],
-        budgetaryImpact=budget["budgetary_impact"],
-    )
+    normalized = dict(child_result)
+    normalized_budget = dict(budget)
+    if "state_tax_revenue_impact" not in normalized_budget:
+        normalized_budget["state_tax_revenue_impact"] = 0.0
+    elif not _is_number(normalized_budget["state_tax_revenue_impact"]):
+        raise ValueError(
+            "Malformed budget-window child result: missing numeric "
+            "budget.state_tax_revenue_impact"
+        )
+    normalized["budget"] = normalized_budget
+
+    try:
+        return SingleYearMacroOutput.model_validate(normalized)
+    except Exception as exc:
+        raise ValueError(
+            f"Malformed budget-window child result for {simulation_year}: {exc}"
+        ) from exc
 
 
-def sum_annual_impacts(
-    annual_impacts: list[BudgetWindowAnnualImpact],
+def sum_single_year_outputs(
+    *,
+    outputs_by_year: dict[str, SingleYearMacroOutput],
+    years: list[str],
 ) -> BudgetWindowTotals:
     """Sum per-year impacts using Decimal accumulators.
 
@@ -93,18 +110,21 @@ def sum_annual_impacts(
         "budgetaryImpact": Decimal(0),
     }
 
-    for annual_impact in annual_impacts:
-        totals["taxRevenueImpact"] += _as_decimal(annual_impact.taxRevenueImpact)
+    for year in years:
+        output = outputs_by_year[year]
+        budget = output.model_dump(mode="json")["budget"]
+        tax_revenue_impact = budget["tax_revenue_impact"]
+        state_tax_revenue_impact = budget.get("state_tax_revenue_impact")
+
+        totals["taxRevenueImpact"] += _as_decimal(tax_revenue_impact)
         totals["federalTaxRevenueImpact"] += _as_decimal(
-            annual_impact.federalTaxRevenueImpact
-        )
-        totals["stateTaxRevenueImpact"] += _as_decimal(
-            annual_impact.stateTaxRevenueImpact
+            tax_revenue_impact - state_tax_revenue_impact
         )
+        totals["stateTaxRevenueImpact"] += _as_decimal(state_tax_revenue_impact)
         totals["benefitSpendingImpact"] += _as_decimal(
-            annual_impact.benefitSpendingImpact
+            budget["benefit_spending_impact"]
         )
-        totals["budgetaryImpact"] += _as_decimal(annual_impact.budgetaryImpact)
+        totals["budgetaryImpact"] += _as_decimal(budget["budgetary_impact"])
 
     return BudgetWindowTotals(**{key: float(value) for key, value in totals.items()})
 
@@ -113,12 +133,25 @@ def build_budget_window_result(
     *,
     start_year: str,
     window_size: int,
-    annual_impacts: list[BudgetWindowAnnualImpact],
+    outputs_by_year: dict[str, SingleYearMacroOutput],
 ) -> BudgetWindowResult:
+    years = [str(int(start_year) + offset) for offset in range(window_size)]
+    missing_years = [year for year in years if year not in outputs_by_year]
+    if missing_years:
+        raise ValueError(
+            "Cannot build budget-window result: missing outputs for "
+            + ", ".join(missing_years)
+        )
+
+    ordered_outputs = {year: outputs_by_year[year] for year in years}
     return BudgetWindowResult(
         startYear=start_year,
         endYear=str(int(start_year) + window_size - 1),
         windowSize=window_size,
-        annualImpacts=annual_impacts,
-        totals=sum_annual_impacts(annual_impacts),
+        years=years,
+        outputsByYear=ordered_outputs,
+        totals=sum_single_year_outputs(
+            outputs_by_year=ordered_outputs,
+            years=years,
+        ),
     )
@@ -14,7 +14,7 @@
 )
 from src.modal.budget_window_results import (
     build_budget_window_result,
-    extract_annual_impact,
+    validate_single_year_output,
 )
 from src.modal.budget_window_state import (
     build_batch_status_response,
@@ -167,7 +167,7 @@ def poll_running_children_once(self) -> bool:
                 return False
 
             try:
-                annual_impact = extract_annual_impact(
+                single_year_output = validate_single_year_output(
                     simulation_year=simulation_year,
                     child_result=child_result,
                 )
@@ -189,7 +189,7 @@ def poll_running_children_once(self) -> bool:
             mark_child_completed(
                 self.state,
                 year=simulation_year,
-                annual_impact=annual_impact,
+                single_year_output=single_year_output,
             )
             put_batch_job_state(self.state)
             progress_made = True
@@ -222,15 +222,15 @@ def fail_batch_for_child_error(
         put_batch_job_state(self.state)
 
     def complete_batch(self) -> dict[str, Any]:
-        annual_impacts = [
-            self.state.partial_annual_impacts[simulation_year]
+        outputs_by_year = {
+            simulation_year: self.state.partial_outputs_by_year[simulation_year]
             for simulation_year in self.state.years
-            if simulation_year in self.state.partial_annual_impacts
-        ]
+            if simulation_year in self.state.partial_outputs_by_year
+        }
         result = build_budget_window_result(
             start_year=self.state.start_year,
             window_size=self.state.window_size,
-            annual_impacts=annual_impacts,
+            outputs_by_year=outputs_by_year,
         )
         mark_batch_complete(self.state, result=result)
         put_batch_job_state(self.state)
 
@@ -9,12 +9,12 @@
 
 from src.modal.gateway.models import (
     BatchChildJobStatus,
-    BudgetWindowAnnualImpact,
     BudgetWindowBatchRequest,
     BudgetWindowBatchState,
     BudgetWindowBatchStatusResponse,
     BudgetWindowResult,
     PolicyEngineBundle,
+    SingleYearMacroOutput,
 )
 
 logger = logging.getLogger(__name__)
@@ -79,7 +79,7 @@ def create_initial_batch_state(
         completed_years=[],
         failed_years=[],
         child_jobs={},
-        partial_annual_impacts={},
+        partial_outputs_by_year={},
         result=None,
         error=None,
         created_at=now,
@@ -166,7 +166,7 @@ def mark_child_completed(
     state: BudgetWindowBatchState,
     *,
     year: str,
-    annual_impact: BudgetWindowAnnualImpact,
+    single_year_output: SingleYearMacroOutput,
 ) -> BudgetWindowBatchState:
     if year in state.running_years:
         state.running_years.remove(year)
@@ -178,7 +178,7 @@ def mark_child_completed(
         job_id=child.job_id,
         status="complete",
     )
-    state.partial_annual_impacts[year] = annual_impact
+    state.partial_outputs_by_year[year] = single_year_output
     return _touch(state)