egraphs-good
diff --git a/‎python/egglog/bindings.pyi‎
Lines changed: 0 additions & 1 deletion b/‎python/egglog/bindings.pyi‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎python/egglog/egraph.py‎
Lines changed: 1 addition & 5 deletions b/‎python/egglog/egraph.py‎
Lines changed: 1 addition & 5 deletions
diff --git a/‎python/egglog/exp/param_eq/__main__.py‎
Lines changed: 0 additions & 1 deletion b/‎python/egglog/exp/param_eq/__main__.py‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎python/egglog/exp/param_eq/normalize_archives.py‎
Lines changed: 5 additions & 7 deletions b/‎python/egglog/exp/param_eq/normalize_archives.py‎
Lines changed: 5 additions & 7 deletions
diff --git a/‎python/egglog/exp/param_eq/pipeline.py‎
Lines changed: 2 additions & 0 deletions b/‎python/egglog/exp/param_eq/pipeline.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎python/egglog/exp/param_eq/replication.ipynb‎
Lines changed: 60 additions & 60 deletions b/‎python/egglog/exp/param_eq/replication.ipynb‎
Lines changed: 60 additions & 60 deletions
diff --git a/‎python/egglog/exp/param_eq/replication.py‎
Lines changed: 59 additions & 59 deletions b/‎python/egglog/exp/param_eq/replication.py‎
Lines changed: 59 additions & 59 deletions
@@ -176,7 +176,6 @@ class Value:
     def __ge__(self, other: object) -> bool: ...
 
 @final
-
 @final
 class EggSmolError(Exception):
     context: str
 
@@ -1315,11 +1315,7 @@ def all_function_sizes(self) -> list[tuple[ExprCallable, int]]:
         """
         (output,) = self._run_program(bindings.PrintSize(span(1), None))
         assert isinstance(output, bindings.PrintAllFunctionsSize)
-        return [
-            (callables[0], size)
-            for (name, size) in output.sizes
-            if (callables := self._egg_fn_to_callables(name))
-        ]
+        return [(callables[0], size) for (name, size) in output.sizes if (callables := self._egg_fn_to_callables(name))]
 
     def _egg_fn_to_callables(self, egg_fn: str) -> list[ExprCallable]:
         return [
 
@@ -4,6 +4,5 @@
 
 from .pipeline import _cli
 
-
 if __name__ == "__main__":
     _cli()
@@ -124,13 +124,11 @@ def _normalize_runtime_rows(source_dir: Path) -> list[dict[str, str]]:
         node_count = int(benchmark_name.split("/")[-1])
         _, numeric, unit, *_ = time_line.split()
         runtime_ms = float(numeric) * _to_runtime_multiplier(unit)
-        rows.append(
-            {
-                "benchmark_name": benchmark_name,
-                "node_count": str(node_count),
-                "runtime_ms": f"{runtime_ms:.9f}",
-            }
-        )
+        rows.append({
+            "benchmark_name": benchmark_name,
+            "node_count": str(node_count),
+            "runtime_ms": f"{runtime_ms:.9f}",
+        })
     return rows
 
 
 
@@ -457,6 +457,7 @@ def _const_propagation(
 GuardCases: TypeAlias = tuple[GuardConditions, ...]
 _CONST_GUARD_COUNTER = count()
 
+
 def _fresh_const_guard_value(prefix: str = "_const_value") -> f64:
     return var(f"{prefix}_{next(_CONST_GUARD_COUNTER)}", f64)
 
@@ -1269,6 +1270,7 @@ def _serialized_counts(egraph: egglog.EGraph) -> tuple[int, int]:
     payload = json.loads(egraph._serialize().to_json())
     return len(payload.get("nodes", {})), len(payload.get("class_data", {}))
 
+
 analysis_schedule = const_merge_rules | const_seed_rules | const_propagation_rules | const_prune_rules
 basic_rules = (
     basic_add_comm_rules
 
@@ -59,7 +59,6 @@
     "\n",
     "from egglog.exp.param_eq.paths import ARTIFACT_DIR, PARAM_EQ_DIR\n",
     "\n",
-    "\n",
     "alt.data_transformers.disable_max_rows()\n",
     "alt.renderers.enable(\"default\")\n",
     "\n",
@@ -273,16 +272,14 @@
     "                percent = float(\"nan\")\n",
     "                if not eligible.empty:\n",
     "                    percent = 100.0 * (eligible[\"simpl_rank\"] <= delta).sum() / len(eligible)\n",
-    "                rows.append(\n",
-    "                    {\n",
-    "                        \"implementation\": implementation,\n",
-    "                        \"dataset\": dataset,\n",
-    "                        \"dataset_label\": DATASET_LABELS[dataset],\n",
-    "                        \"algorithm\": algorithm,\n",
-    "                        \"delta\": f\"Δ {'==' if delta == 0 else '<='} {delta}\",\n",
-    "                        \"percent\": percent,\n",
-    "                    }\n",
-    "                )\n",
+    "                rows.append({\n",
+    "                    \"implementation\": implementation,\n",
+    "                    \"dataset\": dataset,\n",
+    "                    \"dataset_label\": DATASET_LABELS[dataset],\n",
+    "                    \"algorithm\": algorithm,\n",
+    "                    \"delta\": f\"Δ {'==' if delta == 0 else '<='} {delta}\",\n",
+    "                    \"percent\": percent,\n",
+    "                })\n",
     "    result = pd.DataFrame(rows)\n",
     "    result[\"percent_label\"] = result[\"percent\"].map(lambda value: \"n/a\" if pd.isna(value) else f\"{value:.2f}%\")\n",
     "    return result\n",
@@ -309,7 +306,9 @@
     "    display(SVG(buffer.getvalue()))\n",
     "\n",
     "\n",
-    "archived_haskell = with_implementation(add_paper_metrics(_paper_haskell_frame(ARCHIVED_HASKELL_PATH)), \"Archived Haskell\")\n",
+    "archived_haskell = with_implementation(\n",
+    "    add_paper_metrics(_paper_haskell_frame(ARCHIVED_HASKELL_PATH)), \"Archived Haskell\"\n",
+    ")\n",
     "live_haskell = with_implementation(add_paper_metrics(_paper_haskell_frame(LIVE_HASKELL_PATH)), \"Live Haskell\")\n",
     "egglog = with_implementation(add_paper_metrics(_paper_egglog_frame(EGGLOG_PATH)), \"Egglog\")\n",
     "runtime_rows = _paper_runtime_frame()\n",
@@ -375,7 +374,7 @@
     "        comparison_table(egglog, implementation=\"Egglog\"),\n",
     "    ],\n",
     "    ignore_index=True,\n",
-    ")\n"
+    ")"
    ]
   },
   {
@@ -535,58 +534,54 @@
     }
    ],
    "source": [
-    "artifact_summary = pd.DataFrame(\n",
-    "    [\n",
+    "artifact_summary = pd.DataFrame([\n",
+    "    {\n",
+    "        \"implementation\": \"Archived Haskell\",\n",
+    "        \"rows\": len(archived_haskell),\n",
+    "        \"original_median_simpl_rank\": float(archived_haskell[\"simpl_rank\"].median()),\n",
+    "        \"sympy_median_simpl_rank\": float(archived_haskell[\"sympy_rank\"].median()),\n",
+    "    },\n",
+    "    {\n",
+    "        \"implementation\": \"Live Haskell\",\n",
+    "        \"rows\": len(live_haskell),\n",
+    "        \"original_median_simpl_rank\": float(live_haskell[\"simpl_rank\"].median()),\n",
+    "        \"sympy_median_simpl_rank\": float(live_haskell[\"sympy_rank\"].median()),\n",
+    "    },\n",
+    "    {\n",
+    "        \"implementation\": \"Egglog\",\n",
+    "        \"rows\": len(egglog),\n",
+    "        \"original_median_simpl_rank\": float(egglog[\"simpl_rank\"].median()),\n",
+    "        \"sympy_median_simpl_rank\": float(egglog[\"sympy_rank\"].median()),\n",
+    "    },\n",
+    "])\n",
+    "display(artifact_summary)\n",
+    "display(\n",
+    "    pd.DataFrame([\n",
     "        {\n",
-    "            \"implementation\": \"Archived Haskell\",\n",
-    "            \"rows\": len(archived_haskell),\n",
-    "            \"original_median_simpl_rank\": float(archived_haskell[\"simpl_rank\"].median()),\n",
-    "            \"sympy_median_simpl_rank\": float(archived_haskell[\"sympy_rank\"].median()),\n",
+    "            \"comparison\": \"Egglog vs live Haskell (original)\",\n",
+    "            \"exact_matches\": int(egglog_vs_live[\"orig_exact\"].sum()),\n",
+    "            \"total_rows\": len(egglog_vs_live),\n",
+    "            \"max_gap\": int(egglog_vs_live[\"orig_gap\"].max()),\n",
     "        },\n",
     "        {\n",
-    "            \"implementation\": \"Live Haskell\",\n",
-    "            \"rows\": len(live_haskell),\n",
-    "            \"original_median_simpl_rank\": float(live_haskell[\"simpl_rank\"].median()),\n",
-    "            \"sympy_median_simpl_rank\": float(live_haskell[\"sympy_rank\"].median()),\n",
+    "            \"comparison\": \"Egglog vs live Haskell (sympy)\",\n",
+    "            \"exact_matches\": int(egglog_vs_live[\"sympy_exact\"].sum()),\n",
+    "            \"total_rows\": len(egglog_vs_live),\n",
+    "            \"max_gap\": int(egglog_vs_live[\"sympy_gap\"].max()),\n",
     "        },\n",
     "        {\n",
-    "            \"implementation\": \"Egglog\",\n",
-    "            \"rows\": len(egglog),\n",
-    "            \"original_median_simpl_rank\": float(egglog[\"simpl_rank\"].median()),\n",
-    "            \"sympy_median_simpl_rank\": float(egglog[\"sympy_rank\"].median()),\n",
+    "            \"comparison\": \"Live vs archived Haskell (original)\",\n",
+    "            \"exact_matches\": int((archive_drift[\"orig_drift\"] == 0).sum()),\n",
+    "            \"total_rows\": len(archive_drift),\n",
+    "            \"max_gap\": int(archive_drift[\"orig_drift\"].abs().max()),\n",
     "        },\n",
-    "    ]\n",
-    ")\n",
-    "display(artifact_summary)\n",
-    "display(\n",
-    "    pd.DataFrame(\n",
-    "        [\n",
-    "            {\n",
-    "                \"comparison\": \"Egglog vs live Haskell (original)\",\n",
-    "                \"exact_matches\": int(egglog_vs_live[\"orig_exact\"].sum()),\n",
-    "                \"total_rows\": len(egglog_vs_live),\n",
-    "                \"max_gap\": int(egglog_vs_live[\"orig_gap\"].max()),\n",
-    "            },\n",
-    "            {\n",
-    "                \"comparison\": \"Egglog vs live Haskell (sympy)\",\n",
-    "                \"exact_matches\": int(egglog_vs_live[\"sympy_exact\"].sum()),\n",
-    "                \"total_rows\": len(egglog_vs_live),\n",
-    "                \"max_gap\": int(egglog_vs_live[\"sympy_gap\"].max()),\n",
-    "            },\n",
-    "            {\n",
-    "                \"comparison\": \"Live vs archived Haskell (original)\",\n",
-    "                \"exact_matches\": int((archive_drift[\"orig_drift\"] == 0).sum()),\n",
-    "                \"total_rows\": len(archive_drift),\n",
-    "                \"max_gap\": int(archive_drift[\"orig_drift\"].abs().max()),\n",
-    "            },\n",
-    "            {\n",
-    "                \"comparison\": \"Live vs archived Haskell (sympy)\",\n",
-    "                \"exact_matches\": int((archive_drift[\"sympy_drift\"] == 0).sum()),\n",
-    "                \"total_rows\": len(archive_drift),\n",
-    "                \"max_gap\": int(archive_drift[\"sympy_drift\"].abs().max()),\n",
-    "            },\n",
-    "        ]\n",
-    "    )\n",
+    "        {\n",
+    "            \"comparison\": \"Live vs archived Haskell (sympy)\",\n",
+    "            \"exact_matches\": int((archive_drift[\"sympy_drift\"] == 0).sum()),\n",
+    "            \"total_rows\": len(archive_drift),\n",
+    "            \"max_gap\": int(archive_drift[\"sympy_drift\"].abs().max()),\n",
+    "        },\n",
+    "    ])\n",
     ")\n",
     "# -"
    ]
@@ -896,7 +891,12 @@
     }
    ],
    "source": [
-    "show_chart(runtime_chart(runtime_compare, title=\"Pagie runtime versus expression size (Figure 9 analog) across archived Haskell, live Haskell, and Egglog\"))"
+    "show_chart(\n",
+    "    runtime_chart(\n",
+    "        runtime_compare,\n",
+    "        title=\"Pagie runtime versus expression size (Figure 9 analog) across archived Haskell, live Haskell, and Egglog\",\n",
+    "    )\n",
+    ")"
    ]
   },
   {
 
@@ -38,7 +38,6 @@
 
 from egglog.exp.param_eq.paths import ARTIFACT_DIR, PARAM_EQ_DIR
 
-
 alt.data_transformers.disable_max_rows()
 alt.renderers.enable("default")
 
@@ -252,16 +251,14 @@ def comparison_table(frame: pd.DataFrame, *, implementation: str) -> pd.DataFram
                 percent = float("nan")
                 if not eligible.empty:
                     percent = 100.0 * (eligible["simpl_rank"] <= delta).sum() / len(eligible)
-                rows.append(
-                    {
-                        "implementation": implementation,
-                        "dataset": dataset,
-                        "dataset_label": DATASET_LABELS[dataset],
-                        "algorithm": algorithm,
-                        "delta": f"Δ {'==' if delta == 0 else '<='} {delta}",
-                        "percent": percent,
-                    }
-                )
+                rows.append({
+                    "implementation": implementation,
+                    "dataset": dataset,
+                    "dataset_label": DATASET_LABELS[dataset],
+                    "algorithm": algorithm,
+                    "delta": f"Δ {'==' if delta == 0 else '<='} {delta}",
+                    "percent": percent,
+                })
     result = pd.DataFrame(rows)
     result["percent_label"] = result["percent"].map(lambda value: "n/a" if pd.isna(value) else f"{value:.2f}%")
     return result
@@ -288,7 +285,9 @@ def show_chart(chart: Any) -> None:
     display(SVG(buffer.getvalue()))
 
 
-archived_haskell = with_implementation(add_paper_metrics(_paper_haskell_frame(ARCHIVED_HASKELL_PATH)), "Archived Haskell")
+archived_haskell = with_implementation(
+    add_paper_metrics(_paper_haskell_frame(ARCHIVED_HASKELL_PATH)), "Archived Haskell"
+)
 live_haskell = with_implementation(add_paper_metrics(_paper_haskell_frame(LIVE_HASKELL_PATH)), "Live Haskell")
 egglog = with_implementation(add_paper_metrics(_paper_egglog_frame(EGGLOG_PATH)), "Egglog")
 runtime_rows = _paper_runtime_frame()
@@ -360,58 +359,54 @@ def show_chart(chart: Any) -> None:
 
 # ## 1. Artifact Overview
 
-artifact_summary = pd.DataFrame(
-    [
+artifact_summary = pd.DataFrame([
+    {
+        "implementation": "Archived Haskell",
+        "rows": len(archived_haskell),
+        "original_median_simpl_rank": float(archived_haskell["simpl_rank"].median()),
+        "sympy_median_simpl_rank": float(archived_haskell["sympy_rank"].median()),
+    },
+    {
+        "implementation": "Live Haskell",
+        "rows": len(live_haskell),
+        "original_median_simpl_rank": float(live_haskell["simpl_rank"].median()),
+        "sympy_median_simpl_rank": float(live_haskell["sympy_rank"].median()),
+    },
+    {
+        "implementation": "Egglog",
+        "rows": len(egglog),
+        "original_median_simpl_rank": float(egglog["simpl_rank"].median()),
+        "sympy_median_simpl_rank": float(egglog["sympy_rank"].median()),
+    },
+])
+display(artifact_summary)
+display(
+    pd.DataFrame([
         {
-            "implementation": "Archived Haskell",
-            "rows": len(archived_haskell),
-            "original_median_simpl_rank": float(archived_haskell["simpl_rank"].median()),
-            "sympy_median_simpl_rank": float(archived_haskell["sympy_rank"].median()),
+            "comparison": "Egglog vs live Haskell (original)",
+            "exact_matches": int(egglog_vs_live["orig_exact"].sum()),
+            "total_rows": len(egglog_vs_live),
+            "max_gap": int(egglog_vs_live["orig_gap"].max()),
         },
         {
-            "implementation": "Live Haskell",
-            "rows": len(live_haskell),
-            "original_median_simpl_rank": float(live_haskell["simpl_rank"].median()),
-            "sympy_median_simpl_rank": float(live_haskell["sympy_rank"].median()),
+            "comparison": "Egglog vs live Haskell (sympy)",
+            "exact_matches": int(egglog_vs_live["sympy_exact"].sum()),
+            "total_rows": len(egglog_vs_live),
+            "max_gap": int(egglog_vs_live["sympy_gap"].max()),
         },
         {
-            "implementation": "Egglog",
-            "rows": len(egglog),
-            "original_median_simpl_rank": float(egglog["simpl_rank"].median()),
-            "sympy_median_simpl_rank": float(egglog["sympy_rank"].median()),
+            "comparison": "Live vs archived Haskell (original)",
+            "exact_matches": int((archive_drift["orig_drift"] == 0).sum()),
+            "total_rows": len(archive_drift),
+            "max_gap": int(archive_drift["orig_drift"].abs().max()),
         },
-    ]
-)
-display(artifact_summary)
-display(
-    pd.DataFrame(
-        [
-            {
-                "comparison": "Egglog vs live Haskell (original)",
-                "exact_matches": int(egglog_vs_live["orig_exact"].sum()),
-                "total_rows": len(egglog_vs_live),
-                "max_gap": int(egglog_vs_live["orig_gap"].max()),
-            },
-            {
-                "comparison": "Egglog vs live Haskell (sympy)",
-                "exact_matches": int(egglog_vs_live["sympy_exact"].sum()),
-                "total_rows": len(egglog_vs_live),
-                "max_gap": int(egglog_vs_live["sympy_gap"].max()),
-            },
-            {
-                "comparison": "Live vs archived Haskell (original)",
-                "exact_matches": int((archive_drift["orig_drift"] == 0).sum()),
-                "total_rows": len(archive_drift),
-                "max_gap": int(archive_drift["orig_drift"].abs().max()),
-            },
-            {
-                "comparison": "Live vs archived Haskell (sympy)",
-                "exact_matches": int((archive_drift["sympy_drift"] == 0).sum()),
-                "total_rows": len(archive_drift),
-                "max_gap": int(archive_drift["sympy_drift"].abs().max()),
-            },
-        ]
-    )
+        {
+            "comparison": "Live vs archived Haskell (sympy)",
+            "exact_matches": int((archive_drift["sympy_drift"] == 0).sum()),
+            "total_rows": len(archive_drift),
+            "max_gap": int(archive_drift["sympy_drift"].abs().max()),
+        },
+    ])
 )
 # -
 
@@ -510,7 +505,12 @@ def show_chart(chart: Any) -> None:
 # met.
 
 # +
-show_chart(runtime_chart(runtime_compare, title="Pagie runtime versus expression size (Figure 9 analog) across archived Haskell, live Haskell, and Egglog"))
+show_chart(
+    runtime_chart(
+        runtime_compare,
+        title="Pagie runtime versus expression size (Figure 9 analog) across archived Haskell, live Haskell, and Egglog",
+    )
+)
 # -
 
 # This faceted Figure 9 analog is now closer to the archived benchmark setup: