Refactor benchmark documentation update process in GitHub Actions

TKorr · TKorr · commit 9088d9256915 · 2026-01-12T20:29:16.000Z
- Replaced the manual benchmark summary generation script with a dedicated script to streamline the update of benchmark results in the documentation.
- Introduced a new script for writing benchmark estimates and throughput data, improving maintainability and clarity.
- Enhanced the existing workflow to utilize the new script, ensuring consistent and accurate documentation of benchmark results.
diff --git a/.github/workflows/release.yml b/.github/workflows/release.yml
@@ -30,110 +30,7 @@ jobs:
         run: cargo bench --no-fail-fast
       - name: Generate benchmark summary
         run: |
-          set -euo pipefail
-          criterion_dir="target/criterion"
-
-          mean_ns() {
-            local est="$1/new/estimates.json"
-            if [ ! -f "$est" ]; then
-              echo "TBD"
-              return
-            fi
-            jq -r '.mean.point_estimate' "$est"
-          }
-
-          mems_from() {
-            local bench_dir="$1"
-            local bench_json="$bench_dir/new/benchmark.json"
-            local est_json="$bench_dir/new/estimates.json"
-            local elements
-            local ns
-            if [ ! -f "$bench_json" ] || [ ! -f "$est_json" ]; then
-              echo "TBD"
-              return
-            fi
-            elements=$(jq -r '.throughput.Elements // empty' "$bench_json")
-            ns=$(jq -r '.mean.point_estimate // empty' "$est_json")
-            if [ -z "$elements" ] || [ -z "$ns" ] || [ "$elements" = "0" ] || [ "$ns" = "0" ]; then
-              echo "TBD"
-              return
-            fi
-            awk -v e="$elements" -v ns="$ns" 'BEGIN { printf "%.2f", (e * 1e9 / ns) / 1e6 }'
-          }
-
-          lru_get=$(mean_ns "$criterion_dir/lru_get_hit_ns")
-          lru_insert=$(mean_ns "$criterion_dir/lru_insert_full_ns")
-          lru_k_get=$(mean_ns "$criterion_dir/lru_k_get_hit_ns")
-          lru_k_insert=$(mean_ns "$criterion_dir/lru_k_insert_full_ns")
-          lfu_get=$(mean_ns "$criterion_dir/lfu_get_hit_ns")
-          lfu_insert=$(mean_ns "$criterion_dir/lfu_insert_full_ns")
-          lfu_touch=$(mean_ns "$criterion_dir/lfu_policy_only_touch_ns")
-
-          lru_insert_get=$(mems_from "$criterion_dir/lru_policy/insert_get")
-          lru_eviction=$(mems_from "$criterion_dir/lru_policy/eviction_churn")
-          lru_pop=$(mems_from "$criterion_dir/lru_policy/pop_lru")
-          lru_hot=$(mems_from "$criterion_dir/lru_policy/touch_hotset")
-
-          lru_k_insert_get=$(mems_from "$criterion_dir/lru_k_policy/insert_get")
-          lru_k_eviction=$(mems_from "$criterion_dir/lru_k_policy/eviction_churn")
-          lru_k_pop=$(mems_from "$criterion_dir/lru_k_policy/pop_lru_k")
-          lru_k_hot=$(mems_from "$criterion_dir/lru_k_policy/touch_hotset")
-
-          lfu_insert_get=$(mems_from "$criterion_dir/lfu_policy/insert_get")
-          lfu_eviction=$(mems_from "$criterion_dir/lfu_policy/eviction_churn")
-          lfu_pop=$(mems_from "$criterion_dir/lfu_pop_lfu_policy")
-          lfu_hot=$(mems_from "$criterion_dir/lfu_get_hotset_policy")
-
-          lru_uniform=$(mems_from "$criterion_dir/lru_workload_hit_rate/uniform")
-          lru_hotset=$(mems_from "$criterion_dir/lru_workload_hit_rate/hotset_90_10")
-          lru_scan=$(mems_from "$criterion_dir/lru_workload_hit_rate/scan")
-
-          lru_k_uniform=$(mems_from "$criterion_dir/lru_k_workload_hit_rate/uniform")
-          lru_k_hotset=$(mems_from "$criterion_dir/lru_k_workload_hit_rate/hotset_90_10")
-          lru_k_scan=$(mems_from "$criterion_dir/lru_k_workload_hit_rate/scan")
-
-          lfu_uniform=$(mems_from "$criterion_dir/lfu_workload_hit_rate/uniform")
-          lfu_hotset=$(mems_from "$criterion_dir/lfu_workload_hit_rate/hotset_90_10")
-          lfu_scan=$(mems_from "$criterion_dir/lfu_workload_hit_rate/scan")
-
-          cat > /tmp/latest-run.md <<EOF
-          Micro-ops (ns/op):
-
-          | Cache | get_hit | insert_full | policy_only_touch |
-          | --- | --- | --- | --- |
-          | LRU | ${lru_get%.*} | ${lru_insert%.*} | n/a |
-          | LRU-K | ${lru_k_get%.*} | ${lru_k_insert%.*} | n/a |
-          | LFU | ${lfu_get%.*} | ${lfu_insert%.*} | ${lfu_touch%.*} |
-
-          Policy throughput (Melem/s = million operations per second):
-
-          | Cache | insert_get | eviction_churn | pop | touch_hotset |
-          | --- | --- | --- | --- | --- |
-          | LRU | ${lru_insert_get} | ${lru_eviction} | ${lru_pop} | ${lru_hot} |
-          | LRU-K | ${lru_k_insert_get} | ${lru_k_eviction} | ${lru_k_pop} | ${lru_k_hot} |
-          | LFU | ${lfu_insert_get} | ${lfu_eviction} | ${lfu_pop} | ${lfu_hot} |
-
-          Workload throughput (Melem/s, 200k ops):
-
-          | Cache | uniform | hotset_90_10 | scan |
-          | --- | --- | --- | --- |
-          | LRU | ${lru_uniform} | ${lru_hotset} | ${lru_scan} |
-          | LRU-K | ${lru_k_uniform} | ${lru_k_hotset} | ${lru_k_scan} |
-          | LFU | ${lfu_uniform} | ${lfu_hotset} | ${lfu_scan} |
-          EOF
-
-          awk '
-            /<!-- LATEST_RUN_START -->/ {
-              print;
-              while ((getline line < "/tmp/latest-run.md") > 0) print line;
-              in=1;
-              next
-            }
-            /<!-- LATEST_RUN_END -->/ { in=0; print; next }
-            !in { print }
-          ' docs/benchmarks.md > /tmp/benchmarks.md
-
-          mv /tmp/benchmarks.md docs/benchmarks.md
+          ./scripts/update_docs_benchmarks.sh target/criterion docs/benchmarks.md
       - name: Package benchmark results
         run: tar -czf criterion-results.tar.gz target/criterion
       - name: Build docs site with Jekyll
diff --git a/scripts/update_docs_benchmarks.sh b/scripts/update_docs_benchmarks.sh
@@ -0,0 +1,142 @@
+#!/usr/bin/env bash
+set -euo pipefail
+
+criterion_dir="${1:-target/criterion}"
+benchmarks_md="${2:-docs/benchmarks.md}"
+
+mean_ns() {
+  local dir="$1"
+  local est="$dir/new/estimates.json"
+  if [[ ! -f "$est" ]]; then
+    echo "TBD"
+    return 0
+  fi
+  jq -r '.mean.point_estimate' "$est"
+}
+
+melems_from() {
+  local dir="$1"
+  local bench_json="$dir/new/benchmark.json"
+  local est_json="$dir/new/estimates.json"
+  local elements ns
+
+  if [[ ! -f "$bench_json" || ! -f "$est_json" ]]; then
+    echo "TBD"
+    return 0
+  fi
+
+  elements="$(jq -r '.throughput.Elements // empty' "$bench_json")"
+  ns="$(jq -r '.mean.point_estimate // empty' "$est_json")"
+  if [[ -z "$elements" || -z "$ns" || "$elements" == "0" || "$ns" == "0" ]]; then
+    echo "TBD"
+    return 0
+  fi
+
+  awk -v e="$elements" -v ns="$ns" 'BEGIN { printf "%.2f", (e * 1e9 / ns) / 1e6 }'
+}
+
+melems_first_of() {
+  local path
+  for path in "$@"; do
+    if [[ -d "$path" ]]; then
+      melems_from "$path"
+      return 0
+    fi
+  done
+  echo "TBD"
+}
+
+ns_int() {
+  local v="$1"
+  if [[ "$v" == "TBD" ]]; then
+    echo "TBD"
+  else
+    echo "${v%.*}"
+  fi
+}
+
+if [[ ! -f "$benchmarks_md" ]]; then
+  echo "benchmarks markdown not found: $benchmarks_md" >&2
+  exit 1
+fi
+
+lru_get="$(mean_ns "$criterion_dir/lru_get_hit_ns")"
+lru_insert="$(mean_ns "$criterion_dir/lru_insert_full_ns")"
+lru_k_get="$(mean_ns "$criterion_dir/lru_k_get_hit_ns")"
+lru_k_insert="$(mean_ns "$criterion_dir/lru_k_insert_full_ns")"
+lfu_get="$(mean_ns "$criterion_dir/lfu_get_hit_ns")"
+lfu_insert="$(mean_ns "$criterion_dir/lfu_insert_full_ns")"
+lfu_touch="$(mean_ns "$criterion_dir/lfu_policy_only_touch_ns")"
+
+lru_insert_get="$(melems_from "$criterion_dir/lru_policy/insert_get")"
+lru_eviction="$(melems_from "$criterion_dir/lru_policy/eviction_churn")"
+lru_pop="$(melems_from "$criterion_dir/lru_policy/pop_lru")"
+lru_hot="$(melems_from "$criterion_dir/lru_policy/touch_hotset")"
+
+lru_k_insert_get="$(melems_from "$criterion_dir/lru_k_policy/insert_get")"
+lru_k_eviction="$(melems_from "$criterion_dir/lru_k_policy/eviction_churn")"
+lru_k_pop="$(melems_from "$criterion_dir/lru_k_policy/pop_lru_k")"
+lru_k_hot="$(melems_from "$criterion_dir/lru_k_policy/touch_hotset")"
+
+lfu_insert_get="$(melems_from "$criterion_dir/lfu_policy/insert_get")"
+lfu_eviction="$(melems_from "$criterion_dir/lfu_policy/eviction_churn")"
+lfu_pop="$(melems_first_of "$criterion_dir/lfu_pop_lfu_policy" "$criterion_dir/lfu_policy/pop_lfu")"
+lfu_hot="$(melems_first_of "$criterion_dir/lfu_get_hotset_policy" "$criterion_dir/lfu_policy/get_hotset")"
+
+lru_uniform="$(melems_from "$criterion_dir/lru_workload_hit_rate/uniform")"
+lru_hotset="$(melems_from "$criterion_dir/lru_workload_hit_rate/hotset_90_10")"
+lru_scan="$(melems_from "$criterion_dir/lru_workload_hit_rate/scan")"
+
+lru_k_uniform="$(melems_from "$criterion_dir/lru_k_workload_hit_rate/uniform")"
+lru_k_hotset="$(melems_from "$criterion_dir/lru_k_workload_hit_rate/hotset_90_10")"
+lru_k_scan="$(melems_from "$criterion_dir/lru_k_workload_hit_rate/scan")"
+
+lfu_uniform="$(melems_from "$criterion_dir/lfu_workload_hit_rate/uniform")"
+lfu_hotset="$(melems_from "$criterion_dir/lfu_workload_hit_rate/hotset_90_10")"
+lfu_scan="$(melems_from "$criterion_dir/lfu_workload_hit_rate/scan")"
+
+tmp_latest="$(mktemp)"
+cat >"$tmp_latest" <<EOF
+Micro-ops (ns/op):
+
+| Cache | get_hit | insert_full | policy_only_touch |
+| --- | --- | --- | --- |
+| LRU | $(ns_int "$lru_get") | $(ns_int "$lru_insert") | n/a |
+| LRU-K | $(ns_int "$lru_k_get") | $(ns_int "$lru_k_insert") | n/a |
+| LFU | $(ns_int "$lfu_get") | $(ns_int "$lfu_insert") | $(ns_int "$lfu_touch") |
+
+Policy throughput (Melem/s = million operations per second):
+
+| Cache | insert_get | eviction_churn | pop | touch_hotset |
+| --- | --- | --- | --- | --- |
+| LRU | $lru_insert_get | $lru_eviction | $lru_pop | $lru_hot |
+| LRU-K | $lru_k_insert_get | $lru_k_eviction | $lru_k_pop | $lru_k_hot |
+| LFU | $lfu_insert_get | $lfu_eviction | $lfu_pop | $lfu_hot |
+
+Workload throughput (Melem/s, 200k ops):
+
+| Cache | uniform | hotset_90_10 | scan |
+| --- | --- | --- | --- |
+| LRU | $lru_uniform | $lru_hotset | $lru_scan |
+| LRU-K | $lru_k_uniform | $lru_k_hotset | $lru_k_scan |
+| LFU | $lfu_uniform | $lfu_hotset | $lfu_scan |
+EOF
+
+tmp_out="$(mktemp)"
+awk -v latest="$tmp_latest" '
+  /<!-- LATEST_RUN_START -->/ {
+    print;
+    while ((getline line < latest) > 0) print line;
+    in_block=1;
+    next
+  }
+  /<!-- LATEST_RUN_END -->/ {
+    in_block=0;
+    print;
+    next
+  }
+  !in_block { print }
+' "$benchmarks_md" >"$tmp_out"
+
+mv "$tmp_out" "$benchmarks_md"
+rm -f "$tmp_latest"
diff --git a/scripts/update_docs_benchmarks_test.sh b/scripts/update_docs_benchmarks_test.sh
@@ -0,0 +1,109 @@
+#!/usr/bin/env bash
+set -euo pipefail
+
+if ! command -v jq >/dev/null 2>&1; then
+  echo "skipping: jq not found" >&2
+  exit 0
+fi
+
+repo_root="$(cd "$(dirname "${BASH_SOURCE[0]}")/.." && pwd)"
+script="$repo_root/scripts/update_docs_benchmarks.sh"
+
+tmp="$(mktemp -d)"
+trap 'rm -rf "$tmp"' EXIT
+
+criterion_dir="$tmp/criterion"
+docs_dir="$tmp/docs"
+mkdir -p "$criterion_dir" "$docs_dir"
+
+write_estimates() {
+  local dir="$1"
+  local mean="$2"
+  mkdir -p "$dir/new"
+  cat >"$dir/new/estimates.json" <<EOF
+{ "mean": { "point_estimate": $mean } }
+EOF
+}
+
+write_throughput() {
+  local dir="$1"
+  local elements="$2"
+  mkdir -p "$dir/new"
+  cat >"$dir/new/benchmark.json" <<EOF
+{ "throughput": { "Elements": $elements } }
+EOF
+}
+
+write_policy_bench() {
+  local dir="$1"
+  local elements="$2"
+  local mean_ns="$3"
+  write_throughput "$dir" "$elements"
+  write_estimates "$dir" "$mean_ns"
+}
+
+# Micro-ops (ns)
+write_estimates "$criterion_dir/lru_get_hit_ns" 30.9
+write_estimates "$criterion_dir/lru_insert_full_ns" 138.2
+write_estimates "$criterion_dir/lru_k_get_hit_ns" 43.1
+write_estimates "$criterion_dir/lru_k_insert_full_ns" 189.9
+write_estimates "$criterion_dir/lfu_get_hit_ns" 87.5
+write_estimates "$criterion_dir/lfu_insert_full_ns" 195.0
+write_estimates "$criterion_dir/lfu_policy_only_touch_ns" 66.7
+
+# Policy throughput (Elements/op and mean ns/op -> Melem/s)
+write_policy_bench "$criterion_dir/lru_policy/insert_get" 2048 192900.0
+write_policy_bench "$criterion_dir/lru_policy/eviction_churn" 4096 630000.0
+write_policy_bench "$criterion_dir/lru_policy/pop_lru" 1024 58800.0
+write_policy_bench "$criterion_dir/lru_policy/touch_hotset" 1024 40800.0
+
+write_policy_bench "$criterion_dir/lru_k_policy/insert_get" 2048 320000.0
+write_policy_bench "$criterion_dir/lru_k_policy/eviction_churn" 4096 950000.0
+write_policy_bench "$criterion_dir/lru_k_policy/pop_lru_k" 1024 90000.0
+write_policy_bench "$criterion_dir/lru_k_policy/touch_hotset" 1024 70000.0
+
+write_policy_bench "$criterion_dir/lfu_policy/insert_get" 2048 270000.0
+write_policy_bench "$criterion_dir/lfu_policy/eviction_churn" 4096 980000.0
+
+# Workload throughput
+write_policy_bench "$criterion_dir/lru_workload_hit_rate/uniform" 200000 28700000.0
+write_policy_bench "$criterion_dir/lru_workload_hit_rate/hotset_90_10" 200000 10000000.0
+write_policy_bench "$criterion_dir/lru_workload_hit_rate/scan" 200000 27500000.0
+
+write_policy_bench "$criterion_dir/lru_k_workload_hit_rate/uniform" 200000 36000000.0
+write_policy_bench "$criterion_dir/lru_k_workload_hit_rate/hotset_90_10" 200000 12500000.0
+write_policy_bench "$criterion_dir/lru_k_workload_hit_rate/scan" 200000 40000000.0
+
+write_policy_bench "$criterion_dir/lfu_workload_hit_rate/uniform" 200000 42000000.0
+write_policy_bench "$criterion_dir/lfu_workload_hit_rate/hotset_90_10" 200000 24000000.0
+write_policy_bench "$criterion_dir/lfu_workload_hit_rate/scan" 200000 41000000.0
+
+# Benchmarks doc with replacement markers.
+benchmarks_md="$docs_dir/benchmarks.md"
+cat >"$benchmarks_md" <<'EOF'
+# Benchmarks
+
+## Latest run (release)
+
+<!-- LATEST_RUN_START -->
+placeholder
+<!-- LATEST_RUN_END -->
+
+## Release summary
+EOF
+
+"$script" "$criterion_dir" "$benchmarks_md"
+
+grep -q "| LRU | 30 | 138 | n/a |" "$benchmarks_md"
+grep -q "| LRU-K | 43 | 189 | n/a |" "$benchmarks_md"
+grep -q "| LFU | 87 | 195 | 66 |" "$benchmarks_md"
+
+# Ensure missing LFU pop/hotset benches become TBD (we didn't create them).
+grep -q "^| LFU | .* | .* | TBD | TBD |$" "$benchmarks_md"
+
+# Ensure marker block still exists and placeholder is gone.
+grep -q "<!-- LATEST_RUN_START -->" "$benchmarks_md"
+grep -q "<!-- LATEST_RUN_END -->" "$benchmarks_md"
+! grep -q "^placeholder$" "$benchmarks_md"
+
+echo "ok: update_docs_benchmarks.sh"