test

cquil11 · cquil11 · commit e9209b53343d · 2025-12-09T16:02:18.000-06:00
diff --git a/.github/workflows/run-sweep.yml b/.github/workflows/run-sweep.yml
@@ -6,8 +6,6 @@ on:
         branches:
             - main
             - diff-only-runs
-        # paths:
-        #     - "perf-changelog.yaml"
 
 jobs:
     get-jobs:
@@ -30,15 +28,112 @@ jobs:
 
                   echo "search-space-config=$CONFIG_JSON" >> $GITHUB_OUTPUT
 
-    sweep-multi-node-1k1k:
+    # ============================================
+    # Single Node - DeepSeek R1
+    # ============================================
+    sweep-single-node-dsr1-1k1k:
         needs: get-jobs
-        if: ${{ needs.get-jobs.outputs.search-space-config.multi_node['1k1k'] != '[]' }}
+        if: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['dsr1_1k1k'] != null && fromJson(needs.get-jobs.outputs.search-space-config).single_node['dsr1_1k1k'] != '[]' }}
+        uses: ./.github/workflows/benchmark-tmpl.yml
+        name: single-node dsr1_1k1k /
+        strategy:
+            fail-fast: false
+            matrix:
+                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['dsr1_1k1k'] }}
+        secrets: inherit
+        with: &single-node-inputs
+            exp-name: ${{ matrix.config.exp-name }}
+            isl: ${{ matrix.config.isl }}
+            osl: ${{ matrix.config.osl }}
+            max-model-len: ${{ matrix.config.max-model-len }}
+            runner: ${{ matrix.config.runner }}
+            image: ${{ matrix.config.image }}
+            model: ${{ matrix.config.model }}
+            model-prefix: ${{ matrix.config.model-prefix }}
+            framework: ${{ matrix.config.framework }}
+            precision: ${{ matrix.config.precision }}
+            tp: ${{ matrix.config.tp }}
+            ep: ${{ matrix.config.ep }}
+            dp-attn: ${{ matrix.config.dp-attn }}
+            conc: ${{ matrix.config.conc }}
+            spec-decoding: ${{ matrix.config.spec-decoding }}
+            disagg: ${{ matrix.config.disagg }}
+
+    sweep-single-node-dsr1-1k8k:
+        needs: get-jobs
+        if: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['dsr1_1k8k'] != null && fromJson(needs.get-jobs.outputs.search-space-config).single_node['dsr1_1k8k'] != '[]' }}
+        uses: ./.github/workflows/benchmark-tmpl.yml
+        name: single-node dsr1_1k8k /
+        strategy:
+            fail-fast: false
+            matrix:
+                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['dsr1_1k8k'] }}
+        secrets: inherit
+        with: *single-node-inputs
+
+    sweep-single-node-dsr1-8k1k:
+        needs: get-jobs
+        if: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['dsr1_8k1k'] != null && fromJson(needs.get-jobs.outputs.search-space-config).single_node['dsr1_8k1k'] != '[]' }}
+        uses: ./.github/workflows/benchmark-tmpl.yml
+        name: single-node dsr1_8k1k /
+        strategy:
+            fail-fast: false
+            matrix:
+                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['dsr1_8k1k'] }}
+        secrets: inherit
+        with: *single-node-inputs
+
+    # ============================================
+    # Single Node - GPT OSS
+    # ============================================
+    sweep-single-node-gptoss-1k1k:
+        needs: get-jobs
+        if: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['gptoss_1k1k'] != null && fromJson(needs.get-jobs.outputs.search-space-config).single_node['gptoss_1k1k'] != '[]' }}
+        uses: ./.github/workflows/benchmark-tmpl.yml
+        name: single-node gptoss_1k1k /
+        strategy:
+            fail-fast: false
+            matrix:
+                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['gptoss_1k1k'] }}
+        secrets: inherit
+        with: *single-node-inputs
+
+    sweep-single-node-gptoss-1k8k:
+        needs: get-jobs
+        if: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['gptoss_1k8k'] != null && fromJson(needs.get-jobs.outputs.search-space-config).single_node['gptoss_1k8k'] != '[]' }}
+        uses: ./.github/workflows/benchmark-tmpl.yml
+        name: single-node gptoss_1k8k /
+        strategy:
+            fail-fast: false
+            matrix:
+                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['gptoss_1k8k'] }}
+        secrets: inherit
+        with: *single-node-inputs
+
+    sweep-single-node-gptoss-8k1k:
+        needs: get-jobs
+        if: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['gptoss_8k1k'] != null && fromJson(needs.get-jobs.outputs.search-space-config).single_node['gptoss_8k1k'] != '[]' }}
+        uses: ./.github/workflows/benchmark-tmpl.yml
+        name: single-node gptoss_8k1k /
+        strategy:
+            fail-fast: false
+            matrix:
+                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['gptoss_8k1k'] }}
+        secrets: inherit
+        with: *single-node-inputs
+
+    # ============================================
+    # Multi Node - DeepSeek R1
+    # ============================================
+    sweep-multi-node-dsr1-1k1k:
+        needs: get-jobs
+        if: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['dsr1_1k1k'] != null && fromJson(needs.get-jobs.outputs.search-space-config).multi_node['dsr1_1k1k'] != '[]' }}
         uses: ./.github/workflows/benchmark-multinode-tmpl.yml
-        name: multi-node 1k1k /
+        name: multi-node dsr1_1k1k /
         strategy:
             fail-fast: false
             matrix:
-                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['1k1k'] }}
+                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['dsr1_1k1k'] }}
         secrets: inherit
         with: &multi-node-inputs
             isl: ${{ matrix.config.isl }}
@@ -67,91 +162,87 @@ jobs:
             decode-dp-attn: ${{ matrix.config.decode.dp-attn }}
             decode-additional-settings: ${{ toJson(matrix.config.decode.additional-settings) }}
 
-    sweep-multi-node-1k8k:
+    sweep-multi-node-dsr1-1k8k:
         needs: get-jobs
-        if: ${{ needs.get-jobs.outputs.search-space-config.multi_node['1k8k'] != '[]' }}
+        if: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['dsr1_1k8k'] != null && fromJson(needs.get-jobs.outputs.search-space-config).multi_node['dsr1_1k8k'] != '[]' }}
         uses: ./.github/workflows/benchmark-multinode-tmpl.yml
-        name: multi-node 1k8k /
+        name: multi-node dsr1_1k8k /
         strategy:
             fail-fast: false
             matrix:
-                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['1k8k'] }}
+                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['dsr1_1k8k'] }}
         secrets: inherit
         with: *multi-node-inputs
 
-    sweep-multi-node-8k1k:
+    sweep-multi-node-dsr1-8k1k:
         needs: get-jobs
-        if: ${{ needs.get-jobs.outputs.search-space-config.multi_node['8k1k'] != '[]' }}
+        if: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['dsr1_8k1k'] != null && fromJson(needs.get-jobs.outputs.search-space-config).multi_node['dsr1_8k1k'] != '[]' }}
         uses: ./.github/workflows/benchmark-multinode-tmpl.yml
-        name: multi-node 1k8k /
+        name: multi-node dsr1_8k1k /
         strategy:
             fail-fast: false
             matrix:
-                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['8k1k'] }}
+                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['dsr1_8k1k'] }}
         secrets: inherit
         with: *multi-node-inputs
 
-    sweep-single-node-1k1k:
+    # ============================================
+    # Multi Node - GPT OSS (add if needed)
+    # ============================================
+    sweep-multi-node-gptoss-1k1k:
         needs: get-jobs
-        if: ${{ needs.get-jobs.outputs.search-space-config.single_node['1k1k'] != '[]' }}
-        uses: ./.github/workflows/benchmark-tmpl.yml
-        name: single-node 1k1k /
+        if: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['gptoss_1k1k'] != null && fromJson(needs.get-jobs.outputs.search-space-config).multi_node['gptoss_1k1k'] != '[]' }}
+        uses: ./.github/workflows/benchmark-multinode-tmpl.yml
+        name: multi-node gptoss_1k1k /
         strategy:
             fail-fast: false
             matrix:
-                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['1k1k'] }}
+                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['gptoss_1k1k'] }}
         secrets: inherit
-        with: &single-node-inputs
-            exp-name: ${{ matrix.config.exp-name }}
-            isl: ${{ matrix.config.isl }}
-            osl: ${{ matrix.config.osl }}
-            max-model-len: ${{ matrix.config.max-model-len }}
-            runner: ${{ matrix.config.runner }}
-            image: ${{ matrix.config.image }}
-            model: ${{ matrix.config.model }}
-            model-prefix: ${{ matrix.config.model-prefix }}
-            framework: ${{ matrix.config.framework }}
-            precision: ${{ matrix.config.precision }}
-            tp: ${{ matrix.config.tp }}
-            ep: ${{ matrix.config.ep }}
-            dp-attn: ${{ matrix.config.dp-attn }}
-            conc: ${{ matrix.config.conc }}
-            spec-decoding: ${{ matrix.config.spec-decoding }}
-            disagg: ${{ matrix.config.disagg }}
+        with: *multi-node-inputs
 
-    sweep-single-node-1k8k:
+    sweep-multi-node-gptoss-1k8k:
         needs: get-jobs
-        if: ${{ needs.get-jobs.outputs.search-space-config.single_node['1k8k'] != '[]' }}
-        uses: ./.github/workflows/benchmark-tmpl.yml
-        name: single-node 1k8k /
+        if: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['gptoss_1k8k'] != null && fromJson(needs.get-jobs.outputs.search-space-config).multi_node['gptoss_1k8k'] != '[]' }}
+        uses: ./.github/workflows/benchmark-multinode-tmpl.yml
+        name: multi-node gptoss_1k8k /
         strategy:
             fail-fast: false
             matrix:
-                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['1k8k'] }}
+                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['gptoss_1k8k'] }}
         secrets: inherit
-        with: *single-node-inputs
+        with: *multi-node-inputs
 
-    sweep-single-node-8k1k:
+    sweep-multi-node-gptoss-8k1k:
         needs: get-jobs
-        if: ${{ needs.get-jobs.outputs.search-space-config.single_node['8k1k'] != '[]' }}
-        uses: ./.github/workflows/benchmark-tmpl.yml
-        name: single-node 8k1k /
+        if: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['gptoss_8k1k'] != null && fromJson(needs.get-jobs.outputs.search-space-config).multi_node['gptoss_8k1k'] != '[]' }}
+        uses: ./.github/workflows/benchmark-multinode-tmpl.yml
+        name: multi-node gptoss_8k1k /
         strategy:
             fail-fast: false
             matrix:
-                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).single_node['8k1k'] }}
+                config: ${{ fromJson(needs.get-jobs.outputs.search-space-config).multi_node['gptoss_8k1k'] }}
         secrets: inherit
-        with: *single-node-inputs
+        with: *multi-node-inputs
 
+    # ============================================
+    # Results Collection
+    # ============================================
     collect-results:
         needs:
             [
-                sweep-single-node-1k1k,
-                sweep-single-node-1k8k,
-                sweep-single-node-8k1k,
-                sweep-multi-node-1k1k,
-                sweep-multi-node-1k8k,
-                sweep-multi-node-8k1k,
+                sweep-single-node-dsr1-1k1k,
+                sweep-single-node-dsr1-1k8k,
+                sweep-single-node-dsr1-8k1k,
+                sweep-single-node-gptoss-1k1k,
+                sweep-single-node-gptoss-1k8k,
+                sweep-single-node-gptoss-8k1k,
+                sweep-multi-node-dsr1-1k1k,
+                sweep-multi-node-dsr1-1k8k,
+                sweep-multi-node-dsr1-8k1k,
+                sweep-multi-node-gptoss-1k1k,
+                sweep-multi-node-gptoss-1k8k,
+                sweep-multi-node-gptoss-8k1k,
             ]
         if: ${{ always() }}
         uses: ./.github/workflows/collect-results.yml
@@ -188,4 +279,4 @@ jobs:
             - uses: actions/upload-artifact@330a01c490aca151604b8cf639adc76d48f6c5d4 # v5.0.0
               with:
                   name: "run-stats"
-                  path: ${{ env.STATS_FILENAME }}.json
+                  path: ${{ env.STATS_FILENAME }}.json
diff --git a/utils/process_changelog.py b/utils/process_changelog.py
@@ -124,13 +124,18 @@ def main():
             print(e.stderr)
 
         all_results.extend(json.loads(result.stdout))
-
+        
     for result in all_results:
-        seq_len_str = seq_len_to_str(result["isl"], result["osl"])
+        exp_name = result['exp-name']
+        
         if "prefill" in result and result["prefill"] is not None:
-            final_results["multi_node"][seq_len_str].append(result)
+            final_results["multi_node"][exp_name].append(result)
         else:
-            final_results["single_node"][seq_len_str].append(result)
+            final_results["single_node"][exp_name].append(result)
+
+    # Convert defaultdicts to regular dicts for JSON serialization
+    final_results["single_node"] = dict(final_results["single_node"])
+    final_results["multi_node"] = dict(final_results["multi_node"])
 
     # pprint(final_results)
     print(json.dumps(final_results))