Update scripts

OliverRietmann · OliverRietmann · commit 2457847d6ff1 · 2026-04-08T20:19:29.000+02:00
diff --git a/.github/scripts/csv_to_md.py b/.github/scripts/csv_to_md.py
@@ -13,14 +13,16 @@ def get_2d_list(csv_filename):
   with open(csv_filename) as csv_file:
     csv_reader = csv.reader(csv_file)
     next(csv_reader)
-    return [[str(name), float(mean), float(stdev)] for name, mean, stdev in csv_reader]
+    return [[str(name), float(mean), float(stdev), int(count)] for name, mean, stdev, count in csv_reader]
 
 table_baseline = get_2d_list(args.baseline)
 table_current = get_2d_list(args.current)
 
-def student(meanX, stdevX, runsX, meanY, stdevY, runsY):
-  s2 = ((runsX - 1) * stdevX**2 + (runsY - 1) * stdevY**2) / (runsX + runsY - 2)
-  return (meanX - meanY) / math.sqrt(s2 / runsX + s2 / runsY) if s2 > 0.0 else 0.0
+def student(x, sx, m, y, sy, n):
+  s = 0.0 if m < 2 or n < 2 else math.sqrt(((m - 1) * sx**2 + (n - 1) * sy**2) / (m + n - 2))
+  d = x - y
+  t = 0.0 if s == 0.0 else math.sqrt((n * m) / (n + m)) * d / s
+  return d, s, t
 
 def get_emoji(t):
   quantile = 2.0 # 95% confidence interval
@@ -33,13 +35,13 @@ def get_emoji(t):
 
 table = []
 for baseline, current in zip(table_baseline, table_current):
-  baseline_name, baseline_mean, baseline_stdev = baseline
-  name, mean, stdev = current
+  baseline_name, baseline_mean, baseline_stdev, count_baseline = baseline
+  name, mean, stdev, count = current
   assert(baseline_name == name)
-  diff = baseline_mean - mean
-  t = student(baseline_mean, baseline_stdev, args.runs, mean, stdev, args.runs) if args.runs > 2 else 0.0
+  total_time = mean * (count // args.runs)
+  d, s, t = student(baseline_mean, baseline_stdev, args.runs, mean, stdev, args.runs)
   emoji = get_emoji(t)
-  table.append([name, int(mean), f'{stdev:.2f}', int(diff), f'{t:.2f}', emoji])
+  table.append([name, int(total_time), int(mean), f'{stdev:.2f}', f'{d:.2f}', f'{t:.2f}', emoji])
 
-header = ['name', 'mean (\u03BCs)', 'stdev \u03C3', 'diff \u0394', 't', '']
+header = ['name', 'total time (\u03BCs)', 'mean (\u03BCs)', 'stdev \u03C3', 'diff \u0394', 't', '']
 print(tab.tabulate(table, header, tablefmt="github"))
diff --git a/.github/scripts/profiler_ncu.py b/.github/scripts/profiler_ncu.py
@@ -3,7 +3,6 @@
 import statistics
 
 parser = argparse.ArgumentParser()
-parser.add_argument('-r', '--runs', type=int, required=True, help='Number of runs')
 parser.add_argument('-i', '--input', required=True, help='Input CSV file')
 parser.add_argument('-o', '--output', required=True, help='Output CSV file')
 args = parser.parse_args()
@@ -22,12 +21,12 @@
       else:
         kernel_dict[name] = [time]
 
-data = [["name", "time", "stdev"]]
+data = [["name", "time", "stdev", "count"]]
 for name, time_list in kernel_dict.items():
-  count = len(time_list) // args.runs
-  mean = statistics.mean(time_list) * count
-  stdev = 0 if args.runs == 1 else statistics.stdev(time_list) * count
-  data.append([name, mean, stdev])
+  count = len(time_list)
+  mean = statistics.mean(time_list)
+  stdev = 0 if count == 1 else statistics.stdev(time_list)
+  data.append([name, mean, stdev, count])
 
 with open(args.output, 'w') as csv_file:
   csv_writer = csv.writer(csv_file)
diff --git a/.github/scripts/profiler_nsys.py b/.github/scripts/profiler_nsys.py
@@ -3,12 +3,11 @@
 import statistics
 
 parser = argparse.ArgumentParser()
-parser.add_argument('-r', '--runs', type=int, required=True, help='Number of runs')
 parser.add_argument('-i', '--input', required=True, help='Input CSV file')
 parser.add_argument('-o', '--output', required=True, help='Output CSV file')
 args = parser.parse_args()
 
-ntsi_list = []
+kernel_list = []
 with open(args.input) as csv_file:
   csv_reader = csv.reader(csv_file)
   next(csv_reader)
@@ -17,21 +16,17 @@
   for row in csv_reader:
     if row:
       full_name = row[8]
-      instances = int(row[2])
-      time = float(row[3])
-      sigma = float(row[7])
+      count = int(row[2])
+      mean = float(row[3])
+      stdev = float(row[7])
       if len(full_name) > 5 and full_name[:5] == "krnl_":
         name = full_name[5:]
-        ntsi_list.append([name, time, sigma, instances])
+        kernel_list.append([name, mean, stdev, count])
 
-ntsi_list.sort(key = lambda row: row[0])
+kernel_list.sort(key = lambda row: row[0])
 
-data = [["name", "time", "stdev"]]
-for name, time, sigma, instances in ntsi_list:
-  count = instances / args.runs
-  mean = int(time * count)
-  stdev = sigma * count
-  data.append([name, mean, stdev])
+data = [["name", "mean", "stdev", "count"]]
+data += kernel_list
 
 with open(args.output, 'w') as csv_file:
   csv_writer = csv.writer(csv_file)
diff --git a/.github/scripts/profiler_rocprofv2.py b/.github/scripts/profiler_rocprofv2.py
@@ -3,12 +3,11 @@
 import statistics
 
 parser = argparse.ArgumentParser()
-parser.add_argument('-r', '--runs', type=int, required=True, help='Number of runs')
 parser.add_argument('-i', '--input', required=True, help='Input CSV file')
 parser.add_argument('-o', '--output', required=True, help='Output CSV file')
 args = parser.parse_args()
 
-time_dict = dict({})
+kernel_dict = dict({})
 with open(args.input) as csv_file:
   csv_reader = csv.reader(csv_file)
   next(csv_reader)
@@ -17,17 +16,17 @@
     time = (int(row[15]) - int(row[14])) / 1000.0
     if len(full_name) > 5 and full_name[:5] == "krnl_":
       name = full_name[5:-3]
-      if name in time_dict.keys():
-        time_dict[name].append(time)
+      if name in kernel_dict.keys():
+        kernel_dict[name].append(time)
       else:
-        time_dict[name] = [time]
+        kernel_dict[name] = [time]
 
-data = [["name", "time", "stdev"]]
-for name, time_list in time_dict.items():
-  count = len(time_list) / args.runs
-  mean = int(statistics.mean(time_list) * count)
-  stdev = 0 if args.runs == 1 else statistics.stdev(time_list) * count
-  data.append([name, mean, stdev])
+data = [["name", "mean", "stdev", "count"]]
+for name, time_list in kernel_dict.items():
+  count = len(time_list)
+  mean = statistics.mean(time_list)
+  stdev = 0 if count == 1 else statistics.stdev(time_list)
+  data.append([name, mean, stdev, count])
 
 with open(args.output, 'w') as csv_file:
   csv_writer = csv.writer(csv_file)
diff --git a/.github/scripts/profiler_standalone.py b/.github/scripts/profiler_standalone.py
@@ -1,5 +1,6 @@
 import argparse
 import csv
+import math
 import statistics
 
 parser = argparse.ArgumentParser()
@@ -9,23 +10,27 @@
 args = parser.parse_args()
 
 time_dict = dict({})
+count_dict = dict({})
 with open(args.input) as csv_file:
   csv_reader = csv.reader(csv_file)
   next(csv_reader)
   for row in csv_reader:
     name = row[2]
     time = float(row[3])
+    count = row[1]
     if name in time_dict.keys():
       time_dict[name].append(time)
     else:
       time_dict[name] = [time]
+      count_dict[name] = 1 if count == '' else int(count)
 
-data = [["name", "time", "stdev"]]
+data = [["name", "mean", "stdev", "count"]]
 for name, time_list in time_dict.items():
-  mean = int(statistics.mean(time_list[args.discard:]))
+  count = count_dict[name]
+  mean = statistics.mean(time_list[args.discard:]) / count
   runs = len(time_list[args.discard:])
-  stdev = 0.0 if runs == 1 else statistics.stdev(time_list[args.discard:])
-  data.append([name, mean, stdev])
+  stdev = 0.0 if runs == 1 else statistics.stdev(time_list[args.discard:]) / math.sqrt(count)
+  data.append([name, mean, stdev, runs * count])
 
 with open(args.output, 'w') as csv_file:
   csv_writer = csv.writer(csv_file)
diff --git a/.github/workflows/standalone-benchmark.yml b/.github/workflows/standalone-benchmark.yml
@@ -104,8 +104,8 @@ jobs:
           source /etc/profile.d/modules.sh
           module load ninja/fortran-v1.11.1.g9-15 Vc/1.4.5-10 boost/v1.83.0-alice2-57 fmt/11.1.2-14 CMake/v3.31.6-10 ms_gsl/4.2.1-3 Clang/v20.1.7-9 TBB/v2022.3.0-3 ROOT/v6-36-04-alice9-15 ONNXRuntime/v1.22.0-71 GLFW/3.3.2-25
           cd ${STANDALONE_DIR}
-          ${TIMING_CA} --debug 1 --runs ${{ matrix.standalone_runs }} --runsInit 2 --PROCdebugMarkdown 1 --PROCresetTimers 1 --PROCdebugCSV /root/${BENCHMARK_CSV}
-          python3 ${GITHUB_WORKSPACE}/.github/scripts/merge_runs.py --discard 2 --input /root/${BENCHMARK_CSV} --output /root/summary_${BENCHMARK_CSV}
+          ${TIMING_CA} --debug 1 --runs ${{ matrix.standalone_runs }} --runsInit 0 --PROCdebugMarkdown 1 --PROCresetTimers 1 --PROCdebugCSV /root/${BENCHMARK_CSV}
+          python3 ${GITHUB_WORKSPACE}/.github/scripts/profiler_standalone.py --discard 0 --input /root/${BENCHMARK_CSV} --output /root/summary_${BENCHMARK_CSV}
       
       - name: Profiler - Nsight Compute
         if: ${{ matrix.name == 'nvidia-h100' }}
@@ -117,7 +117,7 @@ jobs:
           ncu --set none --metrics gpu__time_duration.avg --export ${{ matrix.name }} --clock-control none --force-overwrite ${TIMING_CA} --runs ${{ matrix.profiler_runs }} --debug 1 --PROCdebugMarkdown 1  # Generates ${{ matrix.name }}.ncu-rep
           ncu --import ${STANDALONE_DIR}/${{ matrix.name }}.ncu-rep --print-units base --csv > /root/${PROFILER_CSV}
           rm -rf ${STANDALONE_DIR}/events/50kHz ${STANDALONE_DIR}/build
-          python3 ${GITHUB_WORKSPACE}/.github/scripts/profiler_ncu.py --runs ${{ matrix.profiler_runs }} --input /root/${PROFILER_CSV} --output /root/summary_${PROFILER_CSV}
+          python3 ${GITHUB_WORKSPACE}/.github/scripts/profiler_ncu.py --input /root/${PROFILER_CSV} --output /root/summary_${PROFILER_CSV}
 
       - name: Profiler - Nsight Systems
         if: ${{ matrix.name == 'nvidia-l40s' }}
@@ -130,7 +130,7 @@ jobs:
           nsys profile -o ${{ matrix.name }} ${TIMING_CA} --runs ${{ matrix.profiler_runs }} --debug 1 --PROCdebugMarkdown 1  # Generates ${{ matrix.name }}.nsys-rep
           nsys stats --report cuda_gpu_kern_sum --timeunit usec --force-export=true --format csv ${{ matrix.name }}.nsys-rep > /root/${PROFILER_CSV}
           rm -rf ${STANDALONE_DIR}/events/50kHz ${STANDALONE_DIR}/build
-          python3 ${GITHUB_WORKSPACE}/.github/scripts/profiler_nsys.py --runs ${{ matrix.profiler_runs }} --input /root/${PROFILER_CSV} --output /root/summary_${PROFILER_CSV}
+          python3 ${GITHUB_WORKSPACE}/.github/scripts/profiler_nsys.py --input /root/${PROFILER_CSV} --output /root/summary_${PROFILER_CSV}
 
       - name: Profiler - rocprofv2
         if: ${{ matrix.name == 'amd-mi300x' || matrix.name == 'amd-w7900' }}
@@ -141,7 +141,7 @@ jobs:
           rocprofv2 --output-directory /root --output-file-name ${{ matrix.name }} ${TIMING_CA} --runs ${{ matrix.standalone_runs }} --debug 1 --PROCdebugMarkdown 1  # Generates results_${{ matrix.name }}.csv
           rm -rf ${STANDALONE_DIR}/events/50kHz ${STANDALONE_DIR}/build
           mv /root/results_${{ matrix.name }}.csv /root/${PROFILER_CSV}
-          python3 ${GITHUB_WORKSPACE}/.github/scripts/profiler_rocprofv2.py --runs ${{ matrix.profiler_runs }} --input /root/${PROFILER_CSV} --output /root/summary_${PROFILER_CSV}
+          python3 ${GITHUB_WORKSPACE}/.github/scripts/profiler_rocprofv2.py --input /root/${PROFILER_CSV} --output /root/summary_${PROFILER_CSV}
 
       - name: Upload Artifact
         uses: actions/upload-artifact@v6