Skip to content

feat: Template hand-written NVFP4 GEMM for BF16/FP32 output #2381

feat: Template hand-written NVFP4 GEMM for BF16/FP32 output

feat: Template hand-written NVFP4 GEMM for BF16/FP32 output #2381

Job Run time
3m 42s
1m 44s
11s
1m 38s
46s
3m 19s
14s
3m 3s
3m 18s
3m 18s
3m 19s
3m 19s
3m 44s
3m 44s
3m 44s
3m 35s
3m 44s
3m 45s
3m 45s
3m 42s
3m 29s
3m 44s
3m 38s
3m 28s
3m 45s
3m 44s
3m 31s
3m 23s
3m 50s
3m 43s
3m 22s
3m 42s
3m 41s
3m 41s
3m 42s
3m 41s
3m 45s
3m 42s
3m 40s
3m 44s
3m 42s
3m 21s
3m 40s
3m 41s
3m 42s
1s
1s
1s
1s
2h 28m 39s