Skip to content

feat: Add NVFP4 (E2M1) quantize/dequantize CUDA kernels #2307

feat: Add NVFP4 (E2M1) quantize/dequantize CUDA kernels

feat: Add NVFP4 (E2M1) quantize/dequantize CUDA kernels #2307

Job Run time
13s
41s
3m 19s
15s
2m 13s
2m 49s
14s
2m 53s
2m 54s
2m 53s
2m 57s
2m 39s
3m 20s
3m 20s
3m 21s
3m 20s
3m 21s
3m 21s
3m 20s
3m 18s
3m 19s
3m 20s
3m 20s
3m 19s
3m 16s
3m 16s
3m 16s
3m 16s
3m 17s
3m 14s
3m 20s
3m 18s
3m 16s
3m 17s
3m 16s
3m 15s
3m 17s
3m 23s
3m 9s
3m 18s
3m 16s
3m 16s
3m 16s
3m 7s
3m 16s
1s
1s
1s
1s
2h 12m 38s