feat: Add NVFP4 (E2M1) quantize/dequantize CUDA kernels #2307
| Job | Run time |
|---|---|
| 13s | |
| 41s | |
| 3m 19s | |
| 15s | |
| 2m 13s | |
| 2m 49s | |
| 14s | |
| 2m 53s | |
| 2m 54s | |
| 2m 53s | |
| 2m 57s | |
| 2m 39s | |
| 3m 20s | |
| 3m 20s | |
| 3m 21s | |
| 3m 20s | |
| 3m 21s | |
| 3m 21s | |
| 3m 20s | |
| 3m 18s | |
| 3m 19s | |
| 3m 20s | |
| 3m 20s | |
| 3m 19s | |
| 3m 16s | |
| 3m 16s | |
| 3m 16s | |
| 3m 16s | |
| 3m 17s | |
| 3m 14s | |
| 3m 20s | |
| 3m 18s | |
| 3m 16s | |
| 3m 17s | |
| 3m 16s | |
| 3m 15s | |
| 3m 17s | |
| 3m 23s | |
| 3m 9s | |
| 3m 18s | |
| 3m 16s | |
| 3m 16s | |
| 3m 16s | |
| 3m 7s | |
| 3m 16s | |
| 1s | |
| 1s | |
| 1s | |
| 1s | |
| 2h 12m 38s |