Commit 9725a31

authored

CUDA: reduce MMQ stream-k overhead (ggml-org#22298)

* CUDA: reduce MMQ stream-k overhead * use 32 bit integers for kbc

1 parent d164904 commit 9725a31Copy full SHA for 9725a31

1 file changed

Comments

(0)

Provide feedback