Fix weight-only quantization for TEGroupedMLP (MoE models)#971

Merged

jenchen13 merged 7 commits intoNVIDIA:mainfrom

jQizhang:weight_only_te_fix

Apr 3, 2026

Commits on Mar 12, 2026

Fix nvfp4 weight-only quantization for TEGroupedMLP (MoE models)
jQizhang
committed

Commits on Mar 18, 2026

Merge remote-tracking branch 'origin/main' into weight_only_te_fix
jQizhang
committed

Commits on Mar 21, 2026

Commits on Mar 23, 2026

Merge branch 'main' into weight_only_te_fix
jQizhang
authored

Commits on Mar 25, 2026

Merge branch 'main' into weight_only_te_fix
jQizhang
authored

Commits on Apr 3, 2026

Merge branch 'main' into weight_only_te_fix
jenchen13
authored