huggingface · dg845 · Mar 24, 2026 · Mar 17, 2026 · Mar 17, 2026 · Mar 17, 2026
diff --git a/src/diffusers/models/attention_dispatch.py b/src/diffusers/models/attention_dispatch.py
@@ -813,6 +813,9 @@ def _native_attention_forward_op(
     if return_lse:
         raise ValueError("Native attention does not support return_lse=True")
 
+    if attn_mask is not None and attn_mask.dim() == 2:
+        attn_mask = attn_mask[:, None, None, :]
 class TestFluxTransformerContextParallel(FluxTransformerTesterConfig, ContextParallelTesterMixin): 
 class TestFluxTransformerContextParallel(FluxTransformerTesterConfig, ContextParallelTesterMixin): 
 batch_size = 1 
 class TestFluxTransformerContextParallel(FluxTransformerTesterConfig, ContextParallelTesterMixin): 
 class TestFluxTransformerContextParallel(FluxTransformerTesterConfig, ContextParallelTesterMixin): 
 batch_size = 1 
+
     # used for backward pass
     if _save_ctx:
         ctx.save_for_backward(query, key, value)