fix condition

Ceng23333 · Ceng23333 · commit 1ea59e9951bc · 2026-04-24T01:31:18.000Z
Signed-off-by: Ceng23333 &lt;441651826@qq.com&gt;
diff --git a/src/infinicore/ops/multi_head_attention_varlen/mha_varlen_flashattn.cc b/src/infinicore/ops/multi_head_attention_varlen/mha_varlen_flashattn.cc
@@ -152,11 +152,7 @@ void run(void *planned_meta) {
 
 #if defined(ENABLE_METAX_API)
     run_flashattn_varlen_metax(p);
-    return;
-#endif
-
-    // Original InfiniCore path (NVIDIA + xmake flash-attn-nvidia). MetaX is handled above.
-#if defined(ENABLE_NVIDIA_API)
+#else
     c10::cuda::CUDAStreamGuard guard(infinicore::adaptor::get_cuda_stream());
 
     auto q = infinicore::adaptor::to_aten_tensor(p->q);
@@ -195,8 +191,6 @@ void run(void *planned_meta) {
         0.0,
         false,
         std::nullopt);
-#else
-    throw std::runtime_error("FlashAttention varlen: no supported GPU backend in this build");
 #endif
 
 #else