fix: make NVIDIA CUDA targets shared to prevent segfault

voltjia · voltjia · commit 638dfcbd3206 · 2026-04-16T07:31:52.000Z
Change `infiniop-nvidia`, `infinirt-nvidia`, `infiniccl-nvidia` from
static to shared libraries so that `nvcc` performs proper CUDA device
linking within each `.so`. When these were static archives, `g++`
linked them into downstream shared libraries without device linking,
corrupting `.nv_fatbin` registration and causing segfaults in
`__cudaRegisterLinkedBinary` during `dlopen`.

Also replace no-op `on_install` with proper `set_installdir` for all
four NVIDIA targets (including `flash-attn-nvidia`).
diff --git a/xmake/nvidia.lua b/xmake/nvidia.lua
@@ -14,9 +14,9 @@ local FLASH_ATTN_ROOT = get_config("flash-attn")
 local INFINI_ROOT = os.getenv("INFINI_ROOT") or (os.getenv(is_host("windows") and "HOMEPATH" or "HOME") .. "/.infini")
 
 target("infiniop-nvidia")
-    set_kind("static")
+    set_kind("shared")
     add_deps("infini-utils")
-    on_install(function (target) end)
+    set_installdir(os.getenv("INFINI_ROOT") or (os.getenv(is_host("windows") and "HOMEPATH" or "HOME") .. "/.infini"))
 
     set_policy("build.cuda.devlink", true)
     set_toolchains("cuda")
@@ -101,9 +101,9 @@ target("infiniop-nvidia")
 target_end()
 
 target("infinirt-nvidia")
-    set_kind("static")
+    set_kind("shared")
     add_deps("infini-utils")
-    on_install(function (target) end)
+    set_installdir(os.getenv("INFINI_ROOT") or (os.getenv(is_host("windows") and "HOMEPATH" or "HOME") .. "/.infini"))
 
     set_policy("build.cuda.devlink", true)
     set_toolchains("cuda")
@@ -124,9 +124,9 @@ target("infinirt-nvidia")
 target_end()
 
 target("infiniccl-nvidia")
-    set_kind("static")
+    set_kind("shared")
     add_deps("infinirt")
-    on_install(function (target) end)
+    set_installdir(os.getenv("INFINI_ROOT") or (os.getenv(is_host("windows") and "HOMEPATH" or "HOME") .. "/.infini"))
     if has_config("ccl") then
         set_policy("build.cuda.devlink", true)
         set_toolchains("cuda")
@@ -202,6 +202,6 @@ target("flash-attn-nvidia")
         on_build(function (target) end)
     end
 
-    on_install(function (target) end)
+    set_installdir(os.getenv("INFINI_ROOT") or (os.getenv(is_host("windows") and "HOMEPATH" or "HOME") .. "/.infini"))
 
 target_end()