fix: add base worker npu support

UsernameFull · UsernameFull · commit 1e7f794625a1 · 2026-04-02T16:12:58.000+08:00
diff --git a/roll/pipeline/base_worker.py b/roll/pipeline/base_worker.py
@@ -451,8 +451,7 @@ async def offload_states_partial(self, target_dp_ranks: List[int]):
 
             # Verify offloaded workers have near-zero GPU memory usage
             if self.rank_info.dp_rank in target_dp_ranks:
-                import torch
-                gpu_memory_gb = torch.cuda.memory_allocated() / 1024**3
+                gpu_memory_gb = current_platform.memory_allocated() / 1024**3
                 if gpu_memory_gb > 1.0:
                     raise RuntimeError(
                         f"GPU memory not properly offloaded for Worker {self.rank} (DP {self.rank_info.dp_rank}): "
@@ -501,7 +500,7 @@ async def generate(self, data: DataProto):
         global_step = data.meta_info.get("global_step", 0)
         self.logger.info(f"{self.worker_name} generate global step {global_step}")
 
-        data = data.to("cuda")
+        data = data.to(current_platform.device_type)
         data.meta_info["micro_batch_size"] = self.worker_config.infer_batch_size
 
         output = await self.strategy.generate(batch=data, generation_config=generation_config)