Nits

remi-or · remi-or · commit b201bfa6bd5b · 2026-05-14T14:12:22.000Z
diff --git a/src/transformers/generation/continuous_batching/continuous_api.py b/src/transformers/generation/continuous_batching/continuous_api.py
@@ -570,7 +570,7 @@ def switch_to_paged_attn(self, model: ProtoPretrainedModel) -> None:
     @traced
     def start(self) -> None:
         """Start the background generation thread."""
-        if self._generation_thread is not None and self._generation_thread.is_alive():
+        if self.is_running():
             logger.warning("Manager thread is already running.")
             return
         self.stop_event.clear()
diff --git a/tests/generation/test_continuous_batching.py b/tests/generation/test_continuous_batching.py
@@ -367,6 +367,7 @@ def test_continuous_batching_will_allocation_be_successful(
             config=AutoConfig.from_pretrained("HuggingFaceTB/SmolLM-1.7B", attn_implementation="sdpa"),
             continuous_batching_config=ContinuousBatchingConfig(block_size=16, num_blocks=8, max_batch_tokens=8),
             device=torch_device,
+            tp_plan={},
             distributed_helper=DistributedHelper(device_mesh=None),
         )
 
@@ -700,9 +701,7 @@ def test_continuous_batching_config_combinations_no_compile(
             attn_implementation=attn_implementation,
         )
 
-    @parameterized.expand(
-        [("eager", False), ("sdpa", False), ("sdpa", True), ("flash_attention_2", True)]
-    )
+    @parameterized.expand([("eager", False), ("sdpa", False), ("sdpa", True), ("flash_attention_2", True)])
     @slow
     def test_continuous_batching_config_combinations_with_compile(
         self,
@@ -1211,11 +1210,11 @@ def test_per_request_logits_processors(self, use_cuda_graph: bool, use_async_bat
             use_async_batching=use_async_batching,
             per_request_processors=True,
             return_logprobs=True,
+            q_padding_interval_size=16,  # allows for exact comparison between CB and regular generation
         )
         manager = model.init_continuous_batching(
             generation_config=generation_config,
             continuous_batching_config=continuous_batching_config,
-            q_padding_interval_size=16,  # allows for exact comparison between CB and regular generation
         )
 
         # Trick to have temperature, top-k, top-p ... without randomness: diable sampling after manager creation