Small refactors and comments to explain return values and reduce code duplication

nv-alicheng · nv-alicheng · commit ad19ae1e2002 · 2025-12-16T12:56:53.000-08:00
diff --git a/src/inference_endpoint/load_generator/load_generator.py b/src/inference_endpoint/load_generator/load_generator.py
@@ -124,6 +124,7 @@ def __init__(
         self,
         sample_issuer: SampleIssuer,
         dataloader: DataLoader,
+        name: str | None = None,
     ):
         """Initialize load generator with required dependencies.
 
@@ -133,7 +134,7 @@ def __init__(
         """
         self.sample_issuer = sample_issuer
         self.dataloader = dataloader
-
+        self.name = name
         self.uuid_to_index_map = {}
 
     @abstractmethod
diff --git a/src/inference_endpoint/load_generator/session.py b/src/inference_endpoint/load_generator/session.py
@@ -75,6 +75,7 @@ def _run_test(
                 )
 
                 for _ in perf_test_generator:
+                    # Actual issue is done during next(generator). Nothing else to do here, just pass.
                     pass
 
                 EventRecorder.record_event(
@@ -84,6 +85,7 @@ def _run_test(
                 if accuracy_test_generators:
                     for _, generator in accuracy_test_generators.items():
                         for _ in generator:
+                            # Actual issue is done during next(generator). Nothing else to do here, just pass.
                             pass
 
                 self.event_recorder.should_check_idle = True
@@ -134,11 +136,17 @@ def _run_test(
                 report = reporter.create_report(tokenizer)
 
                 # Consolidate UUID->index mappings
+                perf_name = (
+                    perf_test_generator.name
+                    if perf_test_generator.name
+                    else "performance"
+                )
                 sample_idx_map = {
-                    "performance": perf_test_generator.uuid_to_index_map,
+                    perf_name: perf_test_generator.uuid_to_index_map,
                 }
                 if accuracy_test_generators:
-                    for name, generator in accuracy_test_generators.items():
+                    for default_name, generator in accuracy_test_generators.items():
+                        name = generator.name if generator.name else default_name
                         sample_idx_map[name] = generator.uuid_to_index_map
                 self.sample_uuid_map = sample_idx_map
 
diff --git a/src/inference_endpoint/metrics/reporter.py b/src/inference_endpoint/metrics/reporter.py
@@ -523,6 +523,15 @@ def display(
             fn("\n")
 
 
+def _output_sequence_to_str(output_sequence: str | list[str]) -> str | None:
+    if isinstance(output_sequence, list):
+        return "".join(output_sequence)
+    elif isinstance(output_sequence, str):
+        return output_sequence
+    else:
+        return None
+
+
 def output_sequence_from_data(
     data_bytes: bytes,
     join_chunks: bool = True,
@@ -553,51 +562,37 @@ def output_sequence_from_data(
         logging.warning("Failed to decode data bytes")
         return None, None
 
-    output_sequence = None
-    reasoning_sequence = None
-
+    output, reasoning = None, None
     if isinstance(decoded_data, str):
         # If decoded value is a string, it's the output sequence
-        output_sequence = decoded_data
+        output = decoded_data
     elif isinstance(decoded_data, dict):
         # If decoded value is a dict, extract 'output' and optionally 'reasoning'
         if "output" not in decoded_data:
             logging.warning("Dictionary data missing required 'output' key")
             return None, None
 
         # Extract output - can be string or list of strings
-        output = decoded_data["output"]
-        if isinstance(output, list):
-            if join_chunks:
-                output_sequence = "".join(output)
-            else:
-                output_sequence = output
-        elif isinstance(output, str):
-            output_sequence = output
-        else:
+        output = (
+            _output_sequence_to_str(decoded_data["output"])
+            if join_chunks
+            else decoded_data["output"]
+        )
+        if output is None:
             logging.warning(f"Output field has unexpected type: {type(output)}")
             return None, None
 
         # Extract reasoning if present - can be string or list of strings
         if "reasoning" in decoded_data:
-            reasoning = decoded_data["reasoning"]
-            if isinstance(reasoning, list):
-                if join_chunks:
-                    reasoning_sequence = "".join(reasoning)
-                else:
-                    reasoning_sequence = reasoning
-            elif isinstance(reasoning, str):
-                reasoning_sequence = reasoning
-            else:
-                logging.warning(
-                    f"Reasoning field has unexpected type: {type(reasoning)}"
-                )
-                # Continue with output_sequence, reasoning is optional
+            reasoning = (
+                _output_sequence_to_str(decoded_data["reasoning"])
+                if join_chunks
+                else decoded_data["reasoning"]
+            )
     else:
         logging.warning(f"Decoded data has unexpected type: {type(decoded_data)}")
         return None, None
-
-    return output_sequence, reasoning_sequence
+    return output, reasoning
 
 
 class MetricsReporter:
@@ -664,7 +659,8 @@ def stop_performance_tracking_timestamp_ns(self) -> float:
         """Returns the timestamp_ns of the STOP_PERFORMANCE_TRACKING event.
 
         This method is cached to prevent re-derivation. If the event is not found,
-        returns positive infinity.
+        returns positive infinity, since this indicates that the performance run is probably still
+        running, or the test was killed before it could complete.
 
         Returns:
             float: The timestamp_ns of STOP_PERFORMANCE_TRACKING event, or float('inf') if not found.
@@ -677,6 +673,9 @@ def stop_performance_tracking_timestamp_ns(self) -> float:
         """).fetchone()
 
         if result is None:
+            logging.warning(
+                "No STOP_PERFORMANCE_TRACKING event found, performance run not yet complete"
+            )
             return float("inf")
         return float(result[0])