aws
diff --git a/‎sagemaker-serve/src/sagemaker/serve/async_inference/__init__.py‎
Lines changed: 3 additions & 1 deletion b/‎sagemaker-serve/src/sagemaker/serve/async_inference/__init__.py‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎sagemaker-serve/src/sagemaker/serve/async_inference/async_inference_config.py‎
Lines changed: 2 additions & 2 deletions b/‎sagemaker-serve/src/sagemaker/serve/async_inference/async_inference_config.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎sagemaker-serve/src/sagemaker/serve/model_builder.py‎
Lines changed: 715 additions & 530 deletions b/‎sagemaker-serve/src/sagemaker/serve/model_builder.py‎
Lines changed: 715 additions & 530 deletions
diff --git a/‎sagemaker-serve/tests/unit/test_artifact_path_propagation.py‎
Lines changed: 124 additions & 125 deletions b/‎sagemaker-serve/tests/unit/test_artifact_path_propagation.py‎
Lines changed: 124 additions & 125 deletions
diff --git a/‎sagemaker-serve/tests/unit/test_artifact_path_resolution.py‎
Lines changed: 133 additions & 175 deletions b/‎sagemaker-serve/tests/unit/test_artifact_path_resolution.py‎
Lines changed: 133 additions & 175 deletions
diff --git a/‎sagemaker-serve/tests/unit/test_compute_requirements_resolution.py‎
Lines changed: 314 additions & 281 deletions b/‎sagemaker-serve/tests/unit/test_compute_requirements_resolution.py‎
Lines changed: 314 additions & 281 deletions
diff --git a/‎sagemaker-serve/tests/unit/test_deploy_passes_inference_config.py‎
Lines changed: 60 additions & 66 deletions b/‎sagemaker-serve/tests/unit/test_deploy_passes_inference_config.py‎
Lines changed: 60 additions & 66 deletions
@@ -16,4 +16,6 @@
 
 from sagemaker.core.inference_config import AsyncInferenceConfig  # noqa: F401
 from sagemaker.serve.async_inference.waiter_config import WaiterConfig  # noqa: F401
-from sagemaker.serve.async_inference.async_inference_response import AsyncInferenceResponse  # noqa: F401
+from sagemaker.serve.async_inference.async_inference_response import (
+    AsyncInferenceResponse,
+)  # noqa: F401
@@ -33,7 +33,7 @@
     "  from sagemaker.core.inference_config import AsyncInferenceConfig\n"
     "This compatibility shim will be removed in a future version.",
     DeprecationWarning,
-    stacklevel=2
+    stacklevel=2,
 )
 
-__all__ = ['AsyncInferenceConfig']
+__all__ = ["AsyncInferenceConfig"]
@@ -25,7 +25,7 @@ def setUp(self):
         self.mock_session.sagemaker_config = {}
         self.mock_session.settings = Mock()
         self.mock_session.settings.include_jumpstart_tags = False
-        
+
         mock_credentials = Mock()
         mock_credentials.access_key = "test-key"
         mock_credentials.secret_key = "test-secret"
@@ -34,172 +34,166 @@ def setUp(self):
         self.mock_session.boto_session.get_credentials.return_value = mock_credentials
         self.mock_session.boto_session.region_name = "us-west-2"
 
-    @patch('sagemaker.serve.model_builder.ModelBuilder._deploy_model_customization')
-    @patch('sagemaker.serve.model_builder.ModelBuilder._is_model_customization')
-    @patch('sagemaker.serve.model_builder.ModelBuilder._fetch_default_instance_type_for_custom_model')
+    @patch("sagemaker.serve.model_builder.ModelBuilder._deploy_model_customization")
+    @patch("sagemaker.serve.model_builder.ModelBuilder._is_model_customization")
+    @patch(
+        "sagemaker.serve.model_builder.ModelBuilder._fetch_default_instance_type_for_custom_model"
+    )
     def test_deploy_passes_inference_config_to_deploy_model_customization(
         self,
         mock_fetch_default_instance,
         mock_is_model_customization,
-        mock_deploy_model_customization
+        mock_deploy_model_customization,
     ):
         """Test that deploy() passes inference_config parameter to _deploy_model_customization."""
         # Setup: Mock model customization check
         mock_is_model_customization.return_value = True
         mock_fetch_default_instance.return_value = "ml.g5.12xlarge"
-        
+
         # Setup: Mock _deploy_model_customization to return a mock endpoint
         mock_endpoint = Mock()
         mock_deploy_model_customization.return_value = mock_endpoint
-        
+
         # Create ModelBuilder
         builder = ModelBuilder(
             model="huggingface-llm-mistral-7b",
             model_metadata={
                 "CUSTOM_MODEL_ID": "huggingface-llm-mistral-7b",
-                "CUSTOM_MODEL_VERSION": "1.0.0"
+                "CUSTOM_MODEL_VERSION": "1.0.0",
             },
             instance_type="ml.g5.12xlarge",
             mode=Mode.SAGEMAKER_ENDPOINT,
             role_arn="arn:aws:iam::123456789012:role/TestRole",
             sagemaker_session=self.mock_session,
-            image_uri="123456789012.dkr.ecr.us-west-2.amazonaws.com/test:latest"
+            image_uri="123456789012.dkr.ecr.us-west-2.amazonaws.com/test:latest",
         )
-        
+
         # Mark as built
         builder.built_model = Mock()
-        
+
         # Create inference_config
         inference_config = ResourceRequirements(
-            requests={
-                "num_cpus": 8,
-                "memory": 16384,
-                "num_accelerators": 4
-            }
+            requests={"num_cpus": 8, "memory": 16384, "num_accelerators": 4}
         )
-        
+
         # Execute: Call deploy() with inference_config
         result = builder.deploy(
             endpoint_name="test-endpoint",
             inference_config=inference_config,
             initial_instance_count=1,
-            wait=True
+            wait=True,
         )
-        
+
         # Verify: _deploy_model_customization was called with inference_config
         assert mock_deploy_model_customization.called
         call_kwargs = mock_deploy_model_customization.call_args[1]
-        
+
         # Verify inference_config was passed through
-        assert 'inference_config' in call_kwargs
-        assert call_kwargs['inference_config'] == inference_config
-        
+        assert "inference_config" in call_kwargs
+        assert call_kwargs["inference_config"] == inference_config
+
         # Verify other parameters were also passed
-        assert call_kwargs['endpoint_name'] == "test-endpoint"
-        assert call_kwargs['initial_instance_count'] == 1
-        assert call_kwargs['wait'] == True
-        
+        assert call_kwargs["endpoint_name"] == "test-endpoint"
+        assert call_kwargs["initial_instance_count"] == 1
+        assert call_kwargs["wait"] == True
+
         # Verify the result is the mock endpoint
         assert result == mock_endpoint
 
-    @patch('sagemaker.serve.model_builder.ModelBuilder._deploy_model_customization')
-    @patch('sagemaker.serve.model_builder.ModelBuilder._is_model_customization')
-    @patch('sagemaker.serve.model_builder.ModelBuilder._fetch_default_instance_type_for_custom_model')
+    @patch("sagemaker.serve.model_builder.ModelBuilder._deploy_model_customization")
+    @patch("sagemaker.serve.model_builder.ModelBuilder._is_model_customization")
+    @patch(
+        "sagemaker.serve.model_builder.ModelBuilder._fetch_default_instance_type_for_custom_model"
+    )
     def test_deploy_passes_none_when_inference_config_not_provided(
         self,
         mock_fetch_default_instance,
         mock_is_model_customization,
-        mock_deploy_model_customization
+        mock_deploy_model_customization,
     ):
         """Test backward compatibility: deploy() passes None when inference_config not provided."""
         # Setup
         mock_is_model_customization.return_value = True
         mock_fetch_default_instance.return_value = "ml.g5.12xlarge"
         mock_endpoint = Mock()
         mock_deploy_model_customization.return_value = mock_endpoint
-        
+
         builder = ModelBuilder(
             model="huggingface-llm-mistral-7b",
             model_metadata={
                 "CUSTOM_MODEL_ID": "huggingface-llm-mistral-7b",
-                "CUSTOM_MODEL_VERSION": "1.0.0"
+                "CUSTOM_MODEL_VERSION": "1.0.0",
             },
             instance_type="ml.g5.12xlarge",
             mode=Mode.SAGEMAKER_ENDPOINT,
             role_arn="arn:aws:iam::123456789012:role/TestRole",
             sagemaker_session=self.mock_session,
-            image_uri="123456789012.dkr.ecr.us-west-2.amazonaws.com/test:latest"
+            image_uri="123456789012.dkr.ecr.us-west-2.amazonaws.com/test:latest",
         )
-        
+
         builder.built_model = Mock()
-        
+
         # Execute: Call deploy() WITHOUT inference_config
-        result = builder.deploy(
-            endpoint_name="test-endpoint",
-            initial_instance_count=1
-        )
-        
+        result = builder.deploy(endpoint_name="test-endpoint", initial_instance_count=1)
+
         # Verify: _deploy_model_customization was called with inference_config=None
         assert mock_deploy_model_customization.called
         call_kwargs = mock_deploy_model_customization.call_args[1]
-        
+
         # Verify inference_config is None (backward compatibility)
-        assert 'inference_config' in call_kwargs
-        assert call_kwargs['inference_config'] is None
+        assert "inference_config" in call_kwargs
+        assert call_kwargs["inference_config"] is None
 
-    @patch('sagemaker.serve.model_builder.ModelBuilder._deploy_model_customization')
-    @patch('sagemaker.serve.model_builder.ModelBuilder._is_model_customization')
-    @patch('sagemaker.serve.model_builder.ModelBuilder._fetch_default_instance_type_for_custom_model')
+    @patch("sagemaker.serve.model_builder.ModelBuilder._deploy_model_customization")
+    @patch("sagemaker.serve.model_builder.ModelBuilder._is_model_customization")
+    @patch(
+        "sagemaker.serve.model_builder.ModelBuilder._fetch_default_instance_type_for_custom_model"
+    )
     def test_deploy_only_passes_resource_requirements_type(
         self,
         mock_fetch_default_instance,
         mock_is_model_customization,
-        mock_deploy_model_customization
+        mock_deploy_model_customization,
     ):
         """Test that deploy() only passes inference_config if it's ResourceRequirements type."""
         # Setup
         mock_is_model_customization.return_value = True
         mock_fetch_default_instance.return_value = "ml.g5.12xlarge"
         mock_endpoint = Mock()
         mock_deploy_model_customization.return_value = mock_endpoint
-        
+
         builder = ModelBuilder(
             model="huggingface-llm-mistral-7b",
             model_metadata={
                 "CUSTOM_MODEL_ID": "huggingface-llm-mistral-7b",
-                "CUSTOM_MODEL_VERSION": "1.0.0"
+                "CUSTOM_MODEL_VERSION": "1.0.0",
             },
             instance_type="ml.g5.12xlarge",
             mode=Mode.SAGEMAKER_ENDPOINT,
             role_arn="arn:aws:iam::123456789012:role/TestRole",
             sagemaker_session=self.mock_session,
-            image_uri="123456789012.dkr.ecr.us-west-2.amazonaws.com/test:latest"
+            image_uri="123456789012.dkr.ecr.us-west-2.amazonaws.com/test:latest",
         )
-        
+
         builder.built_model = Mock()
-        
+
         # Create a non-ResourceRequirements inference_config (e.g., ServerlessInferenceConfig)
         from sagemaker.core.inference_config import ServerlessInferenceConfig
-        serverless_config = ServerlessInferenceConfig(
-            memory_size_in_mb=4096,
-            max_concurrency=10
-        )
-        
+
+        serverless_config = ServerlessInferenceConfig(memory_size_in_mb=4096, max_concurrency=10)
+
         # Execute: Call deploy() with ServerlessInferenceConfig
         # This should NOT pass it to _deploy_model_customization
-        result = builder.deploy(
-            endpoint_name="test-endpoint",
-            inference_config=serverless_config
-        )
-        
+        result = builder.deploy(endpoint_name="test-endpoint", inference_config=serverless_config)
+
         # Verify: _deploy_model_customization was called with inference_config=None
         # because ServerlessInferenceConfig is not ResourceRequirements
         assert mock_deploy_model_customization.called
         call_kwargs = mock_deploy_model_customization.call_args[1]
-        
+
         # Verify inference_config is None (not ServerlessInferenceConfig)
-        assert 'inference_config' in call_kwargs
-        assert call_kwargs['inference_config'] is None
+        assert "inference_config" in call_kwargs
+        assert call_kwargs["inference_config"] is None
 
 
 if __name__ == "__main__":
Original file line number	Diff line number	Diff line change
`@@ -33,7 +33,7 @@`
`33`	`33`	`" from sagemaker.core.inference_config import AsyncInferenceConfig\n"`
`34`	`34`	`"This compatibility shim will be removed in a future version.",`
`35`	`35`	`DeprecationWarning,`
`36`		`- stacklevel=2`
	`36`	`+ stacklevel=2,`
`37`	`37`	`)`
`38`	`38`
`39`		`-__all__ = ['AsyncInferenceConfig']`
	`39`	`+__all__ = ["AsyncInferenceConfig"]`