sagemaker-python-sdk/sagemaker-train/src/sagemaker/train/common_utils/model_resolution.py at 6dc76a3859aefe6e18d637ba35ce3ce770cb2061 · rsareddy0329/sagemaker-python-sdk · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
"""
Internal utilities for resolving model information from various input types.

This module provides common functionality for resolving model metadata from:
- JumpStart model IDs (strings like "llama3-2-1b-instruct")
- ModelPackage objects or ARNs (fine-tuned models)
"""

import os
import json
import boto3
from typing import Union, Optional, Dict, Any
from dataclasses import dataclass
from enum import Enum
import re
from sagemaker.train.base_trainer import BaseTrainer
from sagemaker.core.utils.utils import Unassigned


class _ModelType(Enum):
    """Internal enum for model type classification."""
    JUMPSTART = "jumpstart"
    FINE_TUNED = "fine_tuned"


@dataclass
class _ModelInfo:
    """
    Internal dataclass containing resolved model information.

    Attributes:
        base_model_name: Human-readable model name
        base_model_arn: ARN of the base model
        source_model_package_arn: ARN of source model package (None for JumpStart models)
        model_type: Type of model (JUMPSTART or FINE_TUNED)
        hub_content_name: Name in the hub (for JumpStart models)
        additional_metadata: Any additional metadata extracted during resolution
    """
    base_model_name: str
    base_model_arn: str
    source_model_package_arn: Optional[str]
    model_type: _ModelType
    hub_content_name: Optional[str]
    additional_metadata: Dict[str, Any]


class _ModelResolver:
    """
    Internal utility class for resolving model information.

    Handles resolution of model metadata from both JumpStart model IDs
    and fine-tuned ModelPackage objects/ARNs.
    """

    DEFAULT_HUB_NAME = "SageMakerPublicHub"

    def __init__(self, sagemaker_session=None):
        """
        Initialize the resolver.

        Args:
            sagemaker_session: SageMaker session to use for API calls.
                             If None, will be created with endpoint if configured.
        """
        self.sagemaker_session = sagemaker_session
        self._endpoint = os.environ.get('SAGEMAKER_ENDPOINT')

    def resolve_model_info(
        self,
        base_model: Union[str, BaseTrainer, 'ModelPackage'],
        hub_name: Optional[str] = None
    ) -> _ModelInfo:
        """
        Resolve model information from various input types.

        Args:
            base_model: Either a JumpStart model ID (str) or ModelPackage object/ARN or BaseTrainer object with a completed job
            hub_name: Optional hub name for JumpStart models (defaults to SageMakerPublicHub)

        Returns:
            _ModelInfo: Resolved model information

        Raises:
            ValueError: If model input is invalid or resolution fails
        """
        # Check if it's a string first
        if isinstance(base_model, str):
            # Check if it's a model package ARN or JumpStart model ID
            if base_model.startswith("arn:aws:sagemaker:") and ":model-package/" in base_model:
                return self._resolve_model_package_arn(base_model)
            else:
                return self._resolve_jumpstart_model(base_model, hub_name or self.DEFAULT_HUB_NAME)
        # Handle BaseTrainer type
        elif isinstance(base_model, BaseTrainer):
            if hasattr(base_model, '_latest_training_job') and hasattr(base_model._latest_training_job,
                                                              'output_model_package_arn'):
                arn = base_model._latest_training_job.output_model_package_arn
                if not isinstance(arn, Unassigned):
                    return self._resolve_model_package_arn(arn)
                else:
                    raise ValueError("BaseTrainer must have completed training job to be used for evaluation")
            else:
                raise ValueError("BaseTrainer must have completed training job to be used for evaluation")
        else:
            # Not a string, so assume it's a ModelPackage object
            # Check if it has the expected attributes of a ModelPackage
            if hasattr(base_model, 'model_package_arn') or hasattr(base_model, 'inference_specification'):
                return self._resolve_model_package_object(base_model)
            else:
                raise ValueError(
                    f"base_model must be a string (JumpStart model ID or ModelPackage ARN) "
                    f"or ModelPackage object, got {type(base_model)}"
                )

    def _resolve_jumpstart_model(self, model_id: str, hub_name: str) -> _ModelInfo:
        """
        Resolve JumpStart model information from Hub API.

        Args:
            model_id: JumpStart model identifier
            hub_name: Hub name to query

        Returns:
            _ModelInfo: Resolved model information
        """
        from sagemaker.core.resources import HubContent

        session = self._get_session()

        try:
            hub_content = HubContent.get(
                hub_name=hub_name,
                hub_content_type="Model",
                hub_content_name=model_id,
                session=session.boto_session,
                region=session.boto_session.region_name
            )

            # Parse additional metadata from hub content document
            additional_metadata = {}
            if hub_content.hub_content_document:
                try:
                    additional_metadata = json.loads(hub_content.hub_content_document)
                except json.JSONDecodeError:
                    pass

            return _ModelInfo(
                base_model_name=model_id,
                base_model_arn=hub_content.hub_content_arn,
                source_model_package_arn=None,
                model_type=_ModelType.JUMPSTART,
                hub_content_name=model_id,
                additional_metadata=additional_metadata
            )

        except Exception as e:
            raise ValueError(
                f"Failed to resolve JumpStart model '{model_id}' from hub '{hub_name}': {e}"
            )

    def _resolve_model_package_object(self, model_package: 'ModelPackage') -> _ModelInfo:
        """
        Resolve model information from ModelPackage object.

        Args:
            model_package: ModelPackage object

        Returns:
            _ModelInfo: Resolved model information

        Raises:
            ValueError: If model package doesn't have base_model metadata
        """
        # Extract base model info from inference specification
        base_model_name = None
        base_model_arn = None
        hub_content_name = None

        # Check if inference specification exists
        if not hasattr(model_package, 'inference_specification') or not model_package.inference_specification:
            raise ValueError(
                f"NotSupported: Evaluation is only supported for model packages customized by SageMaker's fine-tuning flows. "
                f"The provided model package (ARN: {getattr(model_package, 'model_package_arn', 'unknown')}) "
                f"does not have an inference_specification."
            )

        # Check if containers exist
        if not model_package.inference_specification.containers:
            raise ValueError(
                f"NotSupported: Evaluation is only supported for model packages customized by SageMaker's fine-tuning flows. "
                f"The provided model package (ARN: {getattr(model_package, 'model_package_arn', 'unknown')}) "
                f"does not have any containers in its inference_specification."
            )

        container = model_package.inference_specification.containers[0]

        # Try to get base model information - this is critical
        if hasattr(container, 'base_model') and container.base_model:
            if hasattr(container.base_model, 'hub_content_name'):
                hub_content_name = container.base_model.hub_content_name
                base_model_name = hub_content_name
            if hasattr(container.base_model, 'hub_content_arn'):
                base_model_arn = container.base_model.hub_content_arn

            # If hub_content_arn is not present, construct it from hub_content_name and version
            if not base_model_arn and hasattr(container.base_model, 'hub_content_version'):
                hub_content_version = container.base_model.hub_content_version
                model_pkg_arn = getattr(model_package, 'model_package_arn', None)

                if hub_content_name and hub_content_version and model_pkg_arn:
                    # Extract region from model package ARN
                    arn_parts = model_pkg_arn.split(':')
                    if len(arn_parts) >= 4:
                        region = arn_parts[3]
                        # Construct hub content ARN for SageMaker public hub
                        base_model_arn = f"arn:aws:sagemaker:{region}:aws:hub-content/SageMakerPublicHub/Model/{hub_content_name}/{hub_content_version}"

        # If we couldn't extract or construct base model ARN, this is not a supported model package
        if not base_model_arn:
            raise ValueError(
                f"NotSupported: Evaluation is only supported for model packages customized by SageMaker's fine-tuning flows. "
                f"The provided model package (ARN: {getattr(model_package, 'model_package_arn', 'unknown')}) "
                f"does not have base_model metadata in its inference_specification.containers[0]. "
                f"Please ensure the model was created using SageMaker's fine-tuning capabilities."
            )

        # If we couldn't extract base model name, use package name as fallback
        if not base_model_name:
            if hasattr(model_package, 'model_package_arn'):
                arn_parts = model_package.model_package_arn.split('/')
                if len(arn_parts) >= 2:
                    base_model_name = arn_parts[-2]  # Get the group name
                else:
                    base_model_name = getattr(model_package, 'model_package_name', 'unknown')
            else:
                base_model_name = getattr(model_package, 'model_package_name', 'unknown')

        return _ModelInfo(
            base_model_name=base_model_name,
            base_model_arn=base_model_arn,
            source_model_package_arn=getattr(model_package, 'model_package_arn', None),
            model_type=_ModelType.FINE_TUNED,
            hub_content_name=hub_content_name,
            additional_metadata={}
        )

    def _resolve_model_package_arn(self, model_package_arn: str) -> _ModelInfo:
        """
        Resolve model information from ModelPackage ARN.

        Args:
            model_package_arn: ARN of the model package

        Returns:
            _ModelInfo: Resolved model information
        """
        session = self._get_session()

        try:
            # Validate ARN format
            self._validate_model_package_arn(model_package_arn)

            # Use sagemaker.core ModelPackage.get() to retrieve model package information
            from sagemaker.core.resources import ModelPackage

            import logging
            logger = logging.getLogger(__name__)

            # Get the model package using sagemaker.core
            model_package = ModelPackage.get(
                model_package_name=model_package_arn,
                session=session.boto_session,
                region=session.boto_session.region_name
            )

            logger.info(f"Retrieved ModelPackage in region: {session.boto_session.region_name}")

            # Now use the existing _resolve_model_package_object method to extract base model info
            return self._resolve_model_package_object(model_package)

        except ValueError:
            # Re-raise ValueError as-is (our custom error messages)
            raise
        except Exception as e:
            raise ValueError(
                f"Failed to resolve model package ARN '{model_package_arn}': {e}"
            )

    def _validate_model_package_arn(self, arn: str) -> bool:
        """
        Validate ModelPackage ARN format.

        Args:
            arn: ARN to validate

        Returns:
            bool: True if valid

        Raises:
            ValueError: If ARN format is invalid
        """
        pattern = r'^arn:aws[a-z\-]*:sagemaker:[a-z0-9\-]+:\d{12}:model-package/.*$'
        if not re.match(pattern, arn):
            raise ValueError(
                f"Invalid ModelPackage ARN format: {arn}. "
                f"Expected format matching regex: {pattern}"
            )
        return True

    def _get_session(self):
        """
        Get or create SageMaker session with endpoint support.

        Returns:
            SageMaker session
        """
        if self.sagemaker_session:
            return self.sagemaker_session

        from sagemaker.core.helper.session_helper import Session

        # Check for endpoint in environment variable
        if self._endpoint:
            sm_client = boto3.client(
                'sagemaker',
                endpoint_url=self._endpoint
            )
            return Session(sagemaker_client=sm_client)

        # Default session
        return Session()


def _resolve_base_model(
    base_model: Union[str, 'ModelPackage'],
    sagemaker_session=None,
    hub_name: Optional[str] = None
) -> _ModelInfo:
    """
    Convenience function to resolve model information.

    This is the main entry point for model resolution. It handles both:
    - JumpStart model IDs (e.g., "llama3-2-1b-instruct")
    - ModelPackage objects or ARNs (fine-tuned models)

    Args:
        base_model: Either a JumpStart model ID (str) or ModelPackage object/ARN
        sagemaker_session: Optional SageMaker session for API calls
        hub_name: Optional hub name for JumpStart models

    Returns:
        _ModelInfo: Resolved model information containing base_model_name,
                   base_model_arn, and other metadata

    Raises:
        ValueError: If model input is invalid or resolution fails

    Example:
        >>> # Resolve JumpStart model
        >>> info = _resolve_base_model("llama3-2-1b-instruct")
        >>> print(info.base_model_name)  # "llama3-2-1b-instruct"
        >>> print(info.base_model_arn)   # "arn:aws:sagemaker:..."

        >>> # Resolve from ModelPackage ARN
        >>> info = _resolve_base_model("arn:aws:sagemaker:us-west-2:123456789012:model-package/my-model/1")
        >>> print(info.source_model_package_arn)  # Original ARN
        >>> print(info.base_model_arn)            # Base model ARN
    """
    resolver = _ModelResolver(sagemaker_session)
    return resolver.resolve_model_info(base_model, hub_name)