From 2e810e4253948609b539a98816589dad282c3776 Mon Sep 17 00:00:00 2001
From: eternalcuriouslearner <suryateja9108@gmail.com>
Date: Tue, 21 Apr 2026 21:52:38 -0400
Subject: [PATCH 1/2] wip: Adding pydantic validation for strong typing in
 anthropic.

---
 .../anthropic/messages_extractors.py          | 219 ++++++++++++++----
 .../tests/requirements.pydantic1.txt          |  49 ++++
 tox.ini                                       |   3 +
 3 files changed, 224 insertions(+), 47 deletions(-)
 create mode 100644 instrumentation-genai/opentelemetry-instrumentation-anthropic/tests/requirements.pydantic1.txt

diff --git a/instrumentation-genai/opentelemetry-instrumentation-anthropic/src/opentelemetry/instrumentation/anthropic/messages_extractors.py b/instrumentation-genai/opentelemetry-instrumentation-anthropic/src/opentelemetry/instrumentation/anthropic/messages_extractors.py
index 8c3dcf26ec..22aab814f3 100644
--- a/instrumentation-genai/opentelemetry-instrumentation-anthropic/src/opentelemetry/instrumentation/anthropic/messages_extractors.py
+++ b/instrumentation-genai/opentelemetry-instrumentation-anthropic/src/opentelemetry/instrumentation/anthropic/messages_extractors.py
@@ -16,10 +16,20 @@
 
 from __future__ import annotations
 
-from dataclasses import dataclass
-from typing import TYPE_CHECKING, Sequence
+import logging
+from collections.abc import Mapping
+from typing import TYPE_CHECKING, Any, List, Optional, TypeVar, Union
 
 from anthropic.types import MessageDeltaUsage
+from pydantic import (
+    BaseModel,
+    Field,
+    StrictBool,
+    StrictFloat,
+    StrictInt,
+    StrictStr,
+    ValidationError,
+)
 
 from opentelemetry.semconv._incubating.attributes import (
     gen_ai_attributes as GenAIAttributes,
@@ -40,8 +50,15 @@
     normalize_finish_reason,
 )
 
+_PYDANTIC_V2 = hasattr(BaseModel, "model_validate")
+
+if _PYDANTIC_V2:
+    from pydantic import ConfigDict
+else:
+    ConfigDict = None
+
 if TYPE_CHECKING:
-    from collections.abc import Iterable, Mapping
+    from collections.abc import Iterable, Sequence
 
     import httpx
     from anthropic.resources.messages import Messages
@@ -57,17 +74,35 @@
     )
 
 
-@dataclass
-class MessageRequestParams:
-    model: str | None = None
-    max_tokens: int | None = None
-    temperature: float | None = None
-    top_k: int | None = None
-    top_p: float | None = None
-    stop_sequences: Sequence[str] | None = None
-    stream: bool | None = None
-    messages: Iterable[MessageParam] | None = None
-    system: str | Iterable[TextBlockParam] | None = None
+_logger = logging.getLogger(__name__)
+ModelT = TypeVar("ModelT", bound=BaseModel)
+
+
+class _ExtractorModel(BaseModel):
+    if _PYDANTIC_V2:
+        model_config = ConfigDict(extra="ignore", from_attributes=True)
+    else:
+
+        class Config:
+            extra = "ignore"
+            orm_mode = True
+
+
+class _InputMessageParamModel(_ExtractorModel):
+    role: Optional[StrictStr] = None
+    content: Any = None
+
+
+class MessageRequestParams(_ExtractorModel):
+    model: Optional[StrictStr] = None
+    max_tokens: Optional[StrictInt] = None
+    temperature: Optional[Union[StrictFloat, StrictInt]] = None
+    top_k: Optional[StrictInt] = None
+    top_p: Optional[Union[StrictFloat, StrictInt]] = None
+    stop_sequences: Optional[List[StrictStr]] = None
+    stream: Optional[StrictBool] = None
+    messages: Optional[List[_InputMessageParamModel]] = None
+    system: Optional[Union[StrictStr, List[Any]]] = None
 
 
 GEN_AI_USAGE_CACHE_CREATION_INPUT_TOKENS = (
@@ -76,12 +111,70 @@ class MessageRequestParams:
 GEN_AI_USAGE_CACHE_READ_INPUT_TOKENS = "gen_ai.usage.cache_read.input_tokens"
 
 
-@dataclass
-class UsageTokens:
-    input_tokens: int | None = None
-    output_tokens: int | None = None
-    cache_creation_input_tokens: int | None = None
-    cache_read_input_tokens: int | None = None
+class UsageTokens(_ExtractorModel):
+    input_tokens: Optional[StrictInt] = None
+    output_tokens: Optional[StrictInt] = None
+    cache_creation_input_tokens: Optional[StrictInt] = None
+    cache_read_input_tokens: Optional[StrictInt] = None
+
+
+class _UsageModel(_ExtractorModel):
+    input_tokens: Optional[StrictInt] = None
+    output_tokens: Optional[StrictInt] = None
+    cache_creation_input_tokens: Optional[StrictInt] = None
+    cache_read_input_tokens: Optional[StrictInt] = None
+
+
+class _MessageResultModel(_ExtractorModel):
+    role: Optional[StrictStr] = None
+    content: List[Any] = Field(default_factory=list)
+    stop_reason: Optional[StrictStr] = None
+    model: Optional[StrictStr] = None
+    id: Optional[StrictStr] = None
+    usage: Optional[_UsageModel] = None
+
+
+def _rebuild_model(model_type: type[BaseModel]) -> None:
+    if _PYDANTIC_V2:
+        model_type.model_rebuild(_types_namespace=globals())
+    else:
+        model_type.update_forward_refs(**globals())
+
+
+for _model_type in (
+    _InputMessageParamModel,
+    MessageRequestParams,
+    UsageTokens,
+    _UsageModel,
+    _MessageResultModel,
+):
+    _rebuild_model(_model_type)
+
+
+def _validate_model(
+    model_type: type[ModelT], value: object, context: str
+) -> ModelT | None:
+    try:
+        if _PYDANTIC_V2:
+            return model_type.model_validate(value)
+        if isinstance(value, Mapping):
+            return model_type.parse_obj(value)
+        return model_type.from_orm(value)
+    except ValidationError:
+        _logger.debug(
+            "Anthropic messages extractor validation failed for %s",
+            context,
+            exc_info=True,
+        )
+        return None
+
+
+def _validate_usage(usage: object) -> _UsageModel | None:
+    return _validate_model(_UsageModel, usage, "usage payload")
+
+
+def _validate_message_result(result: object) -> _MessageResultModel | None:
+    return _validate_model(_MessageResultModel, result, "message payload")
 
 
 def extract_usage_tokens(
@@ -90,10 +183,14 @@ def extract_usage_tokens(
     if usage is None:
         return UsageTokens()
 
-    input_tokens = usage.input_tokens
-    output_tokens = usage.output_tokens
-    cache_creation_input_tokens = usage.cache_creation_input_tokens
-    cache_read_input_tokens = usage.cache_read_input_tokens
+    validated_usage = _validate_usage(usage)
+    if validated_usage is None:
+        return UsageTokens()
+
+    input_tokens = validated_usage.input_tokens
+    output_tokens = validated_usage.output_tokens
+    cache_creation_input_tokens = validated_usage.cache_creation_input_tokens
+    cache_read_input_tokens = validated_usage.cache_read_input_tokens
 
     if (
         input_tokens is None
@@ -117,20 +214,29 @@ def extract_usage_tokens(
 
 
 def get_input_messages(
-    messages: Iterable[MessageParam] | None,
+    messages: Iterable[MessageParam] | list[_InputMessageParamModel] | None,
 ) -> list[InputMessage]:
     if messages is None:
         return []
     result: list[InputMessage] = []
     for message in messages:
-        role = message["role"]
-        parts = convert_content_to_parts(message["content"])
+        validated_message = (
+            message
+            if isinstance(message, _InputMessageParamModel)
+            else _validate_model(
+                _InputMessageParamModel, message, "input message"
+            )
+        )
+        if validated_message is None or validated_message.role is None:
+            continue
+        role = validated_message.role
+        parts = convert_content_to_parts(validated_message.content)
         result.append(InputMessage(role=role, parts=parts))
     return result
 
 
 def get_system_instruction(
-    system: str | Iterable[TextBlockParam] | None,
+    system: str | Iterable[TextBlockParam] | list[Any] | None,
 ) -> list[MessagePart]:
     if system is None:
         return []
@@ -138,16 +244,24 @@ def get_system_instruction(
 
 
 def get_output_messages_from_message(
-    message: Message | None,
+    message: Message | _MessageResultModel | None,
 ) -> list[OutputMessage]:
     if message is None:
         return []
 
-    parts = convert_content_to_parts(message.content)
-    finish_reason = normalize_finish_reason(message.stop_reason)
+    validated_message = (
+        message
+        if isinstance(message, _MessageResultModel)
+        else _validate_message_result(message)
+    )
+    if validated_message is None:
+        return []
+
+    parts = convert_content_to_parts(validated_message.content)
+    finish_reason = normalize_finish_reason(validated_message.stop_reason)
     return [
         OutputMessage(
-            role=message.role,
+            role=validated_message.role or "assistant",
             parts=parts,
             finish_reason=finish_reason or "",
         )
@@ -162,14 +276,18 @@ def set_invocation_response_attributes(
     if message is None:
         return
 
-    invocation.response_model_name = message.model
-    invocation.response_id = message.id
+    validated_message = _validate_message_result(message)
+    if validated_message is None:
+        return
+
+    invocation.response_model_name = validated_message.model
+    invocation.response_id = validated_message.id
 
-    finish_reason = normalize_finish_reason(message.stop_reason)
+    finish_reason = normalize_finish_reason(validated_message.stop_reason)
     if finish_reason:
         invocation.finish_reasons = [finish_reason]
 
-    tokens = extract_usage_tokens(message.usage)
+    tokens = extract_usage_tokens(validated_message.usage)
     invocation.input_tokens = tokens.input_tokens
     invocation.output_tokens = tokens.output_tokens
     if tokens.cache_creation_input_tokens is not None:
@@ -182,7 +300,9 @@ def set_invocation_response_attributes(
         )
 
     if capture_content:
-        invocation.output_messages = get_output_messages_from_message(message)
+        invocation.output_messages = get_output_messages_from_message(
+            validated_message
+        )
 
 
 def extract_params(  # pylint: disable=too-many-locals
@@ -207,17 +327,22 @@ def extract_params(  # pylint: disable=too-many-locals
     timeout: float | httpx.Timeout | None = None,
     **_kwargs: object,
 ) -> MessageRequestParams:
-    return MessageRequestParams(
-        model=model,
-        max_tokens=max_tokens,
-        temperature=temperature,
-        top_p=top_p,
-        top_k=top_k,
-        stop_sequences=stop_sequences,
-        stream=stream,
-        messages=messages,
-        system=system,
+    params = _validate_model(
+        MessageRequestParams,
+        {
+            "model": model,
+            "max_tokens": max_tokens,
+            "temperature": temperature,
+            "top_p": top_p,
+            "top_k": top_k,
+            "stop_sequences": stop_sequences,
+            "stream": stream,
+            "messages": messages,
+            "system": system,
+        },
+        "request parameters",
     )
+    return params or MessageRequestParams()
 
 
 def _set_server_address_and_port(
diff --git a/instrumentation-genai/opentelemetry-instrumentation-anthropic/tests/requirements.pydantic1.txt b/instrumentation-genai/opentelemetry-instrumentation-anthropic/tests/requirements.pydantic1.txt
new file mode 100644
index 0000000000..8c4cb3f09d
--- /dev/null
+++ b/instrumentation-genai/opentelemetry-instrumentation-anthropic/tests/requirements.pydantic1.txt
@@ -0,0 +1,49 @@
+# Copyright The OpenTelemetry Authors
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+# ********************************
+# WARNING: NOT HERMETIC !!!!!!!!!!
+# ********************************
+#
+# This "requirements.txt" is installed in conjunction
+# with multiple other dependencies in the top-level "tox.ini"
+# file. In particular, please see:
+#
+#   anthropic-pydantic1: {[testenv]test_deps}
+#   anthropic-pydantic1: -r {toxinidir}/instrumentation-genai/opentelemetry-instrumentation-anthropic/tests/requirements.pydantic1.txt
+#
+# This provides additional dependencies, namely:
+#
+#   opentelemetry-api
+#   opentelemetry-sdk
+#   opentelemetry-semantic-conventions
+#
+# ... with a "dev" version based on the latest distribution.
+
+
+# This variant of the requirements aims to test the system using
+# the newest supported version of external dependencies with Pydantic 1.9.
+
+anthropic
+pydantic==1.9.0
+pytest==7.4.4
+pytest-vcr==1.0.2
+pytest-asyncio==0.21.0
+wrapt==2.1.2
+# test with the latest version of opentelemetry-api, sdk, and semantic conventions
+
+-e opentelemetry-instrumentation
+-e util/opentelemetry-util-genai
+-e instrumentation-genai/opentelemetry-instrumentation-anthropic
diff --git a/tox.ini b/tox.ini
index 1f2ca7f8e9..bbfc43cacd 100644
--- a/tox.ini
+++ b/tox.ini
@@ -32,6 +32,7 @@ envlist =
 
     ; instrumentation-anthropic
     py3{10,11,12,13,14}-test-instrumentation-anthropic-{oldest,latest}
+    py310-test-instrumentation-anthropic-pydantic1
     # Disabling pypy3 as jiter (anthropic dep) requires PyPy 3.11+
     # pypy3-test-instrumentation-anthropic-{oldest,latest}
     lint-instrumentation-anthropic
@@ -500,6 +501,8 @@ deps =
   anthropic-oldest: -r {toxinidir}/instrumentation-genai/opentelemetry-instrumentation-anthropic/tests/requirements.oldest.txt
   anthropic-latest: {[testenv]test_deps}
   anthropic-latest: -r {toxinidir}/instrumentation-genai/opentelemetry-instrumentation-anthropic/tests/requirements.latest.txt
+  anthropic-pydantic1: {[testenv]test_deps}
+  anthropic-pydantic1: -r {toxinidir}/instrumentation-genai/opentelemetry-instrumentation-anthropic/tests/requirements.pydantic1.txt
   lint-instrumentation-anthropic: -r {toxinidir}/instrumentation-genai/opentelemetry-instrumentation-anthropic/tests/requirements.oldest.txt
 
   claude-agent-sdk-oldest: -r {toxinidir}/instrumentation-genai/opentelemetry-instrumentation-claude-agent-sdk/tests/requirements.oldest.txt

From d04c44c6ba286bb1546c47fbf9af023f5f80893f Mon Sep 17 00:00:00 2001
From: eternalcuriouslearner <suryateja9108@gmail.com>
Date: Tue, 21 Apr 2026 22:02:40 -0400
Subject: [PATCH 2/2] wip: fixing the type checks and adding changelog.

---
 .github/workflows/core_contrib_test.yml       | 30 +++++++++++++++++++
 .github/workflows/test.yml                    | 19 ++++++++++++
 .../CHANGELOG.md                              |  2 ++
 .../anthropic/messages_extractors.py          | 12 +++++---
 4 files changed, 59 insertions(+), 4 deletions(-)

diff --git a/.github/workflows/core_contrib_test.yml b/.github/workflows/core_contrib_test.yml
index d9f90d57d8..e78f110622 100644
--- a/.github/workflows/core_contrib_test.yml
+++ b/.github/workflows/core_contrib_test.yml
@@ -327,6 +327,36 @@ jobs:
       - name: Run tests
         run: tox -e py310-test-instrumentation-anthropic-latest -- -ra
 
+  py310-test-instrumentation-anthropic-pydantic1:
+    name: instrumentation-anthropic-pydantic1 
+    runs-on: ubuntu-latest
+    timeout-minutes: 30
+    steps:
+      - name: Checkout contrib repo @ SHA - ${{ env.CONTRIB_REPO_SHA }}
+        uses: actions/checkout@v4
+        with:
+          repository: open-telemetry/opentelemetry-python-contrib
+          ref: ${{ env.CONTRIB_REPO_SHA }}
+
+      - name: Checkout core repo @ SHA - ${{ env.CORE_REPO_SHA }}
+        uses: actions/checkout@v4
+        with:
+          repository: open-telemetry/opentelemetry-python
+          ref: ${{ env.CORE_REPO_SHA }}
+          path: opentelemetry-python
+
+      - name: Set up Python 3.10
+        uses: actions/setup-python@v5
+        with:
+          python-version: "3.10"
+          architecture: "x64"
+
+      - name: Install tox
+        run: pip install tox-uv
+
+      - name: Run tests
+        run: tox -e py310-test-instrumentation-anthropic-pydantic1 -- -ra
+
   py310-test-instrumentation-claude-agent-sdk-oldest:
     name: instrumentation-claude-agent-sdk-oldest 
     runs-on: ubuntu-latest
diff --git a/.github/workflows/test.yml b/.github/workflows/test.yml
index 9c694007ea..c2a29aa036 100644
--- a/.github/workflows/test.yml
+++ b/.github/workflows/test.yml
@@ -1031,6 +1031,25 @@ jobs:
       - name: Run tests
         run: tox -e py314-test-instrumentation-anthropic-latest -- -ra
 
+  py310-test-instrumentation-anthropic-pydantic1_ubuntu-latest:
+    name: instrumentation-anthropic-pydantic1 3.10 Ubuntu
+    runs-on: ubuntu-latest
+    timeout-minutes: 30
+    steps:
+      - name: Checkout repo @ SHA - ${{ github.sha }}
+        uses: actions/checkout@v4
+
+      - name: Set up Python 3.10
+        uses: actions/setup-python@v5
+        with:
+          python-version: "3.10"
+
+      - name: Install tox
+        run: pip install tox-uv
+
+      - name: Run tests
+        run: tox -e py310-test-instrumentation-anthropic-pydantic1 -- -ra
+
   py310-test-instrumentation-claude-agent-sdk-oldest_ubuntu-latest:
     name: instrumentation-claude-agent-sdk-oldest 3.10 Ubuntu
     runs-on: ubuntu-latest
diff --git a/instrumentation-genai/opentelemetry-instrumentation-anthropic/CHANGELOG.md b/instrumentation-genai/opentelemetry-instrumentation-anthropic/CHANGELOG.md
index 3d19ceddd1..12b150b472 100644
--- a/instrumentation-genai/opentelemetry-instrumentation-anthropic/CHANGELOG.md
+++ b/instrumentation-genai/opentelemetry-instrumentation-anthropic/CHANGELOG.md
@@ -12,6 +12,8 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
 
 ### Added
 
+- Add Pydantic validation for Anthropic message extractor inputs and responses
+  ([#4475](https://github.com/open-telemetry/opentelemetry-python-contrib/pull/4475))
 - Add async Anthropic message stream wrappers and manager wrappers, with wrapper
   tests ([#4346](https://github.com/open-telemetry/opentelemetry-python-contrib/pull/4346))
   - `AsyncMessagesStreamWrapper` for async message stream telemetry
diff --git a/instrumentation-genai/opentelemetry-instrumentation-anthropic/src/opentelemetry/instrumentation/anthropic/messages_extractors.py b/instrumentation-genai/opentelemetry-instrumentation-anthropic/src/opentelemetry/instrumentation/anthropic/messages_extractors.py
index 22aab814f3..078aebf063 100644
--- a/instrumentation-genai/opentelemetry-instrumentation-anthropic/src/opentelemetry/instrumentation/anthropic/messages_extractors.py
+++ b/instrumentation-genai/opentelemetry-instrumentation-anthropic/src/opentelemetry/instrumentation/anthropic/messages_extractors.py
@@ -80,6 +80,7 @@
 
 class _ExtractorModel(BaseModel):
     if _PYDANTIC_V2:
+        assert ConfigDict is not None
         model_config = ConfigDict(extra="ignore", from_attributes=True)
     else:
 
@@ -138,7 +139,8 @@ def _rebuild_model(model_type: type[BaseModel]) -> None:
     if _PYDANTIC_V2:
         model_type.model_rebuild(_types_namespace=globals())
     else:
-        model_type.update_forward_refs(**globals())
+        update_forward_refs = getattr(model_type, "update_forward_refs")
+        update_forward_refs(**globals())
 
 
 for _model_type in (
@@ -158,8 +160,10 @@ def _validate_model(
         if _PYDANTIC_V2:
             return model_type.model_validate(value)
         if isinstance(value, Mapping):
-            return model_type.parse_obj(value)
-        return model_type.from_orm(value)
+            parse_obj = getattr(model_type, "parse_obj")
+            return parse_obj(value)
+        from_orm = getattr(model_type, "from_orm")
+        return from_orm(value)
     except ValidationError:
         _logger.debug(
             "Anthropic messages extractor validation failed for %s",
@@ -178,7 +182,7 @@ def _validate_message_result(result: object) -> _MessageResultModel | None:
 
 
 def extract_usage_tokens(
-    usage: Usage | MessageDeltaUsage | None,
+    usage: Usage | MessageDeltaUsage | _UsageModel | None,
 ) -> UsageTokens:
     if usage is None:
         return UsageTokens()