From b7d941d6ef3ca7e1d11f40fa095054fdfcc33b06 Mon Sep 17 00:00:00 2001
From: Leonel Rivas <encriptandost@gmail.com>
Date: Fri, 19 Jun 2026 19:56:08 -0700
Subject: [PATCH] fix(langchain): resolve request model from ls_model_name
 metadata for LangGraph tool spans

LangGraph tool-orchestrated chat models (e.g. init_chat_model with model_provider=bedrock_converse) don't expose the model in serialized kwargs or invocation_params, so set_request_params fell back to "unknown". LangChain still provides it via the callback metadata (ls_model_name), so thread that through and use it as a fallback, matching what the response side already does. Pure fallback; normal resolution is unchanged.

Fixes #3098
---
 .../langchain/callback_handler.py             |  12 +-
 .../instrumentation/langchain/span_utils.py   |  16 +-
 .../tests/test_request_model_extraction.py    | 138 ++++++++++++++++++
 3 files changed, 158 insertions(+), 8 deletions(-)
 create mode 100644 packages/opentelemetry-instrumentation-langchain/tests/test_request_model_extraction.py

diff --git a/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/callback_handler.py b/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/callback_handler.py
index 15ed817e15..614dc1617f 100644
--- a/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/callback_handler.py
+++ b/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/callback_handler.py
@@ -683,11 +683,13 @@ def on_chat_model_start(
             metadata=metadata,
             serialized=serialized,
         )
-        set_request_params(span, kwargs, self.spans[run_id])
+        set_request_params(span, kwargs, self.spans[run_id], metadata)
         if should_emit_events():
             self._emit_chat_input_events(messages)
         else:
-            set_chat_request(span, serialized, messages, kwargs, self.spans[run_id])
+            set_chat_request(
+                span, serialized, messages, kwargs, self.spans[run_id], metadata
+            )
 
     @dont_throw
     def on_llm_start(
@@ -713,12 +715,14 @@ def on_llm_start(
             LLMRequestTypeValues.COMPLETION,
             serialized=serialized,
         )
-        set_request_params(span, kwargs, self.spans[run_id])
+        set_request_params(span, kwargs, self.spans[run_id], metadata)
         if should_emit_events():
             for prompt in prompts:
                 emit_event(MessageEvent(content=prompt, role="user"))
         else:
-            set_llm_request(span, serialized, prompts, kwargs, self.spans[run_id])
+            set_llm_request(
+                span, serialized, prompts, kwargs, self.spans[run_id], metadata
+            )
 
     @dont_throw
     def on_llm_end(
diff --git a/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/span_utils.py b/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/span_utils.py
index 09d365daaf..ce44bf43e8 100644
--- a/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/span_utils.py
+++ b/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/span_utils.py
@@ -153,7 +153,7 @@ def _tool_calls_to_parts(tool_calls) -> list[dict]:
     return parts
 
 
-def set_request_params(span, kwargs, span_holder: SpanHolder):
+def set_request_params(span, kwargs, span_holder: SpanHolder, metadata=None):
     if not span.is_recording():
         return
 
@@ -167,7 +167,13 @@ def set_request_params(span, kwargs, span_holder: SpanHolder):
             span_holder.request_model = model
             break
     else:
-        model = "unknown"
+        # LangGraph/tool-orchestrated chat models (e.g. init_chat_model with
+        # model_provider="bedrock_converse") don't expose the model through the
+        # serialized kwargs or invocation_params. LangChain still reports it via
+        # the callback metadata, so fall back to that before giving up.
+        model = (metadata or {}).get("ls_model_name") or "unknown"
+        if model != "unknown":
+            span_holder.request_model = model
 
     _set_span_attribute(span, GenAIAttributes.GEN_AI_REQUEST_MODEL, model)
     # response is not available for LLM requests (as opposed to chat)
@@ -215,8 +221,9 @@ def set_llm_request(
     prompts: list[str],
     kwargs: Any,
     span_holder: SpanHolder,
+    metadata: Optional[dict[str, Any]] = None,
 ) -> None:
-    set_request_params(span, kwargs, span_holder)
+    set_request_params(span, kwargs, span_holder, metadata)
 
     if should_send_prompts():
         input_messages = []
@@ -239,8 +246,9 @@ def set_chat_request(
     messages: list[list[BaseMessage]],
     kwargs: Any,
     span_holder: SpanHolder,
+    metadata: Optional[dict[str, Any]] = None,
 ) -> None:
-    set_request_params(span, serialized.get("kwargs", {}), span_holder)
+    set_request_params(span, serialized.get("kwargs", {}), span_holder, metadata)
 
     if should_send_prompts():
         # Tool definitions from functions
diff --git a/packages/opentelemetry-instrumentation-langchain/tests/test_request_model_extraction.py b/packages/opentelemetry-instrumentation-langchain/tests/test_request_model_extraction.py
new file mode 100644
index 0000000000..8b68a56703
--- /dev/null
+++ b/packages/opentelemetry-instrumentation-langchain/tests/test_request_model_extraction.py
@@ -0,0 +1,138 @@
+"""
+Unit tests for request/response model resolution in TraceloopCallbackHandler.
+
+These tests do NOT use VCR cassettes; they drive the callback handler directly
+with an InMemorySpanExporter, so no API keys or real HTTP are required.
+
+Regression coverage for issue #3098: LangGraph/tool-orchestrated chat models
+(e.g. init_chat_model(..., model_provider="bedrock_converse")) do not expose the
+model name through invocation_params. LangChain still provides it via the callback
+metadata ("ls_model_name"), so the request/response model must be resolved from
+there instead of falling back to "unknown".
+"""
+from unittest.mock import MagicMock
+from uuid import uuid4
+
+import pytest
+from langchain_core.messages import AIMessage, HumanMessage
+from langchain_core.outputs import ChatGeneration, LLMResult
+from opentelemetry import context as context_api
+from opentelemetry.sdk.trace import TracerProvider
+from opentelemetry.sdk.trace.export import SimpleSpanProcessor
+from opentelemetry.sdk.trace.export.in_memory_span_exporter import InMemorySpanExporter
+from opentelemetry.semconv._incubating.attributes import (
+    gen_ai_attributes as GenAIAttributes,
+)
+
+from opentelemetry.instrumentation.langchain.callback_handler import (
+    TraceloopCallbackHandler,
+)
+
+MODEL = "us.anthropic.claude-3-5-haiku-20241022-v1:0"
+# Mirrors what LangChain serializes for a ChatBedrockConverse model invoked
+# through LangGraph: the class name is available, but invocation_params carry no
+# model identifier.
+SERIALIZED = {
+    "id": ["langchain", "chat_models", "bedrock_converse", "ChatBedrockConverse"],
+    "kwargs": {},
+}
+SPAN_NAME = "ChatBedrockConverse.chat"
+
+
+@pytest.fixture
+def handler_with_exporter():
+    """A callback handler backed by an in-memory span exporter."""
+    exporter = InMemorySpanExporter()
+    provider = TracerProvider()
+    provider.add_span_processor(SimpleSpanProcessor(exporter))
+    tracer = provider.get_tracer("test")
+    handler = TraceloopCallbackHandler(
+        tracer=tracer,
+        duration_histogram=MagicMock(),
+        token_histogram=MagicMock(),
+    )
+    return handler, exporter
+
+
+@pytest.fixture(autouse=True)
+def restore_otel_context():
+    """Snapshot and restore OTel context so suppression tokens cannot leak."""
+    restore_token = context_api.attach(context_api.get_current())
+    yield
+    context_api.detach(restore_token)
+
+
+def _drive_chat_call(handler, *, metadata, invocation_params):
+    """Run a full chat-model lifecycle (start + end) for a single run."""
+    run_id = uuid4()
+    handler.on_chat_model_start(
+        serialized=SERIALIZED,
+        messages=[[HumanMessage(content="tell me a joke")]],
+        run_id=run_id,
+        metadata=metadata,
+        invocation_params=invocation_params,
+    )
+    # bedrock_converse via LangGraph yields no model info in llm_output either,
+    # so the response side must rely on the same metadata fallback.
+    handler.on_llm_end(
+        LLMResult(
+            generations=[[ChatGeneration(message=AIMessage(content="A clean joke."))]],
+            llm_output=None,
+        ),
+        run_id=run_id,
+    )
+
+
+def _finished_span(exporter):
+    return next(s for s in exporter.get_finished_spans() if s.name == SPAN_NAME)
+
+
+def test_request_model_resolved_from_ls_model_name(handler_with_exporter):
+    """Issue #3098: request model comes from metadata when invocation_params omit it."""
+    handler, exporter = handler_with_exporter
+    _drive_chat_call(
+        handler,
+        metadata={"ls_model_name": MODEL, "ls_provider": "bedrock_converse"},
+        invocation_params={"temperature": 0.0},
+    )
+
+    span = _finished_span(exporter)
+    assert span.attributes[GenAIAttributes.GEN_AI_REQUEST_MODEL] == MODEL, (
+        "Issue #3098 not fixed: gen_ai.request.model is 'unknown' for LangGraph "
+        "tool-orchestrated chat models. The model is available via "
+        "metadata['ls_model_name'] but set_request_params never receives metadata."
+    )
+    assert span.attributes[GenAIAttributes.GEN_AI_RESPONSE_MODEL] == MODEL
+
+
+def test_serialized_model_takes_precedence_over_metadata(handler_with_exporter):
+    """No regression: when the model is resolvable normally, metadata is not used.
+
+    LangChain serializes the model into serialized["kwargs"] for the common case
+    (e.g. ChatOpenAI -> model_name), which is what set_chat_request reads. The
+    ls_model_name fallback must only kick in when that lookup yields nothing.
+    """
+    handler, exporter = handler_with_exporter
+    run_id = uuid4()
+    handler.on_chat_model_start(
+        serialized={
+            "id": ["langchain", "chat_models", "openai", "ChatOpenAI"],
+            "kwargs": {"model_name": "gpt-4o"},
+        },
+        messages=[[HumanMessage(content="hi")]],
+        run_id=run_id,
+        metadata={"ls_model_name": "should-not-be-used"},
+        invocation_params={"temperature": 0.0},
+    )
+    handler.on_llm_end(
+        LLMResult(
+            generations=[[ChatGeneration(message=AIMessage(content="ok"))]],
+            llm_output=None,
+        ),
+        run_id=run_id,
+    )
+
+    span = next(
+        s for s in exporter.get_finished_spans() if s.name == "ChatOpenAI.chat"
+    )
+    assert span.attributes[GenAIAttributes.GEN_AI_REQUEST_MODEL] == "gpt-4o"