deepset-ai
diff --git a/‎.github/workflows/e2b.yml‎
Lines changed: 3 additions & 3 deletions b/‎.github/workflows/e2b.yml‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎integrations/elasticsearch/src/haystack_integrations/components/retrievers/elasticsearch/__init__.py‎
Lines changed: 2 additions & 0 deletions b/‎integrations/elasticsearch/src/haystack_integrations/components/retrievers/elasticsearch/__init__.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎integrations/elasticsearch/src/haystack_integrations/components/retrievers/elasticsearch/inference_hybrid_retriever.py‎
Lines changed: 172 additions & 0 deletions b/‎integrations/elasticsearch/src/haystack_integrations/components/retrievers/elasticsearch/inference_hybrid_retriever.py‎
Lines changed: 172 additions & 0 deletions
diff --git a/‎integrations/elasticsearch/src/haystack_integrations/document_stores/elasticsearch/document_store.py‎
Lines changed: 146 additions & 0 deletions b/‎integrations/elasticsearch/src/haystack_integrations/document_stores/elasticsearch/document_store.py‎
Lines changed: 146 additions & 0 deletions
@@ -87,7 +87,7 @@ jobs:
       - name: Store unit tests coverage
         id: coverage_comment
         if: matrix.python-version == '3.10' && runner.os == 'Linux' && github.event_name != 'schedule'
-        uses: py-cov-action/python-coverage-comment-action@7188638f871f721a365d644f505d1ff3df20d683 # v3.40
+        uses: py-cov-action/python-coverage-comment-action@63f52f4fbbffada6e8dee8ec432de7e01df9ba79 # v3.41
         with:
           GITHUB_TOKEN: ${{ github.token }}
           COVERAGE_PATH: integrations/e2b
@@ -97,7 +97,7 @@ jobs:
 
       - name: Upload coverage comment to be posted
         if: matrix.python-version == '3.10' && runner.os == 'Linux' && github.event_name == 'pull_request' && steps.coverage_comment.outputs.COMMENT_FILE_WRITTEN == 'true'
-        uses: actions/upload-artifact@bbbca2ddaa5d8feaa63e36b76fdaad77386f024f # v7.0.0
+        uses: actions/upload-artifact@043fb46d1a93c77aae656e7c1c64a875d1fc6a0a # v7.0.1
         with:
           name: coverage-comment-e2b
           path: python-coverage-comment-action-e2b.txt
@@ -108,7 +108,7 @@ jobs:
 
       - name: Store combined coverage
         if: github.event_name == 'push'
-        uses: py-cov-action/python-coverage-comment-action@7188638f871f721a365d644f505d1ff3df20d683 # v3.40
+        uses: py-cov-action/python-coverage-comment-action@63f52f4fbbffada6e8dee8ec432de7e01df9ba79 # v3.41
         with:
           GITHUB_TOKEN: ${{ github.token }}
           COVERAGE_PATH: integrations/e2b
 
@@ -4,6 +4,7 @@
 from .bm25_retriever import ElasticsearchBM25Retriever
 from .elasticsearch_hybrid_retriever import ElasticsearchHybridRetriever
 from .embedding_retriever import ElasticsearchEmbeddingRetriever
+from .inference_hybrid_retriever import ElasticsearchInferenceHybridRetriever
 from .inference_sparse_retriever import ElasticsearchInferenceSparseRetriever
 from .sparse_embedding_retriever import ElasticsearchSparseEmbeddingRetriever
 from .sql_retriever import ElasticsearchSQLRetriever
@@ -12,6 +13,7 @@
     "ElasticsearchBM25Retriever",
     "ElasticsearchEmbeddingRetriever",
     "ElasticsearchHybridRetriever",
+    "ElasticsearchInferenceHybridRetriever",
     "ElasticsearchInferenceSparseRetriever",
     "ElasticsearchSQLRetriever",
     "ElasticsearchSparseEmbeddingRetriever",
 
@@ -0,0 +1,172 @@
+# SPDX-FileCopyrightText: 2023-present deepset GmbH <info@deepset.ai>
+#
+# SPDX-License-Identifier: Apache-2.0
+
+from typing import Any
+
+from haystack import component, default_from_dict, default_to_dict
+from haystack.dataclasses import Document
+from haystack.document_stores.types import FilterPolicy
+from haystack.document_stores.types.filter_policy import apply_filter_policy
+
+from haystack_integrations.document_stores.elasticsearch import ElasticsearchDocumentStore
+
+
+@component
+class ElasticsearchInferenceHybridRetriever:
+    """
+    A fully server-side hybrid retriever combining BM25 and ELSER sparse vector search via Elasticsearch RRF.
+
+    Issues a single Elasticsearch request using the `retriever.rrf` API (ES 8.9+ for `rank.rrf`,
+    ES 8.14+ for the Retriever API). No local embedding model is required and no client-side
+    score merging takes place — ranking is handled entirely by Elasticsearch.
+
+    Usage example (Elastic Cloud with ELSER deployed):
+
+    ```python
+    import os
+    from haystack_integrations.components.retrievers.elasticsearch import ElasticsearchInferenceHybridRetriever
+    from haystack_integrations.document_stores.elasticsearch import ElasticsearchDocumentStore
+
+    doc_store = ElasticsearchDocumentStore(
+        hosts=os.environ["ELASTICSEARCH_URL"],
+        api_key=os.environ["ELASTIC_API_KEY"],
+        sparse_vector_field="sparse_vec",
+    )
+    retriever = ElasticsearchInferenceHybridRetriever(
+        document_store=doc_store,
+        inference_id=".elser-2-elasticsearch",
+    )
+    results = retriever.run(query="What is reinforcement learning?")
+    ```
+    """
+
+    def __init__(
+        self,
+        *,
+        document_store: ElasticsearchDocumentStore,
+        inference_id: str,
+        filters: dict[str, Any] | None = None,
+        fuzziness: str = "AUTO",
+        top_k: int = 10,
+        filter_policy: str | FilterPolicy = FilterPolicy.REPLACE,
+        rank_window_size: int = 100,
+        rank_constant: int = 60,
+    ) -> None:
+        """
+        Create the ElasticsearchInferenceHybridRetriever component.
+
+        :param document_store: An instance of ElasticsearchDocumentStore with `sparse_vector_field` configured.
+        :param inference_id: The Elasticsearch inference endpoint ID used for sparse vector search e.g.
+            ".elser-2-elasticsearch"
+        :param filters: Filters applied to both sub-retrievers.
+        :param fuzziness: Fuzziness for the BM25 multi_match query.
+        :param top_k: Maximum number of Documents to return.
+        :param filter_policy: Policy to determine how runtime filters are merged with init-time filters.
+        :param rank_window_size: Number of candidates each sub-retriever collects before RRF ranking.
+        :param rank_constant: RRF rank constant. Higher values reduce the impact of rank position differences.
+        :raises ValueError: If `document_store` is not an ElasticsearchDocumentStore or `inference_id` is empty.
+        """
+        if not isinstance(document_store, ElasticsearchDocumentStore):
+            msg = "document_store must be an instance of ElasticsearchDocumentStore"
+            raise ValueError(msg)
+
+        if not inference_id:
+            msg = "inference_id must be provided"
+            raise ValueError(msg)
+
+        self._document_store = document_store
+        self._inference_id = inference_id
+        self._filters = filters or {}
+        self._fuzziness = fuzziness
+        self._top_k = top_k
+        self._filter_policy = FilterPolicy.from_str(filter_policy) if isinstance(filter_policy, str) else filter_policy
+        self._rank_window_size = rank_window_size
+        self._rank_constant = rank_constant
+
+    def to_dict(self) -> dict[str, Any]:
+        """
+        Serializes the component to a dictionary.
+
+        :returns: Dictionary with serialized data.
+        """
+        return default_to_dict(
+            self,
+            document_store=self._document_store.to_dict(),
+            inference_id=self._inference_id,
+            filters=self._filters,
+            fuzziness=self._fuzziness,
+            top_k=self._top_k,
+            filter_policy=self._filter_policy.value,
+            rank_window_size=self._rank_window_size,
+            rank_constant=self._rank_constant,
+        )
+
+    @classmethod
+    def from_dict(cls, data: dict[str, Any]) -> "ElasticsearchInferenceHybridRetriever":
+        """
+        Deserializes the component from a dictionary.
+
+        :param data: Dictionary to deserialize from.
+        :returns: Deserialized component instance.
+        """
+        data["init_parameters"]["document_store"] = ElasticsearchDocumentStore.from_dict(
+            data["init_parameters"]["document_store"]
+        )
+        if filter_policy := data["init_parameters"].get("filter_policy"):
+            data["init_parameters"]["filter_policy"] = FilterPolicy.from_str(filter_policy)
+        return default_from_dict(cls, data)
+
+    @component.output_types(documents=list[Document])
+    def run(
+        self,
+        query: str,
+        filters: dict[str, Any] | None = None,
+        top_k: int | None = None,
+    ) -> dict[str, list[Document]]:
+        """
+        Run a hybrid retrieval query against Elasticsearch.
+
+        :param query: The query string.
+        :param filters: Runtime filters merged with init-time filters according to `filter_policy`.
+        :param top_k: Maximum number of documents to return, overrides the init-time value.
+        :returns: A dictionary with key `documents` containing the retrieved list of `Document`s.
+        """
+        filters = apply_filter_policy(self._filter_policy, self._filters, filters)
+        docs = self._document_store._hybrid_retrieval_inference(
+            query=query,
+            inference_id=self._inference_id,
+            filters=filters,
+            fuzziness=self._fuzziness,
+            top_k=top_k or self._top_k,
+            rank_window_size=self._rank_window_size,
+            rank_constant=self._rank_constant,
+        )
+        return {"documents": docs}
+
+    @component.output_types(documents=list[Document])
+    async def run_async(
+        self,
+        query: str,
+        filters: dict[str, Any] | None = None,
+        top_k: int | None = None,
+    ) -> dict[str, list[Document]]:
+        """
+        Asynchronously run a hybrid retrieval query against Elasticsearch.
+
+        :param query: The query string.
+        :param filters: Runtime filters merged with init-time filters according to `filter_policy`.
+        :param top_k: Maximum number of documents to return, overrides the init-time value.
+        :returns: A dictionary with key `documents` containing the retrieved list of `Document`s.
+        """
+        filters = apply_filter_policy(self._filter_policy, self._filters, filters)
+        docs = await self._document_store._hybrid_retrieval_inference_async(
+            query=query,
+            inference_id=self._inference_id,
+            filters=filters,
+            fuzziness=self._fuzziness,
+            top_k=top_k or self._top_k,
+            rank_window_size=self._rank_window_size,
+            rank_constant=self._rank_constant,
+        )
+        return {"documents": docs}
@@ -1309,6 +1309,152 @@ async def _sparse_vector_retrieval_inference_async(
         )
         return await self._search_documents_async(**search_body)
 
+    def _create_hybrid_retrieval_inference_body(
+        self,
+        query: str,
+        inference_id: str,
+        *,
+        filters: dict[str, Any] | None = None,
+        fuzziness: str = "AUTO",
+        top_k: int = 10,
+        rank_window_size: int = 100,
+        rank_constant: int = 60,
+    ) -> dict[str, Any]:
+        """
+        Builds the Elasticsearch search body for server-side hybrid retrieval using the RRF retriever API.
+
+        Combines BM25 (multi_match) and sparse vector (ELSER inference) as two standard sub-retrievers
+        inside a single `retriever.rrf` request — no client-side merging.
+
+        :param query: Query text.
+        :param inference_id: Elasticsearch inference model ID (e.g. ".elser_model_2").
+        :param filters: Optional filters applied to both sub-retrievers.
+        :param fuzziness: Fuzziness for the BM25 multi_match query.
+        :param top_k: Number of documents to return.
+        :param rank_window_size: Number of candidates each sub-retriever collects before RRF merging.
+        :param rank_constant: RRF rank constant (higher values reduce the impact of rank differences).
+        :returns: Search body for Elasticsearch.
+        :raises ValueError: If `sparse_vector_field` is not configured or `query` is empty.
+        """
+        if not self._sparse_vector_field:
+            msg = "sparse_vector_field must be set for hybrid retrieval"
+            raise ValueError(msg)
+        if not query:
+            msg = "query must be a non-empty string"
+            raise ValueError(msg)
+
+        bm25_clause: dict[str, Any] = {
+            "standard": {
+                "query": {
+                    "multi_match": {
+                        "query": query,
+                        "fuzziness": fuzziness,
+                        "type": "most_fields",
+                        "operator": "OR",
+                    }
+                }
+            }
+        }
+        sparse_clause: dict[str, Any] = {
+            "standard": {
+                "query": {
+                    "sparse_vector": {
+                        "field": self._sparse_vector_field,
+                        "inference_id": inference_id,
+                        "query": query,
+                    }
+                }
+            }
+        }
+
+        if filters:
+            normalized = _normalize_filters(filters)
+            bm25_clause["standard"]["filter"] = normalized
+            sparse_clause["standard"]["filter"] = normalized
+
+        return {
+            "retriever": {
+                "rrf": {
+                    "retrievers": [bm25_clause, sparse_clause],
+                    "rank_window_size": rank_window_size,
+                    "rank_constant": rank_constant,
+                }
+            },
+            "size": top_k,
+        }
+
+    def _hybrid_retrieval_inference(
+        self,
+        query: str,
+        inference_id: str,
+        *,
+        filters: dict[str, Any] | None = None,
+        fuzziness: str = "AUTO",
+        top_k: int = 10,
+        rank_window_size: int = 100,
+        rank_constant: int = 60,
+    ) -> list[Document]:
+        """
+        Retrieves documents using a fully server-side hybrid search (BM25 + ELSER RRF).
+
+        Issues a single Elasticsearch request using the `retriever.rrf` API (available since ES 8.9,
+        Retriever API since ES 8.14). No client-side score merging is performed.
+
+        :param query: Query text.
+        :param inference_id: Elasticsearch inference model ID (e.g. ".elser_model_2").
+        :param filters: Optional filters applied to both sub-retrievers.
+        :param fuzziness: Fuzziness for the BM25 multi_match query.
+        :param top_k: Maximum number of documents to return.
+        :param rank_window_size: Number of candidates each sub-retriever collects before RRF merging.
+        :param rank_constant: RRF rank constant.
+        :returns: List of Documents ranked by RRF score.
+        """
+        body = self._create_hybrid_retrieval_inference_body(
+            query=query,
+            inference_id=inference_id,
+            filters=filters,
+            fuzziness=fuzziness,
+            top_k=top_k,
+            rank_window_size=rank_window_size,
+            rank_constant=rank_constant,
+        )
+        return self._search_documents(**body)
+
+    async def _hybrid_retrieval_inference_async(
+        self,
+        query: str,
+        inference_id: str,
+        *,
+        filters: dict[str, Any] | None = None,
+        fuzziness: str = "AUTO",
+        top_k: int = 10,
+        rank_window_size: int = 100,
+        rank_constant: int = 60,
+    ) -> list[Document]:
+        """
+        Asynchronously retrieves documents using a fully server-side hybrid search (BM25 + ELSER RRF).
+
+        :param query: Query text.
+        :param inference_id: Elasticsearch inference model ID (e.g. ".elser_model_2").
+        :param filters: Optional filters applied to both sub-retrievers.
+        :param fuzziness: Fuzziness for the BM25 multi_match query.
+        :param top_k: Maximum number of documents to return.
+        :param rank_window_size: Number of candidates each sub-retriever collects before RRF merging.
+        :param rank_constant: RRF rank constant.
+        :returns: List of Documents ranked by RRF score.
+        """
+        self._ensure_initialized()
+        body = self._create_hybrid_retrieval_inference_body(
+            query=query,
+            inference_id=inference_id,
+            filters=filters,
+            fuzziness=fuzziness,
+            top_k=top_k,
+            rank_window_size=rank_window_size,
+            rank_constant=rank_constant,
+        )
+        return await self._search_documents_async(**body)
+
     def count_documents_by_filter(self, filters: dict[str, Any]) -> int:
         """
         Returns the number of documents that match the provided filters.