feat: add Ogham memory provider (#9)

kevin-burns · web-flow · commit 84c3f966f2db · 2026-04-13T10:29:32.000+02:00
Ogham MCP (https://ogham-mcp.dev) -- open-source memory layer using PostgreSQL + pgvector with hybrid vector + BM25 search via Reciprocal Rank Fusion. Architecture: verbatim conversation storage with optional read-time fact extraction. Local Postgres backend, MIT licensed. Setup: pip install ogham-mcp # Requires: local Postgres with pgvector, OGHAM_REPO env var pointing # to the ogham-mcp source, embedding provider configured via env vars. Usage: omb run --dataset longmemeval --split s --memory ogham
diff --git a/src/memory_bench/memory/__init__.py b/src/memory_bench/memory/__init__.py
@@ -7,6 +7,7 @@
 from .mem0 import Mem0MemoryProvider
 from .mem0_cloud import Mem0CloudMemoryProvider
 from .hybrid_search import HybridSearchMemoryProvider
+from .ogham import OghamMemoryProvider
 from .supermemory import SupermemoryMemoryProvider
 
 REGISTRY: dict[str, type[MemoryProvider]] = {
@@ -20,6 +21,7 @@
     "mastra-om": MastraOMMemoryProvider,
     "mem0": Mem0MemoryProvider,
     "mem0-cloud": Mem0CloudMemoryProvider,
+    "ogham": OghamMemoryProvider,
     "qdrant": HybridSearchMemoryProvider,
     "supermemory": SupermemoryMemoryProvider,
 }
diff --git a/src/memory_bench/memory/ogham.py b/src/memory_bench/memory/ogham.py
@@ -0,0 +1,218 @@
+"""Ogham MCP memory provider for Agent Memory Benchmark.
+
+Uses Ogham's hybrid search (vector + BM25 + entity overlap boost)
+via the local Python API. For gateway/cloud use, swap to HTTP calls.
+"""
+
+import os
+import sys
+from pathlib import Path
+
+from ..models import Document
+from .base import MemoryProvider
+
+# Add Ogham source to path for direct import
+_OGHAM_REPO = os.environ.get("OGHAM_REPO", "")
+
+
+def _ensure_ogham():
+    """Lazy-import Ogham modules, adding repo to sys.path if needed."""
+    if _OGHAM_REPO and _OGHAM_REPO not in sys.path:
+        sys.path.insert(0, os.path.join(_OGHAM_REPO, "src"))
+    # Set config from env before importing
+    os.environ.setdefault("DATABASE_BACKEND", "postgres")
+
+
+class OghamMemoryProvider(MemoryProvider):
+    name = "ogham"
+    description = (
+        "Ogham MCP: hybrid vector + BM25 search with entity overlap boost. "
+        "Local Postgres + pgvector. Stores verbatim conversations and retrieves "
+        "via Reciprocal Rank Fusion with optional read-time fact extraction."
+    )
+    kind = "local"
+    provider = "ogham"
+    variant = "local"
+    link = "https://ogham-mcp.dev"
+    concurrency = 8
+
+    def __init__(self, k: int = 20, extract_facts: bool = False):
+        self.k = k
+        self._profile_prefix = "amb_"
+        self._extract_facts_enabled = extract_facts
+        self._extractor_client = None
+
+    def initialize(self) -> None:
+        _ensure_ogham()
+
+    def prepare(
+        self, store_dir: Path, unit_ids: set[str] | None = None, reset: bool = True
+    ) -> None:
+        _ensure_ogham()
+
+    def cleanup(self) -> None:
+        from ogham.database import _reset_backend
+
+        _reset_backend()
+
+    def _profile(self, user_id: str | None) -> str:
+        return f"{self._profile_prefix}{user_id or 'default'}"
+
+    @staticmethod
+    def _format_content(doc: Document) -> str:
+        """Convert document to clean text for embedding and retrieval.
+
+        Handles three cases:
+        1. doc.messages is populated (structured turns)
+        2. doc.content is a JSON string of messages (LME format)
+        3. doc.content is plain text
+        """
+        import json
+
+        messages = doc.messages
+        if not messages and doc.content.strip().startswith("["):
+            try:
+                messages = json.loads(doc.content)
+            except (json.JSONDecodeError, TypeError):
+                pass
+
+        if messages and isinstance(messages, list):
+            parts = []
+            for msg in messages:
+                if isinstance(msg, dict):
+                    role = "User" if msg.get("role") == "user" else "Assistant"
+                    content = msg.get("content", "").strip()
+                    if content:
+                        parts.append(f"{role}: {content}")
+            if parts:
+                text = "\n".join(parts)
+                if doc.timestamp:
+                    text = f"[Date: {doc.timestamp}]\n{text}"
+                return text
+
+        return doc.content
+
+    def ingest(self, documents: list[Document]) -> None:
+        from ogham.embeddings import generate_embeddings_batch
+        from ogham.database import get_backend
+
+        backend = get_backend()
+
+        texts = [self._format_content(doc) for doc in documents]
+        if not texts:
+            return
+
+        embeddings = generate_embeddings_batch(texts)
+
+        rows = []
+        for i, (text, emb) in enumerate(zip(texts, embeddings)):
+            d = documents[i]
+            profile = self._profile(d.user_id)
+            tags = []
+            if d.timestamp:
+                tags.append(f"date:{d.timestamp}")
+            rows.append(
+                {
+                    "content": text,
+                    "embedding": str(emb),
+                    "profile": profile,
+                    "source": "amb",
+                    "tags": tags,
+                    "metadata": {"doc_id": d.id},
+                }
+            )
+
+        for i in range(0, len(rows), 100):
+            batch = rows[i : i + 100]
+            backend.store_memories_batch(batch)
+
+    def _get_extractor(self):
+        """Lazy-init LLM client for read-time fact extraction."""
+        if self._extractor_client is None:
+            provider = os.environ.get("OGHAM_EXTRACTOR_PROVIDER", "gemini")
+            if provider == "openai":
+                from openai import OpenAI
+
+                self._extractor_client = ("openai", OpenAI(api_key=os.environ.get("OPENAI_API_KEY")))
+            else:
+                from google import genai
+
+                api_key = os.environ.get("GEMINI_API_KEY") or os.environ.get("GOOGLE_API_KEY")
+                self._extractor_client = ("gemini", genai.Client(api_key=api_key))
+        return self._extractor_client
+
+    def _extract_facts(self, query: str, raw_content: str) -> str:
+        """Extract query-relevant facts from raw conversation context.
+
+        Read-time extraction: the extractor sees both the query and the
+        retrieved context, producing a focused summary for the reader.
+        """
+        prompt = f"""Given a user's question and conversation history, extract the facts most relevant to answering the question.
+
+Question: {query}
+
+Conversation history:
+{raw_content}
+
+Extract relevant facts as a concise bulleted list. Preserve specific details: names, numbers, dates, locations. If the history contains no relevant information, respond with "NO RELEVANT FACTS"."""
+
+        try:
+            provider, client = self._get_extractor()
+            if provider == "openai":
+                model = os.environ.get("OGHAM_EXTRACTOR_MODEL", "gpt-4.1-mini")
+                response = client.chat.completions.create(
+                    model=model,
+                    messages=[{"role": "user", "content": prompt}],
+                )
+                return response.choices[0].message.content or raw_content
+            else:
+                model = os.environ.get("OGHAM_EXTRACTOR_MODEL", "gemini-2.5-flash")
+                response = client.models.generate_content(
+                    model=model,
+                    contents=prompt,
+                )
+                return response.text or raw_content
+        except Exception:
+            return raw_content
+
+    def retrieve(
+        self,
+        query: str,
+        k: int = 10,
+        user_id: str | None = None,
+        query_timestamp: str | None = None,
+    ) -> tuple[list[Document], dict | None]:
+        from ogham.service import search_memories_enriched
+
+        profile = self._profile(user_id)
+        results = search_memories_enriched(
+            query=query,
+            profile=profile,
+            limit=k or self.k,
+        )
+
+        if not results:
+            return [], None
+
+        if self._extract_facts_enabled:
+            raw_bundle_parts = []
+            for i, r in enumerate(results):
+                content = r.get("content", "")
+                raw_bundle_parts.append(f"## Memory {i + 1}\n{content}")
+            raw_bundle = "\n\n".join(raw_bundle_parts)
+
+            facts = self._extract_facts(query, raw_bundle)
+            return [Document(id="ogham-extracted-facts", content=facts)], None
+
+        docs = []
+        for r in results:
+            content_parts = [r.get("content", "")]
+            if r.get("relevance") is not None:
+                content_parts.append(f"relevance: {r['relevance']:.3f}")
+            docs.append(
+                Document(
+                    id=str(r.get("id", "")),
+                    content="\n".join(content_parts),
+                )
+            )
+        return docs, None