reactome
diff --git a/‎.config.schema.yaml‎
Lines changed: 6 additions & 1 deletion b/‎.config.schema.yaml‎
Lines changed: 6 additions & 1 deletion
diff --git a/‎.github/actions/verify_imports.py‎
Lines changed: 1 addition & 0 deletions b/‎.github/actions/verify_imports.py‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎bin/chat-chainlit.py‎
Lines changed: 11 additions & 18 deletions b/‎bin/chat-chainlit.py‎
Lines changed: 11 additions & 18 deletions
diff --git a/‎bin/chat-repl‎
Lines changed: 0 additions & 91 deletions b/‎bin/chat-repl‎
Lines changed: 0 additions & 91 deletions
diff --git a/‎bin/embeddings_manager‎
Lines changed: 2 additions & 2 deletions b/‎bin/embeddings_manager‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎config_default.yml‎
Lines changed: 3 additions & 0 deletions b/‎config_default.yml‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎src/__init__.py‎ b/‎src/__init__.py‎
diff --git a/‎src/agent/graph.py‎
Lines changed: 99 additions & 0 deletions b/‎src/agent/graph.py‎
Lines changed: 99 additions & 0 deletions
diff --git a/‎src/agent/models.py‎
Lines changed: 68 additions & 0 deletions b/‎src/agent/models.py‎
Lines changed: 68 additions & 0 deletions
@@ -51,6 +51,11 @@ properties:
             - required: ["event"]
             - required: ["after_messages"]
       required: ["message", "trigger"]
+  profiles:
+    type: array
+    items:
+      type: string
+      enum: ["React-to-Me"]
   usage_limits:
     type: object
     properties:
@@ -73,4 +78,4 @@ properties:
               pattern: "^[0-9]+[smhdw]$"
           required: ["users", "max_messages", "interval"]
     required: ["message_rates"]
-required: ["features", "messages", "usage_limits"]
+required: ["features", "messages", "profiles", "usage_limits"]
@@ -11,6 +11,7 @@
             "chat-chainlit.py",
             "chat-fastapi.py",
             "embeddings_manager",
+            "export_nologin_usage.py",
             "export_records.py",
         ],
     )
 
@@ -1,5 +1,3 @@
-#!/usr/bin/env python
-
 import os
 from typing import Any
 
@@ -10,28 +8,19 @@
 from dotenv import load_dotenv
 from langchain_community.callbacks import OpenAICallbackHandler
 
-from conversational_chain.graph import RAGGraphWithMemory
-from retreival_chain import create_retrieval_chain
+from agent.graph import AgentGraph
+from agent.profiles import ProfileName, get_chat_profiles
 from util.chainlit_helpers import (is_feature_enabled, message_rate_limited,
                                    save_openai_metrics, static_messages,
                                    update_search_results)
 from util.config_yml import Config, TriggerEvent
-from util.embedding_environment import EmbeddingEnvironment
 from util.logging import logging
 
 load_dotenv()
 config: Config | None = Config.from_yaml()
 
-
-ENV = os.getenv("CHAT_ENV", "reactome")
-logging.info(f"Selected environment: {ENV}")
-
-llm_graph: RAGGraphWithMemory = create_retrieval_chain(
-    ENV,
-    EmbeddingEnvironment.get_dir(ENV),
-    hf_model=EmbeddingEnvironment.get_model(ENV),
-    oai_model=os.getenv("OPENAI_MODEL", "gpt-4o-mini"),
-)
+profiles: list[ProfileName] = config.profiles if config else [ProfileName.React_to_Me]
+llm_graph = AgentGraph(profiles)
 
 if os.getenv("POSTGRES_CHAINLIT_DB"):
     CHAINLIT_DB_URI = f"postgresql+psycopg://{os.getenv('POSTGRES_USER')}:{os.getenv('POSTGRES_PASSWORD')}@postgres:5432/{os.getenv('POSTGRES_CHAINLIT_DB')}?sslmode=disable"
@@ -56,12 +45,13 @@ def oauth_callback(
 
 
 @cl.set_chat_profiles
-async def chat_profile() -> list[cl.ChatProfile]:
+async def chat_profiles() -> list[cl.ChatProfile]:
     return [
         cl.ChatProfile(
-            name="React-to-me",
-            markdown_description="An AI assistant specialized in exploring **Reactome** biological pathways and processes.",
+            name=profile.name,
+            markdown_description=profile.description,
         )
+        for profile in get_chat_profiles(profiles)
     ]
 
 
@@ -92,6 +82,8 @@ async def main(message: cl.Message) -> None:
     message_count: int = cl.user_session.get("message_count", 0) + 1
     cl.user_session.set("message_count", message_count)
 
+    chat_profile: str = cl.user_session.get("chat_profile")
+
     thread_id: str = cl.user_session.get("thread_id")
 
     chainlit_cb = cl.AsyncLangchainCallbackHandler(
@@ -103,6 +95,7 @@ async def main(message: cl.Message) -> None:
     enable_postprocess: bool = is_feature_enabled(config, "postprocessing")
     result: dict[str, Any] = await llm_graph.ainvoke(
         message.content,
+        chat_profile.lower(),
         callbacks=[chainlit_cb, openai_cb],
         thread_id=thread_id,
         enable_postprocess=enable_postprocess,
 
@@ -12,8 +12,8 @@ import boto3
 from botocore import UNSIGNED
 from botocore.client import Config
 
-from embeddings.alliance_generator import generate_alliance_embeddings
-from embeddings.reactome_generator import generate_reactome_embeddings
+from data_generation.alliance import generate_alliance_embeddings
+from data_generation.reactome import generate_reactome_embeddings
 from util.embedding_environment import EM_ARCHIVE, EmbeddingEnvironment
 
 S3_BUCKET = "download.reactome.org"
 
@@ -1,5 +1,8 @@
 # yaml-language-server: $schema=./.config.schema.yaml
 
+profiles:
+  - React-to-Me
+
 features:
   postprocessing:  # external web search feature
     enabled: true
 
@@ -0,0 +1,99 @@
+import asyncio
+import os
+from typing import Any
+
+from langchain_core.callbacks.base import Callbacks
+from langchain_core.embeddings import Embeddings
+from langchain_core.language_models.chat_models import BaseChatModel
+from langchain_core.runnables import RunnableConfig
+from langgraph.checkpoint.base import BaseCheckpointSaver
+from langgraph.checkpoint.memory import MemorySaver
+from langgraph.checkpoint.postgres.aio import AsyncPostgresSaver
+from langgraph.graph.state import CompiledStateGraph, StateGraph
+from psycopg import AsyncConnection
+from psycopg_pool import AsyncConnectionPool
+
+from agent.models import get_embedding, get_llm
+from agent.profiles import ProfileName, create_profile_graphs
+from util.logging import logging
+
+LANGGRAPH_DB_URI = f"postgresql://{os.getenv('POSTGRES_USER')}:{os.getenv('POSTGRES_PASSWORD')}@postgres:5432/{os.getenv('POSTGRES_LANGGRAPH_DB')}?sslmode=disable"
+
+if not os.getenv("POSTGRES_LANGGRAPH_DB"):
+    logging.warning("POSTGRES_LANGGRAPH_DB undefined; falling back to MemorySaver.")
+
+
+class AgentGraph:
+    def __init__(
+        self,
+        profiles: list[ProfileName],
+    ) -> None:
+        # Get base models
+        llm: BaseChatModel = get_llm("openai", "gpt-4o-mini")
+        embedding: Embeddings = get_embedding("openai", "text-embedding-3-large")
+
+        self.uncompiled_graph: dict[str, StateGraph] = create_profile_graphs(
+            profiles, llm, embedding
+        )
+
+        # The following are set asynchronously by calling initialize()
+        self.graph: dict[str, CompiledStateGraph] | None = None
+        self.pool: AsyncConnectionPool[AsyncConnection[dict[str, Any]]] | None = None
+
+    def __del__(self) -> None:
+        if self.pool:
+            asyncio.run(self.close_pool())
+
+    async def initialize(self) -> dict[str, CompiledStateGraph]:
+        checkpointer: BaseCheckpointSaver[str] = await self.create_checkpointer()
+        return {
+            profile: graph.compile(checkpointer=checkpointer)
+            for profile, graph in self.uncompiled_graph.items()
+        }
+
+    async def create_checkpointer(self) -> BaseCheckpointSaver[str]:
+        if not os.getenv("POSTGRES_LANGGRAPH_DB"):
+            return MemorySaver()
+        self.pool = AsyncConnectionPool(
+            conninfo=LANGGRAPH_DB_URI,
+            max_size=20,
+            open=False,
+            timeout=30,
+            kwargs={
+                "autocommit": True,
+                "prepare_threshold": 0,
+            },
+        )
+        await self.pool.open()
+        checkpointer = AsyncPostgresSaver(self.pool)
+        await checkpointer.setup()
+        return checkpointer
+
+    async def close_pool(self) -> None:
+        if self.pool:
+            await self.pool.close()
+
+    async def ainvoke(
+        self,
+        user_input: str,
+        profile: str,
+        *,
+        callbacks: Callbacks,
+        thread_id: str,
+        enable_postprocess: bool = True,
+    ) -> dict[str, Any]:
+        if self.graph is None:
+            self.graph = await self.initialize()
+        if profile not in self.graph:
+            return {}
+        result: dict[str, Any] = await self.graph[profile].ainvoke(
+            {"user_input": user_input},
+            config=RunnableConfig(
+                callbacks=callbacks,
+                configurable={
+                    "thread_id": thread_id,
+                    "enable_postprocess": enable_postprocess,
+                },
+            ),
+        )
+        return result
@@ -0,0 +1,68 @@
+from typing import Literal
+
+from langchain_core.embeddings import Embeddings
+from langchain_core.language_models.chat_models import BaseChatModel
+from langchain_huggingface import (HuggingFaceEmbeddings,
+                                   HuggingFaceEndpointEmbeddings)
+from langchain_ollama.chat_models import ChatOllama
+from langchain_openai.chat_models.base import ChatOpenAI
+from langchain_openai.embeddings import OpenAIEmbeddings
+
+
+def get_embedding(
+    provider: (
+        Literal[
+            "openai",
+            "huggingfacehub",
+            "huggingfacelocal",
+        ]
+        | str
+    ),
+    model: str | None = None,
+    *,
+    device: str | None = "cpu",
+) -> Embeddings:
+    if model is None:
+        provider, model = provider.split("/", 1)
+    if provider == "openai":
+        return OpenAIEmbeddings(model=model)
+    elif provider == "huggingfacehub":
+        return HuggingFaceEndpointEmbeddings(model=model)
+    elif provider == "huggingfacelocal":
+        return HuggingFaceEmbeddings(
+            model_name=model,
+            model_kwargs={"device": device, "trust_remote_code": True},
+            encode_kwargs={"batch_size": 12, "normalize_embeddings": False},
+        )
+    else:
+        raise ValueError(f"Unknown provider: {provider}")
+
+
+def get_llm(
+    provider: (
+        Literal[
+            "openai",
+            "ollama",
+        ]
+        | str
+    ),
+    model: str | None = None,
+    *,
+    base_url: str | None = None,
+) -> BaseChatModel:
+    if model is None:
+        provider, model = provider.split("/", 1)
+    if provider == "openai":
+        return ChatOpenAI(
+            model=model,
+            temperature=0.0,
+            base_url=base_url,
+        )
+    elif provider == "ollama":
+        return ChatOllama(
+            model=model,
+            temperature=0.0,
+            base_url=base_url,
+        )
+    else:
+        raise ValueError(f"Unknown provider: {provider}")
Original file line number	Diff line number	Diff line change
`@@ -11,6 +11,7 @@`
`11`	`11`	`"chat-chainlit.py",`
`12`	`12`	`"chat-fastapi.py",`
`13`	`13`	`"embeddings_manager",`
	`14`	`+ "export_nologin_usage.py",`
`14`	`15`	`"export_records.py",`
`15`	`16`	`],`
`16`	`17`	`)`