Skip to content
This repository was archived by the owner on Jun 3, 2026. It is now read-only.

Latest commit

 

History

History
433 lines (340 loc) · 32.4 KB

File metadata and controls

433 lines (340 loc) · 32.4 KB
XMem Logo

XMem

AI के लिए मेमोरी लेयर जो कभी भूलती नहीं है

हर AI एजेंट और LLM इंटरफेस को तुरंत स्थायी, क्रॉस-प्लेटफॉर्म मेमोरी दें।

Python 3.11+ BSD-3 License FastAPI
LangGraph Rust Weaver Multi-LLM

English  •  简体中文  •  日本語  •  हिन्दी

डेमो  •  विशेषताएं  •  आर्किटेक्चर  •  बेंचमार्क  •  त्वरित शुरुआत  •  कॉन्फ़िगरेशन

Star History Chart

अपडेट / समाचार

  • [1 जून 2026] XMem के पास अब इसकी मेमोरी लेयर का नेटिव Golang कार्यान्वयन है। उच्च थ्रूपुट, कम विलंबता, और उत्पादन-स्तरीय परिनियोजन के लिए बनाया गया है जहां मेमोरी को लाखों इंटरैक्शन में विश्वसनीयता से काम करना होता है।
  • [25 मई 2026] स्थानीय वर्कस्पेस समर्थन अब लाइव है। XMem को मात्र 3 कमांड में स्थानीय रूप से सेट अप करें और मिनटों में मेमोरी के साथ निर्माण करना शुरू करें। सेटअप निर्देशों के लिए Local.md देखें।
npx create-xmem@latest
cd xmem
npm run dev

XMem क्या है?

LLM के साथ हर बातचीत शून्य से शुरू होती है। टूल स्विच करें, प्रदाता स्विच करें, अगले सप्ताह वापस आएं और सारा संदर्भ गायब है।

XMem भारत की #1 ओपन सोर्स एजेंटिक मेमोरी लेयर है, हम मेमोरी-ऐज़-ए-सर्विस पेश कर रहे हैं, यानी हर AI उपयोग के मामले, डोमेन के लिए मेमोरी लेयर, चाहे वह लंबे समय तक चलने वाले एजेंटों के लिए समय-आधारित मेमोरी हो, रोगी संदर्भ के लिए चिकित्सा मेमोरी हो, टीमों और परियोजनाओं के लिए एंटरप्राइज मेमोरी हो, या कोडिंग एजेंटों और वर्कफ़्लो के लिए डेवलपर मेमोरी हो।

यह स्टेटफुल AI के लिए एक अनूठी किस्म की एजेंटिक मेमोरी लेयर है। पारंपरिक मेमोरी सिस्टम के विपरीत जो केवल चंक संग्रहीत और पुनः प्राप्त करते हैं, XMem मेमोरी को एक सक्रिय तर्क प्रक्रिया में बदल देता है। यह निर्णय लेता है कि क्या याद रखना है, क्या अपडेट करना है, क्या भूलना है, और प्रत्येक मेमोरी को सही विशेषज्ञ एजेंट और स्टोर में गतिशील रूप से रूट करता है।

डेमो

किसी भी AI प्लेटफॉर्म पर "X" टाइप करें और अपनी मेमोरी को निर्बाध रूप से संग्रहीत और खोजने, मौजूदा चैट से संदर्भ आयात करने, या अनुक्रमित रिपो के साथ काम करने के लिए XMem द्वारा दी जाने वाली चार मोड के बीच चयन करें।

demo.mp4

विशेषताएं

Chrome एक्सटेंशन

XMem Chrome एक्सटेंशन ChatGPT, Claude, Gemini, DeepSeek, और Perplexity को स्थायी मेमोरी लाता है।

लाइव सर्च और इंजेक्ट - जैसे ही आप प्रॉम्प्ट टाइप करते हैं, XMem रीयल-टाइम में आपकी मेमोरी को खोजता है और एक फ्लोटिंग चिप दिखाता है। एक क्लिक सीधे आपके इनपुट में प्रासंगिक संदर्भ इंजेक्ट करता है, कोई घर्षण नहीं।

पृष्ठभूमि ऑटो-सेव (Xingest) - जब आप "भेजें" दबाते हैं, XMem अनिवार्य रूप से बातचीत मोड़ को कैप्चर करता है। एक पृष्ठभूमि कतार आपके UI को छुए बिना तथ्यों और सारांशों को निकालता है।

extension-settings-1773462173011.mp4

एजेंट प्लगइन

इसमें Claude Code, Codex, Cursor, Hermes, OpenClaw और OpenCode के लिए प्रथम-पक्षीय एकीकरण शामिल हैं, ताकि एजेंट मौजूदा मेमोरी खोज सकें, टिकाऊ परियोजना ज्ञान सहेज सकें, और सत्रों के बीच संदर्भ ले जा सकें जबकि API कुंजियों को पर्यावरण चर या क्लाइंट-विशिष्ट गुप्त स्टोर में रखते हैं।

संदर्भ

संदर्भ आपको किसी भी चीज़ को मैन्युअल रूप से कॉपी पेस्ट किए बिना एक मौजूदा बातचीत को XMem में लाने देता है।

साझा किया गया ChatGPT, Claude, या Gemini लिंक पेस्ट करें। XMem इसे खोलता है, हर उपयोगकर्ता और सहायक संदेश निकालता है, और पूरी इनगेशन पाइपलाइन चलाता है ताकि बातचीत खोज योग्य मेमोरी बन जाए।

आप एक ट्रांसक्रिप्ट फ़ाइल (पाठ, मार्कडाउन, या JSON) भी अपलोड कर सकते हैं। XMem के पास Cursor और Antigravity निर्यात के लिए निर्मित पार्सिंग है और अज्ञात प्रारूपों के लिए एक LLM फॉलबैक का उपयोग करता है।

abbIsz_DujBnbmVp.mp4

स्कैनर

स्कैनर संपूर्ण Git रिपोजिटरीज को अनुक्रमित करता है और आपके कोडबेस का एक क्वेरीयोग्य ज्ञान ग्राफ बनाता है।

एक बार अनुक्रमित होने के बाद, आप फ़ाइलों, कार्यों, निर्भरताओं, और प्रभाव के बारे में प्राकृतिक भाषा प्रश्न पूछ सकते हैं। इसका उपयोग एक नई रिपो को समझने, यह पता लगाने के लिए करें कि कोई सुविधा कहां रहती है, ट्रेस करें कि कोड कैसे जुड़ता है, या यह समझें कि आप कुछ बदलने से क्या टूट जाएगा।

MV1KUiFXYXN7MpH3.mp4

बहु-डोमेन वर्गीकरण

सभी मेमोरी समान नहीं है, और इसके साथ इसे उसी तरह व्यवहार करना अन्य समाधानों को कम प्रदर्शन करता है। XMem का Classifier Agent आने वाले प्रत्येक डेटा को विश्लेषण करता है और इसे सही डोमेन में रूट करता है:

डोमेन यह क्या संग्रहीत करता है उदाहरण भंडारण
प्रोफाइल स्थायी उपयोगकर्ता तथ्य, प्राथमिकताएं, पहचान "मुझे backends के लिए Go, Python से ज्यादा पसंद है" Pinecone
अस्थायी समय-लंगर घटनाएं तारीख संकल्प के साथ "मुझे कल Staff Engineer के रूप में पदोन्नति मिली" Neo4j
सारांश संपीड़ित बातचीत सारांश "REST से gRPC में माइग्रेशन पर चर्चा की गई" Pinecone
कोड प्रतीकों से जुड़ी व्याख्याएं, बग, व्याख्याएं "इस रीट्राई लॉजिक में एक रेस कंडीशन है" Neo4j + Pinecone
स्निपेट व्यक्तिगत कोड पैटर्न और उपयोगिता "यह Go में मेरा मानक त्रुटि हैंडलर है" Pinecone
छवि दृश्य अवलोकन और विवरण आर्किटेक्चर आरेख का स्क्रीनशॉट Pinecone

एजेंटिक रिट्रीवल

जब आप XMem को क्वेरी करते हैं, तो रिट्रीवल एक सरल वेक्टर सर्च नहीं है। LLM स्वयं निर्णय लेता है कि क्या खोजना है:

  1. टूल चयन - रिट्रीवल LLM आपकी क्वेरी का विश्लेषण करता है और उपयुक्त सर्च टूल (SearchProfile, SearchTemporal, SearchSummary, SearchSnippet) को कॉल करता है, संभावित रूप से समानांतर में कई।
  2. संश्लेषण - सभी सर्च टूल के परिणाम एकत्र किए जाते हैं और LLM स्रोत संदर्भों के साथ एक उद्धृत उत्तर उत्पन्न करता है।

इसका अर्थ है "मेरी पसंदीदा टेक स्टैक क्या है और मैंने अंतिम बार auth मॉड्यूल को रीफैक्टर कब किया?" पूछना स्वचालित रूप से प्रोफाइल लुकअप और एक अस्थायी सर्च दोनों को ट्रिगर करता है।

Multi-LLM ऑर्केस्ट्रेशन फॉलबैक के साथ

XMem एक प्रदाता पर बंद नहीं है। यह Gemini, Claude, OpenAI, OpenRouter, Amazon Bedrock, और Ollama में ऑर्केस्ट्रेट करता है स्वचालित फॉलबैक के साथ:

gemini -> claude -> openai -> bedrock -> ollama

यदि आपका प्राथमिक LLM दर सीमित करता है या नीचे चला जाता है, XMem चुपचाप अगले प्रदाता को फॉलबैक करता है। प्रत्येक एजेंट एक विशिष्ट मॉडल पर पिन किया जा सकता है। फॉलबैक क्रम पूरी तरह से कॉन्फ़िगर करने योग्य है।

स्थानीय रूप से चलाता है

कोई क्लाउड निर्भरता आवश्यक नहीं है। Ollama के साथ XMem चलाएं LLM के लिए, FastEmbed एम्बेडिंग के लिए, और Chroma या SQLite वेक्टर स्टोरेज के लिए:

pip install -e ".[local]"

आर्किटेक्चर

WhatsApp Image 2026-04-27 at 11 50 51

XMem को विशेषज्ञ AI एजेंटों की पाइपलाइन के रूप में बनाया गया है जो LangGraph द्वारा समन्वित है, निर्धारणीय निष्पादन लेयर (Weaver) और तीन उद्देश्य-निर्मित संग्रहण इंजन द्वारा समर्थित है।

इनगेशन फ्लो

यूजर इनपुट (SDK / Chrome Extension / API)
         |
         v
   +--------------+
   |  Classifier   |    पाठ का विश्लेषण करता है, डोमेन में रूट करता है
   +------+-------+
          |
    +-----+-----+------+----------+
    v     v     v      v          v
 Profile Temporal Summary Code  Snippet     डोमेन एजेंट निकालते हैं
 Agent   Agent   Agent  Agent   Agent       संरचित डेटा समानांतर में
    |     |      |      |        |
    v     v      v      v        v
   +----------------------------------+
   |          Judge Agent             |     मौजूदा मेमोरी के विरुद्ध तुलना करता है
   |   (ADD / UPDATE / DELETE / NOOP) |     डुप्लिकेट और स्टेलनेस को रोकता है
   +----------------+-----------------+
                    |
                    v
   +----------------------------------+
   |        Weaver (Rust core)        |     निर्धारणीय निष्पादन
   |  Pinecone | Neo4j | MongoDB     |     कोई LLM नहीं। शुद्ध सॉफ्टवेयर तर्क।
   +----------------------------------+
  1. Classifier इनपुट को प्रासंगिक डोमेन में रूट करता है।
  2. डोमेन एजेंट (Profiler, Temporal, Summarizer, Code, Snippet, Image) समानांतर में संरचित डेटा निकालते हैं।
  3. Judge Agent प्रत्येक निष्कर्षण की तुलना मौजूदा मेमोरी से करता है और निर्णय लेता है: ADD, UPDATE, DELETE, या NOOP।
  4. Weaver Judge के निर्णयों को सभी भंडारण बैकएंड में निर्धारक रूप से निष्पादित करता है। कोर को एक स्टैंडअलोन Rust क्रेट के रूप में लागू किया जाता है कोई LLM निर्भरता के साथ।

उच्च-प्रयास मोड स्वचालित रूप से लंबे इनपुट को ओवरलैपिंग चंक (~200 टोकन) में विभाजित करता है और उन्हें समानांतर में संसाधित करता है, फिर लंबी बातचीत में कुछ भी मिस न हो इसके लिए परिणामों को मर्ज करता है।

रिट्रीवल फ्लो

यूजर क्वेरी
    |
    v
+----------------------------------+
|       Retrieval LLM              |
|  यह निर्धारित करता है कि कौन से  |
|  टूल को कॉल करना है:             |
|  SearchProfile, SearchTemporal,  |
|  SearchSummary, SearchSnippet    |
+----------------+-----------------+
                 |
    +------------+------------+
    v            v            v
 Pinecone      Neo4j      Pinecone        समानांतर सर्च निष्पादन
 (profiles)   (events)   (summaries)
    |            |            |
    +------------+------------+
                 v
+----------------------------------+
|   उत्तर संश्लेषण + साइटेशन        |    LLM स्रोतों के साथ उत्तर उत्पन्न करता है
+----------------------------------+

भंडारण

इंजन उद्देश्य के लिए प्रयुक्त
Pinecone उच्च गति वेक्टर समानता सर्च प्रोफाइल, सारांश, स्निपेट, कोड एनोटेशन
Neo4jग्राफ ट्रैवर्सल + समय-आधारित तर्कघटनाएं, कोड ज्ञान ग्राफ, एनोटेशन ग्राफ ट्रैवर्सल + अस्थायी तर्क घटनाएं, कोड ज्ञान ग्राफ, एनोटेशन
MongoDB कच्चा दस्तावेज़ भंडारण स्कैन किया गया कोड, फ़ाइल मेटाडेटा, स्कैन स्थिति

Note

स्थानीय परिनियोजन के लिए, Pinecone को Chroma, pgvector, या SQLite वेक्टर स्टोर के साथ प्रतिस्थापित किया जा सकता है।

बेंचमार्क

हमने XMem को दो प्रतिष्ठित शैक्षणिक बेंचमार्क पर हर प्रमुख मेमोरी समाधान के खिलाफ परीक्षा की। XMem पूरे बोर्ड में बेहतर प्रदर्शन करता है।

LoCoMo

मेमोरी पर रचनात्मक तर्क का परीक्षण करता है। क्या सिस्टम विभिन्न बातचीत में तथ्यों को जोड़ सकता है, अस्थायी संबंधों के बारे में तर्क कर सकता है, और खुले सिरे के प्रश्नों का उत्तर दे सकता है?

विधि एकल-हॉप (%) मल्टी-हॉप (%) खुली डोमेन (%) अस्थायी (%) समग्र (%)
XMEM (हमारा)90.692.391.291.991.5
Zep74.1166.0467.7179.7975.14
Memobase (v0.0.37)70.9246.8877.1785.0575.78
Mem0g (YC 24)65.7147.1975.7158.1368.44
Mem0 (YC 24)67.1351.1572.9355.5166.88
LangMem62.2347.9271.1223.4358.10
OpenAI63.7942.9262.2921.7152.90

बहु-हॉप तर्क पर (विभिन्न बातचीत से तथ्यों को जोड़ना), XMem अगले सर्वश्रेष्ठ सिस्टम को 26.3 अंक से हराता है। कुल मिलाकर, XMem 91.5% पर सभी सिस्टमों का नेतृत्व करता है, जो Zep से 75.14 पर आगे है।

LongMemEval-S

दीर्घकालीन संवादी मेमोरी के लिए उद्योग मानक बेंचमार्क। यह परीक्षण करता है कि क्या कोई सिस्टम तथ्य याद रख सकता है, प्राथमिकता परिवर्तन को ट्रैक कर सकता है, समय के बारे में तर्क कर सकता है, और सत्रों के बीच संदर्भ बनाए रख सकता है।

श्रेणी XMem (Gemini 3-flash) Backboard.io (GPT-4o) Mastra (GPT-4o) Supermemory (GPT-4o)
मल्टी-सेशन93.691.779.771.43
अस्थायी तर्क94.591.785.776.69
एकल-सेशन सहायक96.4398.282.196.43
एकल-सेशन उपयोगकर्ता97.197.198.697.14
ज्ञान अपडेट91.293.685.988.46
एकल-सेशन प्राथमिकता87.090.073.370.0

XMem Backboard.io के साथ सभी श्रेणियों में मेल खाता है, दोनों सत्र रिकॉल और प्राथमिकता ट्रैकिंग पर near-perfect स्कोर करते हैं। XMem Mastra को 9.2 अंक से और Supermemory को 11.8 अंक से बेहतर प्रदर्शन करता है।

हम कैसे बेंचमार्क करते हैं

  • मूल्यांकन: LLM-as-Judge Gemini का उपयोग करके संरचित रूब्रिक के साथ
  • निष्पक्षता: सभी सिस्टम समान बातचीत इतिहास और क्वेरी के साथ परीक्षा की जाती है

त्वरित शुरुआत

स्थानीय XMem

npx create-xmem@latest
cd xmem
npm run dev

यह Windows, macOS, और Linux पर काम करता है। यह एक स्थानीय XMem वर्कस्पेस बनाता है, बैकएंड स्थापित करता है, स्थानीय भंडारण शुरू करता है, Chrome एक्सटेंशन बनाता है, और API को http://localhost:8000 पर लॉन्च करता है।

स्थानीय पूर्वापेक्षाएं:

  • Git
  • Node.js 20+
  • Python 3.11+
  • Docker Desktop
  • Ollama, जब तक कि आप .env में क्लाउड LLM कुंजी न जोड़ें

सेटअप के बाद, निम्न से एक्सटेंशन लोड करें:

repos/xmem-extension/dist

Chrome पथ: chrome://extensions -> डेवलपर मोड सक्षम करें -> अनपैक किए गए को लोड करें।

स्थानीय कमांड

npm run setup
npm run start
npm run verify
npm run doctor

यदि .env एक वास्तविक क्लाउड LLM कुंजी रखता है, XMem उस प्रदाता का उपयोग करता है और FastEmbed के साथ एम्बेडिंग को स्थानीय रखता है। यदि कोई क्लाउड कुंजी कॉन्फ़िगर नहीं है, XMem स्थानीय Ollama में फॉलबैक करता है और सेटअप के दौरान आवश्यक स्थानीय मॉडल खींचता है।

संदर्भ पोर्टेबिलिटी

npm run context:export
npm run context:import -- --file ./exports/xmem-context.json
npm run context:sync -- --file ./exports/xmem-context.json --server https://api.xmem.in --api-key <key>

context:export एक स्थानीय संदर्भ बंडल लिखता है जिसे बाद में आयात किया जा सकता है या एक XMem सर्वर में सिंक किया जा सकता है।

रिपोजिटरी को अनुक्रमित करें

python -m src.scanner.runner \
  --org your-org \
  --repo your-repo \
  --url https://github.com/your-org/your-repo.git \
  --enrich

Tip

पूरी तरह से स्थानीय सेटअप के लिए कोई क्लाउड निर्भरता के साथ:

FALLBACK_ORDER='["ollama"]'
EMBEDDING_PROVIDER=ollama
VECTOR_STORE_PROVIDER=pgvector

फिर स्थानीय अतिरिक्त स्थापित करें: pip install -e ".[local]"

कॉन्फ़िगरेशन

XMem अत्यधिक कॉन्फ़िगरेबल है। किसी भी एजेंट के मॉडल को ओवरराइड करें, फॉलबैक चेन को ट्यून करें, या गुणवत्ता/गति ट्रेडऑफ को समायोजित करें।

सेटिंग डिफ़ॉल्ट विवरण
FALLBACK_ORDERopenrouter,gemini,claude,openaiप्रदाता फॉलबैक अनुक्रम
DEEPSEEK_API_KEYखालीआधिकारिक OpenAI-संगत एंडपॉइंट के लिए DeepSeek API कुंजी
MIMO_API_KEYखालीआधिकारिक OpenAI-संगत एंडपॉइंट के लिए Xiaomi MiMo API कुंजी
CLASSIFIER_MODELडिफ़ॉल्ट मॉडलclassifier एजेंट के लिए मॉडल को ओवरराइड करें
JUDGE_MODELडिफ़ॉल्ट मॉडलjudge एजेंट के लिए मॉडल को ओवरराइड करें
RETRIEVAL_MODELडिफ़ॉल्ट मॉडलरिट्रीवल संश्लेषण के लिए मॉडल को ओवरराइड करें
EMBEDDING_MODELgemini-embedding-001पाठ एम्बेडिंग मॉडल
EMBEDDING_PROVIDERautoauto, gemini, bedrock, ollama, fastembed
VECTOR_STORE_PROVIDERpineconepinecone, pgvector, chroma, sqlite
PINECONE_DIMENSION768एम्बेडिंग वेक्टर आयाम
RATE_LIMIT60प्रति मिनट API अनुरोध
TEMPERATURE0.4LLM जनरेशन तापमान

XMem के साथ निर्माण को जारी रखें।

GitHub  •  Docs  •  Community