XMem

AI के लिए मेमोरी लेयर जो कभी भूलती नहीं है

हर AI एजेंट और LLM इंटरफेस को तुरंत स्थायी, क्रॉस-प्लेटफॉर्म मेमोरी दें।

English • 简体中文 • 日本語 • हिन्दी

डेमो • विशेषताएं • आर्किटेक्चर • बेंचमार्क • त्वरित शुरुआत • कॉन्फ़िगरेशन

अपडेट / समाचार

[1 जून 2026] XMem के पास अब इसकी मेमोरी लेयर का नेटिव Golang कार्यान्वयन है। उच्च थ्रूपुट, कम विलंबता, और उत्पादन-स्तरीय परिनियोजन के लिए बनाया गया है जहां मेमोरी को लाखों इंटरैक्शन में विश्वसनीयता से काम करना होता है।
[25 मई 2026] स्थानीय वर्कस्पेस समर्थन अब लाइव है। XMem को मात्र 3 कमांड में स्थानीय रूप से सेट अप करें और मिनटों में मेमोरी के साथ निर्माण करना शुरू करें। सेटअप निर्देशों के लिए Local.md देखें।

npx create-xmem@latest
cd xmem
npm run dev

XMem क्या है?

LLM के साथ हर बातचीत शून्य से शुरू होती है। टूल स्विच करें, प्रदाता स्विच करें, अगले सप्ताह वापस आएं और सारा संदर्भ गायब है।

XMem भारत की #1 ओपन सोर्स एजेंटिक मेमोरी लेयर है, हम मेमोरी-ऐज़-ए-सर्विस पेश कर रहे हैं, यानी हर AI उपयोग के मामले, डोमेन के लिए मेमोरी लेयर, चाहे वह लंबे समय तक चलने वाले एजेंटों के लिए समय-आधारित मेमोरी हो, रोगी संदर्भ के लिए चिकित्सा मेमोरी हो, टीमों और परियोजनाओं के लिए एंटरप्राइज मेमोरी हो, या कोडिंग एजेंटों और वर्कफ़्लो के लिए डेवलपर मेमोरी हो।

यह स्टेटफुल AI के लिए एक अनूठी किस्म की एजेंटिक मेमोरी लेयर है। पारंपरिक मेमोरी सिस्टम के विपरीत जो केवल चंक संग्रहीत और पुनः प्राप्त करते हैं, XMem मेमोरी को एक सक्रिय तर्क प्रक्रिया में बदल देता है। यह निर्णय लेता है कि क्या याद रखना है, क्या अपडेट करना है, क्या भूलना है, और प्रत्येक मेमोरी को सही विशेषज्ञ एजेंट और स्टोर में गतिशील रूप से रूट करता है।

डेमो

किसी भी AI प्लेटफॉर्म पर "X" टाइप करें और अपनी मेमोरी को निर्बाध रूप से संग्रहीत और खोजने, मौजूदा चैट से संदर्भ आयात करने, या अनुक्रमित रिपो के साथ काम करने के लिए XMem द्वारा दी जाने वाली चार मोड के बीच चयन करें।

demo.mp4

विशेषताएं

Chrome एक्सटेंशन

XMem Chrome एक्सटेंशन ChatGPT, Claude, Gemini, DeepSeek, और Perplexity को स्थायी मेमोरी लाता है।

लाइव सर्च और इंजेक्ट - जैसे ही आप प्रॉम्प्ट टाइप करते हैं, XMem रीयल-टाइम में आपकी मेमोरी को खोजता है और एक फ्लोटिंग चिप दिखाता है। एक क्लिक सीधे आपके इनपुट में प्रासंगिक संदर्भ इंजेक्ट करता है, कोई घर्षण नहीं।

पृष्ठभूमि ऑटो-सेव (Xingest) - जब आप "भेजें" दबाते हैं, XMem अनिवार्य रूप से बातचीत मोड़ को कैप्चर करता है। एक पृष्ठभूमि कतार आपके UI को छुए बिना तथ्यों और सारांशों को निकालता है।

extension-settings-1773462173011.mp4

एजेंट प्लगइन

इसमें Claude Code, Codex, Cursor, Hermes, OpenClaw और OpenCode के लिए प्रथम-पक्षीय एकीकरण शामिल हैं, ताकि एजेंट मौजूदा मेमोरी खोज सकें, टिकाऊ परियोजना ज्ञान सहेज सकें, और सत्रों के बीच संदर्भ ले जा सकें जबकि API कुंजियों को पर्यावरण चर या क्लाइंट-विशिष्ट गुप्त स्टोर में रखते हैं।

संदर्भ

संदर्भ आपको किसी भी चीज़ को मैन्युअल रूप से कॉपी पेस्ट किए बिना एक मौजूदा बातचीत को XMem में लाने देता है।

साझा किया गया ChatGPT, Claude, या Gemini लिंक पेस्ट करें। XMem इसे खोलता है, हर उपयोगकर्ता और सहायक संदेश निकालता है, और पूरी इनगेशन पाइपलाइन चलाता है ताकि बातचीत खोज योग्य मेमोरी बन जाए।

आप एक ट्रांसक्रिप्ट फ़ाइल (पाठ, मार्कडाउन, या JSON) भी अपलोड कर सकते हैं। XMem के पास Cursor और Antigravity निर्यात के लिए निर्मित पार्सिंग है और अज्ञात प्रारूपों के लिए एक LLM फॉलबैक का उपयोग करता है।

abbIsz_DujBnbmVp.mp4

स्कैनर

स्कैनर संपूर्ण Git रिपोजिटरीज को अनुक्रमित करता है और आपके कोडबेस का एक क्वेरीयोग्य ज्ञान ग्राफ बनाता है।

एक बार अनुक्रमित होने के बाद, आप फ़ाइलों, कार्यों, निर्भरताओं, और प्रभाव के बारे में प्राकृतिक भाषा प्रश्न पूछ सकते हैं। इसका उपयोग एक नई रिपो को समझने, यह पता लगाने के लिए करें कि कोई सुविधा कहां रहती है, ट्रेस करें कि कोड कैसे जुड़ता है, या यह समझें कि आप कुछ बदलने से क्या टूट जाएगा।

MV1KUiFXYXN7MpH3.mp4

बहु-डोमेन वर्गीकरण

सभी मेमोरी समान नहीं है, और इसके साथ इसे उसी तरह व्यवहार करना अन्य समाधानों को कम प्रदर्शन करता है। XMem का Classifier Agent आने वाले प्रत्येक डेटा को विश्लेषण करता है और इसे सही डोमेन में रूट करता है:

डोमेन	यह क्या संग्रहीत करता है	उदाहरण	भंडारण
प्रोफाइल	स्थायी उपयोगकर्ता तथ्य, प्राथमिकताएं, पहचान	"मुझे backends के लिए Go, Python से ज्यादा पसंद है"	Pinecone
अस्थायी	समय-लंगर घटनाएं तारीख संकल्प के साथ	"मुझे कल Staff Engineer के रूप में पदोन्नति मिली"	Neo4j
सारांश	संपीड़ित बातचीत सारांश	"REST से gRPC में माइग्रेशन पर चर्चा की गई"	Pinecone
कोड	प्रतीकों से जुड़ी व्याख्याएं, बग, व्याख्याएं	"इस रीट्राई लॉजिक में एक रेस कंडीशन है"	Neo4j + Pinecone
स्निपेट	व्यक्तिगत कोड पैटर्न और उपयोगिता	"यह Go में मेरा मानक त्रुटि हैंडलर है"	Pinecone
छवि	दृश्य अवलोकन और विवरण	आर्किटेक्चर आरेख का स्क्रीनशॉट	Pinecone

एजेंटिक रिट्रीवल

जब आप XMem को क्वेरी करते हैं, तो रिट्रीवल एक सरल वेक्टर सर्च नहीं है। LLM स्वयं निर्णय लेता है कि क्या खोजना है:

टूल चयन - रिट्रीवल LLM आपकी क्वेरी का विश्लेषण करता है और उपयुक्त सर्च टूल (SearchProfile, SearchTemporal, SearchSummary, SearchSnippet) को कॉल करता है, संभावित रूप से समानांतर में कई।
संश्लेषण - सभी सर्च टूल के परिणाम एकत्र किए जाते हैं और LLM स्रोत संदर्भों के साथ एक उद्धृत उत्तर उत्पन्न करता है।

इसका अर्थ है "मेरी पसंदीदा टेक स्टैक क्या है और मैंने अंतिम बार auth मॉड्यूल को रीफैक्टर कब किया?" पूछना स्वचालित रूप से प्रोफाइल लुकअप और एक अस्थायी सर्च दोनों को ट्रिगर करता है।

Multi-LLM ऑर्केस्ट्रेशन फॉलबैक के साथ

XMem एक प्रदाता पर बंद नहीं है। यह Gemini, Claude, OpenAI, OpenRouter, Amazon Bedrock, और Ollama में ऑर्केस्ट्रेट करता है स्वचालित फॉलबैक के साथ:

gemini -> claude -> openai -> bedrock -> ollama

यदि आपका प्राथमिक LLM दर सीमित करता है या नीचे चला जाता है, XMem चुपचाप अगले प्रदाता को फॉलबैक करता है। प्रत्येक एजेंट एक विशिष्ट मॉडल पर पिन किया जा सकता है। फॉलबैक क्रम पूरी तरह से कॉन्फ़िगर करने योग्य है।

स्थानीय रूप से चलाता है

कोई क्लाउड निर्भरता आवश्यक नहीं है। Ollama के साथ XMem चलाएं LLM के लिए, FastEmbed एम्बेडिंग के लिए, और Chroma या SQLite वेक्टर स्टोरेज के लिए:

pip install -e ".[local]"

आर्किटेक्चर

XMem को विशेषज्ञ AI एजेंटों की पाइपलाइन के रूप में बनाया गया है जो LangGraph द्वारा समन्वित है, निर्धारणीय निष्पादन लेयर (Weaver) और तीन उद्देश्य-निर्मित संग्रहण इंजन द्वारा समर्थित है।

इनगेशन फ्लो

यूजर इनपुट (SDK / Chrome Extension / API)
         |
         v
   +--------------+
   |  Classifier   |    पाठ का विश्लेषण करता है, डोमेन में रूट करता है
   +------+-------+
          |
    +-----+-----+------+----------+
    v     v     v      v          v
 Profile Temporal Summary Code  Snippet     डोमेन एजेंट निकालते हैं
 Agent   Agent   Agent  Agent   Agent       संरचित डेटा समानांतर में
    |     |      |      |        |
    v     v      v      v        v
   +----------------------------------+
   |          Judge Agent             |     मौजूदा मेमोरी के विरुद्ध तुलना करता है
   |   (ADD / UPDATE / DELETE / NOOP) |     डुप्लिकेट और स्टेलनेस को रोकता है
   +----------------+-----------------+
                    |
                    v
   +----------------------------------+
   |        Weaver (Rust core)        |     निर्धारणीय निष्पादन
   |  Pinecone | Neo4j | MongoDB     |     कोई LLM नहीं। शुद्ध सॉफ्टवेयर तर्क।
   +----------------------------------+

Classifier इनपुट को प्रासंगिक डोमेन में रूट करता है।
डोमेन एजेंट (Profiler, Temporal, Summarizer, Code, Snippet, Image) समानांतर में संरचित डेटा निकालते हैं।
Judge Agent प्रत्येक निष्कर्षण की तुलना मौजूदा मेमोरी से करता है और निर्णय लेता है: ADD, UPDATE, DELETE, या NOOP।
Weaver Judge के निर्णयों को सभी भंडारण बैकएंड में निर्धारक रूप से निष्पादित करता है। कोर को एक स्टैंडअलोन Rust क्रेट के रूप में लागू किया जाता है कोई LLM निर्भरता के साथ।

उच्च-प्रयास मोड स्वचालित रूप से लंबे इनपुट को ओवरलैपिंग चंक (~200 टोकन) में विभाजित करता है और उन्हें समानांतर में संसाधित करता है, फिर लंबी बातचीत में कुछ भी मिस न हो इसके लिए परिणामों को मर्ज करता है।

रिट्रीवल फ्लो

यूजर क्वेरी
    |
    v
+----------------------------------+
|       Retrieval LLM              |
|  यह निर्धारित करता है कि कौन से  |
|  टूल को कॉल करना है:             |
|  SearchProfile, SearchTemporal,  |
|  SearchSummary, SearchSnippet    |
+----------------+-----------------+
                 |
    +------------+------------+
    v            v            v
 Pinecone      Neo4j      Pinecone        समानांतर सर्च निष्पादन
 (profiles)   (events)   (summaries)
    |            |            |
    +------------+------------+
                 v
+----------------------------------+
|   उत्तर संश्लेषण + साइटेशन        |    LLM स्रोतों के साथ उत्तर उत्पन्न करता है
+----------------------------------+

भंडारण

इंजन	उद्देश्य	के लिए प्रयुक्त
Pinecone	उच्च गति वेक्टर समानता सर्च	प्रोफाइल, सारांश, स्निपेट, कोड एनोटेशन
Neo4j	ग्राफ ट्रैवर्सल + समय-आधारित तर्क	घटनाएं, कोड ज्ञान ग्राफ, एनोटेशन	ग्राफ ट्रैवर्सल + अस्थायी तर्क	घटनाएं, कोड ज्ञान ग्राफ, एनोटेशन
MongoDB	कच्चा दस्तावेज़ भंडारण	स्कैन किया गया कोड, फ़ाइल मेटाडेटा, स्कैन स्थिति

Note

स्थानीय परिनियोजन के लिए, Pinecone को Chroma, pgvector, या SQLite वेक्टर स्टोर के साथ प्रतिस्थापित किया जा सकता है।

बेंचमार्क

हमने XMem को दो प्रतिष्ठित शैक्षणिक बेंचमार्क पर हर प्रमुख मेमोरी समाधान के खिलाफ परीक्षा की। XMem पूरे बोर्ड में बेहतर प्रदर्शन करता है।

LoCoMo

मेमोरी पर रचनात्मक तर्क का परीक्षण करता है। क्या सिस्टम विभिन्न बातचीत में तथ्यों को जोड़ सकता है, अस्थायी संबंधों के बारे में तर्क कर सकता है, और खुले सिरे के प्रश्नों का उत्तर दे सकता है?

विधि	एकल-हॉप (%)	मल्टी-हॉप (%)	खुली डोमेन (%)	अस्थायी (%)	समग्र (%)
XMEM (हमारा)	90.6	92.3	91.2	91.9	91.5
Zep	74.11	66.04	67.71	79.79	75.14
Memobase (v0.0.37)	70.92	46.88	77.17	85.05	75.78
Mem0g (YC 24)	65.71	47.19	75.71	58.13	68.44
Mem0 (YC 24)	67.13	51.15	72.93	55.51	66.88
LangMem	62.23	47.92	71.12	23.43	58.10
OpenAI	63.79	42.92	62.29	21.71	52.90

बहु-हॉप तर्क पर (विभिन्न बातचीत से तथ्यों को जोड़ना), XMem अगले सर्वश्रेष्ठ सिस्टम को 26.3 अंक से हराता है। कुल मिलाकर, XMem 91.5% पर सभी सिस्टमों का नेतृत्व करता है, जो Zep से 75.14 पर आगे है।

LongMemEval-S

दीर्घकालीन संवादी मेमोरी के लिए उद्योग मानक बेंचमार्क। यह परीक्षण करता है कि क्या कोई सिस्टम तथ्य याद रख सकता है, प्राथमिकता परिवर्तन को ट्रैक कर सकता है, समय के बारे में तर्क कर सकता है, और सत्रों के बीच संदर्भ बनाए रख सकता है।

श्रेणी	XMem (Gemini 3-flash)	Backboard.io (GPT-4o)	Mastra (GPT-4o)	Supermemory (GPT-4o)
मल्टी-सेशन	93.6	91.7	79.7	71.43
अस्थायी तर्क	94.5	91.7	85.7	76.69
एकल-सेशन सहायक	96.43	98.2	82.1	96.43
एकल-सेशन उपयोगकर्ता	97.1	97.1	98.6	97.14
ज्ञान अपडेट	91.2	93.6	85.9	88.46
एकल-सेशन प्राथमिकता	87.0	90.0	73.3	70.0

XMem Backboard.io के साथ सभी श्रेणियों में मेल खाता है, दोनों सत्र रिकॉल और प्राथमिकता ट्रैकिंग पर near-perfect स्कोर करते हैं। XMem Mastra को 9.2 अंक से और Supermemory को 11.8 अंक से बेहतर प्रदर्शन करता है।

हम कैसे बेंचमार्क करते हैं

मूल्यांकन: LLM-as-Judge Gemini का उपयोग करके संरचित रूब्रिक के साथ
निष्पक्षता: सभी सिस्टम समान बातचीत इतिहास और क्वेरी के साथ परीक्षा की जाती है

त्वरित शुरुआत

स्थानीय XMem

npx create-xmem@latest
cd xmem
npm run dev

यह Windows, macOS, और Linux पर काम करता है। यह एक स्थानीय XMem वर्कस्पेस बनाता है, बैकएंड स्थापित करता है, स्थानीय भंडारण शुरू करता है, Chrome एक्सटेंशन बनाता है, और API को http://localhost:8000 पर लॉन्च करता है।

स्थानीय पूर्वापेक्षाएं:

Git
Node.js 20+
Python 3.11+
Docker Desktop
Ollama, जब तक कि आप .env में क्लाउड LLM कुंजी न जोड़ें

सेटअप के बाद, निम्न से एक्सटेंशन लोड करें:

repos/xmem-extension/dist

Chrome पथ: chrome://extensions -> डेवलपर मोड सक्षम करें -> अनपैक किए गए को लोड करें।

स्थानीय कमांड

npm run setup
npm run start
npm run verify
npm run doctor

यदि .env एक वास्तविक क्लाउड LLM कुंजी रखता है, XMem उस प्रदाता का उपयोग करता है और FastEmbed के साथ एम्बेडिंग को स्थानीय रखता है। यदि कोई क्लाउड कुंजी कॉन्फ़िगर नहीं है, XMem स्थानीय Ollama में फॉलबैक करता है और सेटअप के दौरान आवश्यक स्थानीय मॉडल खींचता है।

संदर्भ पोर्टेबिलिटी

npm run context:export
npm run context:import -- --file ./exports/xmem-context.json
npm run context:sync -- --file ./exports/xmem-context.json --server https://api.xmem.in --api-key <key>

context:export एक स्थानीय संदर्भ बंडल लिखता है जिसे बाद में आयात किया जा सकता है या एक XMem सर्वर में सिंक किया जा सकता है।

रिपोजिटरी को अनुक्रमित करें

python -m src.scanner.runner \
  --org your-org \
  --repo your-repo \
  --url https://github.com/your-org/your-repo.git \
  --enrich

Tip

पूरी तरह से स्थानीय सेटअप के लिए कोई क्लाउड निर्भरता के साथ:

FALLBACK_ORDER='["ollama"]'
EMBEDDING_PROVIDER=ollama
VECTOR_STORE_PROVIDER=pgvector

फिर स्थानीय अतिरिक्त स्थापित करें: pip install -e ".[local]"

कॉन्फ़िगरेशन

XMem अत्यधिक कॉन्फ़िगरेबल है। किसी भी एजेंट के मॉडल को ओवरराइड करें, फॉलबैक चेन को ट्यून करें, या गुणवत्ता/गति ट्रेडऑफ को समायोजित करें।

सेटिंग	डिफ़ॉल्ट	विवरण
`FALLBACK_ORDER`	`openrouter,gemini,claude,openai`	प्रदाता फॉलबैक अनुक्रम
`DEEPSEEK_API_KEY`	खाली	आधिकारिक OpenAI-संगत एंडपॉइंट के लिए DeepSeek API कुंजी
`MIMO_API_KEY`	खाली	आधिकारिक OpenAI-संगत एंडपॉइंट के लिए Xiaomi MiMo API कुंजी
`CLASSIFIER_MODEL`	डिफ़ॉल्ट मॉडल	classifier एजेंट के लिए मॉडल को ओवरराइड करें
`JUDGE_MODEL`	डिफ़ॉल्ट मॉडल	judge एजेंट के लिए मॉडल को ओवरराइड करें
`RETRIEVAL_MODEL`	डिफ़ॉल्ट मॉडल	रिट्रीवल संश्लेषण के लिए मॉडल को ओवरराइड करें
`EMBEDDING_MODEL`	`gemini-embedding-001`	पाठ एम्बेडिंग मॉडल
`EMBEDDING_PROVIDER`	`auto`	auto, gemini, bedrock, ollama, fastembed
`VECTOR_STORE_PROVIDER`	`pinecone`	pinecone, pgvector, chroma, sqlite
`PINECONE_DIMENSION`	`768`	एम्बेडिंग वेक्टर आयाम
`RATE_LIMIT`	`60`	प्रति मिनट API अनुरोध
`TEMPERATURE`	`0.4`	LLM जनरेशन तापमान

XMem के साथ निर्माण को जारी रखें।

GitHub • Docs • Community

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

XMem

अपडेट / समाचार

XMem क्या है?

डेमो

विशेषताएं

Chrome एक्सटेंशन

एजेंट प्लगइन

संदर्भ

स्कैनर

बहु-डोमेन वर्गीकरण

एजेंटिक रिट्रीवल

Multi-LLM ऑर्केस्ट्रेशन फॉलबैक के साथ

स्थानीय रूप से चलाता है

आर्किटेक्चर

इनगेशन फ्लो

रिट्रीवल फ्लो

भंडारण

बेंचमार्क

LoCoMo

LongMemEval-S

हम कैसे बेंचमार्क करते हैं

त्वरित शुरुआत

स्थानीय XMem

स्थानीय कमांड

संदर्भ पोर्टेबिलिटी

रिपोजिटरी को अनुक्रमित करें

कॉन्फ़िगरेशन

FilesExpand file tree

README.hi.md

Latest commit

History

README.hi.md

File metadata and controls

XMem

अपडेट / समाचार

XMem क्या है?

डेमो

विशेषताएं

Chrome एक्सटेंशन

एजेंट प्लगइन

संदर्भ

स्कैनर

बहु-डोमेन वर्गीकरण

एजेंटिक रिट्रीवल

Multi-LLM ऑर्केस्ट्रेशन फॉलबैक के साथ

स्थानीय रूप से चलाता है

आर्किटेक्चर

इनगेशन फ्लो

रिट्रीवल फ्लो

भंडारण

बेंचमार्क

LoCoMo

LongMemEval-S

हम कैसे बेंचमार्क करते हैं

त्वरित शुरुआत

स्थानीय XMem

स्थानीय कमांड

संदर्भ पोर्टेबिलिटी

रिपोजिटरी को अनुक्रमित करें

कॉन्फ़िगरेशन