AI के लिए मेमोरी लेयर जो कभी भूलती नहीं है
हर AI एजेंट और LLM इंटरफेस को तुरंत स्थायी, क्रॉस-प्लेटफॉर्म मेमोरी दें।
डेमो • विशेषताएं • आर्किटेक्चर • बेंचमार्क • त्वरित शुरुआत • कॉन्फ़िगरेशन
- [1 जून 2026] XMem के पास अब इसकी मेमोरी लेयर का नेटिव Golang कार्यान्वयन है। उच्च थ्रूपुट, कम विलंबता, और उत्पादन-स्तरीय परिनियोजन के लिए बनाया गया है जहां मेमोरी को लाखों इंटरैक्शन में विश्वसनीयता से काम करना होता है।
- [25 मई 2026] स्थानीय वर्कस्पेस समर्थन अब लाइव है। XMem को मात्र 3 कमांड में स्थानीय रूप से सेट अप करें और मिनटों में मेमोरी के साथ निर्माण करना शुरू करें। सेटअप निर्देशों के लिए Local.md देखें।
npx create-xmem@latest
cd xmem
npm run devLLM के साथ हर बातचीत शून्य से शुरू होती है। टूल स्विच करें, प्रदाता स्विच करें, अगले सप्ताह वापस आएं और सारा संदर्भ गायब है।
XMem भारत की #1 ओपन सोर्स एजेंटिक मेमोरी लेयर है, हम मेमोरी-ऐज़-ए-सर्विस पेश कर रहे हैं, यानी हर AI उपयोग के मामले, डोमेन के लिए मेमोरी लेयर, चाहे वह लंबे समय तक चलने वाले एजेंटों के लिए समय-आधारित मेमोरी हो, रोगी संदर्भ के लिए चिकित्सा मेमोरी हो, टीमों और परियोजनाओं के लिए एंटरप्राइज मेमोरी हो, या कोडिंग एजेंटों और वर्कफ़्लो के लिए डेवलपर मेमोरी हो।
यह स्टेटफुल AI के लिए एक अनूठी किस्म की एजेंटिक मेमोरी लेयर है। पारंपरिक मेमोरी सिस्टम के विपरीत जो केवल चंक संग्रहीत और पुनः प्राप्त करते हैं, XMem मेमोरी को एक सक्रिय तर्क प्रक्रिया में बदल देता है। यह निर्णय लेता है कि क्या याद रखना है, क्या अपडेट करना है, क्या भूलना है, और प्रत्येक मेमोरी को सही विशेषज्ञ एजेंट और स्टोर में गतिशील रूप से रूट करता है।
किसी भी AI प्लेटफॉर्म पर "X" टाइप करें और अपनी मेमोरी को निर्बाध रूप से संग्रहीत और खोजने, मौजूदा चैट से संदर्भ आयात करने, या अनुक्रमित रिपो के साथ काम करने के लिए XMem द्वारा दी जाने वाली चार मोड के बीच चयन करें।
demo.mp4
XMem Chrome एक्सटेंशन ChatGPT, Claude, Gemini, DeepSeek, और Perplexity को स्थायी मेमोरी लाता है।
लाइव सर्च और इंजेक्ट - जैसे ही आप प्रॉम्प्ट टाइप करते हैं, XMem रीयल-टाइम में आपकी मेमोरी को खोजता है और एक फ्लोटिंग चिप दिखाता है। एक क्लिक सीधे आपके इनपुट में प्रासंगिक संदर्भ इंजेक्ट करता है, कोई घर्षण नहीं।
पृष्ठभूमि ऑटो-सेव (Xingest) - जब आप "भेजें" दबाते हैं, XMem अनिवार्य रूप से बातचीत मोड़ को कैप्चर करता है। एक पृष्ठभूमि कतार आपके UI को छुए बिना तथ्यों और सारांशों को निकालता है।
extension-settings-1773462173011.mp4
इसमें Claude Code, Codex, Cursor, Hermes, OpenClaw और OpenCode के लिए प्रथम-पक्षीय एकीकरण शामिल हैं, ताकि एजेंट मौजूदा मेमोरी खोज सकें, टिकाऊ परियोजना ज्ञान सहेज सकें, और सत्रों के बीच संदर्भ ले जा सकें जबकि API कुंजियों को पर्यावरण चर या क्लाइंट-विशिष्ट गुप्त स्टोर में रखते हैं।
संदर्भ आपको किसी भी चीज़ को मैन्युअल रूप से कॉपी पेस्ट किए बिना एक मौजूदा बातचीत को XMem में लाने देता है।
साझा किया गया ChatGPT, Claude, या Gemini लिंक पेस्ट करें। XMem इसे खोलता है, हर उपयोगकर्ता और सहायक संदेश निकालता है, और पूरी इनगेशन पाइपलाइन चलाता है ताकि बातचीत खोज योग्य मेमोरी बन जाए।
आप एक ट्रांसक्रिप्ट फ़ाइल (पाठ, मार्कडाउन, या JSON) भी अपलोड कर सकते हैं। XMem के पास Cursor और Antigravity निर्यात के लिए निर्मित पार्सिंग है और अज्ञात प्रारूपों के लिए एक LLM फॉलबैक का उपयोग करता है।
abbIsz_DujBnbmVp.mp4
स्कैनर संपूर्ण Git रिपोजिटरीज को अनुक्रमित करता है और आपके कोडबेस का एक क्वेरीयोग्य ज्ञान ग्राफ बनाता है।
एक बार अनुक्रमित होने के बाद, आप फ़ाइलों, कार्यों, निर्भरताओं, और प्रभाव के बारे में प्राकृतिक भाषा प्रश्न पूछ सकते हैं। इसका उपयोग एक नई रिपो को समझने, यह पता लगाने के लिए करें कि कोई सुविधा कहां रहती है, ट्रेस करें कि कोड कैसे जुड़ता है, या यह समझें कि आप कुछ बदलने से क्या टूट जाएगा।
MV1KUiFXYXN7MpH3.mp4
सभी मेमोरी समान नहीं है, और इसके साथ इसे उसी तरह व्यवहार करना अन्य समाधानों को कम प्रदर्शन करता है। XMem का Classifier Agent आने वाले प्रत्येक डेटा को विश्लेषण करता है और इसे सही डोमेन में रूट करता है:
| डोमेन | यह क्या संग्रहीत करता है | उदाहरण | भंडारण |
|---|---|---|---|
| प्रोफाइल | स्थायी उपयोगकर्ता तथ्य, प्राथमिकताएं, पहचान | "मुझे backends के लिए Go, Python से ज्यादा पसंद है" | Pinecone |
| अस्थायी | समय-लंगर घटनाएं तारीख संकल्प के साथ | "मुझे कल Staff Engineer के रूप में पदोन्नति मिली" | Neo4j |
| सारांश | संपीड़ित बातचीत सारांश | "REST से gRPC में माइग्रेशन पर चर्चा की गई" | Pinecone |
| कोड | प्रतीकों से जुड़ी व्याख्याएं, बग, व्याख्याएं | "इस रीट्राई लॉजिक में एक रेस कंडीशन है" | Neo4j + Pinecone |
| स्निपेट | व्यक्तिगत कोड पैटर्न और उपयोगिता | "यह Go में मेरा मानक त्रुटि हैंडलर है" | Pinecone |
| छवि | दृश्य अवलोकन और विवरण | आर्किटेक्चर आरेख का स्क्रीनशॉट | Pinecone |
जब आप XMem को क्वेरी करते हैं, तो रिट्रीवल एक सरल वेक्टर सर्च नहीं है। LLM स्वयं निर्णय लेता है कि क्या खोजना है:
- टूल चयन - रिट्रीवल LLM आपकी क्वेरी का विश्लेषण करता है और उपयुक्त सर्च टूल (SearchProfile, SearchTemporal, SearchSummary, SearchSnippet) को कॉल करता है, संभावित रूप से समानांतर में कई।
- संश्लेषण - सभी सर्च टूल के परिणाम एकत्र किए जाते हैं और LLM स्रोत संदर्भों के साथ एक उद्धृत उत्तर उत्पन्न करता है।
इसका अर्थ है "मेरी पसंदीदा टेक स्टैक क्या है और मैंने अंतिम बार auth मॉड्यूल को रीफैक्टर कब किया?" पूछना स्वचालित रूप से प्रोफाइल लुकअप और एक अस्थायी सर्च दोनों को ट्रिगर करता है।
XMem एक प्रदाता पर बंद नहीं है। यह Gemini, Claude, OpenAI, OpenRouter, Amazon Bedrock, और Ollama में ऑर्केस्ट्रेट करता है स्वचालित फॉलबैक के साथ:
gemini -> claude -> openai -> bedrock -> ollama
यदि आपका प्राथमिक LLM दर सीमित करता है या नीचे चला जाता है, XMem चुपचाप अगले प्रदाता को फॉलबैक करता है। प्रत्येक एजेंट एक विशिष्ट मॉडल पर पिन किया जा सकता है। फॉलबैक क्रम पूरी तरह से कॉन्फ़िगर करने योग्य है।
कोई क्लाउड निर्भरता आवश्यक नहीं है। Ollama के साथ XMem चलाएं LLM के लिए, FastEmbed एम्बेडिंग के लिए, और Chroma या SQLite वेक्टर स्टोरेज के लिए:
pip install -e ".[local]"
XMem को विशेषज्ञ AI एजेंटों की पाइपलाइन के रूप में बनाया गया है जो LangGraph द्वारा समन्वित है, निर्धारणीय निष्पादन लेयर (Weaver) और तीन उद्देश्य-निर्मित संग्रहण इंजन द्वारा समर्थित है।
यूजर इनपुट (SDK / Chrome Extension / API)
|
v
+--------------+
| Classifier | पाठ का विश्लेषण करता है, डोमेन में रूट करता है
+------+-------+
|
+-----+-----+------+----------+
v v v v v
Profile Temporal Summary Code Snippet डोमेन एजेंट निकालते हैं
Agent Agent Agent Agent Agent संरचित डेटा समानांतर में
| | | | |
v v v v v
+----------------------------------+
| Judge Agent | मौजूदा मेमोरी के विरुद्ध तुलना करता है
| (ADD / UPDATE / DELETE / NOOP) | डुप्लिकेट और स्टेलनेस को रोकता है
+----------------+-----------------+
|
v
+----------------------------------+
| Weaver (Rust core) | निर्धारणीय निष्पादन
| Pinecone | Neo4j | MongoDB | कोई LLM नहीं। शुद्ध सॉफ्टवेयर तर्क।
+----------------------------------+
- Classifier इनपुट को प्रासंगिक डोमेन में रूट करता है।
- डोमेन एजेंट (Profiler, Temporal, Summarizer, Code, Snippet, Image) समानांतर में संरचित डेटा निकालते हैं।
- Judge Agent प्रत्येक निष्कर्षण की तुलना मौजूदा मेमोरी से करता है और निर्णय लेता है: ADD, UPDATE, DELETE, या NOOP।
- Weaver Judge के निर्णयों को सभी भंडारण बैकएंड में निर्धारक रूप से निष्पादित करता है। कोर को एक स्टैंडअलोन Rust क्रेट के रूप में लागू किया जाता है कोई LLM निर्भरता के साथ।
उच्च-प्रयास मोड स्वचालित रूप से लंबे इनपुट को ओवरलैपिंग चंक (~200 टोकन) में विभाजित करता है और उन्हें समानांतर में संसाधित करता है, फिर लंबी बातचीत में कुछ भी मिस न हो इसके लिए परिणामों को मर्ज करता है।
यूजर क्वेरी
|
v
+----------------------------------+
| Retrieval LLM |
| यह निर्धारित करता है कि कौन से |
| टूल को कॉल करना है: |
| SearchProfile, SearchTemporal, |
| SearchSummary, SearchSnippet |
+----------------+-----------------+
|
+------------+------------+
v v v
Pinecone Neo4j Pinecone समानांतर सर्च निष्पादन
(profiles) (events) (summaries)
| | |
+------------+------------+
v
+----------------------------------+
| उत्तर संश्लेषण + साइटेशन | LLM स्रोतों के साथ उत्तर उत्पन्न करता है
+----------------------------------+
| इंजन | उद्देश्य | के लिए प्रयुक्त | ||
|---|---|---|---|---|
| Pinecone | उच्च गति वेक्टर समानता सर्च | प्रोफाइल, सारांश, स्निपेट, कोड एनोटेशन | ||
| Neo4j | ग्राफ ट्रैवर्सल + समय-आधारित तर्क | घटनाएं, कोड ज्ञान ग्राफ, एनोटेशन | ग्राफ ट्रैवर्सल + अस्थायी तर्क | घटनाएं, कोड ज्ञान ग्राफ, एनोटेशन |
| MongoDB | कच्चा दस्तावेज़ भंडारण | स्कैन किया गया कोड, फ़ाइल मेटाडेटा, स्कैन स्थिति |
Note
स्थानीय परिनियोजन के लिए, Pinecone को Chroma, pgvector, या SQLite वेक्टर स्टोर के साथ प्रतिस्थापित किया जा सकता है।
हमने XMem को दो प्रतिष्ठित शैक्षणिक बेंचमार्क पर हर प्रमुख मेमोरी समाधान के खिलाफ परीक्षा की। XMem पूरे बोर्ड में बेहतर प्रदर्शन करता है।
मेमोरी पर रचनात्मक तर्क का परीक्षण करता है। क्या सिस्टम विभिन्न बातचीत में तथ्यों को जोड़ सकता है, अस्थायी संबंधों के बारे में तर्क कर सकता है, और खुले सिरे के प्रश्नों का उत्तर दे सकता है?
| विधि | एकल-हॉप (%) | मल्टी-हॉप (%) | खुली डोमेन (%) | अस्थायी (%) | समग्र (%) |
|---|---|---|---|---|---|
| XMEM (हमारा) | 90.6 | 92.3 | 91.2 | 91.9 | 91.5 |
| Zep | 74.11 | 66.04 | 67.71 | 79.79 | 75.14 |
| Memobase (v0.0.37) | 70.92 | 46.88 | 77.17 | 85.05 | 75.78 |
| Mem0g (YC 24) | 65.71 | 47.19 | 75.71 | 58.13 | 68.44 |
| Mem0 (YC 24) | 67.13 | 51.15 | 72.93 | 55.51 | 66.88 |
| LangMem | 62.23 | 47.92 | 71.12 | 23.43 | 58.10 |
| OpenAI | 63.79 | 42.92 | 62.29 | 21.71 | 52.90 |
बहु-हॉप तर्क पर (विभिन्न बातचीत से तथ्यों को जोड़ना), XMem अगले सर्वश्रेष्ठ सिस्टम को 26.3 अंक से हराता है। कुल मिलाकर, XMem 91.5% पर सभी सिस्टमों का नेतृत्व करता है, जो Zep से 75.14 पर आगे है।
दीर्घकालीन संवादी मेमोरी के लिए उद्योग मानक बेंचमार्क। यह परीक्षण करता है कि क्या कोई सिस्टम तथ्य याद रख सकता है, प्राथमिकता परिवर्तन को ट्रैक कर सकता है, समय के बारे में तर्क कर सकता है, और सत्रों के बीच संदर्भ बनाए रख सकता है।
| श्रेणी | XMem (Gemini 3-flash) | Backboard.io (GPT-4o) | Mastra (GPT-4o) | Supermemory (GPT-4o) |
|---|---|---|---|---|
| मल्टी-सेशन | 93.6 | 91.7 | 79.7 | 71.43 |
| अस्थायी तर्क | 94.5 | 91.7 | 85.7 | 76.69 |
| एकल-सेशन सहायक | 96.43 | 98.2 | 82.1 | 96.43 |
| एकल-सेशन उपयोगकर्ता | 97.1 | 97.1 | 98.6 | 97.14 |
| ज्ञान अपडेट | 91.2 | 93.6 | 85.9 | 88.46 |
| एकल-सेशन प्राथमिकता | 87.0 | 90.0 | 73.3 | 70.0 |
XMem Backboard.io के साथ सभी श्रेणियों में मेल खाता है, दोनों सत्र रिकॉल और प्राथमिकता ट्रैकिंग पर near-perfect स्कोर करते हैं। XMem Mastra को 9.2 अंक से और Supermemory को 11.8 अंक से बेहतर प्रदर्शन करता है।
- मूल्यांकन: LLM-as-Judge Gemini का उपयोग करके संरचित रूब्रिक के साथ
- निष्पक्षता: सभी सिस्टम समान बातचीत इतिहास और क्वेरी के साथ परीक्षा की जाती है
npx create-xmem@latest
cd xmem
npm run devयह Windows, macOS, और Linux पर काम करता है। यह एक स्थानीय XMem वर्कस्पेस बनाता है, बैकएंड स्थापित करता है, स्थानीय भंडारण शुरू करता है, Chrome एक्सटेंशन बनाता है, और API को http://localhost:8000 पर लॉन्च करता है।
स्थानीय पूर्वापेक्षाएं:
- Git
- Node.js 20+
- Python 3.11+
- Docker Desktop
- Ollama, जब तक कि आप
.envमें क्लाउड LLM कुंजी न जोड़ें
सेटअप के बाद, निम्न से एक्सटेंशन लोड करें:
repos/xmem-extension/dist
Chrome पथ: chrome://extensions -> डेवलपर मोड सक्षम करें -> अनपैक किए गए को लोड करें।
npm run setup
npm run start
npm run verify
npm run doctorयदि .env एक वास्तविक क्लाउड LLM कुंजी रखता है, XMem उस प्रदाता का उपयोग करता है और FastEmbed के साथ एम्बेडिंग को स्थानीय रखता है। यदि कोई क्लाउड कुंजी कॉन्फ़िगर नहीं है, XMem स्थानीय Ollama में फॉलबैक करता है और सेटअप के दौरान आवश्यक स्थानीय मॉडल खींचता है।
npm run context:export
npm run context:import -- --file ./exports/xmem-context.json
npm run context:sync -- --file ./exports/xmem-context.json --server https://api.xmem.in --api-key <key>context:export एक स्थानीय संदर्भ बंडल लिखता है जिसे बाद में आयात किया जा सकता है या एक XMem सर्वर में सिंक किया जा सकता है।
python -m src.scanner.runner \
--org your-org \
--repo your-repo \
--url https://github.com/your-org/your-repo.git \
--enrichTip
पूरी तरह से स्थानीय सेटअप के लिए कोई क्लाउड निर्भरता के साथ:
FALLBACK_ORDER='["ollama"]'
EMBEDDING_PROVIDER=ollama
VECTOR_STORE_PROVIDER=pgvectorफिर स्थानीय अतिरिक्त स्थापित करें: pip install -e ".[local]"
XMem अत्यधिक कॉन्फ़िगरेबल है। किसी भी एजेंट के मॉडल को ओवरराइड करें, फॉलबैक चेन को ट्यून करें, या गुणवत्ता/गति ट्रेडऑफ को समायोजित करें।
| सेटिंग | डिफ़ॉल्ट | विवरण |
|---|---|---|
FALLBACK_ORDER | openrouter,gemini,claude,openai | प्रदाता फॉलबैक अनुक्रम |
DEEPSEEK_API_KEY | खाली | आधिकारिक OpenAI-संगत एंडपॉइंट के लिए DeepSeek API कुंजी |
MIMO_API_KEY | खाली | आधिकारिक OpenAI-संगत एंडपॉइंट के लिए Xiaomi MiMo API कुंजी |
CLASSIFIER_MODEL | डिफ़ॉल्ट मॉडल | classifier एजेंट के लिए मॉडल को ओवरराइड करें |
JUDGE_MODEL | डिफ़ॉल्ट मॉडल | judge एजेंट के लिए मॉडल को ओवरराइड करें |
RETRIEVAL_MODEL | डिफ़ॉल्ट मॉडल | रिट्रीवल संश्लेषण के लिए मॉडल को ओवरराइड करें |
EMBEDDING_MODEL | gemini-embedding-001 | पाठ एम्बेडिंग मॉडल |
EMBEDDING_PROVIDER | auto | auto, gemini, bedrock, ollama, fastembed |
VECTOR_STORE_PROVIDER | pinecone | pinecone, pgvector, chroma, sqlite |
PINECONE_DIMENSION | 768 | एम्बेडिंग वेक्टर आयाम |
RATE_LIMIT | 60 | प्रति मिनट API अनुरोध |
TEMPERATURE | 0.4 | LLM जनरेशन तापमान |
