general-agentic-memory/research/examples/quickstart/basic_usage.py at main · VectorSpaceLab/general-agentic-memory · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
GAM Basic Usage Example

这个示例展示了如何使用 GAM 框架进行基本的记忆构建和问答。
演示了记忆构建、检索和研究的完整流程。
"""

import os

from gam_research import (
    MemoryAgent,
    ResearchAgent,
    OpenAIGenerator,
    OpenAIGeneratorConfig,
    InMemoryMemoryStore,
    InMemoryPageStore,
    IndexRetriever,
    IndexRetrieverConfig,
    BM25Retriever,
    BM25RetrieverConfig,
    DenseRetriever,
    DenseRetrieverConfig,
)


def basic_memory_example():
    """基础记忆构建示例"""
    print("=== 基础记忆构建示例 ===\n")

    # 1. 配置并创建 Generator
    gen_config = OpenAIGeneratorConfig(
        model_name="gpt-4o-mini",
        api_key=os.getenv("OPENAI_API_KEY"),  # 从环境变量读取
        temperature=0.3,
        max_tokens=256
    )
    generator = OpenAIGenerator.from_config(gen_config)

    # 2. 创建存储
    memory_store = InMemoryMemoryStore()
    page_store = InMemoryPageStore()

    # 3. 创建 MemoryAgent
    memory_agent = MemoryAgent(
        generator=generator,
        memory_store=memory_store,
        page_store=page_store
    )

    # 4. 准备要记忆的文本（模拟长文档）
    documents = [
        """人工智能（AI）是计算机科学的一个分支，致力于创建能够执行通常需要人类智能的任务的系统。
        机器学习是 AI 的一个子集，使计算机能够在不被明确编程的情况下学习。""",

        """深度学习是机器学习的一个子集，使用多层神经网络来模拟人脑的工作方式。
        自然语言处理（NLP）是 AI 的另一个重要分支，专注于使计算机能够理解、解释和生成人类语言。""",

        """计算机视觉是 AI 的另一个关键领域，致力于使计算机能够"看到"和理解视觉信息。
        强化学习是一种机器学习方法，通过与环境的交互来学习最优的行为策略。""",

        """神经网络是深度学习的基础，由相互连接的节点（神经元）组成。
        卷积神经网络（CNN）特别适用于图像处理任务，而循环神经网络（RNN）擅长处理序列数据。""",

        """Transformer 架构的引入彻底改变了自然语言处理领域，为 GPT 和 BERT 等大型语言模型奠定了基础。"""
    ]

    # 5. 逐个记忆文档
    print(f"正在记忆 {len(documents)} 个文档...")
    for i, doc in enumerate(documents, 1):
        print(f"  记忆文档 {i}/{len(documents)}...")
        memory_agent.memorize(doc)

    # 6. 查看记忆状态
    memory_state = memory_store.load()
    print(f"\n✅ 成功构建记忆:")
    print(f"  - 记忆摘要数: {len(memory_state.abstracts)}")

    return memory_agent, memory_store, page_store


def research_example(memory_store, page_store):
    """基于记忆的研究示例"""
    print("\n=== 基于记忆的研究示例 ===\n")

    # 1. 配置并创建 Generator
    gen_config = OpenAIGeneratorConfig(
        model_name="gpt-4o-mini",
        api_key=os.getenv("OPENAI_API_KEY"),
        base_url="https://api.openai.com/v1",
        temperature=0.3,
        max_tokens=2048
    )
    generator = OpenAIGenerator.from_config(gen_config)

    # 2. 创建多个检索器
    retrievers = {}
    index_dir = './tmp'

    # 索引检索器
    try:
        page_index_dir = os.path.join(index_dir, "page_index")
        if os.path.exists(page_index_dir):
            import shutil
            shutil.rmtree(page_index_dir)

        index_config = IndexRetrieverConfig(
            index_dir=page_index_dir
        )
        index_retriever = IndexRetriever(index_config.__dict__)
        index_retriever.build(page_store)
        retrievers["page_index"] = index_retriever
        print("✅ 索引检索器创建成功")
    except Exception as e:
        print(f"[WARN] 索引检索器创建失败: {e}")

    # BM25 检索器
    try:
        bm25_index_dir = os.path.join(index_dir, "bm25_index")
        if os.path.exists(bm25_index_dir):
            import shutil
            shutil.rmtree(bm25_index_dir)

        bm25_config = BM25RetrieverConfig(
            index_dir=bm25_index_dir,
            threads=1
        )
        bm25_retriever = BM25Retriever(bm25_config.__dict__)
        bm25_retriever.build(page_store)
        retrievers["keyword"] = bm25_retriever
        print("✅ BM25 检索器创建成功")
    except Exception as e:
        print(f"[WARN] BM25 检索器创建失败: {e}")

    # Dense 检索器
    try:
        dense_index_dir = os.path.join(index_dir, "dense_index")
        if os.path.exists(dense_index_dir):
            import shutil
            shutil.rmtree(dense_index_dir)

        dense_config = DenseRetrieverConfig(
            index_dir=dense_index_dir,
            model_name="BAAI/bge-m3"
        )
        dense_retriever = DenseRetriever(dense_config.__dict__)
        dense_retriever.build(page_store)
        retrievers["vector"] = dense_retriever
        print("✅ Dense 检索器创建成功")
    except Exception as e:
        print(f"[WARN] Dense 检索器创建失败: {e}")

    # 3. 创建 ResearchAgent
    research_agent_kwargs = {
        "page_store": page_store,
        "memory_store": memory_store,
        "retrievers": retrievers,
        "generator": generator,
        "max_iters": 5
    }
    research_agent = ResearchAgent(**research_agent_kwargs)

    # 4. 进行研究
    question = "机器学习和深度学习有什么关键区别？"
    print(f"\n研究问题: {question}\n")

    research_result = research_agent.research(question)
    research_summary = research_result.integrated_memory

    # 5. 显示结果
    print(f"✅ 研究完成:")
    print(f"  - 迭代次数: {len(research_result.raw_memory.get('iterations', []))}")
    print(f"\n研究摘要:")
    print(f"  {research_summary}")

    return research_result


def main():
    """主函数"""
    print("=" * 60)
    print("GAM 框架快速入门示例")
    print("=" * 60)
    print()

    # 检查 API Key
    if not os.getenv("OPENAI_API_KEY"):
        print("⚠️  请设置环境变量 OPENAI_API_KEY")
        print("   export OPENAI_API_KEY='your-api-key'")
        return

    try:
        # 1. 运行基础记忆构建示例
        memory_agent, memory_store, page_store = basic_memory_example()

        # 2. 运行基于记忆的研究示例
        research_result = research_example(memory_store, page_store)

        print("\n" + "=" * 60)
        print("✅ 示例运行完成！")
        print("=" * 60)
        print("\n你可以基于这些示例开发自己的应用！")
        print("\n提示:")
        print("  - 修改文档内容来测试不同的场景")
        print("  - 尝试不同的问题来测试研究能力")
        print("  - 查看 eval/ 目录了解更多评估示例")

    except Exception as e:
        print(f"\n❌ 运行错误: {e}")
        print("\n请检查:")
        print("  1. 网络连接是否正常")
        print("  2. API Key 是否正确")
        print("  3. 是否安装了所需依赖: pip install -r requirements.txt")
        import traceback
        traceback.print_exc()


if __name__ == "__main__":
    main()