Skip to content

xabarov/science-graphrag

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

207 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

SciGraph

Локальный research cockpit для вашей научной библиотеки: загрузка корпуса, граф связей, поиск по смыслу и ответы с опорой на конкретные места в документах — без обязательного «чата в облаке вместо источников».

Короткое демо интерфейса SciGraph


Для кого

Для исследователя или R&D-команды, которым недостаточно папки с PDF. Нужен обзор корпуса, навигация по цитированию и смысловым связям, а не разовый промпт к модели без трассировки.

Что вы получите после установки

  • Корпус становится навигируемым — работы, чанки, граф, workspace и поиск по вашим данным.
  • Вопросы к литературе — с evidence — ответы можно проверить по источникам и фрагментам текста.
  • Стек поднимается локально — Docker Compose, привычный цикл «поднял → открыл UI → загрузил PDF».

Быстрый старт

Вариант 1. Просто поднять UI и стек

Если вы хотите сначала просто посмотреть систему, достаточно Docker + Docker Compose и файла .env:

cp .env.example .env
docker compose -f docker-compose.yml up -d --build

Если у вас есть make, это эквивалентно:

make prod-up

Дальше откройте веб-интерфейс — главная точка входа. Для быстрой проверки API: /health, интерактивная документация: /docs.

Вариант 2. Полный setup для CLI, ingest и локальной разработки

Если вы хотите не только поднять UI, но и запускать science-graphrag с хоста, делать ingest и пользоваться локальным CLI, нужны ещё Python 3.11+ и .venv:

cp .env.example .env
python -m venv .venv
.venv/bin/pip install -e ".[dev]"
.venv/bin/science-graphrag config-check

В .env скопируйте блок SCIENCE_GRAPHRAG_S3_* из .env.example (для MinIO на хосте обычно http://localhost:19000 и те же логин/пароль, что у сервиса minio в compose). Без непустых access key / secret / bucket Settings() на хосте не соберётся — это обязательное объектное хранилище для очереди ingest, raw blobs, артефактов и benchmark.

Далее задайте SCIENCE_GRAPHRAG_OPENALEX_MAILTO — contact email для OpenAlex (не секрет; можно в Настройки → Общие). Для extraction и VL обычно нужен SCIENCE_GRAPHRAG_API_KEY (OpenRouter и т.п.); без него config-check завершится с кодом 1, пока не передать --no-strict.

Для prod-like режима:

docker compose -f docker-compose.yml up -d --build

Для локальной разработки удобнее dev-режим:

docker compose -f docker-compose.dev.yml up -d --build

Если у вас есть make, это те же команды через make prod-up и make dev-up.

Один файл — быстрый «ощутимый» результат

.venv/bin/science-graphrag ingest path/to/paper.pdf

Форматы: pdf, md, txt. Этот шаг требует полного setup из варианта 2. После ingest откройте работу в UI или дерните API — см. Swagger на /docs.

Корпус целиком

Долгие прогоны, таймауты, resume и operational чек-листы — docs/runbooks/ingest-corpus.md. Перед тяжёлым ingest с LLM разумно прогнать строгую проверку:

.venv/bin/science-graphrag config-check

Для embeddings через OpenRouter: .venv/bin/science-graphrag config-check --embeddings-preflight.

Документация

Задача Документ
Индекс всей документации docs/README.md
Запуск стека, порты, compose docs/runbooks/deploy.md
Архитектура docs/architecture/README.md
Архитектура агентного рантайма docs/architecture/agent-runtime-overview-ru.md
Чат-агент и инструменты docs/architecture/agent-chat-tools.md
Бенчмарки и eval docs/benchmarks/README.md · eval/README.md
Roadmap docs/roadmap.md
Планирование (инженерные треки) docs/analysis/README.md

Исходники: science_graphrag/ (backend, CLI, ingestion), ui/ (интерфейс), eval/ и tests/ — качество и регрессии.

Полезные команды: make help, make prod-down, make dev-down, make prod-logs / make dev-logs, make quality.

Лицензия

См. LICENSE.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors