codebeacon

Análisis AST de código fuente y generación de contexto para IA — grafo de conocimiento multi-framework unificado

¿Por qué codebeacon?

Cada vez que se abre una nueva sesión de codificación con IA, el asistente comienza desde cero. No conoce sus rutas, su capa de servicios, su modelo de entidades ni cómo se comunican sus microservicios. Se pasa el inicio de cada sesión pegando archivos, explicando la estructura y restableciendo el contexto.

Las herramientas existentes resuelven esto de forma parcial. Los analizadores de rutas mapean sus controladores, pero omiten las dependencias de servicios. Las herramientas de grafos de conocimiento capturan relaciones, pero ignoran la superficie de la API. El resultado es ejecutar ambas herramientas, unir la salida manualmente y repetirlo cada vez que cambia el código.

codebeacon unifica ambos enfoques en un único CLI. Un comando escanea toda la base de código con análisis AST de tree-sitter, resuelve la inyección de dependencias entre archivos, detecta clústeres de comunidades en la arquitectura y escribe un mapa de contexto listo para usar directamente en CLAUDE.md, .cursorrules y AGENTS.md.

Características principales

Pipeline unificado — análisis de rutas/controladores + grafo de conocimiento en una sola herramienta
27 frameworks, 9 lenguajes — Spring Boot, NestJS, Django, FastAPI, Flask, Rails, Express, Fastify, Koa, React, Next.js, Vue, Nuxt, Angular, SvelteKit, Gin, Echo, Fiber, Laravel, Actix-Web, Axum, Tauri, Rocket, Warp, ASP.NET Core, Vapor, Ktor
Basado en tree-sitter — análisis AST estructural, no expresiones regulares; gramáticas de lenguaje incluidas por defecto
Resolución DI en 2 pasos — Pass 1 extrae nodos AST locales; Pass 2 construye una tabla de símbolos global y resuelve los mapeos Interface → Implementation
Arquitectura Wave merge — archivos procesados en chunks paralelos y fusionados globalmente; maneja grandes monorepos sin problemas de memoria
Múltiples formatos de salida — grafo JSON, wiki Markdown, Obsidian Vault, mapas de contexto para IA, servidor MCP
Detección de comunidades — clustering Leiden/Louvain revela los límites arquitectónicos reales
Caché incremental — basado en SHA-256; solo re-extrae archivos modificados desde el último escaneo
Cero configuración — detecta frameworks y lenguajes automáticamente; genera codebeacon.yaml para ejecuciones posteriores
Modo Deep Dive — --deep-dive genera .codebeacon/ + CLAUDE.md propios para cada sub-proyecto; ejecutar el comando de actualización desde cualquier sub-proyecto sincroniza automáticamente todos los proyectos del workspace

Inicio rápido

pip install codebeacon

codebeacon scan .

codebeacon detecta los tipos de proyecto, extrae rutas/servicios/entidades/componentes, construye el grafo de conocimiento y escribe todo en .codebeacon/.

Para un workspace multi-proyecto:

codebeacon scan /ruta/al/workspace   # detecta todos los proyectos, genera codebeacon.yaml
codebeacon sync                      # ejecuciones posteriores vía configuración

Frameworks soportados

Lenguaje	Frameworks
Java / Kotlin	Spring Boot, Ktor
Python	Django, FastAPI, Flask
JavaScript / TypeScript	Express, Fastify, Koa, NestJS, React, Next.js, Vue, Nuxt, Angular, SvelteKit
Go	Gin, Echo, Fiber
Ruby	Rails
PHP	Laravel
Rust	Actix-Web, Axum, Tauri, Rocket, Warp
C#	ASP.NET Core
Swift	Vapor

Arquitectura

codebeacon ejecuta un pipeline de extracción en 2 pasos:

[Config] → [Discover] → [Wave / Extract] → [Resolve] → [Filter] → [Enrich] → [Graph] → [Wiki] → [ContextMap] → [Export]
                              │                  │           │          │
                         AST local          Tabla de     Filtro      HTTP API
                         por chunk          símbolos     artefactos  DB compartida
                         (Pass 1)           (Pass 2)

Pass 1 — Extracción Wave: Los archivos se procesan en chunks paralelos. Cada archivo pasa por cinco extractores: rutas, servicios, entidades, componentes y dependencias. Los resultados se cachean por SHA-256.

Pass 2 — Construcción del grafo: Se fusionan todos los resultados Wave. Una tabla de símbolos global resuelve las referencias de inyección de dependencias no resueltas — mapeos Interface→Implementation que las herramientas de un solo paso no capturan.

Estructura de salida

Después del escaneo, los archivos de mapa de contexto se actualizan en la raíz del proyecto (el contenido del usuario se conserva) y el grafo de conocimiento en .codebeacon/:

project-root/
  CLAUDE.md              ← mapa de contexto para IA (bloque codebeacon fusionado; contenido del usuario conservado)
  .cursorrules           ← contexto para Cursor IDE (misma estrategia de fusión)
  AGENTS.md              ← contexto para OpenAI Agents / Codex (misma estrategia de fusión)
  .codebeacon/
    beacon.json          ← grafo de conocimiento completo (JSON node-link, consultable)
    REPORT.md            ← nodos dios, conexiones sorprendentes, archivos hub
    wiki/
      index.md
      overview.md
      routes.md
      <project>/
        controllers/<Name>.md
        services/<Name>.md
        entities/<Name>.md
        components/<Name>.md
    obsidian/            ← Obsidian Vault (una nota por nodo del grafo)

Modo Deep Dive

Con --deep-dive, cada sub-proyecto recibe su propio .codebeacon/ + CLAUDE.md. Claude Code carga los archivos CLAUDE.md de forma jerárquica, por lo que una sesión en api-server/ carga tanto la visión general del workspace como los detalles específicos del proyecto.

La clave: un comando de actualización desde cualquier sub-proyecto sincroniza todo el workspace automáticamente:

# Primer escaneo deep dive
codebeacon scan /workspace --deep-dive

# Más tarde, desde cualquier sub-proyecto — encuentra la config padre y actualiza TODOS los proyectos
cd /workspace/api-server
codebeacon scan . --update

Estructura de salida:

workspace/
  CLAUDE.md                   ← combinado (todos los proyectos)
  codebeacon.yaml             ← deep_dive: true
  .codebeacon/                ← grafo combinado
  api-server/
    CLAUDE.md                 ← solo api-server
    .codebeacon/
  frontend/
    CLAUDE.md                 ← solo frontend
    .codebeacon/

Configuración

Ejecuta codebeacon init para generar codebeacon.yaml, o escríbelo manualmente:

version: 1

projects:
  - name: api-server
    path: ./api-server
    type: spring-boot          # opcional: se detecta automáticamente

  - name: frontend
    path: ./frontend
    type: react

output:
  dir: .codebeacon
  wiki: true
  obsidian: true
  context_map:
    targets: [CLAUDE.md, .cursorrules, AGENTS.md]

wave:
  auto: true
  chunk_size: 300              # archivos por chunk
  max_parallel: 5              # hilos paralelos

semantic:
  enabled: false               # sobrescribir con --semantic

deep_dive: false               # establecer true para salida por proyecto

.codebeaconignore

Coloca un archivo .codebeaconignore en la raíz del proyecto para excluir directorios o archivos del escaneo. Misma sintaxis que .gitignore — un patrón por línea, # para comentarios.

# .codebeaconignore
generated/
build/
*.generated.ts
fixtures/

Integración con IA

Skill de Claude Code (`/codebeacon`)

Instala codebeacon como comando slash de Claude Code:

pip install codebeacon
codebeacon install

Copia SKILL.md en ~/.claude/skills/codebeacon/ y registra el trigger /codebeacon en ~/.claude/CLAUDE.md. Reinicia tu sesión de Claude Code y escribe /codebeacon para escanear el directorio actual.

/codebeacon                  # escanear directorio actual
/codebeacon /path/to/project # escanear una ruta específica
/codebeacon sync             # re-escanear desde codebeacon.yaml

Servidor MCP

Ejecuta codebeacon como servidor MCP persistente para que cualquier cliente compatible pueda consultar el grafo de conocimiento directamente.

Paso 1 — escanear el proyecto:

codebeacon scan .

Paso 2 — agregar a la configuración del cliente MCP:

Claude Code (.claude.json en la raíz del proyecto o ~/.claude.json global):

{
  "mcpServers": {
    "codebeacon": {
      "command": "codebeacon",
      "args": ["serve"]
    }
  }
}

Cursor (~/.cursor/mcp.json):

{
  "mcpServers": {
    "codebeacon": {
      "command": "codebeacon",
      "args": ["serve", "--dir", "/path/to/.codebeacon"]
    }
  }
}

Herramientas MCP disponibles tras la conexión:

Herramienta	Descripción
`beacon_wiki_index`	Resumen global del proyecto (rutas, servicios, entidades)
`beacon_wiki_article`	Leer un artículo wiki por ruta
`beacon_query`	Buscar nodos por subcadena de etiqueta
`beacon_path`	Ruta de dependencia más corta entre dos nodos
`beacon_blast_radius`	Llamadores upstream y nodos afectados downstream
`beacon_routes`	Lista de todas las rutas HTTP (filtrable por proyecto)
`beacon_services`	Lista de todos los servicios/clases (filtrable por proyecto)

Opciones de instalación

pip install codebeacon              # gramáticas de lenguaje incluidas
pip install codebeacon[cluster]     # + detección de comunidades Leiden (graspologic)
pip install --upgrade codebeacon    # actualizar a la última versión con todas las dependencias

Los parsers de Java, Kotlin, Python, JavaScript, TypeScript, Go, Ruby, PHP, C#, Rust, Swift, HTML y Svelte se incluyen por defecto.

Referencia CLI

codebeacon scan .                         # directorio actual
codebeacon scan . --update                # incremental: solo archivos modificados
codebeacon scan . --wiki-only             # saltar extracción, regenerar wiki/obsidian/contexto desde beacon.json existente
codebeacon scan . --semantic              # extracción semántica con LLM
codebeacon scan . --list-only             # solo detectar frameworks
codebeacon scan /workspace --deep-dive    # salida por proyecto + workspace combinado

codebeacon init [ruta]                    # generar codebeacon.yaml
codebeacon sync                           # ejecutar desde codebeacon.yaml

codebeacon query <término>                # buscar en el grafo (próximamente)
codebeacon path <origen> <destino>        # ruta más corta entre dos nodos

codebeacon serve [--dir .codebeacon]      # servidor MCP (stdio)
codebeacon install                        # instalar skill de Claude Code

Comparativa

	codesight	graphify	codebeacon
Análisis rutas / controladores	✅	❌	✅
Grafo servicios / DI	parcial	✅	✅
Resolución Interface → Impl	❌	❌	✅
Extracción entidades / ORM	✅	❌	✅
Análisis componentes frontend	✅	❌	✅
Detección de comunidades	❌	✅	✅
Exportación Obsidian Vault	❌	✅	✅
Servidor MCP	✅	❌	✅
Mapa de contexto (CLAUDE.md)	✅	✅	✅
Workspace multi-proyecto	parcial	❌	✅
Basado en Python	❌	✅	✅

Benchmarks

Código fuente	Stack	Archivos	Nodos	Aristas	Comunidades	Tiempo de escaneo
multi-service SaaS app	SvelteKit + Next.js + Spring Boot (3 proyectos)	444	382	553	175	~12s

Privacidad y seguridad

Todo el procesamiento es local. El código fuente nunca sale de su máquina. Sin telemetría ni llamadas de red durante el uso normal.

La bandera --semantic (deshabilitada por defecto) activa dos modos de extracción:
1. Análisis de comentarios estructurados (sin LLM) — infiere referencias cruzadas de Javadoc (@see, {@link}), docstrings de Python (:class:, :func:) y JSDoc (@see, tipos de @param)
2. Inferencia LLM (opcional) — si ANTHROPIC_API_KEY está configurado, envía fragmentos de código a la API de Claude para inferencia de relaciones más profunda; úselo solo si lo habilita explícitamente

Contribuir

git clone https://github.com/Wandererer/codebeacon
cd codebeacon
pip install -e ".[dev,cluster]"
pytest

El punto de entrada más sencillo para agregar soporte de nuevos frameworks es escribir un archivo de consulta tree-sitter en codebeacon/extract/queries/. Consulte codebeacon/extract/queries/README.md.

Licencia

MIT — ver LICENSE.

Agradecimientos

Construido sobre tree-sitter, NetworkX y graspologic. Inspirado en los enfoques complementarios de codesight y graphify.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

codebeacon

¿Por qué codebeacon?

Características principales

Inicio rápido

Frameworks soportados

Arquitectura

Estructura de salida

Modo Deep Dive

Configuración

.codebeaconignore

Integración con IA

Skill de Claude Code (`/codebeacon`)

Servidor MCP

Opciones de instalación

Referencia CLI

Comparativa

Benchmarks

Privacidad y seguridad

Contribuir

Licencia

Agradecimientos

FilesExpand file tree

README.es.md

Latest commit

History

README.es.md

File metadata and controls

codebeacon

¿Por qué codebeacon?

Características principales

Inicio rápido

Frameworks soportados

Arquitectura

Estructura de salida

Modo Deep Dive

Configuración

.codebeaconignore

Integración con IA

Skill de Claude Code (/codebeacon)

Servidor MCP

Opciones de instalación

Referencia CLI

Comparativa

Benchmarks

Privacidad y seguridad

Contribuir

Licencia

Agradecimientos

Skill de Claude Code (`/codebeacon`)