Skip to content

Commit d54bdf5

Browse files
author
MarceloClaro
committed
docs(readme): atualiza v4.6 -> v4.7 com SDD+TDD, CORA-Eval e metricas reais
- Badges: TDD 16/16 GREEN, CORA-Eval 0.67 Basico - Novas secoes: SDD+TDD AutoEvolve, CORA-Eval Benchmark - Tabela evolutiva: 11 ciclos documentados (85->97) - Classificacao por subsistema: +SDD+TDD +CORA-Eval - Metricas: 3 TDD gates, CORA-Eval Score, Health 96/100 - Menu adaptativo: 6 categorias, plugin system, 4 modos - Footer: v4.7, 2026-05-28, 212 raciocinios
1 parent 5aad0e5 commit d54bdf5

1 file changed

Lines changed: 106 additions & 13 deletions

File tree

README.md

Lines changed: 106 additions & 13 deletions
Original file line numberDiff line numberDiff line change
@@ -1,10 +1,10 @@
11
<div align="center">
22

3-
<img src="https://img.shields.io/badge/OpenCode_Ecosystem-v4.6.1-6366f1?style=for-the-badge&logo=openai&logoColor=white" alt="version"/>
3+
<img src="https://img.shields.io/badge/OpenCode_Ecosystem-v4.7-6366f1?style=for-the-badge&logo=openai&logoColor=white" alt="version"/>
44

5-
# OpenCode Ecosystem v4.6.1
5+
# OpenCode Ecosystem v4.7
66

7-
### Arquitetura Multiagente Evolutiva — 212 Raciocinios · 55 IMO Testados · Loop Autonomo
7+
### Arquitetura Multiagente Evolutiva — 212 Raciocinios · 55 IMO Testados · SDD+TDD · CORA-Eval
88

99
<br/>
1010

@@ -14,16 +14,16 @@
1414
[![Raciocinios](https://img.shields.io/badge/Raciocinios-212_(27_cat.)-a855f7?style=flat-square)](skills/reasoning-orchestrator-v11/CATALOGO_RACIOCINIOS_212.md)
1515
[![IMO](https://img.shields.io/badge/IMO_Testados-55_problemas-f59e0b?style=flat-square)](evals/imo_batch_results.json)
1616
[![Cora](https://img.shields.io/badge/Cora_Debate-38/38-22c55e?style=flat-square)](skills/cora-debate/)
17-
[![PCI](https://img.shields.io/badge/PCI_Medio-98.3/100-22c55e?style=flat-square)]()
18-
[![Artigo](https://img.shields.io/badge/Artigo_Qualis_A1-19p/26refs-ef4444?style=flat-square)](artigo_completo_qualis_a1.pdf)
17+
[![TDD](https://img.shields.io/badge/TDD_Green-16/16-22c55e?style=flat-square)](artigo/tests/)
18+
[![CORA-Eval](https://img.shields.io/badge/CORA_Eval-0.67_Basico-f59e0b?style=flat-square)](artigo/evaluations/)
1919
[![CJK](https://img.shields.io/badge/CJK_Leaks-0-22c55e?style=flat-square)]()
2020
[![Status](https://img.shields.io/badge/Status-Producao-22c55e?style=flat-square)]()
2121

2222
<br/>
2323

24-
> **Versao:** 4.6.1 · **Atualizado:** 2026-05-27 · **Modelo:** `deepseek-v4-pro` (200K ctx, 128K out)
24+
> **Versao:** 4.7 · **Atualizado:** 2026-05-28 · **Modelo:** `deepseek-v4-pro` (200K ctx, 128K out)
2525
> **Afiliação:** GeoMaker+IA — Museu Escolar Itinerante (CNM 9.76.35.5698)
26-
> **Novo:** 212 raciocinios (27 cat) · 55 IMO testados (PCI 98.3) · Loop autonomo · ASI-Evolve · Platt Scaling · Artigo Qualis A1 (19p, 26 refs c/ DOI)
26+
> **Novo:** CORA-Eval benchmark · SDD+TDD AutoEvolve LaTeX · Menu adaptativo · 11 ciclos evolutivos
2727
2828
</div>
2929

@@ -420,6 +420,92 @@ O experimento central utiliza o dataset **HAM10000** (10.015 imagens dermatoscó
420420

421421
---
422422

423+
## SDD+TDD AutoEvolve — Pipeline de Refino para LaTeX Acadêmico
424+
425+
O pipeline **SDD+TDD+AutoEvolve** aplica metodologia de engenharia de software a documentos acadêmicos LaTeX, garantindo qualidade tipográfica e estrutural via testes automatizados.
426+
427+
### Como funciona
428+
429+
```
430+
SENSE → DIAGNOSE → FIX → VERIFY → EVOLVE → LEARN
431+
```
432+
433+
1. **SENSE** — Compila o `.tex` e extrai métricas (páginas, tamanho PDF)
434+
2. **DIAGNOSE** — Parseia `.log` com regex: overfull, underfull, erros, font warnings
435+
3. **FIX** — Backup automático + correção seletiva (encurtamento textual, `\sloppy` local, `\raggedright` em colunas)
436+
4. **VERIFY** — 3 Quality Gates (16 testes TDD): Compilation (5), Structure (6), Quality (5)
437+
5. **EVOLVE** — Registra sessão em `fix_history.json` com catálogo de padrões
438+
6. **LEARN** — Gera insights de tendências e recomendações
439+
440+
### Exemplo real: artigo 150 questões (ABNT, 24 páginas)
441+
442+
| Métrica | Antes | Depois |
443+
|---------|:-----:|:------:|
444+
| Overfull boxes | 4 (máx 11,7pt) | **0** |
445+
| Underfull boxes | 1 (badness 10000) | **0** |
446+
| Erros LaTeX | 0 | 0 |
447+
| TDD | N/A | **16/16 GREEN** |
448+
449+
### Menu Adaptativo
450+
451+
O `menu.py` substitui scripts manuais por um painel que auto-descobre artefatos do projeto:
452+
453+
```powershell
454+
python menu.py # Menu interativo colorido
455+
python menu.py 3 # Executa diretamente opção 3
456+
python menu.py --list # Lista artefatos descobertos
457+
python menu.py --quick # Diagnóstico rápido (TDD + métricas)
458+
```
459+
460+
- **6 categorias dinâmicas**: OPERACIONAR, REPRODUZIR, REGISTRAR, AUDITAR, APRENDER, FERRAMENTAS
461+
- **Plugin system**: comandos externos registram-se em `.menu_registry.json` sem editar código
462+
- Funciona em **qualquer projeto LaTeX** com estrutura `tests/`, `orchestration/`, `.tex`
463+
464+
> **Arquivos**: `artigo/tests/` (3 suites, 16 testes) · `artigo/orchestration/` (SPEC + FRAMEWORK + refinement_loop) · `artigo/menu.py`
465+
466+
---
467+
468+
## CORA-Eval — Benchmark Evolutivo para Ciências Exatas e da Natureza
469+
470+
Framework de avaliação da maturidade científica do ecossistema, integrado aos 7 verificadores simbólicos do Cora-Debate (V1-V7).
471+
472+
### Estrutura: 150 tarefas em 10 dimensões × 4 níveis
473+
474+
| Nível | Faixa | Classificação | Tarefas |
475+
|-------|-------|---------------|:-------:|
476+
| **N1** | 0.1–0.9 | Básico | 30 |
477+
| **N2** | 1.0–1.9 | Graduação | 40 |
478+
| **N3** | 2.0–2.9 | Pós-Graduação | 41 |
479+
| **N4** | 3.0+ | Pesquisa | 39 |
480+
481+
### 10 dimensões avaliadas
482+
483+
| D# | Dimensão | Cora V | Peso | Baseline |
484+
|----|----------|--------|:----:|:--------:|
485+
| D1 | Raciocínio Matemático | V2,V3,V6 | 15% | N2 (1.72) |
486+
| D2 | Modelagem Física | V1,V5,V6 | 12% ||
487+
| D3 | Análise Estatística | V4,V5 | 12% | N1 (0.90) |
488+
| D4 | Química Computacional | V2,V5 | 10% ||
489+
| D5 | Biologia Molecular | V4,V5 | 10% ||
490+
| D6 | Geociências | V4,V5,V6 | 8% ||
491+
| D7 | Código Científico | V7a-V7g | 10% | N3 (2.54) |
492+
| D8 | Revisão Literatura | V3,V4 | 8% ||
493+
| D9 | Desenho Experimental | V1,V4 | 8% | N1 (0.60) |
494+
| D10 | Síntese Interdisciplinar | V1-V7 | 7% ||
495+
496+
### Rastreador evolutivo
497+
498+
```powershell
499+
python cora_benchmark_tracker.py --init # Inicializa pontuações
500+
python cora_benchmark_tracker.py --score D1 N2 4 5 # Registra 4/5 tarefas
501+
python cora_benchmark_tracker.py --report # Relatório completo
502+
python cora_benchmark_tracker.py --evolve # Snapshot evolutivo
503+
```
504+
505+
**CORA-Score atual**: 0.67 (Básico) — 4/10 dimensões avaliadas, 12/150 tarefas
506+
507+
> **Arquivo**: `artigo/evaluations/BENCHMARK_CORA_CIENCIAS_EXATAS.md` (600+ linhas) · `cora_benchmark_tracker.py` (440 linhas)
508+
423509
## Simulação MiroFish/BettaFish + PhD Auditor
424510

425511
<img src="diagrams/mirofish-phd-auditor.svg" alt="Pipeline MiroFish/BettaFish + PhD Auditor P14-P18" width="100%"/>
@@ -702,8 +788,11 @@ PLAN → ACT → REFLECT → EXTRACT → EVOLVE
702788
| evo-6 | Iterative Correction Loop v2.0 | 95/100 | Loop de correção iterativa: 86,5 → 92,7/100 (+7,1%) |
703789
| evo-7 | Sync v3.5 + detector CJK | 96/100 | Tolerância zero a caracteres chineses na saída |
704790
| evo-8 | Progressive disclosure + observabilidade | 98/100 | Skills compactas (≤ 2.500B) + monitoramento contínuo de saúde |
791+
| evo-9 | SDD+TDD AutoEvolve LaTeX Refino | 96/100 | 4 overfulls eliminados + 1 underfull fix + 16/16 TDD + FRAMEWORK.md + SPEC + evolutions/ |
792+
| evo-10 | Menu Adaptativo + Plugin System | 96/100 | menu.py: estático (11 opções) → adaptativo (auto-descoberta, 6 categorias, 4 modos) |
793+
| evo-11 | CORA-Eval Benchmark 150 tarefas | 97/100 | 10 dimensões × 4 níveis (Básico→Pesquisa), tracker Python, baseline CORA-Score 0.67 |
705794

706-
**Progressão geral:** 85 → 98/100 (+15,3%) · Média: 91,1/100 — demonstra que o sistema melhora consistentemente a cada ciclo.
795+
**Progressão geral:** 85 → 97/100 (+14,1%) · Média: 93,1/100 — demonstra que o sistema melhora consistentemente a cada ciclo.
707796

708797
---
709798

@@ -736,7 +825,7 @@ PLAN → ACT → REFLECT → EXTRACT → EVOLVE
736825
| Skills dentro do limite | 72/74 | 🟢 |
737826
| Agentes registrados | 118 | 🟢 |
738827
| Reversa confidence | 100/100 | 🟢 |
739-
| AutoEvolve gerações | 9 | 🟢 |
828+
| AutoEvolve gerações | 11 | 🟢 |
740829
| DI Migration | Fases 1–7 (88/88 tests) | 🟢 |
741830
| Gaps abertos | 0 | 🟢 |
742831
| Health score Nexus | 96/100 | 🟢 |
@@ -784,7 +873,9 @@ Cada subsistema possui sua própria classificação técnica, refletindo a espec
784873
| **SEEKER** | Autonomous Research Agent Swarm | 12 agentes paralelos, 10+ fontes acadêmicas |
785874
| **MiroFish/BettaFish** | Agent-Based Simulation Framework (P1–P18) | 18 padrões arquiteturais, 38 raciocínios |
786875
| **PhD Auditor (P18)** | Statistical Validation Engine | NashSolver, Cohen's d, Bonferroni, Power Analysis |
787-
| **AutoEvolve** | Evolutionary Skill Generation Loop | PLAN→ACT→REFLECT→EXTRACT→EVOLVE, 8 ciclos |
876+
| **AutoEvolve** | Evolutionary Skill Generation Loop | PLAN→ACT→REFLECT→EXTRACT→EVOLVE, 11 ciclos |
877+
| **SDD+TDD Pipeline** | Spec-Driven Test-Driven LaTeX Refinement | 3 gates, 16 testes, overfull/underfull zero |
878+
| **CORA-Eval** | Scientific Maturity Benchmark | 150 tarefas, 10 dimensões, 4 níveis, tracker Python |
788879
| **MCP Layer** | Tool Integration Protocol Layer | 40 servidores, lazy init, stdio/HTTP |
789880
| **RAG Engine** | Adaptive Multi-Strategy RAG | 9 estratégias (Vanilla → HyDE), auto-select |
790881
| **Quantum Module** | Variational Quantum Computing (VQC) | 50 qubits, 89.52% acc, QML |
@@ -837,6 +928,8 @@ Os diferenciadores técnicos em relação aos demais frameworks são:
837928
| Serviços DI | **11** + 3 plugins TS |
838929
| Linhas Python | **~109.660** |
839930
| Quality Gates | **4** (G0 → GR → GE → GF) |
931+
| TDD Quality Gates (LaTeX) | **3** (Compilation, Structure, Quality) — 16/16 GREEN |
932+
| CORA-Eval Score | **0.67** (Básico) — 4/10 dimensões, 12/150 tarefas |
840933
| Health Score | **96/100** |
841934

842935
> **Classificação em uma frase:** O OpenCode Ecosystem v4.6 é uma plataforma multiagente evolutiva com orquestração hierárquica de 6 camadas, injeção de dependência centralizada, 18 padrões arquiteturais (P1–P18), debate com Teoria dos Jogos e validação estatística PhD-level, voltada para produção acadêmica Qualis A1, pesquisa científica autônoma e engenharia reversa de sistemas.
@@ -997,10 +1090,10 @@ Mapa radial dos 10 subsistemas com classificação técnica individual: Nexus NM
9971090

9981091
<div align="center">
9991092

1000-
**OpenCode Ecosystem v4.6**
1093+
**OpenCode Ecosystem v4.7**
10011094

1002-
125 agentes catalogados · 41 MCPs · 106 skills · 38 raciocínios · MiroFish/BettaFish · PhD Auditor · Cora-Debate (P19)
1095+
125 agentes catalogados · 41 MCPs · 106 skills · 212 raciocínios · MiroFish/BettaFish · PhD Auditor · Cora-Debate (P19) · SDD+TDD · CORA-Eval
10031096

1004-
*Documentação atualizada — 2026-05-25 · BRAZIL_TIMEZONE UTC-3 · [CORRIGENDUM.md](CORRIGENDUM.md)*
1097+
*Documentação atualizada — 2026-05-28 · BRAZIL_TIMEZONE UTC-3 · [CORRIGENDUM.md](CORRIGENDUM.md)*
10051098

10061099
</div>

0 commit comments

Comments
 (0)