|
1 | 1 | <div align="center"> |
2 | 2 |
|
3 | | -<img src="https://img.shields.io/badge/OpenCode_Ecosystem-v4.6.1-6366f1?style=for-the-badge&logo=openai&logoColor=white" alt="version"/> |
| 3 | +<img src="https://img.shields.io/badge/OpenCode_Ecosystem-v4.7-6366f1?style=for-the-badge&logo=openai&logoColor=white" alt="version"/> |
4 | 4 |
|
5 | | -# OpenCode Ecosystem v4.6.1 |
| 5 | +# OpenCode Ecosystem v4.7 |
6 | 6 |
|
7 | | -### Arquitetura Multiagente Evolutiva — 212 Raciocinios · 55 IMO Testados · Loop Autonomo |
| 7 | +### Arquitetura Multiagente Evolutiva — 212 Raciocinios · 55 IMO Testados · SDD+TDD · CORA-Eval |
8 | 8 |
|
9 | 9 | <br/> |
10 | 10 |
|
|
14 | 14 | [-a855f7?style=flat-square)](skills/reasoning-orchestrator-v11/CATALOGO_RACIOCINIOS_212.md) |
15 | 15 | [](evals/imo_batch_results.json) |
16 | 16 | [](skills/cora-debate/) |
17 | | -[]() |
18 | | -[](artigo_completo_qualis_a1.pdf) |
| 17 | +[](artigo/tests/) |
| 18 | +[](artigo/evaluations/) |
19 | 19 | []() |
20 | 20 | []() |
21 | 21 |
|
22 | 22 | <br/> |
23 | 23 |
|
24 | | -> **Versao:** 4.6.1 · **Atualizado:** 2026-05-27 · **Modelo:** `deepseek-v4-pro` (200K ctx, 128K out) |
| 24 | +> **Versao:** 4.7 · **Atualizado:** 2026-05-28 · **Modelo:** `deepseek-v4-pro` (200K ctx, 128K out) |
25 | 25 | > **Afiliação:** GeoMaker+IA — Museu Escolar Itinerante (CNM 9.76.35.5698) |
26 | | -> **Novo:** 212 raciocinios (27 cat) · 55 IMO testados (PCI 98.3) · Loop autonomo · ASI-Evolve · Platt Scaling · Artigo Qualis A1 (19p, 26 refs c/ DOI) |
| 26 | +> **Novo:** CORA-Eval benchmark · SDD+TDD AutoEvolve LaTeX · Menu adaptativo · 11 ciclos evolutivos |
27 | 27 |
|
28 | 28 | </div> |
29 | 29 |
|
@@ -420,6 +420,92 @@ O experimento central utiliza o dataset **HAM10000** (10.015 imagens dermatoscó |
420 | 420 |
|
421 | 421 | --- |
422 | 422 |
|
| 423 | +## SDD+TDD AutoEvolve — Pipeline de Refino para LaTeX Acadêmico |
| 424 | + |
| 425 | +O pipeline **SDD+TDD+AutoEvolve** aplica metodologia de engenharia de software a documentos acadêmicos LaTeX, garantindo qualidade tipográfica e estrutural via testes automatizados. |
| 426 | + |
| 427 | +### Como funciona |
| 428 | + |
| 429 | +``` |
| 430 | +SENSE → DIAGNOSE → FIX → VERIFY → EVOLVE → LEARN |
| 431 | +``` |
| 432 | + |
| 433 | +1. **SENSE** — Compila o `.tex` e extrai métricas (páginas, tamanho PDF) |
| 434 | +2. **DIAGNOSE** — Parseia `.log` com regex: overfull, underfull, erros, font warnings |
| 435 | +3. **FIX** — Backup automático + correção seletiva (encurtamento textual, `\sloppy` local, `\raggedright` em colunas) |
| 436 | +4. **VERIFY** — 3 Quality Gates (16 testes TDD): Compilation (5), Structure (6), Quality (5) |
| 437 | +5. **EVOLVE** — Registra sessão em `fix_history.json` com catálogo de padrões |
| 438 | +6. **LEARN** — Gera insights de tendências e recomendações |
| 439 | + |
| 440 | +### Exemplo real: artigo 150 questões (ABNT, 24 páginas) |
| 441 | + |
| 442 | +| Métrica | Antes | Depois | |
| 443 | +|---------|:-----:|:------:| |
| 444 | +| Overfull boxes | 4 (máx 11,7pt) | **0** | |
| 445 | +| Underfull boxes | 1 (badness 10000) | **0** | |
| 446 | +| Erros LaTeX | 0 | 0 | |
| 447 | +| TDD | N/A | **16/16 GREEN** | |
| 448 | + |
| 449 | +### Menu Adaptativo |
| 450 | + |
| 451 | +O `menu.py` substitui scripts manuais por um painel que auto-descobre artefatos do projeto: |
| 452 | + |
| 453 | +```powershell |
| 454 | +python menu.py # Menu interativo colorido |
| 455 | +python menu.py 3 # Executa diretamente opção 3 |
| 456 | +python menu.py --list # Lista artefatos descobertos |
| 457 | +python menu.py --quick # Diagnóstico rápido (TDD + métricas) |
| 458 | +``` |
| 459 | + |
| 460 | +- **6 categorias dinâmicas**: OPERACIONAR, REPRODUZIR, REGISTRAR, AUDITAR, APRENDER, FERRAMENTAS |
| 461 | +- **Plugin system**: comandos externos registram-se em `.menu_registry.json` sem editar código |
| 462 | +- Funciona em **qualquer projeto LaTeX** com estrutura `tests/`, `orchestration/`, `.tex` |
| 463 | + |
| 464 | +> **Arquivos**: `artigo/tests/` (3 suites, 16 testes) · `artigo/orchestration/` (SPEC + FRAMEWORK + refinement_loop) · `artigo/menu.py` |
| 465 | +
|
| 466 | +--- |
| 467 | + |
| 468 | +## CORA-Eval — Benchmark Evolutivo para Ciências Exatas e da Natureza |
| 469 | + |
| 470 | +Framework de avaliação da maturidade científica do ecossistema, integrado aos 7 verificadores simbólicos do Cora-Debate (V1-V7). |
| 471 | + |
| 472 | +### Estrutura: 150 tarefas em 10 dimensões × 4 níveis |
| 473 | + |
| 474 | +| Nível | Faixa | Classificação | Tarefas | |
| 475 | +|-------|-------|---------------|:-------:| |
| 476 | +| **N1** | 0.1–0.9 | Básico | 30 | |
| 477 | +| **N2** | 1.0–1.9 | Graduação | 40 | |
| 478 | +| **N3** | 2.0–2.9 | Pós-Graduação | 41 | |
| 479 | +| **N4** | 3.0+ | Pesquisa | 39 | |
| 480 | + |
| 481 | +### 10 dimensões avaliadas |
| 482 | + |
| 483 | +| D# | Dimensão | Cora V | Peso | Baseline | |
| 484 | +|----|----------|--------|:----:|:--------:| |
| 485 | +| D1 | Raciocínio Matemático | V2,V3,V6 | 15% | N2 (1.72) | |
| 486 | +| D2 | Modelagem Física | V1,V5,V6 | 12% | — | |
| 487 | +| D3 | Análise Estatística | V4,V5 | 12% | N1 (0.90) | |
| 488 | +| D4 | Química Computacional | V2,V5 | 10% | — | |
| 489 | +| D5 | Biologia Molecular | V4,V5 | 10% | — | |
| 490 | +| D6 | Geociências | V4,V5,V6 | 8% | — | |
| 491 | +| D7 | Código Científico | V7a-V7g | 10% | N3 (2.54) | |
| 492 | +| D8 | Revisão Literatura | V3,V4 | 8% | — | |
| 493 | +| D9 | Desenho Experimental | V1,V4 | 8% | N1 (0.60) | |
| 494 | +| D10 | Síntese Interdisciplinar | V1-V7 | 7% | — | |
| 495 | + |
| 496 | +### Rastreador evolutivo |
| 497 | + |
| 498 | +```powershell |
| 499 | +python cora_benchmark_tracker.py --init # Inicializa pontuações |
| 500 | +python cora_benchmark_tracker.py --score D1 N2 4 5 # Registra 4/5 tarefas |
| 501 | +python cora_benchmark_tracker.py --report # Relatório completo |
| 502 | +python cora_benchmark_tracker.py --evolve # Snapshot evolutivo |
| 503 | +``` |
| 504 | + |
| 505 | +**CORA-Score atual**: 0.67 (Básico) — 4/10 dimensões avaliadas, 12/150 tarefas |
| 506 | + |
| 507 | +> **Arquivo**: `artigo/evaluations/BENCHMARK_CORA_CIENCIAS_EXATAS.md` (600+ linhas) · `cora_benchmark_tracker.py` (440 linhas) |
| 508 | +
|
423 | 509 | ## Simulação MiroFish/BettaFish + PhD Auditor |
424 | 510 |
|
425 | 511 | <img src="diagrams/mirofish-phd-auditor.svg" alt="Pipeline MiroFish/BettaFish + PhD Auditor P14-P18" width="100%"/> |
@@ -702,8 +788,11 @@ PLAN → ACT → REFLECT → EXTRACT → EVOLVE |
702 | 788 | | evo-6 | Iterative Correction Loop v2.0 | 95/100 | Loop de correção iterativa: 86,5 → 92,7/100 (+7,1%) | |
703 | 789 | | evo-7 | Sync v3.5 + detector CJK | 96/100 | Tolerância zero a caracteres chineses na saída | |
704 | 790 | | evo-8 | Progressive disclosure + observabilidade | 98/100 | Skills compactas (≤ 2.500B) + monitoramento contínuo de saúde | |
| 791 | +| evo-9 | SDD+TDD AutoEvolve LaTeX Refino | 96/100 | 4 overfulls eliminados + 1 underfull fix + 16/16 TDD + FRAMEWORK.md + SPEC + evolutions/ | |
| 792 | +| evo-10 | Menu Adaptativo + Plugin System | 96/100 | menu.py: estático (11 opções) → adaptativo (auto-descoberta, 6 categorias, 4 modos) | |
| 793 | +| evo-11 | CORA-Eval Benchmark 150 tarefas | 97/100 | 10 dimensões × 4 níveis (Básico→Pesquisa), tracker Python, baseline CORA-Score 0.67 | |
705 | 794 |
|
706 | | -**Progressão geral:** 85 → 98/100 (+15,3%) · Média: 91,1/100 — demonstra que o sistema melhora consistentemente a cada ciclo. |
| 795 | +**Progressão geral:** 85 → 97/100 (+14,1%) · Média: 93,1/100 — demonstra que o sistema melhora consistentemente a cada ciclo. |
707 | 796 |
|
708 | 797 | --- |
709 | 798 |
|
@@ -736,7 +825,7 @@ PLAN → ACT → REFLECT → EXTRACT → EVOLVE |
736 | 825 | | Skills dentro do limite | 72/74 | 🟢 | |
737 | 826 | | Agentes registrados | 118 | 🟢 | |
738 | 827 | | Reversa confidence | 100/100 | 🟢 | |
739 | | -| AutoEvolve gerações | 9 | 🟢 | |
| 828 | +| AutoEvolve gerações | 11 | 🟢 | |
740 | 829 | | DI Migration | Fases 1–7 (88/88 tests) | 🟢 | |
741 | 830 | | Gaps abertos | 0 | 🟢 | |
742 | 831 | | Health score Nexus | 96/100 | 🟢 | |
@@ -784,7 +873,9 @@ Cada subsistema possui sua própria classificação técnica, refletindo a espec |
784 | 873 | | **SEEKER** | Autonomous Research Agent Swarm | 12 agentes paralelos, 10+ fontes acadêmicas | |
785 | 874 | | **MiroFish/BettaFish** | Agent-Based Simulation Framework (P1–P18) | 18 padrões arquiteturais, 38 raciocínios | |
786 | 875 | | **PhD Auditor (P18)** | Statistical Validation Engine | NashSolver, Cohen's d, Bonferroni, Power Analysis | |
787 | | -| **AutoEvolve** | Evolutionary Skill Generation Loop | PLAN→ACT→REFLECT→EXTRACT→EVOLVE, 8 ciclos | |
| 876 | +| **AutoEvolve** | Evolutionary Skill Generation Loop | PLAN→ACT→REFLECT→EXTRACT→EVOLVE, 11 ciclos | |
| 877 | +| **SDD+TDD Pipeline** | Spec-Driven Test-Driven LaTeX Refinement | 3 gates, 16 testes, overfull/underfull zero | |
| 878 | +| **CORA-Eval** | Scientific Maturity Benchmark | 150 tarefas, 10 dimensões, 4 níveis, tracker Python | |
788 | 879 | | **MCP Layer** | Tool Integration Protocol Layer | 40 servidores, lazy init, stdio/HTTP | |
789 | 880 | | **RAG Engine** | Adaptive Multi-Strategy RAG | 9 estratégias (Vanilla → HyDE), auto-select | |
790 | 881 | | **Quantum Module** | Variational Quantum Computing (VQC) | 50 qubits, 89.52% acc, QML | |
@@ -837,6 +928,8 @@ Os diferenciadores técnicos em relação aos demais frameworks são: |
837 | 928 | | Serviços DI | **11** + 3 plugins TS | |
838 | 929 | | Linhas Python | **~109.660** | |
839 | 930 | | Quality Gates | **4** (G0 → GR → GE → GF) | |
| 931 | +| TDD Quality Gates (LaTeX) | **3** (Compilation, Structure, Quality) — 16/16 GREEN | |
| 932 | +| CORA-Eval Score | **0.67** (Básico) — 4/10 dimensões, 12/150 tarefas | |
840 | 933 | | Health Score | **96/100** | |
841 | 934 |
|
842 | 935 | > **Classificação em uma frase:** O OpenCode Ecosystem v4.6 é uma plataforma multiagente evolutiva com orquestração hierárquica de 6 camadas, injeção de dependência centralizada, 18 padrões arquiteturais (P1–P18), debate com Teoria dos Jogos e validação estatística PhD-level, voltada para produção acadêmica Qualis A1, pesquisa científica autônoma e engenharia reversa de sistemas. |
@@ -997,10 +1090,10 @@ Mapa radial dos 10 subsistemas com classificação técnica individual: Nexus NM |
997 | 1090 |
|
998 | 1091 | <div align="center"> |
999 | 1092 |
|
1000 | | -**OpenCode Ecosystem v4.6** |
| 1093 | +**OpenCode Ecosystem v4.7** |
1001 | 1094 |
|
1002 | | -125 agentes catalogados · 41 MCPs · 106 skills · 38 raciocínios · MiroFish/BettaFish · PhD Auditor · Cora-Debate (P19) |
| 1095 | +125 agentes catalogados · 41 MCPs · 106 skills · 212 raciocínios · MiroFish/BettaFish · PhD Auditor · Cora-Debate (P19) · SDD+TDD · CORA-Eval |
1003 | 1096 |
|
1004 | | -*Documentação atualizada — 2026-05-25 · BRAZIL_TIMEZONE UTC-3 · [CORRIGENDUM.md](CORRIGENDUM.md)* |
| 1097 | +*Documentação atualizada — 2026-05-28 · BRAZIL_TIMEZONE UTC-3 · [CORRIGENDUM.md](CORRIGENDUM.md)* |
1005 | 1098 |
|
1006 | 1099 | </div> |
0 commit comments