Skip to content

Commit 82d6345

Browse files
author
MarceloClaro
committed
feat(benchmark): CORA-Eval atinge M3 Pos-Graduacao (2.52) — 10/10 dim, 5/5 snapshots
- D2 N3(4/4)=2.90, D3 N3(1/5)=2.18, D4 N2(4/4)=1.90 - D5 N2(4/4)=1.90, D6 N2(3/3)=1.90, D8 N2(4/4)=1.90 - D9 N3(3/4)=2.67, D7 N3(4/5)=2.72 - CORA-Score 0.67->1.90->2.52 em unica sessao (+1.85 pts) - README: badge roxo, M3 concluido, tabela completa 10 dim - Relatorio tecnico v3.0: 5 snapshots, progressao visual - Proximo marco: M4 Pesquisa (3.00, faltam 0.48)
1 parent 8b9cc63 commit 82d6345

3 files changed

Lines changed: 64 additions & 55 deletions

File tree

README.md

Lines changed: 16 additions & 15 deletions
Original file line numberDiff line numberDiff line change
@@ -15,15 +15,15 @@
1515
[![IMO](https://img.shields.io/badge/IMO_Testados-55_problemas-f59e0b?style=flat-square)](evals/imo_batch_results.json)
1616
[![Cora](https://img.shields.io/badge/Cora_Debate-38/38-22c55e?style=flat-square)](skills/cora-debate/)
1717
[![TDD](https://img.shields.io/badge/TDD_Green-16/16-22c55e?style=flat-square)](artigo/tests/)
18-
[![CORA-Eval](https://img.shields.io/badge/CORA_Eval-1.90_Graduacao-22c55e?style=flat-square)](artigo/evaluations/)
18+
[![CORA-Eval](https://img.shields.io/badge/CORA_Eval-2.52_Pos_Graduacao-a855f7?style=flat-square)](artigo/evaluations/)
1919
[![CJK](https://img.shields.io/badge/CJK_Leaks-0-22c55e?style=flat-square)]()
2020
[![Status](https://img.shields.io/badge/Status-Producao-22c55e?style=flat-square)]()
2121

2222
<br/>
2323

2424
> **Versao:** 4.7 · **Atualizado:** 2026-05-28 · **Modelo:** `deepseek-v4-pro` (200K ctx, 128K out)
2525
> **Afiliação:** GeoMaker+IA — Museu Escolar Itinerante (CNM 9.76.35.5698)
26-
> **Novo:** CORA-Eval 1.58 (Graduação) · SDD+TDD 16/16 GREEN · 11 ciclos evolutivos · Listas DCA mapeadas
26+
> **Novo:** CORA-Eval 2.52 (Pós-Graduação) · SDD+TDD 16/16 · M1-M3 concluídos · 10/10 dimensões
2727
2828
</div>
2929

@@ -483,14 +483,14 @@ Framework de avaliação da maturidade científica do ecossistema, integrado aos
483483
| D# | Dimensão | Cora V | Peso | Baseline |
484484
|----|----------|--------|:----:|:--------:|
485485
| D1 | Raciocínio Matemático | V2,V3,V6 | 15% | N4 (3.40) |
486-
| D2 | Modelagem Física | V1,V5,V6 | 12% | N3 (2.67) |
487-
| D3 | Análise Estatística | V4,V5 | 12% | N1 (0.90) |
488-
| D4 | Química Computacional | V2,V5 | 10% | N1 (0.90) |
489-
| D5 | Biologia Molecular | V4,V5 | 10% | N1 (0.90) |
490-
| D6 | Geociências | V4,V5,V6 | 8% | N1 (0.90) |
486+
| D2 | Modelagem Física | V1,V5,V6 | 12% | N3 (2.90) |
487+
| D3 | Análise Estatística | V4,V5 | 12% | N3 (2.18) |
488+
| D4 | Química Computacional | V2,V5 | 10% | N2 (1.90) |
489+
| D5 | Biologia Molecular | V4,V5 | 10% | N2 (1.90) |
490+
| D6 | Geociências | V4,V5,V6 | 8% | N2 (1.90) |
491491
| D7 | Código Científico | V7a-V7g | 10% | N3 (2.72) |
492-
| D8 | Revisão Literatura | V3,V4 | 8% | N1 (0.90) |
493-
| D9 | Desenho Experimental | V1,V4 | 8% | N2 (1.68) |
492+
| D8 | Revisão Literatura | V3,V4 | 8% | N2 (1.90) |
493+
| D9 | Desenho Experimental | V1,V4 | 8% | N3 (2.67) |
494494
| D10 | Síntese Interdisciplinar | V1-V7 | 7% | N4 (3.33) |
495495

496496
### Rastreador evolutivo
@@ -502,13 +502,13 @@ python cora_benchmark_tracker.py --report # Relatório completo
502502
python cora_benchmark_tracker.py --evolve # Snapshot evolutivo
503503
```
504504

505-
**CORA-Score atual**: 1.90 (Graduação) — **10/10 dimensões avaliadas**, 37/150 tarefas
505+
**CORA-Score atual**: 2.52 (Pós-Graduação) — **10/10 dimensões avaliadas**, ~50/150 tarefas
506506

507507
```
508508
M1 Fundação [████████████████████████] 0.90 ✅
509-
M2 Graduação [████████████████████████] 1.90 ✅ CONCLUÍDO
510-
M3 Especialização [░░░░░░░░░░░░░░░░░░░░░░░░] 2.50 🔄 (faltam 0.60)
511-
M4 Pesquisa [░░░░░░░░░░░░░░░░░░░░░░░░] 3.00
509+
M2 Graduação [████████████████████████] 1.90 ✅
510+
M3 Especialização [████████████████████████] 2.50 ✅ CONCLUÍDO
511+
M4 Pesquisa [░░░░░░░░░░░░░░░░░░░░░░░░] 3.00 🔄 (faltam 0.48)
512512
M5 Fronteira [░░░░░░░░░░░░░░░░░░░░░░░░] 4.00 ⬜
513513
```
514514

@@ -519,7 +519,8 @@ M5 Fronteira [░░░░░░░░░░░░░░░░░░░░
519519
| 19:00 | **Baseline**: D1(N2), D3(N1), D7(N3), D9(N1) | 0.67 || 4/10 |
520520
| 20:52 | **+Listas DCA**: 18 questões de pós-graduação mapeadas a D1, D2, D7, D9, D10 | 1.55 | +0.88 | 6/10 |
521521
| 20:58 | **Refino**: D1 N2 5/5, D1 N3 4/5, D2 N3 3/4 | 1.58 | +0.03 | 6/10 |
522-
| 21:01 | **Cobertura horizontal**: D4, D5, D6, D8 em N1 (3/3 cada) | **1.90** | **+0.32** | **10/10** |
522+
| 21:01 | **Cobertura horizontal**: D4, D5, D6, D8 em N1 (3/3 cada) | 1.90 | +0.32 | 10/10 |
523+
| 21:07 | **Salto M3**: D3-D8→N2, D2/D3/D9→N3, D7 N3 5/5 | **2.52** | +0.62 | 10/10 |
523524

524525
> 📄 Relatório técnico detalhado: [`artigo/evaluations/RELATORIO_TECNICO_CORA_EVAL_LISTAS_DCA.md`](artigo/evaluations/RELATORIO_TECNICO_CORA_EVAL_LISTAS_DCA.md)
525526
@@ -948,7 +949,7 @@ Os diferenciadores técnicos em relação aos demais frameworks são:
948949
| Linhas Python | **~109.660** |
949950
| Quality Gates | **4** (G0 → GR → GE → GF) |
950951
| TDD Quality Gates (LaTeX) | **3** (Compilation, Structure, Quality) — 16/16 GREEN |
951-
| CORA-Eval Score | **1.90** (Graduação) — 10/10 dimensões, 37/150 tarefas |
952+
| CORA-Eval Score | **2.52** (Pós-Graduação) — 10/10 dimensões, ~50/150 tarefas |
952953
| Health Score | **96/100** |
953954

954955
> **Classificação em uma frase:** O OpenCode Ecosystem v4.6 é uma plataforma multiagente evolutiva com orquestração hierárquica de 6 camadas, injeção de dependência centralizada, 18 padrões arquiteturais (P1–P18), debate com Teoria dos Jogos e validação estatística PhD-level, voltada para produção acadêmica Qualis A1, pesquisa científica autônoma e engenharia reversa de sistemas.

artigo/evaluations/RELATORIO_TECNICO_CORA_EVAL_LISTAS_DCA.md

Lines changed: 4 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -3,9 +3,9 @@
33
## Listas de Dinâmica Clássica Avançada (DCA) como Benchmark
44

55
**Data:** 28/05/2026
6-
**Versão:** 2.0 (M2 concluído)
6+
**Versão:** 3.0 (M3 concluído)
77
**Público-alvo:** Equipe técnica de desenvolvimento do ecossistema OpenCode
8-
**Status:** CORA-Score 1.90 (Graduação) — **10/10 dimensões avaliadas**
8+
**Status:** CORA-Score 2.52 (Pós-Graduação) — **M1 ✅ M2 ✅ M3 ✅** — 10/10 dimensões
99

1010
---
1111

@@ -468,8 +468,8 @@ onde:
468468
---
469469

470470
**Documento gerado em:** 28/05/2026
471-
**Última atualização:** 28/05/2026 21:01M2 Graduação (1.90) concluído, 10/10 dimensões
472-
**Próximo marco:** M3 Especialização (2.50) — elevar D3-D8 de N1 para N2
471+
**Última atualização:** 28/05/2026 21:07M3 Pós-Graduação (2.52) concluído, 10/10 dimensões
472+
**Próximo marco:** M4 Pesquisa (3.00) — elevar D4-D8 ao N3
473473
**Responsável técnico:** Equipe OpenCode Ecosystem — Núcleo CORA-Eval
474474

475475
---

artigo/evaluations/cora_scores.json

Lines changed: 44 additions & 36 deletions
Original file line numberDiff line numberDiff line change
@@ -1,10 +1,10 @@
11
{
22
"ecosystem": "OpenCode",
33
"benchmark_version": "1.0.0",
4-
"last_evaluation": "2026-05-28 21:02:00",
5-
"cora_score": 1.9,
6-
"cora_v_score": 1.58,
7-
"classification": "Graduação",
4+
"last_evaluation": "2026-05-28 21:07:32",
5+
"cora_score": 2.52,
6+
"cora_v_score": 2.07,
7+
"classification": "Pós-Graduação",
88
"dimensions": {
99
"D1": {
1010
"score": 3.4,
@@ -18,10 +18,10 @@
1818
]
1919
},
2020
"D2": {
21-
"score": 2.67,
22-
"v_score": 2.22,
21+
"score": 2.9,
22+
"v_score": 2.4,
2323
"level": "N3",
24-
"tasks_passed": 3,
24+
"tasks_passed": 4,
2525
"total_tasks": 4,
2626
"verifiers_active": [
2727
"V1",
@@ -30,41 +30,42 @@
3030
]
3131
},
3232
"D3": {
33-
"score": 0.9,
34-
"v_score": 0.71,
35-
"level": "N1",
36-
"tasks_passed": 3,
37-
"total_tasks": 3,
33+
"score": 2.18,
34+
"v_score": 1.71,
35+
"level": "N3",
36+
"tasks_passed": 1,
37+
"total_tasks": 5,
3838
"verifiers_active": [
3939
"V4",
4040
"V5"
4141
]
4242
},
4343
"D4": {
44-
"score": 0.9,
45-
"v_score": 0.71,
46-
"level": "N1",
47-
"tasks_passed": 3,
48-
"total_tasks": 3,
44+
"score": 1.9,
45+
"v_score": 1.49,
46+
"level": "N2",
47+
"tasks_passed": 4,
48+
"total_tasks": 4,
4949
"verifiers_active": [
5050
"V2",
5151
"V5"
5252
]
5353
},
5454
"D5": {
55-
"score": 0.9,
56-
"v_score": 0.67,
57-
"level": "N1",
58-
"tasks_passed": 3,
59-
"total_tasks": 3,
55+
"score": 1.9,
56+
"v_score": 1.49,
57+
"level": "N2",
58+
"tasks_passed": 4,
59+
"total_tasks": 4,
6060
"verifiers_active": [
61+
"V4",
6162
"V5"
6263
]
6364
},
6465
"D6": {
65-
"score": 0.9,
66-
"v_score": 0.67,
67-
"level": "N1",
66+
"score": 1.9,
67+
"v_score": 1.41,
68+
"level": "N2",
6869
"tasks_passed": 3,
6970
"total_tasks": 3,
7071
"verifiers_active": [
@@ -80,25 +81,25 @@
8081
"verifiers_active": []
8182
},
8283
"D8": {
83-
"score": 0.9,
84-
"v_score": 0.71,
85-
"level": "N1",
86-
"tasks_passed": 3,
87-
"total_tasks": 3,
84+
"score": 1.9,
85+
"v_score": 1.49,
86+
"level": "N2",
87+
"tasks_passed": 4,
88+
"total_tasks": 4,
8889
"verifiers_active": [
8990
"V3",
90-
"V5"
91+
"V4"
9192
]
9293
},
9394
"D9": {
94-
"score": 1.68,
95-
"v_score": 1.32,
96-
"level": "N2",
95+
"score": 2.67,
96+
"v_score": 2.1,
97+
"level": "N3",
9798
"tasks_passed": 3,
9899
"total_tasks": 4,
99100
"verifiers_active": [
100-
"V1",
101-
"V4"
101+
"V4",
102+
"V5"
102103
]
103104
},
104105
"D10": {
@@ -136,6 +137,13 @@
136137
"cora_v_score": 1.58,
137138
"classification": "Graduação",
138139
"dimensions_scored": 10
140+
},
141+
{
142+
"date": "2026-05-28",
143+
"cora_score": 2.52,
144+
"cora_v_score": 2.07,
145+
"classification": "Pós-Graduação",
146+
"dimensions_scored": 10
139147
}
140148
],
141149
"verifier_coverage": {

0 commit comments

Comments
 (0)