Skip to content

Commit e9512c8

Browse files
author
MarceloClaro
committed
feat(benchmark): CORA-Eval atinge M2 Graduacao (1.90) — 10/10 dimensoes avaliadas
- D4 (Quimica): N1 3/3, D5 (Biologia): N1 3/3 - D6 (Geociencias): N1 3/3, D8 (Literatura): N1 3/3 - CORA-Score: 0.67 -> 1.58 -> 1.90 em uma sessao (+1.23 pts) - Proximo marco: M3 Especializacao (2.50, faltam 0.60) - README atualizado: badge verde, M2 concluido, barra de progresso
1 parent 16ab0af commit e9512c8

2 files changed

Lines changed: 53 additions & 36 deletions

File tree

README.md

Lines changed: 9 additions & 9 deletions
Original file line numberDiff line numberDiff line change
@@ -15,7 +15,7 @@
1515
[![IMO](https://img.shields.io/badge/IMO_Testados-55_problemas-f59e0b?style=flat-square)](evals/imo_batch_results.json)
1616
[![Cora](https://img.shields.io/badge/Cora_Debate-38/38-22c55e?style=flat-square)](skills/cora-debate/)
1717
[![TDD](https://img.shields.io/badge/TDD_Green-16/16-22c55e?style=flat-square)](artigo/tests/)
18-
[![CORA-Eval](https://img.shields.io/badge/CORA_Eval-1.58_Graduacao-0ea5e9?style=flat-square)](artigo/evaluations/)
18+
[![CORA-Eval](https://img.shields.io/badge/CORA_Eval-1.90_Graduacao-22c55e?style=flat-square)](artigo/evaluations/)
1919
[![CJK](https://img.shields.io/badge/CJK_Leaks-0-22c55e?style=flat-square)]()
2020
[![Status](https://img.shields.io/badge/Status-Producao-22c55e?style=flat-square)]()
2121

@@ -485,11 +485,11 @@ Framework de avaliação da maturidade científica do ecossistema, integrado aos
485485
| D1 | Raciocínio Matemático | V2,V3,V6 | 15% | N4 (3.40) |
486486
| D2 | Modelagem Física | V1,V5,V6 | 12% | N3 (2.67) |
487487
| D3 | Análise Estatística | V4,V5 | 12% | N1 (0.90) |
488-
| D4 | Química Computacional | V2,V5 | 10% | |
489-
| D5 | Biologia Molecular | V4,V5 | 10% | |
490-
| D6 | Geociências | V4,V5,V6 | 8% | |
488+
| D4 | Química Computacional | V2,V5 | 10% | N1 (0.90) |
489+
| D5 | Biologia Molecular | V4,V5 | 10% | N1 (0.90) |
490+
| D6 | Geociências | V4,V5,V6 | 8% | N1 (0.90) |
491491
| D7 | Código Científico | V7a-V7g | 10% | N3 (2.72) |
492-
| D8 | Revisão Literatura | V3,V4 | 8% | |
492+
| D8 | Revisão Literatura | V3,V4 | 8% | N1 (0.90) |
493493
| D9 | Desenho Experimental | V1,V4 | 8% | N2 (1.68) |
494494
| D10 | Síntese Interdisciplinar | V1-V7 | 7% | N4 (3.33) |
495495

@@ -502,12 +502,12 @@ python cora_benchmark_tracker.py --report # Relatório completo
502502
python cora_benchmark_tracker.py --evolve # Snapshot evolutivo
503503
```
504504

505-
**CORA-Score atual**: 1.58 (Graduação) — 6/10 dimensões avaliadas, 28/150 tarefas
505+
**CORA-Score atual**: 1.90 (Graduação) — **10/10 dimensões avaliadas**, 37/150 tarefas
506506

507507
```
508508
M1 Fundação [████████████████████████] 0.90 ✅
509-
M2 Graduação [████████████████░░░░░░░░] 1.90 🔄 (faltam 0.32)
510-
M3 Especialização [░░░░░░░░░░░░░░░░░░░░░░░░] 2.50
509+
M2 Graduação [████████████████████████] 1.90 ✅ CONCLUÍDO
510+
M3 Especialização [░░░░░░░░░░░░░░░░░░░░░░░░] 2.50 🔄 (faltam 0.60)
511511
M4 Pesquisa [░░░░░░░░░░░░░░░░░░░░░░░░] 3.00 ⬜
512512
M5 Fronteira [░░░░░░░░░░░░░░░░░░░░░░░░] 4.00 ⬜
513513
```
@@ -937,7 +937,7 @@ Os diferenciadores técnicos em relação aos demais frameworks são:
937937
| Linhas Python | **~109.660** |
938938
| Quality Gates | **4** (G0 → GR → GE → GF) |
939939
| TDD Quality Gates (LaTeX) | **3** (Compilation, Structure, Quality) — 16/16 GREEN |
940-
| CORA-Eval Score | **1.58** (Graduação) — 6/10 dimensões, 28/150 tarefas |
940+
| CORA-Eval Score | **1.90** (Graduação) — 10/10 dimensões, 37/150 tarefas |
941941
| Health Score | **96/100** |
942942

943943
> **Classificação em uma frase:** O OpenCode Ecosystem v4.6 é uma plataforma multiagente evolutiva com orquestração hierárquica de 6 camadas, injeção de dependência centralizada, 18 padrões arquiteturais (P1–P18), debate com Teoria dos Jogos e validação estatística PhD-level, voltada para produção acadêmica Qualis A1, pesquisa científica autônoma e engenharia reversa de sistemas.

artigo/evaluations/cora_scores.json

Lines changed: 44 additions & 27 deletions
Original file line numberDiff line numberDiff line change
@@ -1,9 +1,9 @@
11
{
22
"ecosystem": "OpenCode",
33
"benchmark_version": "1.0.0",
4-
"last_evaluation": "2026-05-28 20:57:08",
5-
"cora_score": 1.58,
6-
"cora_v_score": 1.33,
4+
"last_evaluation": "2026-05-28 21:02:00",
5+
"cora_score": 1.9,
6+
"cora_v_score": 1.58,
77
"classification": "Graduação",
88
"dimensions": {
99
"D1": {
@@ -41,28 +41,35 @@
4141
]
4242
},
4343
"D4": {
44-
"score": 0.0,
45-
"v_score": 0.0,
46-
"level": null,
47-
"tasks_passed": 0,
48-
"total_tasks": 0,
49-
"verifiers_active": []
44+
"score": 0.9,
45+
"v_score": 0.71,
46+
"level": "N1",
47+
"tasks_passed": 3,
48+
"total_tasks": 3,
49+
"verifiers_active": [
50+
"V2",
51+
"V5"
52+
]
5053
},
5154
"D5": {
52-
"score": 0.0,
53-
"v_score": 0.0,
54-
"level": null,
55-
"tasks_passed": 0,
56-
"total_tasks": 0,
57-
"verifiers_active": []
55+
"score": 0.9,
56+
"v_score": 0.67,
57+
"level": "N1",
58+
"tasks_passed": 3,
59+
"total_tasks": 3,
60+
"verifiers_active": [
61+
"V5"
62+
]
5863
},
5964
"D6": {
60-
"score": 0.0,
61-
"v_score": 0.0,
62-
"level": null,
63-
"tasks_passed": 0,
64-
"total_tasks": 0,
65-
"verifiers_active": []
65+
"score": 0.9,
66+
"v_score": 0.67,
67+
"level": "N1",
68+
"tasks_passed": 3,
69+
"total_tasks": 3,
70+
"verifiers_active": [
71+
"V5"
72+
]
6673
},
6774
"D7": {
6875
"score": 2.72,
@@ -73,12 +80,15 @@
7380
"verifiers_active": []
7481
},
7582
"D8": {
76-
"score": 0.0,
77-
"v_score": 0.0,
78-
"level": null,
79-
"tasks_passed": 0,
80-
"total_tasks": 0,
81-
"verifiers_active": []
83+
"score": 0.9,
84+
"v_score": 0.71,
85+
"level": "N1",
86+
"tasks_passed": 3,
87+
"total_tasks": 3,
88+
"verifiers_active": [
89+
"V3",
90+
"V5"
91+
]
8292
},
8393
"D9": {
8494
"score": 1.68,
@@ -119,6 +129,13 @@
119129
"cora_v_score": 1.31,
120130
"classification": "Graduação",
121131
"dimensions_scored": 6
132+
},
133+
{
134+
"date": "2026-05-28",
135+
"cora_score": 1.9,
136+
"cora_v_score": 1.58,
137+
"classification": "Graduação",
138+
"dimensions_scored": 10
122139
}
123140
],
124141
"verifier_coverage": {

0 commit comments

Comments
 (0)