Skip to content

Commit 3536aec

Browse files
author
MarceloClaro
committed
docs(readme): honestidade total — score ajustado 2.59, confianca, nomenclatura corrigida
- CORA-Score bruto 3.04 / ajustado 2.59 (penalizacao validacao interna) - Coluna de confianca: 2 Alta, 4 Media, 4 Baixa - Nota: 8/10 dim dependem de validacao interna - Comparacao Ollama qualificada como 'modelos bare-metal' - Relatorio Tecnico (nao dissertacao), auto-publicado - 16 suites TDD, 34/34 blind (verificacao automatica, nao revisores)
1 parent 0d7d556 commit 3536aec

1 file changed

Lines changed: 15 additions & 13 deletions

File tree

README.md

Lines changed: 15 additions & 13 deletions
Original file line numberDiff line numberDiff line change
@@ -23,7 +23,7 @@
2323

2424
> **Versao:** 4.7 · **Atualizado:** 2026-05-29 · **Modelo:** `deepseek-v4-pro` (200K ctx, 128K out)
2525
> **Afiliação:** GeoMaker+IA — Museu Escolar Itinerante (CNM 9.76.35.5698)
26-
> **Novo:** CORA-Eval 3.04 (PESQUISA M4) · 34/34 teste cego · CV 2,2% · Dissertação 129 laudas ABNT
26+
> **Novo:** Relatorio Tecnico 131p · CORA-Eval bruto 3.04 / ajustado 2.59 · 34/34 blind · 16 suites TDD
2727
2828
</div>
2929

@@ -531,19 +531,21 @@ M5 Fronteira [░░░░░░░░░░░░░░░░░░░░
531531

532532
| Indicador | Valor |
533533
|-----------|-------|
534-
| **CORA-Score inicial** | 0,67 (Básico) |
535-
| **CORA-Score final** | 3,04 (Pesquisa M4) |
536-
| **Variação total** | **+2,37** (+353,7%) |
537-
| **Marcos concluídos** | M1 ✅ M2 ✅ M3 ✅ M4 ✅ |
538-
| **Dimensões em N4** | 5 (D1 3,80 · D2 3,50 · D3 3,40 · D7 3,20 · D10 3,67) |
539-
| **Teste cego** | **34/34 (100%)** — 25 PE + 10 Rosalind |
534+
| **CORA-Score inicial** | 0,67 (Basico) |
535+
| **CORA-Score bruto** | 3,04 |
536+
| **CORA-Score ajustado** | **2,59** (penalizacao por validacao interna) |
537+
| **Variacao total** | **+2,37** (+353,7%) |
538+
| **Marcos concluidos** | M1 M2 M3 M4 |
539+
| **Dimensoes em N4** | 5 (D1 3,80 · D2 3,50 · D3 3,40 · D7 3,20 · D10 3,67) |
540+
| **Confianca Alta** | 2 (D1 Project Euler, D5 Rosalind) |
541+
| **Confianca Media** | 4 (D2, D3, D7, D10 — TDD proprio) |
542+
| **Confianca Baixa** | 4 (D4, D6, D8, D9 — apenas validacao interna) |
543+
| **Teste cego** | **34/34 (100%)** — verificacao automatica pelas plataformas |
540544
| **Cross-validation** | K=10, CV=2,2% (Excelente) |
541-
| **Suites TDD** | 13 suites, **113/114 GREEN (99,1%)** |
542-
| **Validação externa** | 6,3M solvers (PE 4M + Rosalind 273K + blind 2,1M) |
543-
| **vs Ollama** | **+53%** superior ao melhor modelo local (DeepSeek-V3 671B) |
544-
| **Dissertação** | 129 laudas ABNT, 0 overfull, 30+ refs c/ DOI |
545-
546-
> 📄 Dissertação completa: [`dissertacao_cora_eval_abnt.pdf`](artigo/dissertacao_cora_eval_abnt.pdf) (129 laudas)
545+
| **Suites TDD** | 16 suites, todas GREEN |
546+
| **Comparacao Ollama** | +53% vs modelos bare-metal (comparacao com frameworks multiagente pendente) |
547+
| **Relatorio Tecnico** | 131 laudas ABNT, auto-publicado, 0 overfull, 30+ refs c/ DOI |
548+
| **Nota** | 8/10 dimensoes dependem de validacao interna. Documento NAO e dissertacao defendida. |
547549

548550
## Comparativo Ollama vs OpenCode
549551

0 commit comments

Comments
 (0)