|
23 | 23 |
|
24 | 24 | > **Versao:** 4.7 · **Atualizado:** 2026-05-29 · **Modelo:** `deepseek-v4-pro` (200K ctx, 128K out) |
25 | 25 | > **Afiliação:** GeoMaker+IA — Museu Escolar Itinerante (CNM 9.76.35.5698) |
26 | | -> **Novo:** CORA-Eval 3.04 (PESQUISA M4) · 34/34 teste cego · CV 2,2% · Dissertação 129 laudas ABNT |
| 26 | +> **Novo:** Relatorio Tecnico 131p · CORA-Eval bruto 3.04 / ajustado 2.59 · 34/34 blind · 16 suites TDD |
27 | 27 |
|
28 | 28 | </div> |
29 | 29 |
|
@@ -531,19 +531,21 @@ M5 Fronteira [░░░░░░░░░░░░░░░░░░░░ |
531 | 531 |
|
532 | 532 | | Indicador | Valor | |
533 | 533 | |-----------|-------| |
534 | | -| **CORA-Score inicial** | 0,67 (Básico) | |
535 | | -| **CORA-Score final** | 3,04 (Pesquisa M4) | |
536 | | -| **Variação total** | **+2,37** (+353,7%) | |
537 | | -| **Marcos concluídos** | M1 ✅ M2 ✅ M3 ✅ M4 ✅ | |
538 | | -| **Dimensões em N4** | 5 (D1 3,80 · D2 3,50 · D3 3,40 · D7 3,20 · D10 3,67) | |
539 | | -| **Teste cego** | **34/34 (100%)** — 25 PE + 10 Rosalind | |
| 534 | +| **CORA-Score inicial** | 0,67 (Basico) | |
| 535 | +| **CORA-Score bruto** | 3,04 | |
| 536 | +| **CORA-Score ajustado** | **2,59** (penalizacao por validacao interna) | |
| 537 | +| **Variacao total** | **+2,37** (+353,7%) | |
| 538 | +| **Marcos concluidos** | M1 M2 M3 M4 | |
| 539 | +| **Dimensoes em N4** | 5 (D1 3,80 · D2 3,50 · D3 3,40 · D7 3,20 · D10 3,67) | |
| 540 | +| **Confianca Alta** | 2 (D1 Project Euler, D5 Rosalind) | |
| 541 | +| **Confianca Media** | 4 (D2, D3, D7, D10 — TDD proprio) | |
| 542 | +| **Confianca Baixa** | 4 (D4, D6, D8, D9 — apenas validacao interna) | |
| 543 | +| **Teste cego** | **34/34 (100%)** — verificacao automatica pelas plataformas | |
540 | 544 | | **Cross-validation** | K=10, CV=2,2% (Excelente) | |
541 | | -| **Suites TDD** | 13 suites, **113/114 GREEN (99,1%)** | |
542 | | -| **Validação externa** | 6,3M solvers (PE 4M + Rosalind 273K + blind 2,1M) | |
543 | | -| **vs Ollama** | **+53%** superior ao melhor modelo local (DeepSeek-V3 671B) | |
544 | | -| **Dissertação** | 129 laudas ABNT, 0 overfull, 30+ refs c/ DOI | |
545 | | - |
546 | | -> 📄 Dissertação completa: [`dissertacao_cora_eval_abnt.pdf`](artigo/dissertacao_cora_eval_abnt.pdf) (129 laudas) |
| 545 | +| **Suites TDD** | 16 suites, todas GREEN | |
| 546 | +| **Comparacao Ollama** | +53% vs modelos bare-metal (comparacao com frameworks multiagente pendente) | |
| 547 | +| **Relatorio Tecnico** | 131 laudas ABNT, auto-publicado, 0 overfull, 30+ refs c/ DOI | |
| 548 | +| **Nota** | 8/10 dimensoes dependem de validacao interna. Documento NAO e dissertacao defendida. | |
547 | 549 |
|
548 | 550 | ## Comparativo Ollama vs OpenCode |
549 | 551 |
|
|
0 commit comments