|
| 1 | +# Catalogo de Problemas Complexos — Evolucao CORA-Eval |
| 2 | + |
| 3 | +**Versao:** 1.0 | **Data:** 29/05/2026 |
| 4 | +**Objetivo:** Fornecer problemas verificaveis para elevar CORA-Score de 2.62 → 4.00 (M4+M5) |
| 5 | +**Fontes:** Project Euler (988), Rosalind (284), DCA Listas (18), GAT (30+ refs), arXiv recent papers |
| 6 | + |
| 7 | +--- |
| 8 | + |
| 9 | +## Indice de Fontes |
| 10 | + |
| 11 | +| Fonte | Problemas | Area | Niveis | URL | |
| 12 | +|-------|:---------:|------|--------|-----| |
| 13 | +| Project Euler | 988 | Matematica/Computacao | N1-N4 | projecteuler.net/archives | |
| 14 | +| Rosalind | 284 | Bioinformatica | N1-N4 | rosalind.info/problems/list-view/ | |
| 15 | +| DCA Listas | 18 | Fisica-Matematica | N3-N4 | (local) | |
| 16 | +| GAT Farinelli | 30+ refs | Geometria/Financas | N4 | arXiv:0910.1671v10 | |
| 17 | +| arXiv comp-ph | 69 recentes | Fisica Computacional | N3-N4 | arxiv.org/list/physics.comp-ph/recent | |
| 18 | + |
| 19 | +--- |
| 20 | + |
| 21 | +## D2 — Modelagem de Sistemas Fisicos (N3→N4, peso 12%) |
| 22 | + |
| 23 | +### Problemas D2-N4 (Pesquisa, 3.0+) |
| 24 | + |
| 25 | +| ID | Problema | Fonte | Cora V | Ground Truth | |
| 26 | +|----|----------|-------|:------:|--------------| |
| 27 | +| D2-N4-01 | Simulacao N-corpos com Barnes-Hut (N=10^5, erro < 10^-6) | arXiv:2605.29683 | V1,V5,V6,V7 | Conservacao de energia | |
| 28 | +| D2-N4-02 | Equacao de Schrodinger dependente do tempo 2D (split-operator FFT) | arXiv comp-ph | V1,V6,V7 | Pacote Gaussiano analitico | |
| 29 | +| D2-N4-03 | Dinamica Molecular NVE com potencial Lennard-Jones (N=10^4, 10^5 passos) | MD benchmarks | V1,V5,V7 | Temperatura, pressao, RDF | |
| 30 | +| D2-N4-04 | CFD: Navier-Stokes 2D incompressivel (metodo de projecao, Re=1000) | OpenFOAM benchmarks | V1,V5,V6 | Lid-driven cavity (Ghia 1982) | |
| 31 | +| D2-N4-05 | Simulacao de Monte Carlo Quantico (path integral, N=100 particulas) | arXiv:2605.30165 | V4,V5,V7 | Energia do estado fundamental | |
| 32 | + |
| 33 | +### Problemas D2-N3 (Confirmacao TDD) |
| 34 | + |
| 35 | +| ID | Problema | Fonte | Cora V | Tarefa CORA-Eval | |
| 36 | +|----|----------|-------|:------:|------------------| |
| 37 | +| D2-N3-01 | Secao de Poincare Henon-Heiles (E=1/6, E=1/8) | DCA Lista 2 Q3 | V5,V7 | D2-N3-04 | |
| 38 | +| D2-N3-02 | Rede de Toda: integrais de movimento verificadas | DCA Lista 2 Q2 | V1,V2,V5 | D2-N3-04 | |
| 39 | +| D2-N3-03 | Walker-Ford: ressonancias e superficies racionais | DCA Lista 2 Q4 | V1,V2 | D2-N3-04 | |
| 40 | +| D2-N3-04 | Contato Hamiltoniano: toros instantaneos vs invariantes | DCA Lista 3 Q1-Q2 | V1,V6,V7 | D2-N3-04 | |
| 41 | + |
| 42 | +--- |
| 43 | + |
| 44 | +## D3 — Analise Estatistica (N3→N4, peso 12%) |
| 45 | + |
| 46 | +### Problemas D3-N4 (Pesquisa) |
| 47 | + |
| 48 | +| ID | Problema | Fonte | Cora V | Ground Truth | |
| 49 | +|----|----------|-------|:------:|--------------| |
| 50 | +| D3-N4-01 | Inferencia Variacional para Mistura Gaussiana (K=3, ELBO converge) | PRML Bishop Cap.10 | V4,V5,V7 | Parametros verdadeiros conhecidos | |
| 51 | +| D3-N4-02 | Causalidade: do-calculus + backdoor criterion (Pearl) | Pearl 2009 | V4 | DAG com efeito conhecido | |
| 52 | +| D3-N4-03 | Modelo Hierarquico Bayesiano multi-nivel (WAIC, LOO, R-hat) | Gelman BDA3 | V4,V5,V7 | Dados simulados com parametros | |
| 53 | +| D3-N4-04 | Processo Gaussiano com kernel Matern (otimizacao de hiperparametros) | Rasmussen & Williams | V4,V5,V7 | Funcao alvo conhecida | |
| 54 | +| D3-N4-05 | Bootstrap para serie temporal (block bootstrap, stationary bootstrap) | Efron & Tibshirani | V4,V5 | Autocorrelacao conhecida | |
| 55 | + |
| 56 | +### Problemas D3-N3 (Completar 3/5→5/5) |
| 57 | + |
| 58 | +| ID | Problema | Fonte | Tarefa CORA-Eval | |
| 59 | +|----|----------|-------|------------------| |
| 60 | +| D3-N3-05 | Kaplan-Meier + Cox PH (dados de leucemia, n=23) | survival package R | D3-N3-05 | |
| 61 | + |
| 62 | +--- |
| 63 | + |
| 64 | +## D4 — Quimica Computacional (N2→N4, peso 10%) |
| 65 | + |
| 66 | +### Problemas D4-N3 (Pos-Graduacao) |
| 67 | + |
| 68 | +| ID | Problema | Fonte | Cora V | Ground Truth | |
| 69 | +|----|----------|-------|:------:|--------------| |
| 70 | +| D4-N3-01 | Otimizacao geometria H2O com DFT (B3LYP/6-31G*) | Gaussian/ORCA | V5 | Angulo 104.5°, r=0.96A | |
| 71 | +| D4-N3-02 | Espectro UV-Vis benzeno via TD-DFT | TD-DFT benchmarks | V5 | lambda_max ~255 nm | |
| 72 | +| D4-N3-03 | Dinamica molecular NVT de alanina dipeptide (AMBER ff) | MD benchmarks | V5,V7 | Ramachandran plot | |
| 73 | +| D4-N3-04 | Reacao SN2: Cl- + CH3Cl → ClCH3 + Cl- (IRC) | Gaussian/ORCA | V2,V5 | Barreira ~3 kcal/mol | |
| 74 | + |
| 75 | +### Problemas D4-N4 (Pesquisa) |
| 76 | + |
| 77 | +| ID | Problema | Fonte | Cora V | |
| 78 | +|----|----------|-------|:------:| |
| 79 | +| D4-N4-01 | Predicao de estrutura cristalina (CSP blind test) | Cambridge CCDC | V5 | |
| 80 | +| D4-N4-02 | Design de catalisador enantioseletivo (DFT+microkinetics) | Organometallics | V5,V7 | |
| 81 | +| D4-N4-03 | Mecanismo enzimatico QM/MM (ONIOM, cytochrome P450) | Chem. Rev. | V5,V7 | |
| 82 | + |
| 83 | +--- |
| 84 | + |
| 85 | +## D5 — Biologia Molecular (N2→N4, peso 10%) |
| 86 | + |
| 87 | +### Problemas D5-N3 (Pos-Graduacao) — Rosalind |
| 88 | + |
| 89 | +| ID | Problema | Rosalind ID | Cora V | Tarefa CORA-Eval | |
| 90 | +|----|----------|:----------:|:------:|------------------| |
| 91 | +| D5-N3-01 | Montagem de genoma (de Bruijn graph, N50) | LONG, BA3* | V5,V7 | D5-N3-02 | |
| 92 | +| D5-N3-02 | Alinhamento multiplo (ClustalW, perfil HMM) | CLUS, MSA | V4,V5 | — | |
| 93 | +| D5-N3-03 | Predicao de estrutura secundaria RNA (Nussinov, ViennaRNA) | PMCH, RNAS | V5,V7 | — | |
| 94 | +| D5-N3-04 | Arvore filogenetica (Neighbor-Joining, 100+ taxons) | NWCK, NKEW | V5 | D5-N3-03 | |
| 95 | + |
| 96 | +### Problemas D5-N4 (Pesquisa) |
| 97 | + |
| 98 | +| ID | Problema | Cora V | |
| 99 | +|----|----------|:------:| |
| 100 | +| D5-N4-01 | Predicao estrutura 3D proteina (AlphaFold/ESMFold) com RMSD | V5,V7 | |
| 101 | +| D5-N4-02 | Filogenomica: 1000 genomas, max. likelihood, bootstrap 1000 | V4,V5 | |
| 102 | +| D5-N4-03 | Docking molecular proteina-ligante com energia de ligacao | V5,V7 | |
| 103 | + |
| 104 | +--- |
| 105 | + |
| 106 | +## D6 — Geociencias (N2→N4, peso 8%) |
| 107 | + |
| 108 | +### Problemas D6-N3 (Pos-Graduacao) |
| 109 | + |
| 110 | +| ID | Problema | Fonte | Cora V | |
| 111 | +|----|----------|-------|:------:| |
| 112 | +| D6-N3-01 | Modelo climatico EBM 1D com feedback de albedo | North 1975 | V5,V6 | |
| 113 | +| D6-N3-02 | Reconstrucao paleoclimatica delta-O18 de testemunho Vostok | NOAA NCEI | V4 | |
| 114 | +| D6-N3-03 | Dispersao gaussiana de poluentes (modelo de pluma) | Turner 1994 | V5,V6 | |
| 115 | + |
| 116 | +### D6-N4 |
| 117 | + |
| 118 | +| ID | Problema | Fonte | Cora V | |
| 119 | +|----|----------|-------|:------:| |
| 120 | +| D6-N4-01 | Ensemble CMIP6: projecao 2100 com IC, atribuicao de forcantes | IPCC AR6 | V4,V5 | |
| 121 | +| D6-N4-02 | Ciclo carbono acoplado oceano-atmosfera com feedback | GEOS-Chem | V6,V7 | |
| 122 | +| D6-N4-03 | Full Waveform Inversion (FWI) sismica 2D | SEG benchmarks | V5,V7 | |
| 123 | + |
| 124 | +--- |
| 125 | + |
| 126 | +## D7 — Codigo Cientifico (N3→N4, peso 10%) |
| 127 | + |
| 128 | +### Problemas D7-N4 |
| 129 | + |
| 130 | +| ID | Problema | Cora V | Ground Truth | |
| 131 | +|----|----------|:------:|--------------| |
| 132 | +| D7-N4-01 | Biblioteca algebra linear (1000+ LOC) com triplas Hoare | V7b | numpy.linalg | |
| 133 | +| D7-N4-02 | Codigo HPC MPI/OpenMP: race conditions, deadlocks | V7e,V7g | Valgrind/Helgrind | |
| 134 | +| D7-N4-03 | Gradient Boosting: monotonicidade da loss, convergencia | V7g | XGBoost | |
| 135 | +| D7-N4-04 | 100% branch coverage + boundary value analysis | V7f | gcov/lcov | |
| 136 | + |
| 137 | +--- |
| 138 | + |
| 139 | +## D9 — Metodologia Experimental (N3→N4, peso 8%) |
| 140 | + |
| 141 | +### Problemas D9-N4 |
| 142 | + |
| 143 | +| ID | Problema | Cora V | |
| 144 | +|----|----------|:------:| |
| 145 | +| D9-N4-01 | Bayesian Optimization para hiperparametros (GP-UCB) | V4,V7 | |
| 146 | +| D9-N4-02 | Analise de sensibilidade global Sobol (N=20 parametros) | V5 | |
| 147 | +| D9-N4-03 | Validacao Bland-Altman com padrao-ouro (bias < 5%) | V4 | |
| 148 | + |
| 149 | +--- |
| 150 | + |
| 151 | +## Plano de Execucao para M4 (3.00) |
| 152 | + |
| 153 | +| Dimensao | Acao | Nivel Alvo | Tarefas | Score | Ganho | |
| 154 | +|----------|------|:----------:|:--------:|:-----:|:-----:| |
| 155 | +| D2 | TDD Poincare + N-corpos | N3→N4 | 2/4 N4 | 3.50 | +0.10 | |
| 156 | +| D3 | TDD inferencia variacional + causalidade | N3→N4 | 2/5 N4 | 3.40 | +0.14 | |
| 157 | +| D4 | TDD DFT + MD (dados reais) | N2→N3 | 3/4 N3 | 2.67 | +0.08 | |
| 158 | +| D5 | TDD alinhamento + filogenia Rosalind | N2→N3 | 3/4 N3 | 2.67 | +0.08 | |
| 159 | +| D6 | TDD EBM climatico | N2→N3 | 2/3 N3 | 2.60 | +0.06 | |
| 160 | +| D7 | TDD Hoare + HPC | N3→N4 | 2/5 N4 | 3.40 | +0.07 | |
| 161 | +| D9 | TDD Sobol + Bland-Altman | N3→N4 | 2/4 N4 | 3.50 | +0.07 | |
| 162 | +| | | | | **Total** | **+0.60** | |
| 163 | + |
| 164 | +**CORA-Score projetado:** 2.62 + 0.60 = **3.22 (M4 Pesquisa)** ✅ |
| 165 | + |
| 166 | +--- |
| 167 | + |
| 168 | +## Plano para M5 (4.00) |
| 169 | + |
| 170 | +| Dimensao | Acao | Alvo | Ganho | |
| 171 | +|----------|------|:----:|:-----:| |
| 172 | +| D2 | Completar 5/5 N4 | 4.00 | +0.06 | |
| 173 | +| D3 | Completar 5/5 N4 | 4.00 | +0.07 | |
| 174 | +| D4 | CSP + QM/MM (N4) | 4.00 | +0.13 | |
| 175 | +| D5 | AlphaFold + filogenomica (N4) | 4.00 | +0.13 | |
| 176 | +| D6 | CMIP6 + FWI (N4) | 4.00 | +0.10 | |
| 177 | +| D7 | Completar 5/5 N4 | 4.00 | +0.05 | |
| 178 | +| D8 | Meta-analise em rede PRISMA (N3→N4) | 3.33 | +0.11 | |
| 179 | +| D9 | Completar 4/4 N4 | 4.00 | +0.05 | |
| 180 | +| D10 | Gemeo digital sistema complexo (N4 completo) | 4.00 | +0.02 | |
| 181 | +| | | **Total** | **+0.78** | |
| 182 | + |
| 183 | +--- |
| 184 | + |
| 185 | +## Referencias |
| 186 | + |
| 187 | +- Project Euler: https://projecteuler.net/archives (988 problemas) |
| 188 | +- Rosalind: https://rosalind.info/problems/list-view/ (284 problemas) |
| 189 | +- GAT: Farinelli, arXiv:0910.1671v10 (2021) |
| 190 | +- DCA Listas: 3 listas de pos-graduacao (18 questoes) |
| 191 | +- arXiv comp-ph: arxiv.org/list/physics.comp-ph/recent (69 recentes) |
| 192 | +- WF-Bench: arXiv:2605.29683 (neural network wavefunction benchmark) |
| 193 | +- Tunneling phase diagram: arXiv:2605.30165 (machine learning kinetic isotope effects) |
0 commit comments