Contexto del proyecto para Claude

Simulador educativo de GPU en Python. El usuario es nuevo en arquitectura GPU y esta aprendiendo los conceptos implementandolos desde cero. No implementar codigo por el — solo orientar, explicar y evaluar con /evaluar.

Estado de las tareas

Fase 1 — ISA

isa/opcodes.py — enum de opcodes (ADD, SUB, MUL, DIV, LOAD, STORE, JMP, BEQ, BNE, MOV, NOP, RET, GETID)
isa/instruction.py — clase Instruction con opcode, dest, src1, src2, label

Fase 2 — Hardware

gpu/thread.py — Thread: registers (dict), pc, state, active
gpu/warp.py — Warp: 32 threads, active_mask, SIMT, divergencia
gpu/memory.py — GlobalMemory + SharedMemory
gpu/core.py — execute(instruction, thread, memory) con todos los opcodes
gpu/scheduler.py — WarpScheduler: round_robin y greedy, latency hiding
gpu/sm.py — SM: assign_block(), step()
gpu/gpu.py — GPU: launch_kernel(), run()

Fase 3 — Assembler y kernels

isa/assembler.py — parser texto → list[Instruction], resolver labels
kernels/vector_add.asm — kernel de suma de vectores en ISA propio

Fase 4 — Integracion

sim/runner.py — load_data(), run_kernel(), print_stats()
main.py — demo y validacion end-to-end

Fase 5 — Shared Memory + Sincronizacion

isa/opcodes.py — agregar LOADS, STORES, SYNC
isa/instruction.py — soporte para nuevos opcodes si es necesario
gpu/core.py — ejecutar LOADS, STORES (accede a shared_memory), SYNC
gpu/warp.py — agregar estado SYNCING
gpu/scheduler.py — no ejecutar warps en SYNCING hasta que todos los warps del bloque lleguen al SYNC
gpu/sm.py — pasar shared_memory a core.execute(), detectar barrera por bloque
kernels/dot_product.asm — producto punto: parciales en shared, SYNC, reduccion por Thread 0

Como actualizar este archivo

Cuando el usuario complete una tarea, cambiar [ ] por [x]. Ejemplo:

- [x] `isa/opcodes.py` — completado

Perfil del usuario

Nuevo en arquitectura GPU (no conoce warps, SMs, SIMT de antes)
Quiere aprender haciendo, no que le den el codigo
Nivel educativo / conceptual — sin cycle-accuracy
Quiere ejecutar kernels simples y definir su propio ISA

Skill disponible

/evaluar — evalua lo implementado como un profesor: puntos positivos, problemas y pistas. No da soluciones directas.

Orden de dependencias

opcodes → instruction → thread → warp → memory → core → scheduler → sm → gpu → assembler → vector_add.asm → runner → main

Cada componente depende de los anteriores. Si algo no funciona, revisar la cadena hacia atras.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Contexto del proyecto para Claude

Estado de las tareas

Fase 1 — ISA

Fase 2 — Hardware

Fase 3 — Assembler y kernels

Fase 4 — Integracion

Fase 5 — Shared Memory + Sincronizacion

Como actualizar este archivo

Perfil del usuario

Skill disponible

Orden de dependencias

FilesExpand file tree

CLAUDE.md

Latest commit

History

CLAUDE.md

File metadata and controls

Contexto del proyecto para Claude

Estado de las tareas

Fase 1 — ISA

Fase 2 — Hardware

Fase 3 — Assembler y kernels

Fase 4 — Integracion

Fase 5 — Shared Memory + Sincronizacion

Como actualizar este archivo

Perfil del usuario

Skill disponible

Orden de dependencias