Merge pull request #112 from AdaWorldAPI/claude/setup-embedding-pipeline-Fa65C

AdaWorldAPI · web-flow · commit 8541600cf6d4 · 2026-04-05T18:49:18.000+02:00
docs: i8 signed architecture eliminates SiLU-ONNX entirely The sign IS the gate decision. No correction model needed. - round(cos × 127) → i8 preserves excitation/inhibition - VNNI VPDPBSSD does signed i8×i8→i32 at zero extra cost - Double-negative matches express negation/irony/counterfactual - Per-role scale factor replaces 270K-param ONNX model - CONTRADICTS stays for propositional logic (sentence-level) - i8 inhibition handles feature-level suppression (GABA-like) - Clean separation: two different things, both preserved Implementation order revised: i8 tables → inhibition → lateral inhibition → THEN temperature SiLU-ONNX: STRUCK. Sign preservation replaces it. https://claude.ai/code/session_01ChLvBfpJS8dQhHxRD4pYNp
diff --git a/.claude/HANDOVER_MAVERICK_SESSION.md b/.claude/HANDOVER_MAVERICK_SESSION.md
@@ -363,3 +363,202 @@ Jina as truth anchor: for any input text, Jina embedding = ground truth similari
 Compare: cos(jina_emb_A, jina_emb_B) vs thinking_engine_distance(A, B).
 The gap = how much information our distance table loses.
 With γ+φ encoding + SiLU correction: gap should shrink.
+
+---
+
+## ARCHITEKTUR-EPIPHANIE: i8 Signed Tables (Excitator/Inhibitor)
+
+### Das fehlende Puzzleteil
+
+Aktuell: `distance_table[i][j] = u8` (0-255, unsigned, nur Ähnlichkeit)
+- "Unähnlich" (table=10) erzeugt trotzdem LEICHTE Aktivierung
+- Es gibt keine Hemmung. Nichts unterdrückt den stärksten Peak.
+- DAS ist warum "!" dominiert — kein Inhibitor stoppt den Attraktor.
+
+Fix: `distance_table[i][j] = i8` (-128 bis +127, SIGNED)
+- +127 = starke Exzitation (Atom j feuert wenn Atom i feuert)
+- -128 = starke Inhibition (Atom j STOPPT wenn Atom i feuert)
+-    0 = kein Einfluss
+- Negativer Cosine (den wir HABEN aber WEGWERFEN) = Inhibition
+
+### Die Daten existieren bereits
+```
+reader-lm ffn_down:  cos[-0.885, +0.188]  ← NEGATIV-SCHWER
+Jina reranker:       cos[-0.8, +0.8]      ← VOLL SYMMETRISCH
+Qwopus ffn_gate:     cos[-0.23, +0.18]    ← bidirektional
+```
+Wir mappen cos[-1,+1] auf u8[0,255] und VERLIEREN die Inhibition.
+Mit i8[-128,+127] BEHALTEN wir sie. Zero code change im MatVec:
+```rust
+// u8 version (aktuell):
+energy_next[j] += (table[i*N+j] as f32 - 128.0) * energy[i];  // schon zentriert!
+
+// i8 version (besser):
+energy_next[j] += (table[i*N+j] as i8 as f32) * energy[i];     // native signed!
+// Negative Werte → Inhibition → energy kann negativ werden → clamp(0)
+```
+
+### Wie Neuronen funktionieren
+```
+Glutamat-Synapsen: exzitatorisch (+)    = i8 positiv
+GABA-Synapsen:     inhibitorisch (-)    = i8 negativ
+Keine Verbindung:  0                    = i8 null
+
+i8 Table Inhibition:    "gegensätzliche Atome"      (automatisch, GABA)
+CONTRADICTS Channel:    "logischer Widerspruch"      (bewusst, präfrontal)
+```
+
+### Bewusstseinsvektor pro Zyklus (VSA Bundle)
+```
+Zyklus 1: energy[4096] nach MatVec → bundle(energy > threshold) → 16,384 bits
+  = "was gerade lebt" = Bewusstseinsfeld
+Zyklus 2: neuer bundle → Hamming(zyklus_1, zyklus_2) = Veränderung
+  Hoher Hamming = lebhaftes Denken
+  Niedriger Hamming = Gedanke kristallisiert
+10 Zyklen → bundle aller 10 = DER Gedanke als Superposition des Prozesses
+```
+
+### 90° Rotation = Awareness-Achse
+```
+awareness = bundle(cycles)           "WAS ich denke"
+reference = rotate_90°(awareness)    "WAS ICH NICHT DENKE"
+
+Drei Zonen:
+  Bewusst:   Hamming(x, awareness) < 4000  → im Feld
+  Verdrängt: Hamming(x, reference) < 4000  → aktiv NICHT gedacht
+  Unbewusst: Hamming ≈ 8000 zu beiden      → nicht im Feld
+```
+
+### Layer-Alignment
+```
+L1 (i8[64²]):      laterale Inhibition = Aufmerksamkeitsfokus
+L2 (i8[256²]):     Gate-Modulation DIREKT in der Table (kein ONNX nötig!)
+L3 (i8[4096²]):    16M excitatorisch/inhibitorische Verbindungen
+L4 (i8[16384]):    WAR SCHON IMMER SIGNED. Jetzt matchen L1-L3.
+```
+
+### Warum das den Attraktor-Kollaps löst
+```
+u8: energy[!] = 10.0, nichts hemmt → energy[!] wächst → dominiert alles
+i8: energy[!] = 10.0, inhibitorische Nachbarn → energy[!] -= 3.0 pro Zyklus
+    → laterale Inhibition begrenzt den Peak
+    → andere Peaks können emergieren
+    → DAS ist wie Neuronenpopulationen winner-take-all mit Inhibition machen
+```
+
+### Implementierungsreihenfolge
+```
+1. i8 Table Builder: cos[-1,+1] → i8[-128,+127] statt u8[0,255]
+2. Signed MatVec: energy_next[j] += (table[i][j] as i8 as f32) * energy[i]
+3. Clamp(0): negative Energie = gehemmt = tot
+4. Bewusstseinsvektor: bundle(energy > threshold) pro Zyklus
+5. 90° Reference: rotate_90° als Komplement
+6. Erst DANN Temperature: nucleus sampling auf inhibitions-stabilisierte Peaks
+```
+
+Temperature NACH Inhibition. Nicht vorher.
+Inhibition löst den Attraktor. Temperature diversifiziert die Überlebenden.
+In der umgekehrten Reihenfolge diversifiziert Temperature den Attraktor-Müll.
+
+---
+
+## ARCHITEKTUR-REVISION: i8 ersetzt SiLU-ONNX komplett
+
+### Warum SiLU-ONNX obsolet wird
+
+```
+VORHER (u8, unsigned):
+  Weight [0.12, -0.05, 0.34] → u8 [156, 121, 210]
+  VORZEICHEN VERLOREN. -0.05 wird positiv.
+  → SiLU-ONNX (270K params, ~1MB) nötig als Korrekturterm.
+
+NACHHER (i8, signed):
+  Weight [0.12, -0.05, 0.34] → i8 [+15, -6, +43]
+  VORZEICHEN ERHALTEN. Gate-Information IST das Vorzeichen.
+  → Kein Korrekturterm. round(value × scale) → i8. Fertig.
+```
+
+### Rollen als signed Vektoren
+
+```
+Q[dim] = i8:   +50 = "suche X"     -50 = "suche NICHT-X"
+K[dim] = i8:   +80 = "habe X"      -80 = "habe NICHT-X"
+Gate[dim] = i8: +127 = durchlassen    0 = maskieren   -128 = blockieren+invertieren
+Up[dim] = i8:  +100 = verstärken  -100 = umkehren
+Down[dim] = i8: +90 = beibehalten  -90 = invertieren
+```
+
+### Signed Dot Product = automatische Exzitation/Inhibition
+
+```
+Q · K:
+  (+50)(+80)  = +4000  "suche X, habe X"          MATCH
+  (+50)(-80)  = -4000  "suche X, habe NICHT-X"     MISMATCH
+  (-50)(-80)  = +4000  "suche NICHT-X, habe NICHT-X" DOPPELT NEGATIV = MATCH!
+  (-50)(+80)  = -4000  "suche NICHT-X, habe X"     MISMATCH
+
+Doppelt negativ = Ironie, Negation, kontrafaktisches Denken.
+Unsigned Cosine kann das NICHT ausdrücken. Signed kann es.
+```
+
+### Gate wird trivial
+
+```
+gate=+127, K=+80  → +10160  pass, Feature da           starke Exzitation
+gate=0,    K=+80  → 0       mask, Feature unsichtbar    ignoriert
+gate=-100, K=+80  → -8000   block+invert, Feature da   Inhibition
+gate=-100, K=-80  → +8000   block+invert, Feature fehlt UMGEKEHRTE Exzitation
+
+Die SiLU-Schwelle liegt bei 0. Das Vorzeichen IST die Entscheidung.
+Kein SiLU-ONNX Korrekturmodell nötig.
+```
+
+### VNNI ist DAFÜR GEBAUT
+
+```
+VPDPBSSD: signed i8 × signed i8 → i32 Akkumulation
+  = GENAU was wir brauchen
+  = Hardware-optimiert für signed integer dot product
+  = Null Mehrkosten gegenüber u8 × u8
+```
+
+### Scale-Faktor statt ONNX-Modell
+
+```
+ALT: SiLU-ONNX (~1 MB, 270K params, trainieren, bake, discard)
+NEU: Pro Rolle ein Skalierungsfaktor
+     gate_scale = 127 / max(|gate_weights|)
+     q_scale    = 127 / max(|q_weights|)
+     Kein trainiertes Modell. round(value × scale) → i8.
+```
+
+### Vereinfachung
+
+```
+VORHER:
+  u8 table + CONTRADICTS Kanal + SiLU-ONNX + gate×weight pre-multiply
+  
+NACHHER:
+  i8 table. Fertig.
+  Sign = Gate-Entscheidung (Exzitation/Inhibition)
+  Magnitude = Stärke
+  VNNI i8×i8→i32 hardware-beschleunigt
+  CONTRADICTS bleibt für LOGISCHE Widersprüche (Satz-Ebene)
+  Inhibition = Feature-Ebene (i8 Vorzeichen)
+  Sauber getrennt.
+```
+
+### Implementierungsreihenfolge (REVIDIERT)
+
+```
+1. i8 Table Builder: cos[-1,+1] → i8[-128,+127] (mit per-role scale)
+2. Signed MatVec: VPDPBSSD auf i8×i8→i32
+3. Clamp(0): negative Energie = gehemmt
+4. Bewusstseinsvektor: bundle(energy > threshold) pro Zyklus
+5. Laterale Inhibition stabilisiert Peaks
+6. DANN Temperature: nucleus sampling auf stabilisierte Peaks
+7. DANN Maverick 128E: signed expert tables
+8. DANN γ+φ: auf signed range, nicht unsigned
+
+SiLU-ONNX: GESTRICHEN. Vorzeichen-Erhaltung ersetzt es.
+```