numpyGPT/test.py at main · codiceSpaghetti/numpyGPT · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
#! /usr/bin/env python3

import os
import sys
import unittest

import numpy as np


def run_tests() -> bool:
    project_root = os.path.dirname(os.path.abspath(__file__))
    sys.path.insert(0, project_root)

    loader = unittest.TestLoader()
    start_dir = os.path.join(project_root, "tests")
    suite = loader.discover(start_dir, pattern="test_*.py")

    runner = unittest.TextTestRunner(verbosity=2)
    result = runner.run(suite)

    return result.wasSuccessful()


def demo_adam_optimizer() -> None:
    from numpyGPT.nn.modules import Linear
    from numpyGPT.optim import Adam

    print("=== Adam Optimizer Demo ===")
    np.random.seed(42)

    layer = Linear(2, 1)
    optimizer = Adam([layer], lr=0.01)

    X = np.array([[1.0, 2.0], [3.0, 4.0], [5.0, 6.0]])
    y_true = np.array([[3.0], [7.0], [11.0]])

    print(f"Initial weights: W={layer.W.flatten()}, b={layer.b}")

    for epoch in range(100):
        y_pred = layer.forward(X)
        loss = np.mean((y_pred - y_true) ** 2)

        if epoch % 25 == 0:
            print(f"Epoch {epoch}: Loss = {loss:.6f}")

        dY = 2 * (y_pred - y_true) / len(X)
        layer.backward(dY)

        optimizer.step()
        optimizer.zero_grad()

    print(f"Final weights: W={layer.W.flatten()}, b={layer.b}")
    print(f"Final loss: {loss:.6f}")
    print("Expected: W≈[1, 1], b≈[1] for linear relation y = x1 + x2 + 1")


def demo_lr_schedulers() -> None:
    from numpyGPT.nn.modules import Linear
    from numpyGPT.optim import Adam
    from numpyGPT.optim.lr_scheduler import WarmupCosineLR

    print("=== Learning Rate Scheduler Demo ===")
    np.random.seed(42)

    print("--- WarmupCosineLR Demo ---")
    layer = Linear(2, 1)
    optimizer = Adam([layer], lr=0.1)
    scheduler = WarmupCosineLR(optimizer, warmup_iters=3, lr_decay_iters=10, min_lr=0.01)

    print("WarmupCosineLR: lr=0.1, warmup_iters=3, lr_decay_iters=10, min_lr=0.01")
    for epoch in range(15):
        if epoch == 3:
            print("  ^ End of warmup phase")
        elif epoch == 10:
            print("  ^ Start of min_lr phase")
        print(f"Epoch {epoch}: lr = {optimizer.lr:.4f}")
        scheduler.step()


if __name__ == "__main__":
    demo_adam_optimizer()
    print("\n" + "=" * 50 + "\n")

    demo_lr_schedulers()
    print("\n" + "=" * 50 + "\n")

    success = run_tests()
    sys.exit(0 if success else 1)