Recording loss and accuracy throughout the training. Fixing metrics printing.

gabikadlecova · gabikadlecova · commit 65bb60a6e17b · 2022-07-14T09:46:35.000+02:00
diff --git a/main.py b/main.py
@@ -91,7 +91,9 @@ def reload_checkpoint(path, device=None):
     result = train(net, train_loader, loss=criterion, optimizer=optimizer, scheduler=scheduler, grad_clip=args.grad_clip,
                    num_epochs=args.epochs, num_validation=args.validation_size, validation_loader=valid_loader,
                    device=args.device, print_frequency=args.print_freq)
-    print(f"Final train metrics: {result}")
+
+    last_epoch = {k: v[-1] for k, v in result.items() if len(v) > 0}
+    print(f"Final train metrics: {last_epoch}")
 
     result = test(net, test_loader, loss=criterion, num_tests=test_size, device=args.device)
     print(f"\nFinal test metrics: {result}")
diff --git a/nasbench_pytorch/trainer.py b/nasbench_pytorch/trainer.py
@@ -51,7 +51,7 @@ def train(net, train_loader, loss=None, optimizer=None, scheduler=None, grad_cli
 
     n_batches = len(train_loader)
     last_loss, acc, val_loss, val_acc = [torch.tensor(0.0) for _ in range(4)]
-    metric_dict = {}
+    metric_dict = {'train_loss': [], 'train_accuracy': [], 'val_loss': [], 'val_accuracy': []}
     for epoch in range(num_epochs):
         # checkpoint using a user defined function
         if checkpoint_every_k is not None and (epoch + 1) % checkpoint_every_k == 0:
@@ -91,12 +91,15 @@ def train(net, train_loader, loss=None, optimizer=None, scheduler=None, grad_cli
         last_loss = train_loss / (batch_idx + 1)
         acc = correct / total
 
+        # save metrics
+        metric_dict['train_loss'].append(last_loss.item())
+        metric_dict['train_accuracy'].append(acc.item())
+
         if validation_loader is not None:
-            val_loss, val_acc = test(net, validation_loader, loss, num_tests=num_validation, device=device)
+            test_metrics = test(net, validation_loader, loss, num_tests=num_validation, device=device)
+            metric_dict['val_loss'].append(test_metrics['test_loss'])
+            metric_dict['val_accuracy'].append(test_metrics['test_accuracy'])
 
-        # save metrics
-        metric_dict = {'train_loss': last_loss.item(), 'train_accuracy': acc.item(),
-                       'val_loss': val_loss.item(), 'val_accuracy': val_acc.item()}
         print('--------------------')
         scheduler.step()