Merge pull request #96 from asogaard/training-on-upgrade-mc

asogaard · web-flow · commit 5e217a40eec8 · 2021-12-11T10:47:41.000+01:00
Training on upgrade MC
diff --git a/examples/test_model_training_upgrade.py b/examples/test_model_training_upgrade.py
@@ -0,0 +1,128 @@
+import logging
+import numpy as np
+import pandas as pd
+from timer import timer
+
+from pytorch_lightning import Trainer
+from pytorch_lightning.callbacks import EarlyStopping
+import torch
+from torch.optim.adam import Adam
+from torch.utils.data import dataloader
+
+from gnn_reco.components.loss_functions import  LogCoshLoss, VonMisesFisher2DLoss
+from gnn_reco.components.utils import fit_scaler
+from gnn_reco.data.constants import FEATURES, TRUTH
+from gnn_reco.data.utils import get_desired_event_numbers
+from gnn_reco.models import Model
+from gnn_reco.models.detector.icecube import IceCubeUpgrade
+from gnn_reco.models.gnn import DynEdge, ConvNet
+from gnn_reco.models.graph_builders import KNNGraphBuilder
+from gnn_reco.models.task.reconstruction import EnergyReconstruction
+from gnn_reco.models.training.callbacks import ProgressBar, PiecewiseLinearLR
+from gnn_reco.models.training.utils import get_predictions, make_train_validation_dataloader, save_results
+
+# Configurations
+timer.set_level(logging.INFO)
+logging.basicConfig(level=logging.INFO)
+torch.multiprocessing.set_sharing_strategy('file_system')
+
+# Constants
+features = FEATURES.UPGRADE
+truth = TRUTH.UPGRADE
+
+# Main function definition
+def main():
+
+    print(f"features: {features}")
+    print(f"truth: {truth}")
+
+    # Configuraiton
+    db = '/groups/icecube/asogaard/temp/sqlite_test_upgrade/data_test/data/data_test.db'
+    pulsemap = 'I3RecoPulseSeriesMapRFCleaned_mDOM'
+    batch_size = 128
+    num_workers = 10
+    gpus = [0]
+    target = 'energy'
+    n_epochs = 30
+    patience = 5
+    archive = '/groups/icecube/asogaard/gnn/results'
+
+    # Common variables
+    train_selection = get_desired_event_numbers(db, 1000000, fraction_nu_e=1.)
+
+    training_dataloader, validation_dataloader = make_train_validation_dataloader(
+        db,
+        train_selection,
+        pulsemap,
+        features,
+        truth,
+        batch_size=batch_size,
+        num_workers=num_workers,
+    )
+
+    # Building model
+    detector = IceCubeUpgrade(
+        graph_builder=KNNGraphBuilder(nb_nearest_neighbours=8),
+    )
+    gnn = DynEdge(
+        nb_inputs=detector.nb_outputs,
+    )
+    task = EnergyReconstruction(
+        hidden_size=gnn.nb_outputs,
+        target_label=target,
+        loss_function=LogCoshLoss(
+            transform_prediction_and_target=torch.log10,
+        ),
+    )
+    model = Model(
+        detector=detector,
+        gnn=gnn,
+        tasks=[task],
+        optimizer_class=Adam,
+        optimizer_kwargs={'lr': 1e-03, 'eps': 1e-03},
+        scheduler_class=PiecewiseLinearLR,
+        scheduler_kwargs={
+            'milestones': [0, len(training_dataloader) / 2, len(training_dataloader) * n_epochs],
+            'factors': [1e-2, 1, 1e-02],
+        },
+        scheduler_config={
+            'interval': 'step',
+        },
+     )
+
+    # Training model
+    callbacks = [
+        EarlyStopping(
+            monitor='val_loss',
+            patience=patience,
+        ),
+        ProgressBar(),
+    ]
+
+    trainer = Trainer(
+        gpus=gpus,
+        max_epochs=n_epochs,
+        callbacks=callbacks,
+        log_every_n_steps=1,
+    )
+
+    try:
+        trainer.fit(model, training_dataloader, validation_dataloader)
+    except KeyboardInterrupt:
+        print("[ctrl+c] Exiting gracefully.")
+        pass
+
+    # Saving predictions to file
+    results = get_predictions(
+        trainer,
+        model,
+        validation_dataloader,
+        [target + '_pred'],
+        [target, 'event_no'],
+    )
+
+    save_results(db, 'test_upgrade_mDOM_energy', results, archive, model)
+
+# Main function call
+if __name__ == "__main__":
+    main()
diff --git a/misc/badges/pylint.svg b/misc/badges/pylint.svg
@@ -17,7 +17,7 @@
         <text x="22.0" y="14">pylint</text>
     </g>
     <g fill="#fff" text-anchor="middle" font-family="DejaVu Sans,Verdana,Geneva,sans-serif" font-size="11">
-        <text x="63.0" y="15" fill="#010101" fill-opacity=".3">7.78</text>
-        <text x="62.0" y="14">7.78</text>
+        <text x="63.0" y="15" fill="#010101" fill-opacity=".3">7.19</text>
+        <text x="62.0" y="14">7.19</text>
     </g>
 </svg>
diff --git a/src/gnn_reco/data/utils.py b/src/gnn_reco/data/utils.py
@@ -23,7 +23,7 @@ def get_desired_event_numbers(db_path, desired_size, fraction_noise=0, fraction_
         tot_event_nos = pd.read_sql(total_query,con)
         if len(tot_event_nos) < desired_size:
             desired_size = len(tot_event_nos)
-            numbers_desired = [x * desired_size for x in fracs]
+            numbers_desired = [int(x * desired_size) for x in fracs]
             print('Only {} events in database, using this number instead.'.format(len(tot_event_nos)))
 
         list_of_dataframes = []
@@ -43,9 +43,9 @@ def get_desired_event_numbers(db_path, desired_size, fraction_noise=0, fraction_
                     numbers_desired = [int(new_x * (len(tmp_dataframe)/number)) for new_x in numbers_desired]
                     restart_trigger = True
                     list_of_dataframes = []
-                    break                    
+                    break
 
-                list_of_dataframes.append(dataframe)   
+                list_of_dataframes.append(dataframe)
         retrieved_event_nos_pd = pd.concat(list_of_dataframes)
         event_no_list = retrieved_event_nos_pd.sample(frac=1, replace=False, random_state=rng).values.ravel().tolist()
 
diff --git a/src/gnn_reco/models/detector/icecube.py b/src/gnn_reco/models/detector/icecube.py
@@ -30,7 +30,7 @@ def _forward(self, data: Data) -> Data:
         """
 
         # Check(s)
-        assert self.nb_inputs == 7
+        #assert self.nb_inputs == 7
 
         # Preprocessing
         data.x[:,0] /= 100.  # dom_x
@@ -50,3 +50,65 @@ def _forward(self, data: Data) -> Data:
 
 class IceCubeDeepCore(IceCube86):
     """`Detector` class for IceCube-DeepCore."""
+
+
+class IceCubeUpgrade(IceCubeDeepCore):
+    """`Detector` class for IceCube-Upgrade."""
+
+    # Implementing abstract class attribute
+    features = FEATURES.UPGRADE
+
+    def _forward(self, data: Data) -> Data:
+        """Ingests data, builds graph (connectivity/adjacency), and preprocesses features.
+
+        Assuming the following features, in this order (see self._features):
+            dom_x
+            dom_y
+            dom_z
+            dom_times
+            charge
+            rde
+            pmt_area
+            string
+            pmt_number
+            dom_number
+            pmt_dir_x
+            pmt_dir_y
+            pmt_dir_z
+            dom_type
+
+        Args:
+            data (Data): Input graph data.
+
+        Returns:
+            Data: Connected and preprocessed graph data.
+        """
+
+        # Check(s)
+        #assert self.nb_inputs == 14
+
+        # Run IceCube/DeepCore preprocessing on first 7 features
+        #data = super()._forward(data)
+
+        # Preprocessing
+        data.x[:,0] /= 100.  # dom_x
+        data.x[:,1] /= 100.  # dom_y
+        data.x[:,2] += 350.  # dom_z
+        data.x[:,2] /= 100.
+        data.x[:,3] /= 1.05e+04  # dom_time
+        data.x[:,3] -= 1.
+        data.x[:,3] *= 20.
+        data.x[:,4] /= 1.  # charge
+        #data.x[:,5] -= 1.25  # rde
+        #data.x[:,5] /= 0.25
+        data.x[:,6] /= 0.05  # pmt_area
+        data.x[:,7] -= 90  # string
+        data.x[:,8] /= 20.  # pmt_number
+        data.x[:,9] -= 60.  # dom_number
+        data.x[:,9] /= 60.
+        #data.x[:,10] /= 1. # pmt_dir_x
+        #data.x[:,11] /= 1.  # pmt_dir_y
+        #data.x[:,12] /= 1.  # pmt_dir_z
+        data.x[:,13] /= 130.  # dom_type
+
+        return data
diff --git a/src/gnn_reco/models/training/utils.py b/src/gnn_reco/models/training/utils.py
@@ -34,12 +34,17 @@ def make_dataloader(
         selection=selection,
     )
 
+    def collate_fn(graphs):
+        # Remove graphs with less than two DOM hits. Should not occur in "production."
+        graphs = [g for g in graphs if g.n_pulses > 1]
+        return Batch.from_data_list(graphs)
+
     dataloader = DataLoader(
         dataset,
         batch_size=batch_size,
         shuffle=shuffle,
         num_workers=num_workers,
-        collate_fn=Batch.from_data_list,
+        collate_fn=collate_fn,
         persistent_workers=persistent_workers,
         prefetch_factor=2,
     )