AdityaLab
diff --git a/‎leaderboard.py‎
Lines changed: 129 additions & 128 deletions b/‎leaderboard.py‎
Lines changed: 129 additions & 128 deletions
@@ -75,136 +75,137 @@ def calc_pred_and_context_len(freq):
 
 
 if __name__ == "__main__":
-    model_name = MODEL_NAMES[1]
-
-    # create csv file for leaderboard if not already created
-    csv_path = f"leaderboard/{model_name}.csv"
-    if not os.path.exists(csv_path):
-        print(f"Creating leaderboard csv file: {csv_path}")
-        df = pd.DataFrame(columns=["dataset", "size_in_MB", "eval_time", "mse", "mae", "mase", "mape", "rmse", "nrmse", "smape", "msis", "nd", "mwsq", "crps"])
-        df.to_csv(csv_path, index=False)
-
-    # Load model config
-    if model_name == "timesfm":
-        arg_path = "config/timesfm.json"
-        args = load_args(arg_path)
-    elif model_name == "moment":
-        arg_path = "config/moment_forecast.json"
-        args = load_args(arg_path)
-    elif model_name == "chronos":
-        arg_path = "config/chronos.json"
-        args = load_args(arg_path)
-    elif model_name == "ttm":
-        arg_path = "config/tinytimemixer.json"
-        args = load_args(arg_path)
-    elif model_name == "moirai":
-        arg_path = "config/moirai.json"
-        args = load_args(arg_path)
-
-    for fname, freq, fs in filesizes:
-        print(f"Evaluating {fname} ({freq})")
-        # Adjust the context and prediction length based on the frequency
-        # pred_len, context_len = calc_pred_and_context_len(freq)
-        pred_len, context_len = 96, 512
-        if model_name == "timesfm":
-            args["config"]["horizon_len"] = pred_len
-            args["config"]["context_len"] = context_len
-        elif model_name == "moment":
-            args["config"]["forecast_horizon"] = pred_len
-        elif model_name == "ttm":
-            args["config"]["horizon_len"] = pred_len
-            args["config"]["context_len"] = context_len
-        elif model_name == "moirai":
-            args["config"]["horizon_len"] = pred_len
-            args["config"]["context_len"] = context_len
-        
-        # Set the dataset path
-        if len(NAMES.get(fname)) == 1:
-            dataset_path = f"data/gifteval/{fname}/data.csv"
-        else:
-            dataset_path = f"data/gifteval/{fname}/{freq}/data.csv"
-        
-        # Initialize the model and dataset
+    
+    for model_name in MODEL_NAMES[4:]:
+        print(f"Evaluating model: {model_name}")
+        # create csv file for leaderboard if not already created
+        csv_path = f"leaderboard/{model_name}.csv"
+        if not os.path.exists(csv_path):
+            print(f"Creating leaderboard csv file: {csv_path}")
+            df = pd.DataFrame(columns=["dataset", "size_in_MB", "eval_time", "mse", "mae", "mase", "mape", "rmse", "nrmse", "smape", "msis", "nd", "mwsq", "crps"])
+            df.to_csv(csv_path, index=False)
+
+        # Load model config
         if model_name == "timesfm":
-            model = TimesfmModel(**args)
-            dataset = TimesfmDataset(datetime_col='timestamp', path=dataset_path, mode='test', context_len=args["config"]["context_len"], horizon_len=args["config"]["horizon_len"], boundaries=(-1, -1, -1), batchsize=64)
-            start = time.time()
-            metrics = model.evaluate(dataset)
-            end = time.time()
-            print(f"Size of dataset: {fs:.2f} MB")
-            print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
-
+            arg_path = "config/timesfm.json"
+            args = load_args(arg_path)
         elif model_name == "moment":
-            model = MomentModel(**args)
-            args["config"]["task_name"] = "forecasting"
-            train_dataset = MomentDataset(datetime_col='timestamp', path=dataset_path, mode='train', horizon_len=args["config"]["forecast_horizon"], normalize=False)
-            dataset = MomentDataset(datetime_col='timestamp', path=dataset_path, mode='test', horizon_len=args["config"]["forecast_horizon"], normalize=False)
-            finetuned_model = model.finetune(train_dataset, task_name="forecasting")
-            start = time.time()
-            metrics = model.evaluate(dataset, task_name="forecasting")
-            end = time.time()
-            print(f"Size of dataset: {fs:.2f} MB")
-            print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
-            print(metrics)
-
+            arg_path = "config/moment_forecast.json"
+            args = load_args(arg_path)
         elif model_name == "chronos":
-            model = ChronosModel(**args)
-            dataset_config = load_args("config/chronos_dataset.json")
-            dataset_config["context_length"] = context_len
-            dataset_config["prediction_length"] = pred_len
-            dataset = ChronosDataset(datetime_col='timestamp', path=dataset_path, mode='test', config=dataset_config, batch_size=4)
-            start = time.time()
-            metrics = model.evaluate(dataset, horizon_len=dataset_config["prediction_length"], quantile_levels=[0.1, 0.5, 0.9])
-            end = time.time()
-            print(f"Size of dataset: {fs:.2f} MB")
-            print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
-
-        elif model_name == "chronosbolt":
-            repo = "amazon/chronos-bolt-small"
-            model = ChronosBoltModel(repo=repo)
-            dataset = ChronosBoltDataset(datetime_col='timestamp', path=dataset_path, mode='test', batch_size=8, context_len=context_len, horizon_len=pred_len)
-            start = time.time()
-            metrics = model.evaluate(dataset, horizon_len=pred_len, quantile_levels=[0.1, 0.5, 0.9])
-            end = time.time()
-            print(f"Size of dataset: {fs:.2f} MB")
-            print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
-
+            arg_path = "config/chronos.json"
+            args = load_args(arg_path)
         elif model_name == "ttm":
-            model = TinyTimeMixerModel(**args)
-            dataset = TinyTimeMixerDataset(datetime_col='timestamp', path=dataset_path, mode='test', context_len=context_len, horizon_len=pred_len)
-            start = time.time()
-            metrics = model.evaluate(dataset)
-            end = time.time()
-            print(f"Size of dataset: {fs:.2f} MB")
-            print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
-        
+            arg_path = "config/tinytimemixer.json"
+            args = load_args(arg_path)
         elif model_name == "moirai":
-            model = MoiraiTSModel(**args)
-            dataset = MoiraiDataset(name=fname,datetime_col='timestamp', freq=freq,
-                                    path=dataset_path, mode='test', context_len=context_len, horizon_len=pred_len)
-
-            start = time.time()
-            metrics = model.evaluate(dataset,leaderboard=True)
-            end = time.time()
-            print(f"Size of dataset: {fs:.2f} MB")
-            print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
-        
-        print("Evaluation done!")
-
-        eval_time = end - start
-        unit = "s"
-        if eval_time > 1000: # convert to minutes
-            eval_time = eval_time / 60
-            unit = "m"
-
-
-        df = pd.read_csv(csv_path)
-        if fname in df["dataset"].values:
-            df.loc[df["dataset"] == fname, "size_in_MB"] = round(fs,2)
-            df.loc[df["dataset"] == fname, "eval_time"] = str(round(eval_time,2)) + unit
-            df.loc[df["dataset"] == fname, list(metrics.keys())] = list(metrics.values())
-        else:
-            new_row = pd.DataFrame([{**{"dataset": fname, "size_in_MB":round(fs,2), "eval_time":str(round(eval_time,2)) + unit}, **metrics}])
-            df = pd.concat([df, new_row], ignore_index=True)
-
-        df.to_csv(csv_path, index=False)            
+            arg_path = "config/moirai.json"
+            args = load_args(arg_path)
+
+        for fname, freq, fs in filesizes:
+            print(f"Evaluating {fname} ({freq})")
+            # Adjust the context and prediction length based on the frequency
+            # pred_len, context_len = calc_pred_and_context_len(freq)
+            pred_len, context_len = 96, 512
+            if model_name == "timesfm":
+                args["config"]["horizon_len"] = pred_len
+                args["config"]["context_len"] = context_len
+            elif model_name == "moment":
+                args["config"]["forecast_horizon"] = pred_len
+            elif model_name == "ttm":
+                args["config"]["horizon_len"] = pred_len
+                args["config"]["context_len"] = context_len
+            elif model_name == "moirai":
+                args["config"]["horizon_len"] = pred_len
+                args["config"]["context_len"] = context_len
+            
+            # Set the dataset path
+            if len(NAMES.get(fname)) == 1:
+                dataset_path = f"data/gifteval/{fname}/data.csv"
+            else:
+                dataset_path = f"data/gifteval/{fname}/{freq}/data.csv"
+            
+            # Initialize the model and dataset
+            if model_name == "timesfm":
+                model = TimesfmModel(**args)
+                dataset = TimesfmDataset(datetime_col='timestamp', path=dataset_path, mode='test', context_len=args["config"]["context_len"], horizon_len=args["config"]["horizon_len"], boundaries=(-1, -1, -1), batchsize=64)
+                start = time.time()
+                metrics = model.evaluate(dataset)
+                end = time.time()
+                print(f"Size of dataset: {fs:.2f} MB")
+                print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
+
+            elif model_name == "moment":
+                model = MomentModel(**args)
+                args["config"]["task_name"] = "forecasting"
+                train_dataset = MomentDataset(datetime_col='timestamp', path=dataset_path, mode='train', horizon_len=args["config"]["forecast_horizon"], normalize=False)
+                dataset = MomentDataset(datetime_col='timestamp', path=dataset_path, mode='test', horizon_len=args["config"]["forecast_horizon"], normalize=False)
+                finetuned_model = model.finetune(train_dataset, task_name="forecasting")
+                start = time.time()
+                metrics = model.evaluate(dataset, task_name="forecasting")
+                end = time.time()
+                print(f"Size of dataset: {fs:.2f} MB")
+                print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
+                print(metrics)
+
+            elif model_name == "chronos":
+                model = ChronosModel(**args)
+                dataset_config = load_args("config/chronos_dataset.json")
+                dataset_config["context_length"] = context_len
+                dataset_config["prediction_length"] = pred_len
+                dataset = ChronosDataset(datetime_col='timestamp', path=dataset_path, mode='test', config=dataset_config, batch_size=4)
+                start = time.time()
+                metrics = model.evaluate(dataset, horizon_len=dataset_config["prediction_length"], quantile_levels=[0.1, 0.5, 0.9])
+                end = time.time()
+                print(f"Size of dataset: {fs:.2f} MB")
+                print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
+
+            elif model_name == "chronosbolt":
+                repo = "amazon/chronos-bolt-small"
+                model = ChronosBoltModel(repo=repo)
+                dataset = ChronosBoltDataset(datetime_col='timestamp', path=dataset_path, mode='test', batch_size=8, context_len=context_len, horizon_len=pred_len)
+                start = time.time()
+                metrics = model.evaluate(dataset, horizon_len=pred_len, quantile_levels=[0.1, 0.5, 0.9])
+                end = time.time()
+                print(f"Size of dataset: {fs:.2f} MB")
+                print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
+
+            elif model_name == "ttm":
+                model = TinyTimeMixerModel(**args)
+                dataset = TinyTimeMixerDataset(datetime_col='timestamp', path=dataset_path, mode='test', context_len=context_len, horizon_len=pred_len)
+                start = time.time()
+                metrics = model.evaluate(dataset)
+                end = time.time()
+                print(f"Size of dataset: {fs:.2f} MB")
+                print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
+            
+            elif model_name == "moirai":
+                model = MoiraiTSModel(**args)
+                dataset = MoiraiDataset(name=fname,datetime_col='timestamp', freq=freq,
+                                        path=dataset_path, mode='test', context_len=context_len, horizon_len=pred_len)
+
+                start = time.time()
+                metrics = model.evaluate(dataset,leaderboard=True)
+                end = time.time()
+                print(f"Size of dataset: {fs:.2f} MB")
+                print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
+            
+            print("Evaluation done!")
+
+            eval_time = end - start
+            unit = "s"
+            if eval_time > 1000: # convert to minutes
+                eval_time = eval_time / 60
+                unit = "m"
+
+
+            df = pd.read_csv(csv_path)
+            if fname in df["dataset"].values:
+                df.loc[df["dataset"] == fname, "size_in_MB"] = round(fs,2)
+                df.loc[df["dataset"] == fname, "eval_time"] = str(round(eval_time,2)) + unit
+                df.loc[df["dataset"] == fname, list(metrics.keys())] = list(metrics.values())
+            else:
+                new_row = pd.DataFrame([{**{"dataset": fname, "size_in_MB":round(fs,2), "eval_time":str(round(eval_time,2)) + unit}, **metrics}])
+                df = pd.concat([df, new_row], ignore_index=True)
+
+            df.to_csv(csv_path, index=False)