Merge pull request #30 from AdityaLab/Shiduo

Risto0211 · web-flow · commit b2b444813029 · 2025-04-01T07:03:49.000+08:00
logic for using all data and choice for short horizon
diff --git a/leaderboard.py b/leaderboard.py
@@ -4,14 +4,14 @@
 import pandas as pd
 import time
 
-# src_path = os.path.abspath(os.path.join("src"))
-# if src_path not in sys.path:
-#     sys.path.insert(0, src_path)
+src_path = os.path.abspath(os.path.join("src"))
+if src_path not in sys.path:
+    sys.path.insert(0, src_path)
 
-from src.samay.model import TimesfmModel, MomentModel, ChronosModel, ChronosBoltModel, TinyTimeMixerModel, MoiraiTSModel
-from src.samay.dataset import TimesfmDataset, MomentDataset, ChronosDataset, ChronosBoltDataset, TinyTimeMixerDataset, MoiraiDataset
-from src.samay.utils import load_args, get_gifteval_datasets
-from src.samay.metric import *
+from samay.model import TimesfmModel, MomentModel, ChronosModel, ChronosBoltModel, TinyTimeMixerModel, MoiraiTSModel
+from samay.dataset import TimesfmDataset, MomentDataset, ChronosDataset, ChronosBoltDataset, TinyTimeMixerDataset, MoiraiDataset
+from samay.utils import load_args, get_gifteval_datasets
+from samay.metric import *
 
 
 # ECON_NAMES = {
@@ -146,7 +146,7 @@ def calc_pred_and_context_len(freq):
 
 if __name__ == "__main__":
     
-    for model_name in MODEL_NAMES[4:]:
+    for model_name in MODEL_NAMES[3:]:
         print(f"Evaluating model: {model_name}")
         # create csv file for leaderboard if not already created
         csv_path = f"leaderboard/{model_name}.csv"
@@ -173,6 +173,10 @@ def calc_pred_and_context_len(freq):
             args = load_args(arg_path)
 
         for fname, freq, fs in filesizes:
+            if fname != "solar":
+                continue
+            elif freq != "W":
+                continue
             print(f"Evaluating {fname} ({freq})")
             # Adjust the context and prediction length based on the frequency
 
@@ -201,6 +205,7 @@ def calc_pred_and_context_len(freq):
                 dataset = TimesfmDataset(datetime_col='timestamp', path=dataset_path, mode='test', context_len=args["config"]["context_len"], horizon_len=args["config"]["horizon_len"], boundaries=(-1, -1, -1), batchsize=64)
                 start = time.time()
                 metrics = model.evaluate(dataset)
+                print("Metrics: ", metrics)
                 end = time.time()
                 print(f"Size of dataset: {fs:.2f} MB")
                 print(f"Time taken for evaluation of {fname}: {end-start:.2f} seconds")
@@ -209,7 +214,7 @@ def calc_pred_and_context_len(freq):
                 model = MomentModel(**args)
                 args["config"]["task_name"] = "forecasting"
                 train_dataset = MomentDataset(datetime_col='timestamp', path=dataset_path, mode='train', horizon_len=args["config"]["forecast_horizon"], normalize=False)
-                dataset = MomentDataset(datetime_col='timestamp', path=dataset_path, mode='test', horizon_len=args["config"]["forecast_horizon"], normalize=False)
+                dataset = MomentDataset(datetime_col='timestamp', path=dataset_path, mode='test', horizon_len=args["config"]["forecast_horizon"], normalize=False, boundaries=[-1, -1, -1])
                 finetuned_model = model.finetune(train_dataset, task_name="forecasting")
                 start = time.time()
                 metrics = model.evaluate(dataset, task_name="forecasting")
@@ -223,7 +228,7 @@ def calc_pred_and_context_len(freq):
                 dataset_config = load_args("config/chronos_dataset.json")
                 dataset_config["context_length"] = context_len
                 dataset_config["prediction_length"] = pred_len
-                dataset = ChronosDataset(datetime_col='timestamp', path=dataset_path, mode='test', config=dataset_config, batch_size=4)
+                dataset = ChronosDataset(datetime_col='timestamp', path=dataset_path, mode='test', config=dataset_config, batch_size=4, boundaries=[-1, -1, -1])
                 start = time.time()
                 metrics = model.evaluate(dataset, horizon_len=dataset_config["prediction_length"], quantile_levels=[0.1, 0.5, 0.9])
                 end = time.time()
@@ -233,7 +238,7 @@ def calc_pred_and_context_len(freq):
             elif model_name == "chronosbolt":
                 repo = "amazon/chronos-bolt-small"
                 model = ChronosBoltModel(repo=repo)
-                dataset = ChronosBoltDataset(datetime_col='timestamp', path=dataset_path, mode='test', batch_size=8, context_len=context_len, horizon_len=pred_len)
+                dataset = ChronosBoltDataset(datetime_col='timestamp', path=dataset_path, mode='test', batch_size=8, context_len=context_len, horizon_len=pred_len, boundaries=[-1, -1, -1])
                 start = time.time()
                 metrics = model.evaluate(dataset, horizon_len=pred_len, quantile_levels=[0.1, 0.5, 0.9])
                 end = time.time()
@@ -242,7 +247,7 @@ def calc_pred_and_context_len(freq):
 
             elif model_name == "ttm":
                 model = TinyTimeMixerModel(**args)
-                dataset = TinyTimeMixerDataset(datetime_col='timestamp', path=dataset_path, mode='test', context_len=context_len, horizon_len=pred_len)
+                dataset = TinyTimeMixerDataset(datetime_col='timestamp', path=dataset_path, mode='test', context_len=context_len, horizon_len=pred_len, boundaries=[-1, -1, -1])
                 start = time.time()
                 metrics = model.evaluate(dataset)
                 end = time.time()
diff --git a/leaderboard/timesfm.csv b/leaderboard/timesfm.csv
@@ -1,10 +1,11 @@
-dataset,mse,mae,mase,mape,rmse,nrmse,smape,msis,nd,mwsq,crps
-m4_yearly,9324.314453125,1.453155755996704,,129.92918395996094,96.56249237060548,0.003338028634445,1.9404819011688232,1825546.875,0.1487463746984999,736.5278930664062,4763464.50894722
-m4_quarterly,11540.2001953125,4.373758316040039,,0.000894644006621,107.42532348632812,0.0021157962591371,0.0008130415226332,0.0147697096690535,0.0007122407249761,8877.486328125,76965652.61745518
-m4_monthly,21410.37890625,6.217271327972412,0.3291291296482086,0.0012720649829134,146.32286071777344,0.0019095096563116,0.0012352424673736,0.019323231652379,0.001287188373541,12769.849609375,105929602.0931511
-m4_weekly,561843.9375,169.09071350097656,0.0666100904345512,0.0394658930599689,749.5625,0.0146108341018089,0.0377030260860919,0.026721965521574,0.0343743559651665,258700.15625,2611755055.7616825
-m4_daily,72798.4453125,27.041128158569336,0.0343014523386955,0.0043948837555944,269.8118591308594,0.006309027242851,0.0045300694182515,0.0084697818383574,0.0044873143451785,40192.64453125,424549963.43306565
-m4_hourly,5090942.0,191.70616149902344,,0.3146225810050964,2256.3115234375,0.0032095561059994,0.0889025703072547,0.1215216591954231,0.0266055212389293,663349.375,118992351217.515
-car_parts_with_missing,1.4118587970733645,0.4692889750003814,,11805.2060546875,1.1882166862487793,0.029705409729867,1.828437566757202,0.1179555356502533,1.0383541264832732,0.2255326509475708,0.730486241146584
-hierarchical_sales,223.04559326171875,3.070805549621582,,1988.4501953125,14.934711456298828,0.0273529508841928,1.5463078022003174,0.0621227174997329,0.4439457604474497,8.156706809997559,1187.0533112340966
-restaurant,23.778711318969727,0.7549307346343994,,122.93232727050781,4.876341819763184,0.018611990968104102,1.880303978919983,0.04096284881234169,0.5990635938742331,0.7695077061653137,48.720557867116376
+dataset,mse,mae,mase,mape,rmse,nrmse,smape,msis,nd,mwsq,crps,size_in_MB,eval_time
+m4_yearly,9324.314453125,1.453155755996704,,129.92918395996094,96.56249237060548,0.003338028634445,1.9404819011688232,1825546.875,0.1487463746984999,736.5278930664062,4763464.50894722,,
+m4_quarterly,11540.2001953125,4.373758316040039,,0.000894644006621,107.42532348632812,0.0021157962591371,0.0008130415226332,0.0147697096690535,0.0007122407249761,8877.486328125,76965652.61745518,,
+m4_monthly,21410.37890625,6.217271327972412,0.3291291296482086,0.0012720649829134,146.32286071777344,0.0019095096563116,0.0012352424673736,0.019323231652379,0.001287188373541,12769.849609375,105929602.0931511,,
+m4_weekly,561843.9375,169.09071350097656,0.0666100904345512,0.0394658930599689,749.5625,0.0146108341018089,0.0377030260860919,0.026721965521574,0.0343743559651665,258700.15625,2611755055.7616825,,
+m4_daily,72798.4453125,27.041128158569336,0.0343014523386955,0.0043948837555944,269.8118591308594,0.006309027242851,0.0045300694182515,0.0084697818383574,0.0044873143451785,40192.64453125,424549963.43306565,,
+m4_hourly,5090942.0,191.70616149902344,,0.3146225810050964,2256.3115234375,0.0032095561059994,0.0889025703072547,0.1215216591954231,0.0266055212389293,663349.375,118992351217.515,,
+car_parts_with_missing,1.4118587970733645,0.4692889750003814,,11805.2060546875,1.1882166862487793,0.029705409729867,1.828437566757202,0.1179555356502533,1.0383541264832732,0.2255326509475708,0.730486241146584,,
+hierarchical_sales,223.04559326171875,3.070805549621582,,1988.4501953125,14.934711456298828,0.0273529508841928,1.5463078022003174,0.0621227174997329,0.4439457604474497,8.156706809997559,1187.0533112340966,,
+restaurant,23.778711318969727,0.7549307346343994,,122.9323272705078,4.876341819763184,0.0186119909681041,1.880303978919983,0.0409628488123416,0.5990635938742331,0.7695077061653137,48.720557867116376,,
+solar,243211.953125,140.67047119140625,0.10394947230815887,168.28846740722656,493.1652526855469,0.027132100801376485,1.5959948301315308,0.037582240998744965,0.1559242251909539,68889.2734375,313517743.6982181,0.06,3.3s
diff --git a/src/samay/dataset.py b/src/samay/dataset.py
@@ -170,6 +170,7 @@ def __init__(self, name=None,
             self.boundaries = [0, 0, len(self.data) - 1]
         else:
             self.boundaries = boundaries
+        self.horizon_len = min(self.horizon_len, int(0.3*len(self.data)+1))
         self.ts_cols = [col for col in self.data.columns if col != self.datetime_col]
         tfdtl = TimeSeriesdata(
             data_path=self.data_path,
@@ -301,6 +302,12 @@ def _read_data(self):
         if self.boundaries[2] == 0:
             self.boundaries[2] = int(len(self.df) - 1)
 
+        if self.boundaries == [-1, -1, -1]:
+            # use all data for training
+            self.boundaries = [0, 0, len(self.df) - 1]
+
+        self.horizon_len = min(self.horizon_len, int(0.3*len(self.df)+1))
+
         self.n_channels = self.df.shape[1] - 1
         self.num_chunks = (self.n_channels + self.max_col_num - 1) // self.max_col_num
         
@@ -445,6 +452,12 @@ def _read_data(self):
         if self.boundaries[2] == 0:
             self.boundaries[2] = int(len(self.df) - 1)
 
+        if self.boundaries == [-1, -1, -1]:
+            # use all data for training
+            self.boundaries = [0, 0, len(self.df) - 1]
+
+        self.horizon_len = min(self.horizon_len, int(0.3*len(self.df)+1))
+
         self.n_channels = self.df.shape[1] - 1
         self.num_chunks = (self.n_channels + self.max_col_num - 1) // self.max_col_num
         
@@ -566,6 +579,12 @@ def _read_data(self):
         if self.boundaries[2] == 0:
             self.boundaries[2] = int(len(self.df) - 1)
 
+        if self.boundaries == [-1, -1, -1]:
+            # use all data for training
+            self.boundaries = [0, 0, len(self.df) - 1]
+
+        self.forecast_horizon = min(self.forecast_horizon, int(0.3*len(self.df)+1))
+
         if self.task_name == 'detection':
             self.n_channels = 1
         else:
@@ -748,6 +767,12 @@ def _read_data(self):
         if self.boundaries[2] == 0:
             self.boundaries[2] = int(len(self.df) - 1)
 
+        if self.boundaries == [-1, -1, -1]:
+            # use all data for training
+            self.boundaries = [0, 0, len(self.df) - 1]
+            
+        self.horizon_len = min(self.horizon_len, int(0.3*len(self.df)+1))
+
         self.n_channels = self.df.shape[1] - 1
         self.num_chunks = (self.n_channels + self.max_col_num - 1) // self.max_col_num