efficient-task-transfer/training_scripts/run_limited.py at main · adapter-hub/efficient-task-transfer · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
import argparse
import json
import os

from config_utils import RUN_CONFIGS

from itrain import DATASET_MANAGER_CLASSES, DatasetArguments, ModelArguments, RunArguments, Setup


OUTPUT_DIR = os.path.expanduser(os.getenv("RUN_LIMITED_OUTPUT_DIR", "limited_output"))


def _patch_run_config_adapter(config):
    config["training"]["learning_rate"] = 1e-4
    config["training"]["checkpoint_steps"] = 100


def _patch_run_config_full_model(config):
    config["model"]["train_adapter"] = False
    config["training"]["learning_rate"] = 3e-5
    config["training"]["num_train_epochs"] = 3
    config["training"]["patience"] = 0


def run_limited_training(args):
    results = {}
    # load training config
    with open(os.path.join(RUN_CONFIGS, args["target_task"] + ".json"), "r", encoding="utf-8") as f:
        config = json.load(f)
    output_base = os.path.join(OUTPUT_DIR, args["target_task"])
    if not os.path.exists(output_base):
        os.makedirs(output_base)
    # patch model/ training args
    if args["full_model"]:
        _patch_run_config_full_model(config)
    else:
        _patch_run_config_adapter(config)
    for dataset_size in args["train_sizes"]:
        print(f"*** Running {args['target_task']} with size = {dataset_size} ***")
        output_dir = os.path.join(output_base, str(dataset_size))
        # skip this iteration if no overwrites requested & existing
        if not args["overwrite_output"] and os.path.exists(output_dir):
            print(f"Skipping size {dataset_size} as it already exists.")
            continue
        # create dataset
        config["dataset"]["train_subset_size"] = dataset_size
        dataset_args = DatasetArguments(**config["dataset"])
        dataset_manager = DATASET_MANAGER_CLASSES[dataset_args.dataset_name](dataset_args)
        # create run setup
        setup = Setup(id=f"{args['target_task']}_n{dataset_size}")
        setup.dataset(dataset_manager)
        config["training"]["output_dir"] = output_dir
        setup.training(RunArguments(**config["training"]))
        if isinstance(config["evaluation"], str):
            setup.evaluation(split=config["evaluation"])
        else:
            setup.evaluation()
        setup.notify(config["notify"])
        # setup model
        if args["model_name_or_path"]:
            config["model"]["model_name_or_path"] = args["model_name_or_path"]
        setup.model(ModelArguments(**config["model"]))
        # start!
        run_results = setup.run(restarts=args["restarts"])
        results[str(dataset_size)] = run_results
        # stop training if the current dataset size exceeds the total size
        if len(dataset_manager.train_split) <= dataset_size:
            print(f"Dataset size exceeded at n = {dataset_size}, stopping.")
            break
        # clean up
        del dataset_manager
        del setup
    # save results
    with open(os.path.join(output_base, "eval_results.json"), "w") as f:
        json.dump(results, f)


if __name__ == "__main__":
    parser = argparse.ArgumentParser()

    parser.add_argument("target_task", type=str, help="Name of the target task training setup.")
    parser.add_argument("--overwrite_output", action="store_true", default=False)
    parser.add_argument("--train_sizes", type=lambda s: [int(item) for item in s.split(",")])
    parser.add_argument("--restarts", type=int, default=None)
    parser.add_argument("--full_model", action="store_true")
    parser.add_argument("--model_name_or_path", default=None)
    args = vars(parser.parse_args())

    run_limited_training(args)