feat(downloads): allow separate MODEL_REVISION and MODEL_PRECISION

gadicc · gadicc · commit 6edc821da159 · 2023-01-04T07:58:16.000+02:00
TODO: allow same for builds
diff --git a/api/app.py b/api/app.py
@@ -152,6 +152,7 @@ def inference(all_inputs: dict) -> dict:
 
     if RUNTIME_DOWNLOADS:
         hf_model_id = call_inputs.get("HF_MODEL_ID", None)
+        model_revision = call_inputs.get("MODEL_REVISION", None)
         model_precision = call_inputs.get("MODEL_PRECISION", None)
         checkpoint_url = call_inputs.get("CHECKPOINT_URL", None)
         checkpoint_config_url = call_inputs.get("CHECKPOINT_CONFIG_URL", None)
@@ -171,10 +172,11 @@ def inference(all_inputs: dict) -> dict:
                 download_model(
                     model_id=model_id,
                     model_url=model_url,
-                    model_revision=model_precision,
+                    model_revision=model_revision or model_precision,
                     checkpoint_url=checkpoint_url,
                     checkpoint_config_url=checkpoint_config_url,
                     hf_model_id=hf_model_id,
+                    model_precision=model_precision,
                 )
                 # downloaded_models.update({normalized_model_id: True})
             clearPipelines()
diff --git a/api/download.py b/api/download.py
@@ -44,6 +44,7 @@ def download_model(
     checkpoint_url=None,
     checkpoint_config_url=None,
     hf_model_id=None,
+    model_precision=None,
 ):
     print(
         "download_model",
@@ -56,11 +57,11 @@ def download_model(
     )
     url = model_url or MODEL_URL
     hf_model_id = hf_model_id or model_id
-    revision = model_revision or revision_from_precision()
+    model_revision = model_revision or revision_from_precision()
     normalized_model_id = id
 
     if url != "":
-        normalized_model_id = normalize_model_id(model_id, model_revision)
+        normalized_model_id = normalize_model_id(model_id, model_precision)
         print({"normalized_model_id": normalized_model_id})
         filename = url.split("/").pop()
         if not filename:
@@ -97,16 +98,16 @@ def download_model(
                 )
             else:
                 print("Does not exist, let's try find it on huggingface")
-                print("precision = ", {"model_revision": model_revision})
+                print({"model_precision": model_precision, "model_revision": model_revision})
                 # This would be quicker to just model.to("cuda") afterwards, but
                 # this conveniently logs all the timings (and doesn't happen often)
                 print("download")
                 send("download", "start", {})
-                model = loadModel(hf_model_id, False, precision=model_revision)  # download
+                model = loadModel(hf_model_id, False, precision=model_precision, revision=model_revision)  # download
                 send("download", "done", {})
 
             print("load")
-            model = loadModel(hf_model_id, True, precision=model_revision)  # load
+            model = loadModel(hf_model_id, True, precision=model_precision, revision=model_revision)  # load
             # dir = "models--" + model_id.replace("/", "--") + "--dda"
             dir = os.path.join(MODELS_DIR, normalized_model_id)
             model.save_pretrained(dir, safe_serialization=True)
diff --git a/api/loadModel.py b/api/loadModel.py
@@ -24,10 +24,10 @@
 ]
 
 
-def loadModel(model_id: str, load=True, precision=None):
-    print("loadModel", {"model_id": model_id, "load": load, "precision": precision})
-    revision = revision_from_precision(precision)
+def loadModel(model_id: str, load=True, precision=None, revision=None):
+    revision = revision or revision_from_precision(precision)
     torch_dtype = torch_dtype_from_precision(precision)
+    print("loadModel", {"model_id": model_id, "load": load, "precision": precision, "revision": revision})
     print(
         ("Loading" if load else "Downloading")
         + " model: "