Add adapter_quant field to LoraConfig

billmguo · web-flow · commit f61d7c142c9a · 2026-06-25T18:47:00.000Z
Differential Revision: D109642451 Pull Request resolved: #20503
diff --git a/extension/llm/export/config/llm_config.py b/extension/llm/export/config/llm_config.py
@@ -96,6 +96,9 @@ class LoraConfig:
     lora_rank: int = 0
     lora_alpha: int = 0
     target_modules: List[str] = field(default_factory=list)
+    # Per-adapter quantization/precision: "int8" | "fp16" | "fp32" | None.
+    # Overrides the global --lora_precision flag for this adapter only.
+    adapter_quant: Optional[str] = None
 
 
 @dataclass