DennySORA
diff --git a/‎pyproject.toml‎
Lines changed: 2 additions & 0 deletions b/‎pyproject.toml‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/app.py‎
Lines changed: 62 additions & 10 deletions b/‎src/app.py‎
Lines changed: 62 additions & 10 deletions
diff --git a/‎src/backends/__init__.py‎
Lines changed: 2 additions & 3 deletions b/‎src/backends/__init__.py‎
Lines changed: 2 additions & 3 deletions
diff --git a/‎src/common/__init__.py‎
Lines changed: 2 additions & 0 deletions b/‎src/common/__init__.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/common/model_compat.py‎
Lines changed: 104 additions & 0 deletions b/‎src/common/model_compat.py‎
Lines changed: 104 additions & 0 deletions
diff --git a/‎src/features/background_removal/portrait_matting.py‎
Lines changed: 9 additions & 19 deletions b/‎src/features/background_removal/portrait_matting.py‎
Lines changed: 9 additions & 19 deletions
@@ -6,13 +6,15 @@ readme = "README.md"
 requires-python = ">=3.13"
 dependencies = [
     "inquirerpy>=0.3.4",
+    "kornia>=0.8.2",
     "numpy>=1.24.0",
     "opencv-contrib-python>=4.10.0",
     "pillow>=12.0.0",
     "pydantic>=2.12.5",
     "pydantic-settings>=2.12.0",
     "rich>=13.0.0",
     "scikit-learn>=1.3.0",
+    "timm>=1.0.24",
     "torch>=2.0.0",
     "torchvision>=0.15.0",
     "transformers>=4.45.0",
 
@@ -7,7 +7,14 @@
 import logging
 
 from src.backends.registry import BackendRegistry
-from src.common import ColorFilter, ColorFilterConfig
+from src.common import (
+    AlphaConfig,
+    AlphaMode,
+    ColorFilter,
+    ColorFilterConfig,
+    ResolutionConfig,
+    ResolutionMode,
+)
 from src.core.interfaces import BackendProtocol
 from src.core.processor import ImageProcessor
 from src.data_model import ProcessConfig, ProcessResult
@@ -106,15 +113,8 @@ def _create_backend(self, config: ProcessConfig) -> BackendProtocol:
         """
         backend_kwargs = {}
 
-        # 如果需要色彩過濾，建立配置
-        if config.backend_name == "ultra" and "color_filter" in config.extra_config:
-            color_value = str(config.extra_config["color_filter"])
-            color_filter = ColorFilterConfig(
-                enabled=True,
-                color=ColorFilter(color_value),
-                edge_refine_strength=config.strength,
-            )
-            backend_kwargs["color_filter"] = color_filter
+        if config.backend_name == "ultra":
+            backend_kwargs = self._build_ultra_kwargs(config)
 
         # 使用註冊表建立後端（工廠模式）
         return self.backend_registry.create(
@@ -124,6 +124,58 @@ def _create_backend(self, config: ProcessConfig) -> BackendProtocol:
             **backend_kwargs,
         )
 
+    def _build_ultra_kwargs(self, config: ProcessConfig) -> dict[str, object]:
+        """
+        從 extra_config 建構 Ultra 後端的完整參數
+
+        Args:
+            config: 處理配置
+
+        Returns:
+            Ultra 後端建構參數
+        """
+        extra = config.extra_config
+        kwargs: dict[str, object] = {}
+
+        # 色彩過濾
+        color_value = str(extra.get("color_filter", "none"))
+        if color_value != "none":
+            kwargs["color_filter"] = ColorFilterConfig(
+                enabled=True,
+                color=ColorFilter(color_value),
+                edge_refine_strength=config.strength,
+            )
+
+        # Trimap 精修
+        if "use_trimap_refine" in extra:
+            kwargs["use_trimap_refine"] = bool(extra["use_trimap_refine"])
+
+        # 人像 Matting 精修
+        if "use_portrait_matting" in extra:
+            kwargs["use_portrait_matting"] = bool(extra["use_portrait_matting"])
+        if "portrait_matting_strength" in extra:
+            kwargs["portrait_matting_strength"] = float(
+                extra["portrait_matting_strength"]  # type: ignore[arg-type]
+            )
+        if "portrait_matting_model" in extra:
+            kwargs["portrait_matting_model"] = str(extra["portrait_matting_model"])
+
+        # Alpha 設定
+        alpha_mode = str(extra.get("alpha_mode", "straight"))
+        edge_decontam = bool(extra.get("edge_decontamination", True))
+        kwargs["alpha_config"] = AlphaConfig(
+            mode=AlphaMode(alpha_mode),
+            edge_decontamination=edge_decontam,
+        )
+
+        # 解析度設定
+        resolution = str(extra.get("resolution_mode", "1024"))
+        kwargs["resolution_config"] = ResolutionConfig(
+            mode=ResolutionMode(resolution),
+        )
+
+        return kwargs
+
     def _display_result(self, result: ProcessResult) -> None:
         """
         顯示處理結果
 
@@ -7,13 +7,12 @@
 from .gemini_watermark import GeminiWatermarkBackend
 from .image_splitter import ImageSplitterBackend
 from .registry import BackendRegistry
+from .ultra import UltraBackend
 
 
-# Note: UltraBackend is imported from src.features.background_removal.ultra
-# to avoid circular imports. Import it directly from there if needed.
-
 __all__ = [
     "BackendRegistry",
     "GeminiWatermarkBackend",
     "ImageSplitterBackend",
+    "UltraBackend",
 ]
@@ -16,6 +16,7 @@
     unpremultiply_alpha,
 )
 from .color_filter import ColorFilter, ColorFilterConfig
+from .model_compat import load_pretrained_no_meta
 from .preset_config import (
     BackgroundRemovalPreset,
     PresetLevel,
@@ -42,4 +43,5 @@
     "get_preset",
     "list_presets",
     "print_preset_comparison",
+    "load_pretrained_no_meta",
 ]
@@ -0,0 +1,104 @@
+"""
+模型載入相容性修補模組
+
+修補 transformers >= 5.0 與自訂模型程式碼（如 BiRefNet）的相容性問題：
+1. get_init_context 無條件使用 torch.device("meta")，
+   但自訂模型在 __init__ 中呼叫 .item()，meta tensor 不支援。
+2. 自訂模型未呼叫 post_init()，導致 all_tied_weights_keys 未設定。
+"""
+
+import logging
+import os
+import warnings
+from collections.abc import Iterator
+from contextlib import contextmanager
+from typing import Any
+
+import torch
+import transformers
+from transformers import AutoModelForImageSegmentation
+from transformers.modeling_utils import PreTrainedModel
+
+
+@contextmanager
+def _suppress_loading_noise() -> Iterator[None]:
+    """暫時抑制模型載入期間的冗餘輸出（httpx、transformers、timm、tqdm）"""
+    # 保存原始狀態
+    orig_verbosity = transformers.logging.get_verbosity()
+    httpx_logger = logging.getLogger("httpx")
+    orig_httpx_level = httpx_logger.level
+    hf_logger = logging.getLogger("huggingface_hub")
+    orig_hf_level = hf_logger.level
+    orig_tqdm_disable = os.environ.get("TQDM_DISABLE")
+
+    # 抑制: transformers 日誌、httpx HTTP 請求、huggingface_hub、tqdm 進度條
+    transformers.logging.set_verbosity_error()  # type: ignore[no-untyped-call]
+    httpx_logger.setLevel(logging.WARNING)
+    hf_logger.setLevel(logging.WARNING)
+    os.environ["TQDM_DISABLE"] = "1"
+
+    # 抑制: timm FutureWarning
+    with warnings.catch_warnings():
+        warnings.filterwarnings("ignore", category=FutureWarning, module="timm")
+        try:
+            yield
+        finally:
+            transformers.logging.set_verbosity(orig_verbosity)  # type: ignore[no-untyped-call]
+            httpx_logger.setLevel(orig_httpx_level)
+            hf_logger.setLevel(orig_hf_level)
+            if orig_tqdm_disable is None:
+                os.environ.pop("TQDM_DISABLE", None)
+            else:
+                os.environ["TQDM_DISABLE"] = orig_tqdm_disable
+
+
+def load_pretrained_no_meta(model_name: str) -> Any:
+    """
+    載入預訓練 ImageSegmentation 模型，修補 meta device 相容性問題
+
+    自動抑制載入期間的冗餘輸出（HTTP 請求日誌、進度條、FutureWarning 等）
+
+    Args:
+        model_name: HuggingFace 模型名稱
+
+    Returns:
+        載入完成的模型
+    """
+
+    # 修補 1: 移除 meta device context
+    orig_context = PreTrainedModel.__dict__["get_init_context"]
+
+    @classmethod  # type: ignore[misc]
+    def _safe_context(
+        cls: type,
+        dtype: torch.dtype,
+        is_quantized: bool,
+        _is_ds_init_called: bool,
+    ) -> list[Any]:
+        bound_original = orig_context.__get__(None, cls)
+        contexts: list[Any] = bound_original(dtype, is_quantized, _is_ds_init_called)
+        return [
+            c
+            for c in contexts
+            if not (isinstance(c, torch.device) and c.type == "meta")
+        ]
+
+    # 修補 2: 確保 all_tied_weights_keys 存在
+    orig_finalize = PreTrainedModel.__dict__["_finalize_model_loading"]
+
+    @classmethod  # type: ignore[misc]
+    def _safe_finalize(cls: type, model: Any, *args: Any, **kwargs: Any) -> Any:
+        if not hasattr(model, "all_tied_weights_keys"):
+            model.all_tied_weights_keys = {}
+        return orig_finalize.__get__(None, cls)(model, *args, **kwargs)
+
+    PreTrainedModel.get_init_context = _safe_context  # type: ignore[assignment]
+    PreTrainedModel._finalize_model_loading = _safe_finalize  # type: ignore[assignment]
+    try:
+        with _suppress_loading_noise():
+            return AutoModelForImageSegmentation.from_pretrained(
+                model_name, trust_remote_code=True
+            )
+    finally:
+        PreTrainedModel.get_init_context = orig_context  # type: ignore[method-assign]
+        PreTrainedModel._finalize_model_loading = orig_finalize  # type: ignore[method-assign]
@@ -99,10 +99,9 @@ def __init__(
         self._model_loaded = False
         self._transform: transforms.Compose | None = None
 
-        logger.info("Portrait matting refiner initialized")
-        logger.info("  Model: %s", self.model_name)
-        logger.info("  Device: %s", self.device)
-        logger.info("  High-res mode: %s", self.enable_hr_mode)
+        logger.info(
+            "Portrait matting: model=%s, device=%s", self.model_name, self.device
+        )
 
     def load_model(self) -> None:
         """載入人像 matting 模型"""
@@ -131,30 +130,21 @@ def _load_birefnet(self) -> None:
         - Hugging Face: ZhengPeng7/BiRefNet-matting
         - 授權：MIT License
         """
-        from transformers import AutoModelForImageSegmentation
+        from src.common.model_compat import load_pretrained_no_meta
 
         repo_id = BIREFNET_MODELS[self.model_name]
         input_size = BIREFNET_INPUT_SIZES[self.model_name]
 
         try:
             logger.info("Loading BiRefNet model: %s ...", repo_id)
 
-            self._model = AutoModelForImageSegmentation.from_pretrained(
-                repo_id, trust_remote_code=True
-            )
+            self._model = load_pretrained_no_meta(repo_id)
             self._model.to(self.device)
             self._model.eval()
 
-            # torch.compile() 加速（MPS 不支援）
-            if hasattr(torch, "compile") and self.device.type != "mps":
-                try:
-                    self._model = torch.compile(self._model, mode="reduce-overhead")
-                    logger.info("torch.compile() enabled for BiRefNet")
-                except Exception:
-                    logger.debug(
-                        "torch.compile() unavailable for BiRefNet",
-                        exc_info=True,
-                    )
+            # 啟用 TF32（Ampere+ GPU 自動加速 float32 矩陣運算）
+            if self.device.type == "cuda":
+                torch.set_float32_matmul_precision("high")
 
             # 建立預處理轉換器
             self._transform = transforms.Compose(
@@ -166,7 +156,7 @@ def _load_birefnet(self) -> None:
             )
 
             self._model_loaded = True
-            logger.info("BiRefNet loaded successfully (%s)", self.model_name)
+            logger.info("BiRefNet loaded on %s", self.device)
 
         except Exception as e:
             logger.warning(
Original file line number	Diff line number	Diff line change
`@@ -16,6 +16,7 @@`
`16`	`16`	`unpremultiply_alpha,`
`17`	`17`	`)`
`18`	`18`	`from .color_filter import ColorFilter, ColorFilterConfig`
	`19`	`+from .model_compat import load_pretrained_no_meta`
`19`	`20`	`from .preset_config import (`
`20`	`21`	`BackgroundRemovalPreset,`
`21`	`22`	`PresetLevel,`
`@@ -42,4 +43,5 @@`
`42`	`43`	`"get_preset",`
`43`	`44`	`"list_presets",`
`44`	`45`	`"print_preset_comparison",`
	`46`	`+ "load_pretrained_no_meta",`
`45`	`47`	`]`