NXP backend: Add use_new_neutron_c_flag to NeutronTargetSpec

StrycekSimon · StrycekSimon · commit 83b2c9f4f299 · 2026-05-13T07:45:33.000+02:00
diff --git a/backends/nxp/backend/neutron_target_spec.py b/backends/nxp/backend/neutron_target_spec.py
@@ -8,12 +8,10 @@
 from enum import Enum
 
 import torch
-
 from executorch.backends.nxp.backend.neutron_converter_manager import (
     NeutronConverterManager,
 )
 from executorch.exir.dialects._ops import ops as exir_ops
-
 from torch.fx import Node
 
 
@@ -98,12 +96,13 @@ class NeutronTargetSpec:
     The functionality for probing the properties of Neutron Target.
     """
 
-    def __init__(self, target: str):
+    def __init__(self, target: str, use_new_flow_neutron_c: bool = False):
 
         converter_manager = NeutronConverterManager()
         converter_manager.verify_target(target)
         neutron_converter = converter_manager.get_converter()
         self.neutron_target = neutron_converter.getNeutronTarget(target)
+        self.use_new_flow_neutron_c = use_new_flow_neutron_c
 
         if self.is_subsystem():
             raise ValueError(
diff --git a/backends/nxp/nxp_backend.py b/backends/nxp/nxp_backend.py
@@ -14,7 +14,6 @@
 
 import numpy as np
 import torch
-
 from executorch.backends.nxp.backend.custom_delegation_options import (
     CustomDelegationOptions,
 )
@@ -86,7 +85,9 @@ def neutron_compile_spec(
         :return: self for method chaining
         """
 
-        self.config = NeutronTargetSpec(config)
+        self.config = NeutronTargetSpec(
+            config, use_new_flow_neutron_c=use_new_flow_neutron_c
+        )
 
         assert (
             self.output_format is None
diff --git a/backends/nxp/quantizer/neutron_quantizer.py b/backends/nxp/quantizer/neutron_quantizer.py
@@ -9,7 +9,6 @@
     _get_default_passes,
     NeutronAtenPassManager,
 )
-
 from executorch.backends.nxp.backend.neutron_target_spec import NeutronTargetSpec
 from executorch.backends.nxp.quantizer.patterns import (
     AbsPattern,
@@ -255,53 +254,63 @@ def __init__(self, neutron_target_spec: NeutronTargetSpec, is_qat: bool = False)
         OpQuantizer = NeutronAtenQuantizer
         super().__init__(
             [
-                OpQuantizer(AbsPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(AdaptiveAvgPoolPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(AddTensorPattern(is_qat=is_qat), static_qconfig),
+                OpQuantizer(AbsPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(
+                    AdaptiveAvgPoolPattern(self, is_qat=is_qat), static_qconfig
+                ),
+                OpQuantizer(AddTensorPattern(self, is_qat=is_qat), static_qconfig),
                 OpQuantizer(AddmmPattern(self, is_qat=is_qat), static_fc_qconfig),
-                OpQuantizer(AvgPool1DPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(AvgPool2DPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(BatchNormPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(BMMPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(CatPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(ClampPattern(is_qat=is_qat), static_qconfig),
+                OpQuantizer(AvgPool1DPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(AvgPool2DPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(BatchNormPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(BMMPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(CatPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(ClampPattern(self, is_qat=is_qat), static_qconfig),
                 OpQuantizer(Conv2dPattern(self, is_qat=is_qat), static_qconfig),
                 OpQuantizer(
                     ConvTranspose2dPattern(self, is_qat=is_qat), static_qconfig
                 ),
-                OpQuantizer(DropoutPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(FlattenPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(HardTanhPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(HardTanhInPlacePattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(LeakyReluPattern(is_qat=is_qat), static_fc_qconfig),
-                OpQuantizer(LeakyReluInPlacePattern(is_qat=is_qat), static_fc_qconfig),
+                OpQuantizer(DropoutPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(FlattenPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(HardTanhPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(
+                    HardTanhInPlacePattern(self, is_qat=is_qat), static_qconfig
+                ),
+                OpQuantizer(LeakyReluPattern(self, is_qat=is_qat), static_fc_qconfig),
+                OpQuantizer(
+                    LeakyReluInPlacePattern(self, is_qat=is_qat), static_fc_qconfig
+                ),
                 OpQuantizer(LinearPattern(self, is_qat=is_qat), static_fc_qconfig),
-                OpQuantizer(MaxPool1DPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(MaxPool2DPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(MeanDimPattern(is_qat=is_qat), static_qconfig),
+                OpQuantizer(MaxPool1DPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(MaxPool2DPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(MeanDimPattern(self, is_qat=is_qat), static_qconfig),
                 OpQuantizer(MmPattern(self, is_qat=is_qat), static_qconfig),
-                OpQuantizer(MulTensorPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(NegPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(PadPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(PermutePattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(PReLUPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(ReluPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(ReluInPlacePattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(ReshapePattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(SigmoidPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(SliceTensorPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(SoftMaxPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(SqueezeDimPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(SqueezeDimsPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(SqueezePattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(SubTensorPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(TanhPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(TanhInPlacePattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(TransposeIntPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(UnsqueezePattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(UpsampleBilinear2DPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(UpsampleNearest2DPattern(is_qat=is_qat), static_qconfig),
-                OpQuantizer(ViewPattern(is_qat=is_qat), static_qconfig),
+                OpQuantizer(MulTensorPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(NegPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(PadPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(PermutePattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(PReLUPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(ReluPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(ReluInPlacePattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(ReshapePattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(SigmoidPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(SliceTensorPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(SoftMaxPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(SqueezeDimPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(SqueezeDimsPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(SqueezePattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(SubTensorPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(TanhPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(TanhInPlacePattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(TransposeIntPattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(UnsqueezePattern(self, is_qat=is_qat), static_qconfig),
+                OpQuantizer(
+                    UpsampleBilinear2DPattern(self, is_qat=is_qat), static_qconfig
+                ),
+                OpQuantizer(
+                    UpsampleNearest2DPattern(self, is_qat=is_qat), static_qconfig
+                ),
+                OpQuantizer(ViewPattern(self, is_qat=is_qat), static_qconfig),
             ]
         )
 
diff --git a/backends/nxp/quantizer/patterns.py b/backends/nxp/quantizer/patterns.py
@@ -10,7 +10,6 @@
 from functools import partial
 
 import torch
-
 from executorch.backends.nxp.quantizer.utils import (
     get_bias_qparams,
     get_bias_qparams_transp_conv,
@@ -86,7 +85,8 @@ class PartitionAnchors:
 
 
 class QuantizationPattern(ABC):
-    def __init__(self, is_qat: bool = False):
+    def __init__(self, neutron_quantizer, is_qat: bool = False):
+        self.neutron_quantizer = neutron_quantizer
         self.is_qat = is_qat
 
     @abstractmethod
@@ -157,9 +157,6 @@ def get_anchors(
 
 
 class BatchNormPattern(QuantizationPattern):
-    def __init__(self, is_qat: bool):
-        super().__init__(is_qat=is_qat)
-
     def partition_types(self) -> list[OpOverload]:
         # BatchNorm quantization is needed only when in QAT mode
         return [torch.ops.aten.batch_norm.default] if self.is_qat else []
@@ -227,9 +224,8 @@ def partition_types(self):
 
 class AddmmPattern(QuantizationPattern):
     def __init__(self, neutron_quantizer, is_qat: bool):
-        super().__init__(is_qat=is_qat)
+        super().__init__(neutron_quantizer, is_qat=is_qat)
 
-        self.neutron_quantizer = neutron_quantizer
         self.neutron_target_info = (
             self.neutron_quantizer.neutron_target_spec.neutron_target_info
         )
@@ -488,9 +484,8 @@ def get_anchors(
 
 class Conv2dPattern(ConvPattern):
     def __init__(self, neutron_quantizer, is_qat: bool = False):
-        super().__init__(is_qat=is_qat)
+        super().__init__(neutron_quantizer, is_qat=is_qat)
 
-        self.neutron_quantizer = neutron_quantizer
         self.neutron_target_info = (
             self.neutron_quantizer.neutron_target_spec.neutron_target_info
         )
@@ -582,7 +577,7 @@ def get_anchors(
 
 class ConvTranspose2dPattern(QuantizationPattern):
     def __init__(self, neutron_quantizer, is_qat: bool = False):
-        super().__init__(is_qat=is_qat)
+        super().__init__(neutron_quantizer, is_qat=is_qat)
 
         self.neutron_quantizer = neutron_quantizer
         self.neutron_target_info = (
@@ -745,9 +740,8 @@ def partition_types(self):
 
 class LinearPattern(QuantizationPattern):
     def __init__(self, neutron_quantizer, is_qat: bool = False):
-        super().__init__(is_qat=is_qat)
+        super().__init__(neutron_quantizer, is_qat=is_qat)
 
-        self.neutron_quantizer = neutron_quantizer
         self.neutron_target_info = (
             self.neutron_quantizer.neutron_target_spec.neutron_target_info
         )
@@ -836,9 +830,8 @@ def partition_types(self):
 
 class MmPattern(QuantizationPattern):
     def __init__(self, neutron_quantizer, is_qat: bool = False):
-        super().__init__(is_qat=is_qat)
+        super().__init__(neutron_quantizer, is_qat=is_qat)
 
-        self.neutron_quantizer = neutron_quantizer
         self.neutron_target_info = (
             self.neutron_quantizer.neutron_target_spec.neutron_target_info
         )
@@ -1172,9 +1165,8 @@ class ActivationsConcatClusterPattern(QuantizationPattern):
     """
 
     def __init__(self, neutron_quantizer, is_qat: bool = False):
-        super().__init__(is_qat=is_qat)
+        super().__init__(neutron_quantizer, is_qat=is_qat)
 
-        self.neutron_quantizer = neutron_quantizer
         self.neutron_target_info = (
             self.neutron_quantizer.neutron_target_spec.neutron_target_info
         )
diff --git a/backends/nxp/tests/executorch_pipeline.py b/backends/nxp/tests/executorch_pipeline.py
@@ -13,7 +13,6 @@
 import eiq_neutron_sdk
 import numpy as np
 import torch
-
 from executorch import exir
 from executorch.backends.nxp.backend.custom_delegation_options import (
     CustomDelegationOptions,
@@ -98,7 +97,7 @@ def _get_default_quantizer(target_spec: NeutronTargetSpec, use_qat: bool) -> Qua
 
 
 def to_model_input_spec(
-    input_spec: Iterable[ModelInputSpec] | tuple[int, ...] | list[tuple[int, ...]]
+    input_spec: Iterable[ModelInputSpec] | tuple[int, ...] | list[tuple[int, ...]],
 ) -> tuple[ModelInputSpec, ...]:
     match input_spec:
         case _ if isinstance(input_spec, Iterable) and all(
@@ -122,7 +121,7 @@ def to_model_input_spec(
 
 def get_calibration_inputs_fn_from_dataset_dir(dataset_dir) -> GetCalibrationInputsFn:
     def _nested(
-        input_spec: tuple[ModelInputSpec, ...]
+        input_spec: tuple[ModelInputSpec, ...],
     ) -> Iterable[tuple[torch.Tensor, ...]]:
         data = sorted(os.listdir(dataset_dir))
         inputs_needed = len(input_spec)
@@ -156,7 +155,7 @@ def _nested(
 
 
 def _get_example_input(
-    input_spec: tuple[ModelInputSpec, ...]
+    input_spec: tuple[ModelInputSpec, ...],
 ) -> tuple[torch.Tensor, ...]:
     example_input = []
     for spec in input_spec:
@@ -193,7 +192,9 @@ def to_quantized_edge_program(
     use_new_flow_neutron_c: bool = False,
     delegate_to_npu=True,
 ) -> EdgeProgramManager:
-    _neutron_target_spec = NeutronTargetSpec(target)
+    _neutron_target_spec = NeutronTargetSpec(
+        target, use_new_flow_neutron_c=use_new_flow_neutron_c
+    )
     custom_delegation_options.use_new_flow_neutron_c = use_new_flow_neutron_c
     if get_quantizer_fn is None:
         get_quantizer_fn = partial(