NVIDIA
diff --git a/‎examples/puzzletron/evaluation/hf_deployable_anymodel.py‎
Lines changed: 0 additions & 1 deletion b/‎examples/puzzletron/evaluation/hf_deployable_anymodel.py‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎modelopt/torch/puzzletron/__init__.py‎
Lines changed: 0 additions & 1 deletion b/‎modelopt/torch/puzzletron/__init__.py‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎modelopt/torch/puzzletron/activation_scoring/score_pruning_activations.py‎
Lines changed: 2 additions & 0 deletions b/‎modelopt/torch/puzzletron/activation_scoring/score_pruning_activations.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎modelopt/torch/puzzletron/anymodel/models/gpt_oss/__init__.py‎
Lines changed: 2 additions & 2 deletions b/‎modelopt/torch/puzzletron/anymodel/models/gpt_oss/__init__.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎modelopt/torch/puzzletron/anymodel/models/gpt_oss/gpt_oss_converter.py‎
Lines changed: 2 additions & 0 deletions b/‎modelopt/torch/puzzletron/anymodel/models/gpt_oss/gpt_oss_converter.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎modelopt/torch/puzzletron/anymodel/models/gpt_oss/gpt_oss_model_descriptor.py‎
Lines changed: 2 additions & 0 deletions b/‎modelopt/torch/puzzletron/anymodel/models/gpt_oss/gpt_oss_model_descriptor.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎modelopt/torch/puzzletron/anymodel/models/gpt_oss/gpt_oss_pruned_to_mxfp4.py‎
Lines changed: 2 additions & 0 deletions b/‎modelopt/torch/puzzletron/anymodel/models/gpt_oss/gpt_oss_pruned_to_mxfp4.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎modelopt/torch/puzzletron/anymodel/models/llama/__init__.py‎
Lines changed: 2 additions & 2 deletions b/‎modelopt/torch/puzzletron/anymodel/models/llama/__init__.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎modelopt/torch/puzzletron/anymodel/models/llama/llama_converter.py‎
Lines changed: 2 additions & 0 deletions b/‎modelopt/torch/puzzletron/anymodel/models/llama/llama_converter.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎modelopt/torch/puzzletron/anymodel/models/llama/llama_model_descriptor.py‎
Lines changed: 6 additions & 0 deletions b/‎modelopt/torch/puzzletron/anymodel/models/llama/llama_model_descriptor.py‎
Lines changed: 6 additions & 0 deletions
@@ -331,7 +331,6 @@ def get_triton_input(self):
             Tensor(name="top_p", shape=(-1,), dtype=np.single, optional=True),
             Tensor(name="temperature", shape=(-1,), dtype=np.single, optional=True),
             Tensor(name="random_seed", shape=(-1,), dtype=np.int_, optional=True),
-            Tensor(name="max_length", shape=(-1,), dtype=np.int_, optional=True),
             Tensor(name="output_logits", shape=(-1,), dtype=np.bool_, optional=True),
             Tensor(name="output_scores", shape=(-1,), dtype=np.bool_, optional=True),
         )
 
@@ -27,7 +27,6 @@
     puzzletron_nas_plugin,
     replacement_library,
     scoring,
-    sewing_kit,
     subblock_stats,
     tools,
     utils,
 
@@ -22,6 +22,8 @@
 
 from ..tools.logger import mprint
 
+__all__ = ["launch_score_activations"]
+
 
 def has_checkpoint_support(activation_hooks_kwargs: dict) -> bool:
     """Determine if the activation hook method has proper checkpoint support implemented.
 
@@ -18,5 +18,5 @@
 
 """GPT-OSS model support for AnyModel."""
 
-from .gpt_oss_converter import GptOssConverter
-from .gpt_oss_model_descriptor import GptOssModelDescriptor
+from .gpt_oss_converter import *
+from .gpt_oss_model_descriptor import *
@@ -23,6 +23,8 @@
 from ....block_config import AttentionConfig, BlockConfig, FFNConfig, MoEConfig
 from ...converter import Converter, ConverterFactory
 
+__all__ = ["GptOssConverter"]
+
 
 @ConverterFactory.register_decorator("gpt_oss")
 class GptOssConverter(Converter):
 
@@ -37,6 +37,8 @@
 from ...model_descriptor import ModelDescriptor, ModelDescriptorFactory
 from ...puzzformer.no_op import MatchingZeros, Same, return_tuple_of_size
 
+__all__ = ["GptOssModelDescriptor", "GptOssExpertRemovalLayerDescriptor"]
+
 
 @ModelDescriptorFactory.register_decorator("gpt_oss")
 class GptOssModelDescriptor(ModelDescriptor):
 
@@ -35,6 +35,8 @@
 from tqdm import tqdm
 from transformers.integrations.mxfp4 import convert_moe_packed_tensors
 
+__all__ = []
+
 
 def deduce_experts_for_layer(
     layer: int,
 
@@ -13,5 +13,5 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-from .llama_converter import LlamaConverter
-from .llama_model_descriptor import LlamaModelDescriptor
+from .llama_converter import *
+from .llama_model_descriptor import *
@@ -23,6 +23,8 @@
 from ....block_config import AttentionConfig, BlockConfig, FFNConfig
 from ...converter import Converter, ConverterFactory
 
+__all__ = ["LlamaConverter"]
+
 
 @ConverterFactory.register_decorator("llama")
 class LlamaConverter(Converter):
 
@@ -32,6 +32,12 @@
 from ...model_descriptor import ModelDescriptor, ModelDescriptorFactory
 from ...puzzformer.no_op import MatchingZeros, Same, return_tuple_of_size
 
+__all__ = [
+    "LlamaModelDescriptor",
+    "LlamaFFNIntermediateLayerDescriptor",
+    "LlamaKVHeadsLayerDescriptor",
+]
+
 
 @ModelDescriptorFactory.register_decorator("llama")
 class LlamaModelDescriptor(ModelDescriptor):
Original file line number	Diff line number	Diff line change
`@@ -331,7 +331,6 @@ def get_triton_input(self):`
`331`	`331`	`Tensor(name="top_p", shape=(-1,), dtype=np.single, optional=True),`
`332`	`332`	`Tensor(name="temperature", shape=(-1,), dtype=np.single, optional=True),`
`333`	`333`	`Tensor(name="random_seed", shape=(-1,), dtype=np.int_, optional=True),`
`334`		`- Tensor(name="max_length", shape=(-1,), dtype=np.int_, optional=True),`
`335`	`334`	`Tensor(name="output_logits", shape=(-1,), dtype=np.bool_, optional=True),`
`336`	`335`	`Tensor(name="output_scores", shape=(-1,), dtype=np.bool_, optional=True),`
`337`	`336`	`)`