From 14a349ba5c53d07507c21d90fd8294247519f896 Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Fri, 15 May 2026 11:06:57 -0700
Subject: [PATCH 01/18] Check weight shape dimensions in ConvTranspose shape
 inference

---
 .../core/graph/contrib_ops/contrib_defs.cc    |  7 ++++-
 .../conv_transpose_with_dynamic_pads_test.cc  | 29 +++++++++++++++++++
 2 files changed, 35 insertions(+), 1 deletion(-)
diff --git a/onnxruntime/core/graph/contrib_ops/contrib_defs.cc b/onnxruntime/core/graph/contrib_ops/contrib_defs.cc
index a5537c7d58b05..e8b78e430a9ef 100644
--- a/onnxruntime/core/graph/contrib_ops/contrib_defs.cc
+++ b/onnxruntime/core/graph/contrib_ops/contrib_defs.cc
@@ -62,6 +62,11 @@ void convTransposeWithDynamicPadsShapeInference(InferenceContext& ctx) {
     return;  // Input tensor should have at least two dimensions.
   }
 
+  auto weight_shape = ctx.getInputType(1)->tensor_type().shape();
+  if (weight_shape.dim_size() < 2) {
+    return;  // Weight tensor should have at least two dimensions.
+  }
+
   // first dim is the batch axis and the next is the number of channels.
   size_t n_input_dims = static_cast<size_t>(input_shape.dim_size() - size_t{2});
 
@@ -147,7 +152,7 @@ void convTransposeWithDynamicPadsShapeInference(InferenceContext& ctx) {
 
   *final_output_shape->add_dim() = input_shape.dim(0);
   *final_output_shape->add_dim() =
-      ctx.getInputType(1)->tensor_type().shape().dim(1) *
+      weight_shape.dim(1) *
       group;  // channels should be the second dim of second input multiply
   // group.
 
diff --git a/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc b/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
index 092d07cc0e9a6..a6d3cb04da5a8 100644
--- a/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
+++ b/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
@@ -19,5 +19,34 @@ TEST(ContribOpTest, ConvTransposeWithDynamicPads) {
   test.AddOutput<float>("Y", {1, 1, 6, 6}, std::vector<float>{0.07368518f, -0.08925839f, -0.06627201f, 0.06301362f, 0.03732984f, -0.01919658f, -0.00628807f, -0.02817563f, -0.01472169f, 0.04392925f, -0.00689478f, -0.01549204f, 0.07957941f, -0.11459791f, -0.09505399f, 0.07681622f, 0.03604182f, -0.01853423f, -0.0270785f, -0.00680824f, -0.06650258f, 0.08004665f, 0.07918708f, -0.0724144f, 0.06256775f, -0.17838378f, -0.18863615f, 0.20064656f, 0.133717f, -0.06876295f, -0.06398046f, -0.00864975f, 0.19289537f, -0.01490572f, -0.13673618f, 0.01949645f});
   test.Run();
 }
+
+// Test that a rank-0 W input is gracefully rejected rather than causing undefined behavior.
+TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidWeightRank0) {
+  OpTester test("ConvTransposeWithDynamicPads", 1, onnxruntime::kMSDomain);
+  test.AddAttribute("kernel_shape", std::vector<int64_t>{3, 3});
+  test.AddAttribute("strides", std::vector<int64_t>{2, 2});
+  test.AddAttribute("dilations", std::vector<int64_t>{1, 1});
+
+  test.AddInput<float>("X", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<float>("W", {}, std::vector<float>{1.0f});  // scalar (rank 0)
+  test.AddInput<int64_t>("Pads", {4}, std::vector<int64_t>{1, 1, 1, 1});
+  test.AddOutput<float>("Y", {}, std::vector<float>{0.0f});
+  test.Run(OpTester::ExpectResult::kExpectFailure, "", {kTensorrtExecutionProvider});
+}
+
+// Test that a rank-1 W input is gracefully rejected.
+TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidWeightRank1) {
+  OpTester test("ConvTransposeWithDynamicPads", 1, onnxruntime::kMSDomain);
+  test.AddAttribute("kernel_shape", std::vector<int64_t>{3, 3});
+  test.AddAttribute("strides", std::vector<int64_t>{2, 2});
+  test.AddAttribute("dilations", std::vector<int64_t>{1, 1});
+
+  test.AddInput<float>("X", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<float>("W", {9}, std::vector<float>(9, 1.0f));  // rank 1
+  test.AddInput<int64_t>("Pads", {4}, std::vector<int64_t>{1, 1, 1, 1});
+  test.AddOutput<float>("Y", {}, std::vector<float>{0.0f});
+  test.Run(OpTester::ExpectResult::kExpectFailure, "", {kTensorrtExecutionProvider});
+}
+
 }  // namespace test
 }  // namespace onnxruntime

From e95efd2d60dad46eb19d0e7251f3ceeaa2af614d Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Fri, 15 May 2026 11:52:02 -0700
Subject: [PATCH 02/18] Address specification and validation gaps

---
 .../core/providers/cpu/nn/conv_transpose.cc   |   8 +-
 .../cpu/nn/conv_transpose_attributes.h        | 110 +++++++++++++++---
 .../core/providers/cuda/nn/conv_transpose.cc  |  19 ++-
 .../providers/webgpu/nn/conv_transpose.cc     |   2 +-
 .../core/providers/xnnpack/nn/conv_base.cc    |   4 +-
 .../conv_transpose_with_dynamic_pads_test.cc  |   3 +
 .../cpu/nn/conv_transpose_op_test.cc          |  69 +++++++++++
 7 files changed, 189 insertions(+), 26 deletions(-)

diff --git a/onnxruntime/core/providers/cpu/nn/conv_transpose.cc b/onnxruntime/core/providers/cpu/nn/conv_transpose.cc
index bbb530d037cec..04e70d71c28cb 100644
--- a/onnxruntime/core/providers/cpu/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/cpu/nn/conv_transpose.cc
@@ -76,16 +76,18 @@ Status ConvTranspose<float>::PrePack(const Tensor& tensor, int input_idx, Alloca
     size_t packed_filter_data_size = SafeInt<size_t>(packed_elements_per_group) * sizeof(float) * conv_transpose_attrs_.group;
     auto* packed_filter_data = alloc->Alloc(packed_filter_data_size);
 
+    // Wrap in BufferUniquePtr immediately to prevent leaks if MlasTranspose throws.
+    // We must capture a copy of alloc before moving it into the deleter.
+    transposed_filter_ = BufferUniquePtr(packed_filter_data, BufferDeleter(alloc));
+
     // Initialize memory to 0 as there could be some padding associated with pre-packed
     // buffer memory and we don not want it uninitialized and generate different hashes
     // if and when we try to cache this pre-packed buffer for sharing between sessions.
     memset(packed_filter_data, 0, packed_filter_data_size);
 
-    transposed_filter_ = BufferUniquePtr(packed_filter_data, BufferDeleter(std::move(alloc)));
-
     for (int64_t group_id = 0; group_id < conv_transpose_attrs_.group; ++group_id) {
       MlasTranspose(tensor.Data<float>() + (group_id * N * K),
-                    ((float*)packed_filter_data) + (group_id * packed_elements_per_group),
+                    static_cast<float*>(packed_filter_data) + (group_id * packed_elements_per_group),
                     K, N, nullptr);
     }
 
diff --git a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
index 4ca90a885ea96..c2a91eb681138 100644
--- a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
+++ b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
@@ -19,6 +19,7 @@
 #pragma once
 
 #include "core/providers/cpu/nn/conv_attributes.h"
+#include "core/common/safeint.h"
 
 namespace onnxruntime {
 
@@ -61,6 +62,21 @@ struct ConvTransposeAttributes : public ConvAttributes {
     const Tensor* B = has_bias ? (dynamic_padding ? context->Input<Tensor>(3) : context->Input<Tensor>(2)) : nullptr;
 
     const int rank = static_cast<int>(X->Shape().NumDimensions());
+
+    // ConvTranspose requires X shape (N x C x D1...Dn) and W shape (C x M/group x k1...kn),
+    // both must have at least 3 dimensions.
+    if (rank < 3) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "Input X must have at least 3 dimensions (N x C x D1...Dn).",
+                             " X: ", X->Shape().ToString().c_str());
+    }
+
+    if (static_cast<int>(F_Shape.NumDimensions()) < 3) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "Filter W must have at least 3 dimensions (C x M/group x k1...kn).",
+                             " W: ", F_Shape.ToString().c_str());
+    }
+
     TensorShape input_shape = X->Shape().Slice(is_nhwc ? 1 : 2, is_nhwc ? rank - 1 : rank);
     const int64_t num_input_channels = is_nhwc ? X->Shape()[rank - 1] : X->Shape()[1];
     const int64_t N = X->Shape()[0];
@@ -119,10 +135,22 @@ struct ConvTransposeAttributes : public ConvAttributes {
     if (local_output_padding.empty()) {
       local_output_padding.resize(kernel_shape.size(), 0);
     }
+    if (local_output_padding.size() != kernel_shape.size()) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "output_padding size (", local_output_padding.size(),
+                             ") does not match the number of spatial dimensions (", kernel_shape.size(), ").");
+    }
     ConvPadVector local_pads;
     local_pads.reserve(2 * (input_shape.NumDimensions()));
     if (dynamic_padding) {
-      for (int64_t i = 0; i < Pads->Shape().SizeFromDimension(0); ++i) {
+      const int64_t expected_pads_size = static_cast<int64_t>(kernel_shape.size()) * 2;
+      const int64_t actual_pads_size = Pads->Shape().SizeFromDimension(0);
+      if (actual_pads_size != expected_pads_size) {
+        return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                               "Dynamic pads tensor size (", actual_pads_size,
+                               ") does not match expected size (2 * spatial_dims = ", expected_pads_size, ").");
+      }
+      for (int64_t i = 0; i < actual_pads_size; ++i) {
         local_pads.push_back(Pads->Data<int64_t>()[i]);
       }
     } else {
@@ -140,10 +168,23 @@ struct ConvTransposeAttributes : public ConvAttributes {
       local_strides.resize(kernel_shape.size(), 1);
     }
 
+    // ONNX spec: "output_padding[i] should be less than max(stride[i], dilation[i])".
+    // This constraint ensures the output_padding is unambiguous — larger values would shift
+    // the output by more than one stride/dilation step, making the inverse of Conv ill-defined.
+    for (size_t i = 0; i < local_output_padding.size(); ++i) {
+      int64_t limit = std::max(local_strides[i], local_dilations[i]);
+      if (local_output_padding[i] >= limit) {
+        return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                               "output_padding[", i, "] (", local_output_padding[i],
+                               ") must be less than max(stride, dilation) (", limit,
+                               ") for spatial dimension ", i, ".");
+      }
+    }
+
     TensorShapeVector Y_dims;
 
-    ComputePadsAndOutputShape(input_shape, num_output_channels, kernel_shape,
-                              local_strides, local_dilations, local_output_padding, N, &local_pads, &Y_dims, is_nhwc);
+    ORT_RETURN_IF_ERROR(ComputePadsAndOutputShape(input_shape, num_output_channels, kernel_shape,
+                                                  local_strides, local_dilations, local_output_padding, N, &local_pads, &Y_dims, is_nhwc));
     TensorShape Yshape(Y_dims);
     Tensor* Y = context->Output(0, Yshape);
 
@@ -162,19 +203,27 @@ struct ConvTransposeAttributes : public ConvAttributes {
     return Status::OK();
   }
 
-  void ComputePadsAndOutputShape(TensorShape input_shape, int64_t output_channel,
-                                 const TensorShapeVector& kernel_shape, const TensorShapeVector& p_strides,
-                                 const TensorShapeVector& p_dilations, const TensorShapeVector& p_output_padding, const int64_t N,
-                                 ConvPadVector* p_pads, TensorShapeVector* output_shape_p,
-                                 bool is_nhwc = false) const {
+  Status ComputePadsAndOutputShape(TensorShape input_shape, int64_t output_channel,
+                                   const TensorShapeVector& kernel_shape, const TensorShapeVector& p_strides,
+                                   const TensorShapeVector& p_dilations, const TensorShapeVector& p_output_padding, const int64_t N,
+                                   ConvPadVector* p_pads, TensorShapeVector* output_shape_p,
+                                   bool is_nhwc = false) const {
     size_t output_shape_size = output_shape.size();
+    size_t rank = input_shape.NumDimensions();
+
+    // output_shape attribute, if specified, must have either 'rank' or 'rank + 2' elements
+    if (output_shape_size != 0 && output_shape_size != rank && output_shape_size != rank + 2) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "output_shape attribute has ", output_shape_size,
+                             " elements, expected ", rank, " or ", rank + 2, ".");
+    }
+
     if (is_nhwc) {
       output_shape_p->insert(output_shape_p->begin(), {N});
     } else {
       output_shape_p->insert(output_shape_p->begin(), {N, output_channel});
     }
 
-    size_t rank = input_shape.NumDimensions();
     for (size_t dim = 0; dim < rank; ++dim) {
       int64_t dim_size = -1;
 
@@ -182,7 +231,7 @@ struct ConvTransposeAttributes : public ConvAttributes {
         dim_size = output_shape_size == rank ? output_shape[dim] : output_shape[dim + 2];
       }
 
-      ComputeTransposePadAndOutputShape(
+      ORT_RETURN_IF_ERROR(ComputeTransposePadAndOutputShape(
           input_shape[dim],
           p_strides[dim],
           kernel_shape[dim],
@@ -191,21 +240,26 @@ struct ConvTransposeAttributes : public ConvAttributes {
           auto_pad,
           &p_pads->at(dim),
           &p_pads->at(input_shape.NumDimensions() + dim),
-          &dim_size);
+          &dim_size));
 
-      ORT_ENFORCE(dim_size > 0, "Invalid input shape: ", input_shape.ToString());
+      if (dim_size <= 0) {
+        return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                               "Computed output dimension is <= 0 for dim ", dim,
+                               ". Input shape: ", input_shape.ToString());
+      }
       output_shape_p->push_back(dim_size);
     }
     if (is_nhwc) {
       output_shape_p->push_back(output_channel);
     }
+    return Status::OK();
   }
 
   TensorShapeVector output_padding;
   TensorShapeVector output_shape;
 
  private:
-  void ComputeTransposePadAndOutputShape(
+  Status ComputeTransposePadAndOutputShape(
       const int64_t in_size,
       const int64_t stride,
       const int64_t kernel,
@@ -217,12 +271,15 @@ struct ConvTransposeAttributes : public ConvAttributes {
       int64_t* out_size) const {
     // Output shape is explicitly provided - pad values will have to be computed
     if (*out_size != -1) {
-      ORT_ENFORCE(*out_size >= 0);
+      if (*out_size < 0) {
+        return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                               "Explicit output size is negative: ", *out_size);
+      }
       // total pad
       auto total_pad = ComputeTotalPad(in_size, stride, adj,
                                        kernel, dilation, *out_size);
       DistributePadding(pad_type, total_pad, *pad_head, *pad_tail);
-      return;
+      return Status::OK();
     }
 
     // Output shape is not provided - it needs to be computed along with pad values (if applicable)
@@ -231,13 +288,30 @@ struct ConvTransposeAttributes : public ConvAttributes {
     if (pad_type == AutoPadType::SAME_UPPER || pad_type == AutoPadType::SAME_LOWER) {
       // The ONNX spec says if `auto_pad` attribute is set, pad until the `out_size`
       // is `in_size * stride`
+      int64_t auto_out_size = 0;
+      ORT_RETURN_IF_NOT(SafeMultiply(in_size, stride, auto_out_size),
+                        "Integer overflow computing auto_pad output size: in_size=", in_size,
+                        " stride=", stride);
       auto total_pad = ComputeTotalPad(in_size, stride, adj,
-                                       kernel, dilation, /*out_size = */ in_size * stride);
+                                       kernel, dilation, auto_out_size);
       DistributePadding(pad_type, total_pad, *pad_head, *pad_tail);
     }
 
-    *out_size =
-        (in_size - 1) * stride + adj + (kernel - 1) * dilation + 1 - *pad_head - *pad_tail;
+    // *out_size = (in_size - 1) * stride + adj + (kernel - 1) * dilation + 1 - *pad_head - *pad_tail
+    // Use checked arithmetic to detect overflow from adversarial inputs.
+    int64_t term1 = 0, term2 = 0, result = 0;
+    ORT_RETURN_IF_NOT(SafeMultiply(in_size - 1, stride, term1),
+                      "Integer overflow in output size computation.");
+    ORT_RETURN_IF_NOT(SafeMultiply(kernel - 1, dilation, term2),
+                      "Integer overflow in output size computation.");
+    ORT_RETURN_IF_NOT(SafeAdd(term1, adj, result) &&
+                          SafeAdd(result, term2, result) &&
+                          SafeAdd(result, static_cast<int64_t>(1), result) &&
+                          SafeSubtract(result, *pad_head, result) &&
+                          SafeSubtract(result, *pad_tail, result),
+                      "Integer overflow in output size computation.");
+    *out_size = result;
+    return Status::OK();
   }
 };
 
diff --git a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
index 808c0352e69c9..a9b864e01876d 100644
--- a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
@@ -283,6 +283,21 @@ Status ConvTranspose<T, Layout>::UpdateState(OpKernelContext* context, bool dyna
     // The following code is from ConvTransposeAttributes::PrepareForCompute
 
     const int rank = static_cast<int>(X->Shape().NumDimensions());
+
+    // ConvTranspose requires X shape (N x C x D1...Dn) and W shape (C x M/group x k1...kn),
+    // both must have at least 3 dimensions.
+    if (rank < 3) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "Input X must have at least 3 dimensions (N x C x D1...Dn).",
+                             " X: ", X->Shape().ToString().c_str());
+    }
+
+    if (static_cast<int>(w_shape.NumDimensions()) < 3) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "Filter W must have at least 3 dimensions (C x M/group x k1...kn).",
+                             " W: ", w_shape.ToString().c_str());
+    }
+
     TensorShape input_shape = X->Shape().Slice(channels_last ? 1 : 2, channels_last ? rank - 1 : rank);
     const int64_t num_input_channels = channels_last ? X->Shape()[rank - 1] : X->Shape()[1];
     const int64_t N = X->Shape()[0];
@@ -359,8 +374,8 @@ Status ConvTranspose<T, Layout>::UpdateState(OpKernelContext* context, bool dyna
 
     TensorShapeVector y_dims;
 
-    conv_transpose_attrs_.ComputePadsAndOutputShape(input_shape, num_output_channels, kernel_shape,
-                                                    strides, dilations, local_output_padding, N, &pads, &y_dims, channels_last);
+    ORT_RETURN_IF_ERROR(conv_transpose_attrs_.ComputePadsAndOutputShape(input_shape, num_output_channels, kernel_shape,
+                                                                        strides, dilations, local_output_padding, N, &pads, &y_dims, channels_last));
 
     s_.y_dims = gsl::make_span(y_dims);
     s_.Y = context->Output(0, s_.y_dims);
diff --git a/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc b/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc
index 488fc75382040..8a3dad9aa26d5 100644
--- a/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc
@@ -45,7 +45,7 @@ Status ConvTranspose<is_channels_last>::ComputeInternal(ComputeContext& context)
   auto num_output_channels = group * filter_shape[1];
   auto batch_size = input_shape[0];
   TensorShapeVector output_shape_vector;
-  conv_transpose_attrs_.ComputePadsAndOutputShape(input_spacial_shape, num_output_channels, kernel_shape_vector, local_strides, local_dilations, local_output_padding, batch_size, &local_pads, &output_shape_vector, is_channels_last);
+  ORT_RETURN_IF_ERROR(conv_transpose_attrs_.ComputePadsAndOutputShape(input_spacial_shape, num_output_channels, kernel_shape_vector, local_strides, local_dilations, local_output_padding, batch_size, &local_pads, &output_shape_vector, is_channels_last));
   TensorShape computed_output_shape(output_shape_vector);
   std::vector<uint32_t> strides;
   std::vector<uint32_t> pads;
diff --git a/onnxruntime/core/providers/xnnpack/nn/conv_base.cc b/onnxruntime/core/providers/xnnpack/nn/conv_base.cc
index 9742f397315a7..724734bc91051 100644
--- a/onnxruntime/core/providers/xnnpack/nn/conv_base.cc
+++ b/onnxruntime/core/providers/xnnpack/nn/conv_base.cc
@@ -491,10 +491,10 @@ ConvBase::ConvBase(const OpKernelInfo& info, bool is_transpose)
       conv_transpose_attrs_.output_padding.resize(kernel_shape_.size(), 0);
     }
 
-    conv_transpose_attrs_.ComputePadsAndOutputShape(
+    ORT_THROW_IF_ERROR(conv_transpose_attrs_.ComputePadsAndOutputShape(
         input_shape, M_, kernel_shape_,
         conv_transpose_attrs_.strides, conv_transpose_attrs_.dilations,
-        conv_transpose_attrs_.output_padding, 1, &conv_transpose_attrs_.pads, &output_shape_);
+        conv_transpose_attrs_.output_padding, 1, &conv_transpose_attrs_.pads, &output_shape_));
 
     output_shape_[1] = output_shape_[2];
     if (rank == 4) {
diff --git a/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc b/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
index a6d3cb04da5a8..3fc2f0a1b2588 100644
--- a/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
+++ b/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
@@ -31,6 +31,8 @@ TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidWeightRank0) {
   test.AddInput<float>("W", {}, std::vector<float>{1.0f});  // scalar (rank 0)
   test.AddInput<int64_t>("Pads", {4}, std::vector<int64_t>{1, 1, 1, 1});
   test.AddOutput<float>("Y", {}, std::vector<float>{0.0f});
+  // Skip ONNX shape inference to avoid potential crashes on invalid-rank inputs.
+  test.AddShapeToTensorData(false);
   test.Run(OpTester::ExpectResult::kExpectFailure, "", {kTensorrtExecutionProvider});
 }
 
@@ -45,6 +47,7 @@ TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidWeightRank1) {
   test.AddInput<float>("W", {9}, std::vector<float>(9, 1.0f));  // rank 1
   test.AddInput<int64_t>("Pads", {4}, std::vector<int64_t>{1, 1, 1, 1});
   test.AddOutput<float>("Y", {}, std::vector<float>{0.0f});
+  test.AddShapeToTensorData(false);
   test.Run(OpTester::ExpectResult::kExpectFailure, "", {kTensorrtExecutionProvider});
 }
 
diff --git a/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc b/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc
index a3b039a9694fe..ee01d09fcd762 100644
--- a/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc
+++ b/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc
@@ -1573,5 +1573,74 @@ TEST(ConvTransposeTest, ConvTranspose_ZeroDilation_Dml) {
       .RunWithConfig();
 }
 
+TEST(ConvTransposeTest, ConvTranspose_InvalidInputRank0) {
+  OpTester test("ConvTranspose", 11);
+  test.AddInput<float>("X", {}, {1.0f});
+  test.AddInput<float>("W", {}, {1.0f});
+  test.AddOutput<float>("Y", {0}, {});
+  // Skip ONNX shape inference which may crash on invalid-rank inputs (not our code to fix).
+  test.AddShapeToTensorData(false);
+
+  test.Run(OpTester::ExpectResult::kExpectFailure, "at least 3 dimensions",
+           {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
+}
+
+TEST(ConvTransposeTest, ConvTranspose_InvalidInputRank1) {
+  OpTester test("ConvTranspose", 11);
+  test.AddInput<float>("X", {2}, {1.0f, 2.0f});
+  test.AddInput<float>("W", {2}, {1.0f, 2.0f});
+  test.AddOutput<float>("Y", {0}, {});
+  test.AddShapeToTensorData(false);
+
+  test.Run(OpTester::ExpectResult::kExpectFailure, "at least 3 dimensions",
+           {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
+}
+
+TEST(ConvTransposeTest, ConvTranspose_InvalidInputRank2) {
+  OpTester test("ConvTranspose", 11);
+  test.AddInput<float>("X", {1, 1}, {1.0f});
+  test.AddInput<float>("W", {1, 1}, {1.0f});
+  test.AddOutput<float>("Y", {0}, {});
+  test.AddShapeToTensorData(false);
+
+  test.Run(OpTester::ExpectResult::kExpectFailure, "at least 3 dimensions",
+           {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
+}
+
+TEST(ConvTransposeTest, ConvTranspose_InvalidWeightRank0) {
+  OpTester test("ConvTranspose", 11);
+  test.AddInput<float>("X", {1, 1, 3}, {1.0f, 2.0f, 3.0f});
+  test.AddInput<float>("W", {}, {1.0f});
+  test.AddOutput<float>("Y", {0}, {});
+  test.AddShapeToTensorData(false);
+
+  test.Run(OpTester::ExpectResult::kExpectFailure, "at least 3 dimensions",
+           {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
+}
+
+TEST(ConvTransposeTest, ConvTranspose_InvalidOutputPaddingSize) {
+  OpTester test("ConvTranspose", 11);
+  test.AddAttribute("output_padding", std::vector<int64_t>{0, 0, 0});  // 3 values for 2D spatial
+  test.AddInput<float>("X", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<float>("W", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddOutput<float>("Y", {0}, {});
+
+  test.Run(OpTester::ExpectResult::kExpectFailure, "output_padding size",
+           {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
+}
+
+TEST(ConvTransposeTest, ConvTranspose_OutputPaddingExceedsStride) {
+  OpTester test("ConvTranspose", 11);
+  // output_padding[i] must be < max(stride[i], dilation[i]). stride=2, so output_padding must be < 2.
+  test.AddAttribute("strides", std::vector<int64_t>{2, 2});
+  test.AddAttribute("output_padding", std::vector<int64_t>{2, 2});
+  test.AddInput<float>("X", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<float>("W", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddOutput<float>("Y", {0}, {});
+
+  test.Run(OpTester::ExpectResult::kExpectFailure, "output_padding",
+           {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
+}
+
 }  // namespace test
 }  // namespace onnxruntime

From 1bf6435834355a69f3d233d5e6ddee50f47827a4 Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Fri, 15 May 2026 12:13:40 -0700
Subject: [PATCH 03/18] Make inference throw

---
 onnxruntime/core/graph/contrib_ops/contrib_defs.cc  |  4 ++--
 .../conv_transpose_with_dynamic_pads_test.cc        | 13 ++++++++-----
 2 files changed, 10 insertions(+), 7 deletions(-)

diff --git a/onnxruntime/core/graph/contrib_ops/contrib_defs.cc b/onnxruntime/core/graph/contrib_ops/contrib_defs.cc
index e8b78e430a9ef..5456556df8a9e 100644
--- a/onnxruntime/core/graph/contrib_ops/contrib_defs.cc
+++ b/onnxruntime/core/graph/contrib_ops/contrib_defs.cc
@@ -59,12 +59,12 @@ void convTransposeWithDynamicPadsShapeInference(InferenceContext& ctx) {
 
   auto input_shape = ctx.getInputType(0)->tensor_type().shape();
   if (input_shape.dim_size() < 2) {
-    return;  // Input tensor should have at least two dimensions.
+    fail_shape_inference("Input tensor must have at least 2 dimensions. Got: ", input_shape.dim_size());
   }
 
   auto weight_shape = ctx.getInputType(1)->tensor_type().shape();
   if (weight_shape.dim_size() < 2) {
-    return;  // Weight tensor should have at least two dimensions.
+    fail_shape_inference("Weight tensor must have at least 2 dimensions. Got: ", weight_shape.dim_size());
   }
 
   // first dim is the batch axis and the next is the number of channels.
diff --git a/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc b/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
index 3fc2f0a1b2588..a838b3885e067 100644
--- a/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
+++ b/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
@@ -21,6 +21,9 @@ TEST(ContribOpTest, ConvTransposeWithDynamicPads) {
 }
 
 // Test that a rank-0 W input is gracefully rejected rather than causing undefined behavior.
+// These tests exercise shape inference which uses fail_shape_inference (throws InferenceError).
+// In no-exception builds, fail_shape_inference calls abort(), so these tests must be skipped.
+#ifndef ORT_NO_EXCEPTIONS
 TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidWeightRank0) {
   OpTester test("ConvTransposeWithDynamicPads", 1, onnxruntime::kMSDomain);
   test.AddAttribute("kernel_shape", std::vector<int64_t>{3, 3});
@@ -31,9 +34,8 @@ TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidWeightRank0) {
   test.AddInput<float>("W", {}, std::vector<float>{1.0f});  // scalar (rank 0)
   test.AddInput<int64_t>("Pads", {4}, std::vector<int64_t>{1, 1, 1, 1});
   test.AddOutput<float>("Y", {}, std::vector<float>{0.0f});
-  // Skip ONNX shape inference to avoid potential crashes on invalid-rank inputs.
-  test.AddShapeToTensorData(false);
-  test.Run(OpTester::ExpectResult::kExpectFailure, "", {kTensorrtExecutionProvider});
+  test.Run(OpTester::ExpectResult::kExpectFailure, "Weight tensor must have at least 2 dimensions",
+           {kTensorrtExecutionProvider});
 }
 
 // Test that a rank-1 W input is gracefully rejected.
@@ -47,9 +49,10 @@ TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidWeightRank1) {
   test.AddInput<float>("W", {9}, std::vector<float>(9, 1.0f));  // rank 1
   test.AddInput<int64_t>("Pads", {4}, std::vector<int64_t>{1, 1, 1, 1});
   test.AddOutput<float>("Y", {}, std::vector<float>{0.0f});
-  test.AddShapeToTensorData(false);
-  test.Run(OpTester::ExpectResult::kExpectFailure, "", {kTensorrtExecutionProvider});
+  test.Run(OpTester::ExpectResult::kExpectFailure, "Weight tensor must have at least 2 dimensions",
+           {kTensorrtExecutionProvider});
 }
+#endif  // !ORT_NO_EXCEPTIONS
 
 }  // namespace test
 }  // namespace onnxruntime

From 4c9669ebe8eca931267e29603ebe660a6641f254 Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Mon, 18 May 2026 11:24:58 -0700
Subject: [PATCH 04/18] Address SafeInt<> comments

---
 .../cpu/nn/conv_transpose_attributes.h        | 22 +++++--------------
 1 file changed, 5 insertions(+), 17 deletions(-)

diff --git a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
index c2a91eb681138..4f0cb71fed424 100644
--- a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
+++ b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
@@ -288,29 +288,17 @@ struct ConvTransposeAttributes : public ConvAttributes {
     if (pad_type == AutoPadType::SAME_UPPER || pad_type == AutoPadType::SAME_LOWER) {
       // The ONNX spec says if `auto_pad` attribute is set, pad until the `out_size`
       // is `in_size * stride`
-      int64_t auto_out_size = 0;
-      ORT_RETURN_IF_NOT(SafeMultiply(in_size, stride, auto_out_size),
-                        "Integer overflow computing auto_pad output size: in_size=", in_size,
-                        " stride=", stride);
+      int64_t auto_out_size = SafeInt<int64_t>(in_size) * stride;
       auto total_pad = ComputeTotalPad(in_size, stride, adj,
                                        kernel, dilation, auto_out_size);
       DistributePadding(pad_type, total_pad, *pad_head, *pad_tail);
     }
 
     // *out_size = (in_size - 1) * stride + adj + (kernel - 1) * dilation + 1 - *pad_head - *pad_tail
-    // Use checked arithmetic to detect overflow from adversarial inputs.
-    int64_t term1 = 0, term2 = 0, result = 0;
-    ORT_RETURN_IF_NOT(SafeMultiply(in_size - 1, stride, term1),
-                      "Integer overflow in output size computation.");
-    ORT_RETURN_IF_NOT(SafeMultiply(kernel - 1, dilation, term2),
-                      "Integer overflow in output size computation.");
-    ORT_RETURN_IF_NOT(SafeAdd(term1, adj, result) &&
-                          SafeAdd(result, term2, result) &&
-                          SafeAdd(result, static_cast<int64_t>(1), result) &&
-                          SafeSubtract(result, *pad_head, result) &&
-                          SafeSubtract(result, *pad_tail, result),
-                      "Integer overflow in output size computation.");
-    *out_size = result;
+    // SafeInt throws OnnxRuntimeException on overflow from adversarial inputs.
+    *out_size = SafeInt<int64_t>(in_size - 1) * stride + adj +
+                SafeInt<int64_t>(kernel - 1) * dilation + 1 -
+                *pad_head - *pad_tail;
     return Status::OK();
   }
 };

From 147d2df196a14939d95b1dccc939a4104d43a33b Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Mon, 18 May 2026 11:50:55 -0700
Subject: [PATCH 05/18] Fix test issues

---
 .../test/providers/cpu/nn/conv_transpose_op_test.cc   | 11 ++++++-----
 1 file changed, 6 insertions(+), 5 deletions(-)

diff --git a/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc b/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc
index ee01d09fcd762..f6824e2b9b8fc 100644
--- a/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc
+++ b/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc
@@ -1575,11 +1575,12 @@ TEST(ConvTransposeTest, ConvTranspose_ZeroDilation_Dml) {
 
 TEST(ConvTransposeTest, ConvTranspose_InvalidInputRank0) {
   OpTester test("ConvTranspose", 11);
+  // Skip ONNX shape inference which may crash on invalid-rank inputs (not our code to fix).
+  // Must be set before AddInput/AddOutput so type protos are built without shape info.
+  test.AddShapeToTensorData(false);
   test.AddInput<float>("X", {}, {1.0f});
   test.AddInput<float>("W", {}, {1.0f});
   test.AddOutput<float>("Y", {0}, {});
-  // Skip ONNX shape inference which may crash on invalid-rank inputs (not our code to fix).
-  test.AddShapeToTensorData(false);
 
   test.Run(OpTester::ExpectResult::kExpectFailure, "at least 3 dimensions",
            {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
@@ -1587,10 +1588,10 @@ TEST(ConvTransposeTest, ConvTranspose_InvalidInputRank0) {
 
 TEST(ConvTransposeTest, ConvTranspose_InvalidInputRank1) {
   OpTester test("ConvTranspose", 11);
+  test.AddShapeToTensorData(false);
   test.AddInput<float>("X", {2}, {1.0f, 2.0f});
   test.AddInput<float>("W", {2}, {1.0f, 2.0f});
   test.AddOutput<float>("Y", {0}, {});
-  test.AddShapeToTensorData(false);
 
   test.Run(OpTester::ExpectResult::kExpectFailure, "at least 3 dimensions",
            {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
@@ -1598,10 +1599,10 @@ TEST(ConvTransposeTest, ConvTranspose_InvalidInputRank1) {
 
 TEST(ConvTransposeTest, ConvTranspose_InvalidInputRank2) {
   OpTester test("ConvTranspose", 11);
+  test.AddShapeToTensorData(false);
   test.AddInput<float>("X", {1, 1}, {1.0f});
   test.AddInput<float>("W", {1, 1}, {1.0f});
   test.AddOutput<float>("Y", {0}, {});
-  test.AddShapeToTensorData(false);
 
   test.Run(OpTester::ExpectResult::kExpectFailure, "at least 3 dimensions",
            {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
@@ -1609,10 +1610,10 @@ TEST(ConvTransposeTest, ConvTranspose_InvalidInputRank2) {
 
 TEST(ConvTransposeTest, ConvTranspose_InvalidWeightRank0) {
   OpTester test("ConvTranspose", 11);
+  test.AddShapeToTensorData(false);
   test.AddInput<float>("X", {1, 1, 3}, {1.0f, 2.0f, 3.0f});
   test.AddInput<float>("W", {}, {1.0f});
   test.AddOutput<float>("Y", {0}, {});
-  test.AddShapeToTensorData(false);
 
   test.Run(OpTester::ExpectResult::kExpectFailure, "at least 3 dimensions",
            {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});

From 1a3acddb14b775ded3d6102a619145d9e4946985 Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Mon, 18 May 2026 12:19:06 -0700
Subject: [PATCH 06/18] Fix test issues

---
 onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc b/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc
index f6824e2b9b8fc..607d253e75e0c 100644
--- a/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc
+++ b/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc
@@ -1621,6 +1621,7 @@ TEST(ConvTransposeTest, ConvTranspose_InvalidWeightRank0) {
 
 TEST(ConvTransposeTest, ConvTranspose_InvalidOutputPaddingSize) {
   OpTester test("ConvTranspose", 11);
+  test.AddShapeToTensorData(false);
   test.AddAttribute("output_padding", std::vector<int64_t>{0, 0, 0});  // 3 values for 2D spatial
   test.AddInput<float>("X", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
   test.AddInput<float>("W", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
@@ -1632,6 +1633,7 @@ TEST(ConvTransposeTest, ConvTranspose_InvalidOutputPaddingSize) {
 
 TEST(ConvTransposeTest, ConvTranspose_OutputPaddingExceedsStride) {
   OpTester test("ConvTranspose", 11);
+  test.AddShapeToTensorData(false);
   // output_padding[i] must be < max(stride[i], dilation[i]). stride=2, so output_padding must be < 2.
   test.AddAttribute("strides", std::vector<int64_t>{2, 2});
   test.AddAttribute("output_padding", std::vector<int64_t>{2, 2});

From 8374b8cfd51394cb6408d7aababc34ae7bc2f898 Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Mon, 18 May 2026 14:06:58 -0700
Subject: [PATCH 07/18] Fix test EP test issues

---
 .../core/providers/cuda/nn/conv_transpose.cc  | 33 ++++++++++---------
 .../providers/webgpu/nn/conv_transpose.cc     | 14 +++++++-
 .../cuda/nhwc/conv_transpose_test.cc          |  9 +++--
 3 files changed, 34 insertions(+), 22 deletions(-)

diff --git a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
index a9b864e01876d..610f9af3c1184 100644
--- a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
@@ -270,6 +270,23 @@ Status ConvTranspose<T, Layout>::UpdateState(OpKernelContext* context, bool dyna
 
   const Tensor* Pads = dynamic_padding ? context->Input<Tensor>(2) : nullptr;
 
+  // ConvTranspose requires X shape (N x C x D1...Dn) and W shape (C x M/group x k1...kn),
+  // both must have at least 3 dimensions. Check before dims-changed comparison because
+  // a scalar (rank 0) has empty dims which matches the default-initialized last_x_dims,
+  // causing the validation block to be skipped entirely.
+  const int rank = static_cast<int>(x_shape.NumDimensions());
+  if (rank < 3) {
+    return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                           "Input X must have at least 3 dimensions (N x C x D1...Dn).",
+                           " X: ", x_shape.ToString().c_str());
+  }
+
+  if (static_cast<int>(w_shape.NumDimensions()) < 3) {
+    return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                           "Filter W must have at least 3 dimensions (C x M/group x k1...kn).",
+                           " W: ", w_shape.ToString().c_str());
+  }
+
   bool input_dims_changed = (s_.last_x_dims != x_dims);
   bool w_dims_changed = (s_.last_w_dims != w_dims);
   if (input_dims_changed || w_dims_changed) {
@@ -282,22 +299,6 @@ Status ConvTranspose<T, Layout>::UpdateState(OpKernelContext* context, bool dyna
 
     // The following code is from ConvTransposeAttributes::PrepareForCompute
 
-    const int rank = static_cast<int>(X->Shape().NumDimensions());
-
-    // ConvTranspose requires X shape (N x C x D1...Dn) and W shape (C x M/group x k1...kn),
-    // both must have at least 3 dimensions.
-    if (rank < 3) {
-      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
-                             "Input X must have at least 3 dimensions (N x C x D1...Dn).",
-                             " X: ", X->Shape().ToString().c_str());
-    }
-
-    if (static_cast<int>(w_shape.NumDimensions()) < 3) {
-      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
-                             "Filter W must have at least 3 dimensions (C x M/group x k1...kn).",
-                             " W: ", w_shape.ToString().c_str());
-    }
-
     TensorShape input_shape = X->Shape().Slice(channels_last ? 1 : 2, channels_last ? rank - 1 : rank);
     const int64_t num_input_channels = channels_last ? X->Shape()[rank - 1] : X->Shape()[1];
     const int64_t N = X->Shape()[0];
diff --git a/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc b/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc
index 8a3dad9aa26d5..7ceefb932f2ff 100644
--- a/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc
@@ -19,13 +19,25 @@ Status ConvTranspose<is_channels_last>::ComputeInternal(ComputeContext& context)
   const auto* filter = context.Input<Tensor>(1);
   TensorShape input_shape = input->Shape();
   TensorShape filter_shape = filter->Shape();
+
+  const auto rank = input_shape.NumDimensions();
+  if (rank < 3) {
+    return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                           "Input X must have at least 3 dimensions (N x C x D1...Dn).",
+                           " X: ", input_shape.ToString().c_str());
+  }
+  if (filter_shape.NumDimensions() < 3) {
+    return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                           "Filter W must have at least 3 dimensions (C x M/group x k1...kn).",
+                           " W: ", filter_shape.ToString().c_str());
+  }
+
   const InlinedVector<size_t> perm = {2, 3, 0, 1};
   TensorShapeVector local_output_padding(conv_transpose_attrs_.output_padding.begin(), conv_transpose_attrs_.output_padding.end());
   ConvAttributes::ConvPadVector local_pads(conv_transpose_attrs_.pads.begin(), conv_transpose_attrs_.pads.end());
   TensorShapeVector local_dilations(conv_transpose_attrs_.dilations.begin(), conv_transpose_attrs_.dilations.end());
   TensorShapeVector local_strides(conv_transpose_attrs_.strides.begin(), conv_transpose_attrs_.strides.end());
   TensorShapeVector kernel_shape_vector;
-  auto rank = input_shape.NumDimensions();
   TensorShape input_spacial_shape = input_shape.Slice(is_channels_last ? 1 : 2, is_channels_last ? rank - 1 : rank);
   local_pads.reserve(2 * (input_spacial_shape.NumDimensions()));
   ORT_RETURN_IF_ERROR(conv_transpose_attrs_.ComputeKernelShape(filter_shape, kernel_shape_vector, false));
diff --git a/onnxruntime/test/providers/cuda/nhwc/conv_transpose_test.cc b/onnxruntime/test/providers/cuda/nhwc/conv_transpose_test.cc
index 13a8f42e1fd4c..86a408060ee8c 100644
--- a/onnxruntime/test/providers/cuda/nhwc/conv_transpose_test.cc
+++ b/onnxruntime/test/providers/cuda/nhwc/conv_transpose_test.cc
@@ -16,7 +16,7 @@ struct ConvTransposeOp {
   bool bias = false;
   std::vector<int64_t> strides = {1, 1};
   std::vector<int64_t> padding = {0, 0, 0, 0};
-  std::vector<int64_t> output_padding = {0, 0, 0, 0};
+  std::vector<int64_t> output_padding = {0, 0};
   std::vector<int64_t> dilations = {1, 1};
 
   std::unique_ptr<CompareOpTester> get_test() {
@@ -48,8 +48,6 @@ struct ConvTransposeOp {
     test->AddAttribute("pads", padding);
     if (!output_padding.empty()) {
       test->AddAttribute("output_padding", output_padding);
-    } else {
-      output_padding = {0, 0, 0, 0};
     }
 
     // the test input is NCHW so calculate output based on that. conversion to/from NHWC is internal to execution.
@@ -58,8 +56,9 @@ struct ConvTransposeOp {
     for (size_t i = 0, end = is_1D ? 1 : 2; i < end; ++i) {
       // formula from https://github.com/onnx/onnx/blob/main/docs/Operators.md#ConvTranspose
       const size_t start_pad = i * 2;
+      int64_t out_pad = i < output_padding.size() ? output_padding[i] : 0;
       output_dims.push_back(
-          strides[i] * (input_dims[i + 2] - 1) + output_padding[i] +
+          strides[i] * (input_dims[i + 2] - 1) + out_pad +
           ((kernel_shape[i] - 1) * dilations[i] + 1) - padding[start_pad] - padding[start_pad + 1]);
     }
 
@@ -132,7 +131,7 @@ TYPED_TEST(CudaNhwcTypedTest, ConvTransposeNhwcOutPad) {
   op.kernel_shape = {3, 3};
   op.channels = 32;
   op.strides = {2, 2};
-  op.output_padding = {1, 1, 1, 1};
+  op.output_padding = {1, 1};
 
   MAKE_PROVIDERS_EPS_TYPE(TypeParam)
 }

From 8f07cadbd8fda28fe22a65f75c164191f9f9c1f3 Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Mon, 18 May 2026 14:32:21 -0700
Subject: [PATCH 08/18] Address code review

---
 onnxruntime/core/providers/cpu/nn/conv_transpose.cc | 3 +--
 1 file changed, 1 insertion(+), 2 deletions(-)

diff --git a/onnxruntime/core/providers/cpu/nn/conv_transpose.cc b/onnxruntime/core/providers/cpu/nn/conv_transpose.cc
index 04e70d71c28cb..4c3ce36f9261d 100644
--- a/onnxruntime/core/providers/cpu/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/cpu/nn/conv_transpose.cc
@@ -77,8 +77,7 @@ Status ConvTranspose<float>::PrePack(const Tensor& tensor, int input_idx, Alloca
     auto* packed_filter_data = alloc->Alloc(packed_filter_data_size);
 
     // Wrap in BufferUniquePtr immediately to prevent leaks if MlasTranspose throws.
-    // We must capture a copy of alloc before moving it into the deleter.
-    transposed_filter_ = BufferUniquePtr(packed_filter_data, BufferDeleter(alloc));
+    transposed_filter_ = BufferUniquePtr(packed_filter_data, BufferDeleter(std::move(alloc)));
 
     // Initialize memory to 0 as there could be some padding associated with pre-packed
     // buffer memory and we don not want it uninitialized and generate different hashes

From 0d1e93e75f3647ebad291b19ce39cae91c9dc4ff Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Mon, 18 May 2026 15:26:16 -0700
Subject: [PATCH 09/18] Fix test EP test issues

---
 onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc b/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc
index 607d253e75e0c..4553537219409 100644
--- a/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc
+++ b/onnxruntime/test/providers/cpu/nn/conv_transpose_op_test.cc
@@ -1628,7 +1628,7 @@ TEST(ConvTransposeTest, ConvTranspose_InvalidOutputPaddingSize) {
   test.AddOutput<float>("Y", {0}, {});
 
   test.Run(OpTester::ExpectResult::kExpectFailure, "output_padding size",
-           {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
+           {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider, kWebGpuExecutionProvider});
 }
 
 TEST(ConvTransposeTest, ConvTranspose_OutputPaddingExceedsStride) {
@@ -1642,7 +1642,7 @@ TEST(ConvTransposeTest, ConvTranspose_OutputPaddingExceedsStride) {
   test.AddOutput<float>("Y", {0}, {});
 
   test.Run(OpTester::ExpectResult::kExpectFailure, "output_padding",
-           {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
+           {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider, kWebGpuExecutionProvider});
 }
 
 }  // namespace test

From fcd39a629bae6cdc709a5578229fe4d357c1f2b4 Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Mon, 18 May 2026 16:50:35 -0700
Subject: [PATCH 10/18] Fix test EP test issues

---
 .../core/providers/cuda/nn/conv_transpose.cc     | 16 ++++++++++++++++
 1 file changed, 16 insertions(+)

diff --git a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
index 610f9af3c1184..b64c1c7fdd477 100644
--- a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
@@ -352,6 +352,11 @@ Status ConvTranspose<T, Layout>::UpdateState(OpKernelContext* context, bool dyna
     if (local_output_padding.empty()) {
       local_output_padding.resize(kernel_shape.size(), 0);
     }
+    if (local_output_padding.size() != kernel_shape.size()) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "output_padding size (", local_output_padding.size(),
+                             ") does not match the number of spatial dimensions (", kernel_shape.size(), ").");
+    }
     ConvPadVector pads;
     pads.reserve(2 * (input_shape.NumDimensions()));
     if (dynamic_padding) {
@@ -373,6 +378,17 @@ Status ConvTranspose<T, Layout>::UpdateState(OpKernelContext* context, bool dyna
       strides.resize(kernel_shape.size(), 1);
     }
 
+    // ONNX spec: "output_padding[i] should be less than max(stride[i], dilation[i])".
+    for (size_t i = 0; i < local_output_padding.size(); ++i) {
+      int64_t limit = std::max(strides[i], dilations[i]);
+      if (local_output_padding[i] >= limit) {
+        return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                               "output_padding[", i, "] (", local_output_padding[i],
+                               ") must be less than max(stride, dilation) (", limit,
+                               ") for spatial dimension ", i, ".");
+      }
+    }
+
     TensorShapeVector y_dims;
 
     ORT_RETURN_IF_ERROR(conv_transpose_attrs_.ComputePadsAndOutputShape(input_shape, num_output_channels, kernel_shape,

From 46d77b63201434995d31862698ac28d3729fa51b Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Mon, 18 May 2026 17:08:37 -0700
Subject: [PATCH 11/18] Addressing comments and merging PR#28548 into one.

---
 .../core/graph/contrib_ops/contrib_defs.cc    | 15 ++++--
 .../cpu/nn/conv_transpose_attributes.h        | 33 ++++++++++++
 .../core/providers/cuda/nn/conv_transpose.cc  | 35 +++++++++++-
 .../providers/webgpu/nn/conv_transpose.cc     | 15 ++++++
 .../core/providers/xnnpack/nn/conv_base.cc    |  3 ++
 .../conv_transpose_with_dynamic_pads_test.cc  | 54 ++++++++++++++++++-
 6 files changed, 147 insertions(+), 8 deletions(-)

diff --git a/onnxruntime/core/graph/contrib_ops/contrib_defs.cc b/onnxruntime/core/graph/contrib_ops/contrib_defs.cc
index 5456556df8a9e..50e8c017284e2 100644
--- a/onnxruntime/core/graph/contrib_ops/contrib_defs.cc
+++ b/onnxruntime/core/graph/contrib_ops/contrib_defs.cc
@@ -56,15 +56,22 @@ void convTransposeWithDynamicPadsShapeInference(InferenceContext& ctx) {
   }
 
   int64_t group = getAttribute(ctx, "group", 1);
+  if (group <= 0) {
+    fail_shape_inference("group attribute must be positive. Got: ", group);
+  }
 
   auto input_shape = ctx.getInputType(0)->tensor_type().shape();
-  if (input_shape.dim_size() < 2) {
-    fail_shape_inference("Input tensor must have at least 2 dimensions. Got: ", input_shape.dim_size());
+  // ConvTranspose requires X=(N x C x D1...Dn) and W=(C x M/group x k1...kn), both rank >= 3.
+  // The upstream ONNX ConvTranspose shape inference only checks rank >= 2, which allows rank-2
+  // inputs to pass shape inference but crash at kernel execution time. We tighten the check here
+  // to fail early at model load with a clear error. Fixing ONNX upstream is tracked separately.
+  if (input_shape.dim_size() < 3) {
+    fail_shape_inference("Input tensor must have at least 3 dimensions. Got: ", input_shape.dim_size());
   }
 
   auto weight_shape = ctx.getInputType(1)->tensor_type().shape();
-  if (weight_shape.dim_size() < 2) {
-    fail_shape_inference("Weight tensor must have at least 2 dimensions. Got: ", weight_shape.dim_size());
+  if (weight_shape.dim_size() < 3) {
+    fail_shape_inference("Weight tensor must have at least 3 dimensions. Got: ", weight_shape.dim_size());
   }
 
   // first dim is the batch axis and the next is the number of channels.
diff --git a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
index 4f0cb71fed424..5c52d5d471738 100644
--- a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
+++ b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
@@ -143,6 +143,10 @@ struct ConvTransposeAttributes : public ConvAttributes {
     ConvPadVector local_pads;
     local_pads.reserve(2 * (input_shape.NumDimensions()));
     if (dynamic_padding) {
+      if (Pads->Shape().NumDimensions() != 1) {
+        return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                               "Dynamic pads tensor must be 1-D. Got rank: ", Pads->Shape().NumDimensions());
+      }
       const int64_t expected_pads_size = static_cast<int64_t>(kernel_shape.size()) * 2;
       const int64_t actual_pads_size = Pads->Shape().SizeFromDimension(0);
       if (actual_pads_size != expected_pads_size) {
@@ -151,6 +155,10 @@ struct ConvTransposeAttributes : public ConvAttributes {
                                ") does not match expected size (2 * spatial_dims = ", expected_pads_size, ").");
       }
       for (int64_t i = 0; i < actual_pads_size; ++i) {
+        if (Pads->Data<int64_t>()[i] < 0) {
+          return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                                 "Dynamic pads must be non-negative. Got pads[", i, "] = ", Pads->Data<int64_t>()[i]);
+        }
         local_pads.push_back(Pads->Data<int64_t>()[i]);
       }
     } else {
@@ -168,6 +176,17 @@ struct ConvTransposeAttributes : public ConvAttributes {
       local_strides.resize(kernel_shape.size(), 1);
     }
 
+    if (local_strides.size() != kernel_shape.size()) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "strides size (", local_strides.size(),
+                             ") does not match the number of spatial dimensions (", kernel_shape.size(), ").");
+    }
+    if (local_dilations.size() != kernel_shape.size()) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "dilations size (", local_dilations.size(),
+                             ") does not match the number of spatial dimensions (", kernel_shape.size(), ").");
+    }
+
     // ONNX spec: "output_padding[i] should be less than max(stride[i], dilation[i])".
     // This constraint ensures the output_padding is unambiguous — larger values would shift
     // the output by more than one stride/dilation step, making the inverse of Conv ill-defined.
@@ -284,6 +303,20 @@ struct ConvTransposeAttributes : public ConvAttributes {
 
     // Output shape is not provided - it needs to be computed along with pad values (if applicable)
 
+    // Validate that stride, kernel, and dilation are positive
+    if (stride <= 0) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT, "Stride must be positive. Got: ", stride);
+    }
+    if (kernel <= 0) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT, "Kernel size must be positive. Got: ", kernel);
+    }
+    if (dilation <= 0) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT, "Dilation must be positive. Got: ", dilation);
+    }
+    if (adj < 0) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT, "Output padding must be non-negative. Got: ", adj);
+    }
+
     // Compute padding if the auto_pad attribute is SAME_UPPER/SAME_LOWER
     if (pad_type == AutoPadType::SAME_UPPER || pad_type == AutoPadType::SAME_LOWER) {
       // The ONNX spec says if `auto_pad` attribute is set, pad until the `out_size`
diff --git a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
index b64c1c7fdd477..6d2f9fa830978 100644
--- a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
@@ -289,7 +289,9 @@ Status ConvTranspose<T, Layout>::UpdateState(OpKernelContext* context, bool dyna
 
   bool input_dims_changed = (s_.last_x_dims != x_dims);
   bool w_dims_changed = (s_.last_w_dims != w_dims);
-  if (input_dims_changed || w_dims_changed) {
+  // When dynamic_padding is used, Pads can change between calls even when X/W shapes
+  // stay the same, so we must always recompute the output shape and re-validate.
+  if (input_dims_changed || w_dims_changed || dynamic_padding) {
     if (input_dims_changed)
       s_.last_x_dims = gsl::make_span(x_dims);
 
@@ -360,7 +362,25 @@ Status ConvTranspose<T, Layout>::UpdateState(OpKernelContext* context, bool dyna
     ConvPadVector pads;
     pads.reserve(2 * (input_shape.NumDimensions()));
     if (dynamic_padding) {
-      for (int64_t i = 0; i < Pads->Shape().SizeFromDimension(0); ++i) {
+      if (Pads == nullptr) {
+        return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                               "Pads input is required in dynamic padding mode.");
+      }
+      if (Pads->Shape().NumDimensions() != 1) {
+        return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                               "Pads input must be a 1-D tensor. Got rank: ", Pads->Shape().NumDimensions());
+      }
+      const int64_t expected_pads_size = static_cast<int64_t>(kernel_shape.size()) * 2;
+      if (Pads->Shape()[0] != expected_pads_size) {
+        return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                               "Pads input must have ", expected_pads_size,
+                               " elements (2 * num_spatial_dims). Got: ", Pads->Shape()[0]);
+      }
+      for (int64_t i = 0; i < Pads->Shape()[0]; ++i) {
+        if (Pads->Data<int64_t>()[i] < 0) {
+          return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                                 "Pads values must be non-negative. Got pads[", i, "] = ", Pads->Data<int64_t>()[i]);
+        }
         pads.push_back(Pads->Data<int64_t>()[i]);
       }
     } else {
@@ -378,6 +398,17 @@ Status ConvTranspose<T, Layout>::UpdateState(OpKernelContext* context, bool dyna
       strides.resize(kernel_shape.size(), 1);
     }
 
+    if (strides.size() != kernel_shape.size()) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "strides size (", strides.size(),
+                             ") does not match the number of spatial dimensions (", kernel_shape.size(), ").");
+    }
+    if (dilations.size() != kernel_shape.size()) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "dilations size (", dilations.size(),
+                             ") does not match the number of spatial dimensions (", kernel_shape.size(), ").");
+    }
+
     // ONNX spec: "output_padding[i] should be less than max(stride[i], dilation[i])".
     for (size_t i = 0; i < local_output_padding.size(); ++i) {
       int64_t limit = std::max(strides[i], dilations[i]);
diff --git a/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc b/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc
index 7ceefb932f2ff..f15d74b9643b8 100644
--- a/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc
@@ -44,6 +44,11 @@ Status ConvTranspose<is_channels_last>::ComputeInternal(ComputeContext& context)
   if (local_output_padding.empty()) {
     local_output_padding.resize(kernel_shape_vector.size(), 0);
   }
+  if (local_output_padding.size() != kernel_shape_vector.size()) {
+    return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                           "output_padding size (", local_output_padding.size(),
+                           ") does not match the number of spatial dimensions (", kernel_shape_vector.size(), ").");
+  }
   if (local_pads.empty()) {
     local_pads.resize(kernel_shape_vector.size() * 2, 0);
   }
@@ -53,6 +58,16 @@ Status ConvTranspose<is_channels_last>::ComputeInternal(ComputeContext& context)
   if (local_strides.empty()) {
     local_strides.resize(kernel_shape_vector.size(), 1);
   }
+  // ONNX spec: "output_padding[i] should be less than max(stride[i], dilation[i])".
+  for (size_t i = 0; i < local_output_padding.size(); ++i) {
+    int64_t limit = std::max(local_strides[i], local_dilations[i]);
+    if (local_output_padding[i] >= limit) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "output_padding[", i, "] (", local_output_padding[i],
+                             ") must be less than max(stride, dilation) (", limit,
+                             ") for spatial dimension ", i, ".");
+    }
+  }
   auto group = conv_transpose_attrs_.group;
   auto num_output_channels = group * filter_shape[1];
   auto batch_size = input_shape[0];
diff --git a/onnxruntime/core/providers/xnnpack/nn/conv_base.cc b/onnxruntime/core/providers/xnnpack/nn/conv_base.cc
index 724734bc91051..df43dfe1384ef 100644
--- a/onnxruntime/core/providers/xnnpack/nn/conv_base.cc
+++ b/onnxruntime/core/providers/xnnpack/nn/conv_base.cc
@@ -490,6 +490,9 @@ ConvBase::ConvBase(const OpKernelInfo& info, bool is_transpose)
     if (conv_transpose_attrs_.output_padding.empty()) {
       conv_transpose_attrs_.output_padding.resize(kernel_shape_.size(), 0);
     }
+    ORT_ENFORCE(conv_transpose_attrs_.output_padding.size() == kernel_shape_.size(),
+                "output_padding size (", conv_transpose_attrs_.output_padding.size(),
+                ") does not match the number of spatial dimensions (", kernel_shape_.size(), ").");
 
     ORT_THROW_IF_ERROR(conv_transpose_attrs_.ComputePadsAndOutputShape(
         input_shape, M_, kernel_shape_,
diff --git a/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc b/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
index a838b3885e067..fcfe0180efd75 100644
--- a/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
+++ b/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
@@ -34,7 +34,7 @@ TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidWeightRank0) {
   test.AddInput<float>("W", {}, std::vector<float>{1.0f});  // scalar (rank 0)
   test.AddInput<int64_t>("Pads", {4}, std::vector<int64_t>{1, 1, 1, 1});
   test.AddOutput<float>("Y", {}, std::vector<float>{0.0f});
-  test.Run(OpTester::ExpectResult::kExpectFailure, "Weight tensor must have at least 2 dimensions",
+  test.Run(OpTester::ExpectResult::kExpectFailure, "Weight tensor must have at least 3 dimensions",
            {kTensorrtExecutionProvider});
 }
 
@@ -49,10 +49,60 @@ TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidWeightRank1) {
   test.AddInput<float>("W", {9}, std::vector<float>(9, 1.0f));  // rank 1
   test.AddInput<int64_t>("Pads", {4}, std::vector<int64_t>{1, 1, 1, 1});
   test.AddOutput<float>("Y", {}, std::vector<float>{0.0f});
-  test.Run(OpTester::ExpectResult::kExpectFailure, "Weight tensor must have at least 2 dimensions",
+  test.Run(OpTester::ExpectResult::kExpectFailure, "Weight tensor must have at least 3 dimensions",
+           {kTensorrtExecutionProvider});
+}
+
+// Test that a rank-2 input is rejected (requires at least 3 dims for ConvTranspose).
+TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidInputRank2) {
+  OpTester test("ConvTransposeWithDynamicPads", 1, onnxruntime::kMSDomain);
+  test.AddAttribute("kernel_shape", std::vector<int64_t>{3, 3});
+  test.AddAttribute("strides", std::vector<int64_t>{2, 2});
+  test.AddAttribute("dilations", std::vector<int64_t>{1, 1});
+
+  test.AddInput<float>("X", {1, 1}, std::vector<float>{1.0f});  // rank 2
+  test.AddInput<float>("W", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<int64_t>("Pads", {4}, std::vector<int64_t>{1, 1, 1, 1});
+  test.AddOutput<float>("Y", {}, std::vector<float>{0.0f});
+  test.Run(OpTester::ExpectResult::kExpectFailure, "Input tensor must have at least 3 dimensions",
            {kTensorrtExecutionProvider});
 }
 #endif  // !ORT_NO_EXCEPTIONS
 
+// Test that incorrectly sized dynamic pads are rejected.
+// This runs through kernel validation (not shape inference) so it works in no-exception builds.
+TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidPadsSize) {
+  OpTester test("ConvTransposeWithDynamicPads", 1, onnxruntime::kMSDomain);
+  test.AddShapeToTensorData(false);
+  test.AddAttribute("kernel_shape", std::vector<int64_t>{3, 3});
+  test.AddAttribute("strides", std::vector<int64_t>{2, 2});
+  test.AddAttribute("dilations", std::vector<int64_t>{1, 1});
+
+  test.AddInput<float>("X", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<float>("W", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<int64_t>("Pads", {3}, std::vector<int64_t>{0, 0, 0});  // Wrong size: should be 4
+  test.AddOutput<float>("Y", {1, 1, 5, 5}, std::vector<float>(25, 0.0f));
+
+  test.Run(OpTester::ExpectResult::kExpectFailure, "does not match expected size",
+           {kTensorrtExecutionProvider, kQnnExecutionProvider});
+}
+
+// Test that negative pad values are rejected.
+TEST(ContribOpTest, ConvTransposeWithDynamicPads_NegativePads) {
+  OpTester test("ConvTransposeWithDynamicPads", 1, onnxruntime::kMSDomain);
+  test.AddShapeToTensorData(false);
+  test.AddAttribute("kernel_shape", std::vector<int64_t>{3, 3});
+  test.AddAttribute("strides", std::vector<int64_t>{2, 2});
+  test.AddAttribute("dilations", std::vector<int64_t>{1, 1});
+
+  test.AddInput<float>("X", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<float>("W", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<int64_t>("Pads", {4}, std::vector<int64_t>{-1, 0, 0, 0});  // Negative pad
+  test.AddOutput<float>("Y", {1, 1, 5, 5}, std::vector<float>(25, 0.0f));
+
+  test.Run(OpTester::ExpectResult::kExpectFailure, "non-negative",
+           {kTensorrtExecutionProvider, kQnnExecutionProvider});
+}
+
 }  // namespace test
 }  // namespace onnxruntime

From ae014a3fe0914d992bc846ea66bbb1a4d85b1d22 Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Tue, 19 May 2026 11:02:05 -0700
Subject: [PATCH 12/18] Addressing comments

---
 .../core/providers/cpu/nn/conv_transpose_attributes.h    | 9 ++++++---
 onnxruntime/core/providers/cuda/nn/conv_transpose.cc     | 8 +++++---
 .../test/providers/cuda/nhwc/conv_transpose_test.cc      | 2 +-
 3 files changed, 12 insertions(+), 7 deletions(-)

diff --git a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
index 5c52d5d471738..34e8570fbdfa9 100644
--- a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
+++ b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
@@ -18,6 +18,8 @@
 
 #pragma once
 
+#include <algorithm>
+
 #include "core/providers/cpu/nn/conv_attributes.h"
 #include "core/common/safeint.h"
 
@@ -154,12 +156,13 @@ struct ConvTransposeAttributes : public ConvAttributes {
                                "Dynamic pads tensor size (", actual_pads_size,
                                ") does not match expected size (2 * spatial_dims = ", expected_pads_size, ").");
       }
+      const auto* pads_data = Pads->Data<int64_t>();
       for (int64_t i = 0; i < actual_pads_size; ++i) {
-        if (Pads->Data<int64_t>()[i] < 0) {
+        if (pads_data[i] < 0) {
           return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
-                                 "Dynamic pads must be non-negative. Got pads[", i, "] = ", Pads->Data<int64_t>()[i]);
+                                 "Dynamic pads must be non-negative. Got pads[", i, "] = ", pads_data[i]);
         }
-        local_pads.push_back(Pads->Data<int64_t>()[i]);
+        local_pads.push_back(pads_data[i]);
       }
     } else {
       local_pads.assign(pads.begin(), pads.end());
diff --git a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
index 6d2f9fa830978..6e702ba5c6292 100644
--- a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
@@ -2,6 +2,7 @@
 // Copyright (c) 2023 NVIDIA Corporation.
 // Licensed under the MIT License.
 
+#include <algorithm>
 #include <string>
 #include <utility>
 
@@ -376,12 +377,13 @@ Status ConvTranspose<T, Layout>::UpdateState(OpKernelContext* context, bool dyna
                                "Pads input must have ", expected_pads_size,
                                " elements (2 * num_spatial_dims). Got: ", Pads->Shape()[0]);
       }
+      const auto* pads_data = Pads->Data<int64_t>();
       for (int64_t i = 0; i < Pads->Shape()[0]; ++i) {
-        if (Pads->Data<int64_t>()[i] < 0) {
+        if (pads_data[i] < 0) {
           return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
-                                 "Pads values must be non-negative. Got pads[", i, "] = ", Pads->Data<int64_t>()[i]);
+                                 "Pads values must be non-negative. Got pads[", i, "] = ", pads_data[i]);
         }
-        pads.push_back(Pads->Data<int64_t>()[i]);
+        pads.push_back(pads_data[i]);
       }
     } else {
       pads.assign(conv_transpose_attrs_.pads.begin(), conv_transpose_attrs_.pads.end());
diff --git a/onnxruntime/test/providers/cuda/nhwc/conv_transpose_test.cc b/onnxruntime/test/providers/cuda/nhwc/conv_transpose_test.cc
index 86a408060ee8c..869b14a24ae07 100644
--- a/onnxruntime/test/providers/cuda/nhwc/conv_transpose_test.cc
+++ b/onnxruntime/test/providers/cuda/nhwc/conv_transpose_test.cc
@@ -16,7 +16,7 @@ struct ConvTransposeOp {
   bool bias = false;
   std::vector<int64_t> strides = {1, 1};
   std::vector<int64_t> padding = {0, 0, 0, 0};
-  std::vector<int64_t> output_padding = {0, 0};
+  std::vector<int64_t> output_padding;
   std::vector<int64_t> dilations = {1, 1};
 
   std::unique_ptr<CompareOpTester> get_test() {

From 09f204c2bfb98cb2a8aa3c612fc4a7cddd150ed3 Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Tue, 19 May 2026 11:20:55 -0700
Subject: [PATCH 13/18] Address CI failures.

---
 .../core/providers/cuda/nn/conv_transpose.cc  |  8 ++--
 .../conv_transpose_with_dynamic_pads_test.cc  | 47 ++++++++++++++++++-
 2 files changed, 49 insertions(+), 6 deletions(-)

diff --git a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
index 6e702ba5c6292..9c1e91c503bd3 100644
--- a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
@@ -369,19 +369,19 @@ Status ConvTranspose<T, Layout>::UpdateState(OpKernelContext* context, bool dyna
       }
       if (Pads->Shape().NumDimensions() != 1) {
         return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
-                               "Pads input must be a 1-D tensor. Got rank: ", Pads->Shape().NumDimensions());
+                               "Dynamic pads tensor must be 1-D. Got rank: ", Pads->Shape().NumDimensions());
       }
       const int64_t expected_pads_size = static_cast<int64_t>(kernel_shape.size()) * 2;
       if (Pads->Shape()[0] != expected_pads_size) {
         return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
-                               "Pads input must have ", expected_pads_size,
-                               " elements (2 * num_spatial_dims). Got: ", Pads->Shape()[0]);
+                               "Dynamic pads tensor size (", Pads->Shape()[0],
+                               ") does not match expected size (2 * spatial_dims = ", expected_pads_size, ").");
       }
       const auto* pads_data = Pads->Data<int64_t>();
       for (int64_t i = 0; i < Pads->Shape()[0]; ++i) {
         if (pads_data[i] < 0) {
           return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
-                                 "Pads values must be non-negative. Got pads[", i, "] = ", pads_data[i]);
+                                 "Dynamic pads must be non-negative. Got pads[", i, "] = ", pads_data[i]);
         }
         pads.push_back(pads_data[i]);
       }
diff --git a/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc b/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
index fcfe0180efd75..345a143d5b87c 100644
--- a/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
+++ b/onnxruntime/test/contrib_ops/conv_transpose_with_dynamic_pads_test.cc
@@ -3,6 +3,7 @@
 
 #include "gtest/gtest.h"
 #include "test/providers/provider_test_utils.h"
+#include "default_providers.h"
 
 namespace onnxruntime {
 namespace test {
@@ -84,7 +85,7 @@ TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidPadsSize) {
   test.AddOutput<float>("Y", {1, 1, 5, 5}, std::vector<float>(25, 0.0f));
 
   test.Run(OpTester::ExpectResult::kExpectFailure, "does not match expected size",
-           {kTensorrtExecutionProvider, kQnnExecutionProvider});
+           {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
 }
 
 // Test that negative pad values are rejected.
@@ -101,8 +102,50 @@ TEST(ContribOpTest, ConvTransposeWithDynamicPads_NegativePads) {
   test.AddOutput<float>("Y", {1, 1, 5, 5}, std::vector<float>(25, 0.0f));
 
   test.Run(OpTester::ExpectResult::kExpectFailure, "non-negative",
-           {kTensorrtExecutionProvider, kQnnExecutionProvider});
+           {kTensorrtExecutionProvider, kQnnExecutionProvider, kDmlExecutionProvider});
 }
 
+// DML-specific tests for invalid dynamic pads.
+// DML validates operator parameters internally before ORT kernel code runs. When inputs are
+// invalid, DML's COM/HRESULT boundary strips the descriptive message and re-throws with just
+// E_INVALIDARG (0x80070057), surfacing as "The parameter is incorrect." on Windows.
+// We still want to verify DML rejects these inputs rather than crashing, so we test separately
+// with the DML-specific error text.
+#ifdef USE_DML
+TEST(ContribOpTest, ConvTransposeWithDynamicPads_InvalidPadsSize_Dml) {
+  OpTester test("ConvTransposeWithDynamicPads", 1, onnxruntime::kMSDomain);
+  test.AddShapeToTensorData(false);
+  test.AddAttribute("kernel_shape", std::vector<int64_t>{3, 3});
+  test.AddAttribute("strides", std::vector<int64_t>{2, 2});
+  test.AddAttribute("dilations", std::vector<int64_t>{1, 1});
+
+  test.AddInput<float>("X", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<float>("W", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<int64_t>("Pads", {3}, std::vector<int64_t>{0, 0, 0});  // Wrong size: should be 4
+  test.AddOutput<float>("Y", {1, 1, 5, 5}, std::vector<float>(25, 0.0f));
+
+  test.ConfigEp(DefaultDmlExecutionProvider())
+      .Config(OpTester::ExpectResult::kExpectFailure, "The parameter is incorrect")
+      .RunWithConfig();
+}
+
+TEST(ContribOpTest, ConvTransposeWithDynamicPads_NegativePads_Dml) {
+  OpTester test("ConvTransposeWithDynamicPads", 1, onnxruntime::kMSDomain);
+  test.AddShapeToTensorData(false);
+  test.AddAttribute("kernel_shape", std::vector<int64_t>{3, 3});
+  test.AddAttribute("strides", std::vector<int64_t>{2, 2});
+  test.AddAttribute("dilations", std::vector<int64_t>{1, 1});
+
+  test.AddInput<float>("X", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<float>("W", {1, 1, 3, 3}, std::vector<float>(9, 1.0f));
+  test.AddInput<int64_t>("Pads", {4}, std::vector<int64_t>{-1, 0, 0, 0});  // Negative pad
+  test.AddOutput<float>("Y", {1, 1, 5, 5}, std::vector<float>(25, 0.0f));
+
+  test.ConfigEp(DefaultDmlExecutionProvider())
+      .Config(OpTester::ExpectResult::kExpectFailure, "The parameter is incorrect")
+      .RunWithConfig();
+}
+#endif  // USE_DML
+
 }  // namespace test
 }  // namespace onnxruntime

From 2a48fbcdf8885a14109c4548537f941b28669098 Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Tue, 19 May 2026 13:29:23 -0700
Subject: [PATCH 14/18] Address CI failures and review comments.

---
 .../cpu/nn/conv_transpose_attributes.h        | 27 +++++++++++++------
 .../providers/webgpu/nn/conv_transpose.cc     | 10 +++++++
 2 files changed, 29 insertions(+), 8 deletions(-)

diff --git a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
index 34e8570fbdfa9..6d29e7fb871ab 100644
--- a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
+++ b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
@@ -324,17 +324,28 @@ struct ConvTransposeAttributes : public ConvAttributes {
     if (pad_type == AutoPadType::SAME_UPPER || pad_type == AutoPadType::SAME_LOWER) {
       // The ONNX spec says if `auto_pad` attribute is set, pad until the `out_size`
       // is `in_size * stride`
-      int64_t auto_out_size = SafeInt<int64_t>(in_size) * stride;
-      auto total_pad = ComputeTotalPad(in_size, stride, adj,
-                                       kernel, dilation, auto_out_size);
-      DistributePadding(pad_type, total_pad, *pad_head, *pad_tail);
+      ORT_TRY {
+        int64_t auto_out_size = SafeInt<int64_t>(in_size) * stride;
+        auto total_pad = ComputeTotalPad(in_size, stride, adj,
+                                         kernel, dilation, auto_out_size);
+        DistributePadding(pad_type, total_pad, *pad_head, *pad_tail);
+      }
+      ORT_CATCH(const OnnxRuntimeException&) {
+        return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                               "Integer overflow in ConvTranspose output size computation.");
+      }
     }
 
     // *out_size = (in_size - 1) * stride + adj + (kernel - 1) * dilation + 1 - *pad_head - *pad_tail
-    // SafeInt throws OnnxRuntimeException on overflow from adversarial inputs.
-    *out_size = SafeInt<int64_t>(in_size - 1) * stride + adj +
-                SafeInt<int64_t>(kernel - 1) * dilation + 1 -
-                *pad_head - *pad_tail;
+    ORT_TRY {
+      *out_size = SafeInt<int64_t>(in_size - 1) * stride + adj +
+                  SafeInt<int64_t>(kernel - 1) * dilation + 1 -
+                  *pad_head - *pad_tail;
+    }
+    ORT_CATCH(const OnnxRuntimeException&) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "Integer overflow in ConvTranspose output size computation.");
+    }
     return Status::OK();
   }
 };
diff --git a/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc b/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc
index f15d74b9643b8..5132cc51d0a0a 100644
--- a/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/webgpu/nn/conv_transpose.cc
@@ -58,6 +58,16 @@ Status ConvTranspose<is_channels_last>::ComputeInternal(ComputeContext& context)
   if (local_strides.empty()) {
     local_strides.resize(kernel_shape_vector.size(), 1);
   }
+  if (local_strides.size() != kernel_shape_vector.size()) {
+    return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                           "strides size (", local_strides.size(),
+                           ") does not match the number of spatial dimensions (", kernel_shape_vector.size(), ").");
+  }
+  if (local_dilations.size() != kernel_shape_vector.size()) {
+    return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                           "dilations size (", local_dilations.size(),
+                           ") does not match the number of spatial dimensions (", kernel_shape_vector.size(), ").");
+  }
   // ONNX spec: "output_padding[i] should be less than max(stride[i], dilation[i])".
   for (size_t i = 0; i < local_output_padding.size(); ++i) {
     int64_t limit = std::max(local_strides[i], local_dilations[i]);

From b9f3bbf2a2420e7886e78e7c3c449a4635989dfe Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Tue, 19 May 2026 14:16:06 -0700
Subject: [PATCH 15/18] Addressing comments

---
 .../core/providers/cpu/nn/conv_transpose_attributes.h    | 9 +++++++--
 .../test/providers/cuda/nhwc/conv_transpose_test.cc      | 1 +
 2 files changed, 8 insertions(+), 2 deletions(-)

diff --git a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
index 6d29e7fb871ab..60d6e1d9eb264 100644
--- a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
+++ b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
@@ -233,6 +233,11 @@ struct ConvTransposeAttributes : public ConvAttributes {
     size_t output_shape_size = output_shape.size();
     size_t rank = input_shape.NumDimensions();
 
+    if (p_pads->size() != 2 * rank) {
+      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
+                             "pads size (", p_pads->size(), ") does not match expected size (2 * ", rank, ").");
+    }
+
     // output_shape attribute, if specified, must have either 'rank' or 'rank + 2' elements
     if (output_shape_size != 0 && output_shape_size != rank && output_shape_size != rank + 2) {
       return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
@@ -260,8 +265,8 @@ struct ConvTransposeAttributes : public ConvAttributes {
           p_dilations[dim],
           p_output_padding[dim],
           auto_pad,
-          &p_pads->at(dim),
-          &p_pads->at(input_shape.NumDimensions() + dim),
+          &(*p_pads)[dim],
+          &(*p_pads)[input_shape.NumDimensions() + dim],
           &dim_size));
 
       if (dim_size <= 0) {
diff --git a/onnxruntime/test/providers/cuda/nhwc/conv_transpose_test.cc b/onnxruntime/test/providers/cuda/nhwc/conv_transpose_test.cc
index 869b14a24ae07..dfa63ae35bd21 100644
--- a/onnxruntime/test/providers/cuda/nhwc/conv_transpose_test.cc
+++ b/onnxruntime/test/providers/cuda/nhwc/conv_transpose_test.cc
@@ -55,6 +55,7 @@ struct ConvTransposeOp {
 
     for (size_t i = 0, end = is_1D ? 1 : 2; i < end; ++i) {
       // formula from https://github.com/onnx/onnx/blob/main/docs/Operators.md#ConvTranspose
+      assert(output_padding.empty() || output_padding.size() >= end);
       const size_t start_pad = i * 2;
       int64_t out_pad = i < output_padding.size() ? output_padding[i] : 0;
       output_dims.push_back(

From 174b9ad6f28e258433960482873c9552fe0fac9a Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Tue, 26 May 2026 11:10:35 -0700
Subject: [PATCH 16/18] Adjust comment

---
 onnxruntime/core/providers/cpu/nn/conv_transpose.cc | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/onnxruntime/core/providers/cpu/nn/conv_transpose.cc b/onnxruntime/core/providers/cpu/nn/conv_transpose.cc
index 4c3ce36f9261d..4cb1b91fc28c8 100644
--- a/onnxruntime/core/providers/cpu/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/cpu/nn/conv_transpose.cc
@@ -76,7 +76,7 @@ Status ConvTranspose<float>::PrePack(const Tensor& tensor, int input_idx, Alloca
     size_t packed_filter_data_size = SafeInt<size_t>(packed_elements_per_group) * sizeof(float) * conv_transpose_attrs_.group;
     auto* packed_filter_data = alloc->Alloc(packed_filter_data_size);
 
-    // Wrap in BufferUniquePtr immediately to prevent leaks if MlasTranspose throws.
+    // Wrap in BufferUniquePtr immediately to prevent leaks.
     transposed_filter_ = BufferUniquePtr(packed_filter_data, BufferDeleter(std::move(alloc)));
 
     // Initialize memory to 0 as there could be some padding associated with pre-packed

From 36cf9c48794c27434c4b6fa56c74fc2cefcb2deb Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Tue, 26 May 2026 12:10:40 -0700
Subject: [PATCH 17/18] Let SafeInt<> exception propagate

---
 .../cpu/nn/conv_transpose_attributes.h        | 26 +++++--------------
 1 file changed, 7 insertions(+), 19 deletions(-)

diff --git a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
index 60d6e1d9eb264..9631dd37695e8 100644
--- a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
+++ b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
@@ -329,28 +329,16 @@ struct ConvTransposeAttributes : public ConvAttributes {
     if (pad_type == AutoPadType::SAME_UPPER || pad_type == AutoPadType::SAME_LOWER) {
       // The ONNX spec says if `auto_pad` attribute is set, pad until the `out_size`
       // is `in_size * stride`
-      ORT_TRY {
-        int64_t auto_out_size = SafeInt<int64_t>(in_size) * stride;
-        auto total_pad = ComputeTotalPad(in_size, stride, adj,
-                                         kernel, dilation, auto_out_size);
-        DistributePadding(pad_type, total_pad, *pad_head, *pad_tail);
-      }
-      ORT_CATCH(const OnnxRuntimeException&) {
-        return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
-                               "Integer overflow in ConvTranspose output size computation.");
-      }
+      int64_t auto_out_size = SafeInt<int64_t>(in_size) * stride;
+      auto total_pad = ComputeTotalPad(in_size, stride, adj,
+                                       kernel, dilation, auto_out_size);
+      DistributePadding(pad_type, total_pad, *pad_head, *pad_tail);
     }
 
     // *out_size = (in_size - 1) * stride + adj + (kernel - 1) * dilation + 1 - *pad_head - *pad_tail
-    ORT_TRY {
-      *out_size = SafeInt<int64_t>(in_size - 1) * stride + adj +
-                  SafeInt<int64_t>(kernel - 1) * dilation + 1 -
-                  *pad_head - *pad_tail;
-    }
-    ORT_CATCH(const OnnxRuntimeException&) {
-      return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
-                             "Integer overflow in ConvTranspose output size computation.");
-    }
+    *out_size = SafeInt<int64_t>(in_size - 1) * stride + adj +
+                SafeInt<int64_t>(kernel - 1) * dilation + 1 -
+                *pad_head - *pad_tail;
     return Status::OK();
   }
 };

From 1062c9f742b1ae3608ecc0081d7f2d5beab7d545 Mon Sep 17 00:00:00 2001
From: Dmitri Smirnov <dmitrism@microsoft.com>
Date: Tue, 26 May 2026 12:39:24 -0700
Subject: [PATCH 18/18] Addressing comments

---
 onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h | 2 +-
 onnxruntime/core/providers/cuda/nn/conv_transpose.cc          | 4 ++--
 2 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
index 9631dd37695e8..03d9c4e28f6eb 100644
--- a/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
+++ b/onnxruntime/core/providers/cpu/nn/conv_transpose_attributes.h
@@ -149,7 +149,7 @@ struct ConvTransposeAttributes : public ConvAttributes {
         return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
                                "Dynamic pads tensor must be 1-D. Got rank: ", Pads->Shape().NumDimensions());
       }
-      const int64_t expected_pads_size = static_cast<int64_t>(kernel_shape.size()) * 2;
+      const int64_t expected_pads_size = SafeInt<int64_t>(kernel_shape.size()) * 2;
       const int64_t actual_pads_size = Pads->Shape().SizeFromDimension(0);
       if (actual_pads_size != expected_pads_size) {
         return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
diff --git a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
index 9c1e91c503bd3..f1e7e5c41055a 100644
--- a/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
+++ b/onnxruntime/core/providers/cuda/nn/conv_transpose.cc
@@ -275,14 +275,14 @@ Status ConvTranspose<T, Layout>::UpdateState(OpKernelContext* context, bool dyna
   // both must have at least 3 dimensions. Check before dims-changed comparison because
   // a scalar (rank 0) has empty dims which matches the default-initialized last_x_dims,
   // causing the validation block to be skipped entirely.
-  const int rank = static_cast<int>(x_shape.NumDimensions());
+  const size_t rank = x_shape.NumDimensions();
   if (rank < 3) {
     return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
                            "Input X must have at least 3 dimensions (N x C x D1...Dn).",
                            " X: ", x_shape.ToString().c_str());
   }
 
-  if (static_cast<int>(w_shape.NumDimensions()) < 3) {
+  if (w_shape.NumDimensions() < 3) {
     return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT,
                            "Filter W must have at least 3 dimensions (C x M/group x k1...kn).",
                            " W: ", w_shape.ToString().c_str());