ARM-software
diff --git a/‎Android.bp‎
Lines changed: 8 additions & 0 deletions b/‎Android.bp‎
Lines changed: 8 additions & 0 deletions
diff --git a/‎arm_compute/runtime/NEON/NEFunctions.h‎
Lines changed: 2 additions & 1 deletion b/‎arm_compute/runtime/NEON/NEFunctions.h‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎arm_compute/runtime/NEON/functions/NETopKV.h‎
Lines changed: 98 additions & 0 deletions b/‎arm_compute/runtime/NEON/functions/NETopKV.h‎
Lines changed: 98 additions & 0 deletions
diff --git a/‎arm_compute/runtime/OperatorList.h‎
Lines changed: 11 additions & 1 deletion b/‎arm_compute/runtime/OperatorList.h‎
Lines changed: 11 additions & 1 deletion
diff --git a/‎docs/user_guide/operator_list.dox‎
Lines changed: 22 additions & 1 deletion b/‎docs/user_guide/operator_list.dox‎
Lines changed: 22 additions & 1 deletion
diff --git a/‎filelist.json‎
Lines changed: 21 additions & 0 deletions b/‎filelist.json‎
Lines changed: 21 additions & 0 deletions
diff --git a/‎src/BUILD.bazel‎
Lines changed: 9 additions & 1 deletion b/‎src/BUILD.bazel‎
Lines changed: 9 additions & 1 deletion
diff --git a/‎src/CMakeLists.txt‎
Lines changed: 8 additions & 0 deletions b/‎src/CMakeLists.txt‎
Lines changed: 8 additions & 0 deletions
@@ -462,6 +462,7 @@ cc_library_static {
         "src/cpu/kernels/CpuScatterKernel.cpp",
         "src/cpu/kernels/CpuSoftmaxKernel.cpp",
         "src/cpu/kernels/CpuSubKernel.cpp",
+        "src/cpu/kernels/CpuTopKVKernel.cpp",
         "src/cpu/kernels/CpuTransposeKernel.cpp",
         "src/cpu/kernels/CpuWeightsReshapeKernel.cpp",
         "src/cpu/kernels/CpuWinogradConv2dKernel.cpp",
@@ -611,6 +612,11 @@ cc_library_static {
         "src/cpu/kernels/sub/neon/qasymm8.cpp",
         "src/cpu/kernels/sub/neon/qasymm8_signed.cpp",
         "src/cpu/kernels/sub/neon/qsymm16.cpp",
+        "src/cpu/kernels/topkv/generic/neon/fp16.cpp",
+        "src/cpu/kernels/topkv/generic/neon/fp32.cpp",
+        "src/cpu/kernels/topkv/generic/neon/integer.cpp",
+        "src/cpu/kernels/topkv/generic/neon/qasymm8.cpp",
+        "src/cpu/kernels/topkv/generic/neon/qasymm8_signed.cpp",
         "src/cpu/operators/CpuActivation.cpp",
         "src/cpu/operators/CpuAdd.cpp",
         "src/cpu/operators/CpuAddMulAdd.cpp",
@@ -649,6 +655,7 @@ cc_library_static {
         "src/cpu/operators/CpuScatter.cpp",
         "src/cpu/operators/CpuSoftmax.cpp",
         "src/cpu/operators/CpuSub.cpp",
+        "src/cpu/operators/CpuTopKV.cpp",
         "src/cpu/operators/CpuTranspose.cpp",
         "src/cpu/operators/CpuWinogradConv2d.cpp",
         "src/cpu/operators/internal/CpuGemmAssemblyDispatch.cpp",
@@ -978,6 +985,7 @@ cc_library_static {
         "src/runtime/NEON/functions/NEStackLayer.cpp",
         "src/runtime/NEON/functions/NEStridedSlice.cpp",
         "src/runtime/NEON/functions/NETile.cpp",
+        "src/runtime/NEON/functions/NETopKV.cpp",
         "src/runtime/NEON/functions/NETranspose.cpp",
         "src/runtime/NEON/functions/NEUnstack.cpp",
         "src/runtime/NEON/functions/NEWinogradConvolutionLayer.cpp",
 
@@ -1,5 +1,5 @@
 /*
- * Copyright (c) 2016-2025 Arm Limited.
+ * Copyright (c) 2016-2026 Arm Limited.
  *
  * SPDX-License-Identifier: MIT
  *
@@ -112,6 +112,7 @@
 #include "arm_compute/runtime/NEON/functions/NEStackLayer.h"
 #include "arm_compute/runtime/NEON/functions/NEStridedSlice.h"
 #include "arm_compute/runtime/NEON/functions/NETile.h"
+#include "arm_compute/runtime/NEON/functions/NETopKV.h"
 #include "arm_compute/runtime/NEON/functions/NETranspose.h"
 #include "arm_compute/runtime/NEON/functions/NEUnstack.h"
 #include "arm_compute/runtime/NEON/functions/NEWinogradConvolutionLayer.h"
 
@@ -0,0 +1,98 @@
+/*
+ * Copyright (c) 2026 Arm Limited.
+ *
+ * SPDX-License-Identifier: MIT
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a copy
+ * of this software and associated documentation files (the "Software"), to
+ * deal in the Software without restriction, including without limitation the
+ * rights to use, copy, modify, merge, publish, distribute, sublicense, and/or
+ * sell copies of the Software, and to permit persons to whom the Software is
+ * furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice shall be included in all
+ * copies or substantial portions of the Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+ * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+ * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+ * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+ * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+ * SOFTWARE.
+ */
+#ifndef ACL_ARM_COMPUTE_RUNTIME_NEON_FUNCTIONS_NETOPKV_H
+#define ACL_ARM_COMPUTE_RUNTIME_NEON_FUNCTIONS_NETOPKV_H
+
+/** @file
+ * @publicapi
+ */
+
+#include "arm_compute/core/Error.h"
+#include "arm_compute/runtime/IFunction.h"
+
+#include <memory>
+
+namespace arm_compute
+{
+// Forward declarations
+class ITensor;
+class ITensorInfo;
+
+/** Basic function to run cpu::kernels::CpuTopKVKernel
+ *
+ */
+class NETopKV : public IFunction
+{
+public:
+    /** Constructor */
+    NETopKV();
+    /** Prevent instances of this class from being copied (As this class contains pointers) */
+    NETopKV(const NETopKV &) = delete;
+    /** Default move constructor */
+    NETopKV(NETopKV &&);
+    /** Prevent instances of this class from being copied (As this class contains pointers) */
+    NETopKV &operator=(const NETopKV &) = delete;
+    /** Default move assignment operator */
+    NETopKV &operator=(NETopKV &&);
+    /** Destructor */
+    ~NETopKV();
+    /** Set the input and output of the kernel.
+     *
+     * Valid data layouts:
+     * - All
+     *
+     * Valid data type configurations:
+     * |src1           |src2           |dst            |
+     * |:--------------|:--------------|:--------------|
+     * |QASYMM8        |U32            |U8             |
+     * |QASYMM8_SIGNED |U32            |U8             |
+     * |S32            |U32            |U8             |
+     * |F16            |U32            |U8             |
+     * |F32            |U32            |U8             |
+     *
+     * @param[in]  predictions A batch_size x classes tensor. Data types supported: F16/F32/QASYMM8/QASYMM8_SIGNED/S32
+     * @param[in]  targets     A batch_size 1D tensor of class ids. Data types supported: U32
+     * @param[out] output      Computed precision at @p k as a bool 1D tensor. Data types supported: U8
+     * @param[in]  k           Number of top elements to look at for computing precision.
+     */
+    void configure(const ITensor *predictions, const ITensor *targets, ITensor *output, const unsigned int k);
+
+    /** Static function to check if given info will lead to a valid configuration.
+     *
+     * Similar to @ref NETopKV::configure()
+     *
+     * @return a status
+     */
+    static Status
+    validate(const ITensorInfo *predictions, const ITensorInfo *targets, ITensorInfo *output, const unsigned int k);
+
+    // Inherited methods overridden
+    void run() override;
+
+private:
+    struct Impl;
+    std::unique_ptr<Impl> _impl;
+};
+} // namespace arm_compute
+#endif // ACL_ARM_COMPUTE_RUNTIME_NEON_FUNCTIONS_NETOPKV_H
@@ -1,5 +1,5 @@
 /*
- * Copyright (c) 2021-2023, 2025 Arm Limited.
+ * Copyright (c) 2021-2023, 2025-2026 Arm Limited.
  *
  * SPDX-License-Identifier: MIT
  *
@@ -1033,6 +1033,16 @@
  *
  */
 
+/** TopKV
+ *
+ * Description:
+ * Function to compute TopKV
+ *
+ * Equivalent Android NNAPI Op:
+ * ANEURALNETWORKS_TOPK_V2
+ *
+ */
+
 /** Transpose
  *
  * Description:
 
@@ -1,5 +1,5 @@
 ///
-/// Copyright (c) 2021-2025 Arm Limited.
+/// Copyright (c) 2021-2026 Arm Limited.
 ///
 /// SPDX-License-Identifier: MIT
 ///
@@ -3219,6 +3219,27 @@ where N = batches, C = channels, H = height, W = width, D = depth
     <tr><th>src<th>dst
     <tr><td>All<td>All
     </table>
+<tr>
+  <td rowspan="1">TopKV
+  <td rowspan="1" style="width:200px;"> Function to compute TopKV
+  <td rowspan="1">
+      <ul>
+       <li>ANEURALNETWORKS_TOPK_V2
+      </ul>
+  <td>NETopKV
+  <td>
+      <ul>
+       <li>All
+      </ul>
+  <td>
+    <table>
+    <tr><th>src1<th>src2<th>dst
+    <tr><td>QASYMM8<td>U32<td>U8
+    <tr><td>QASYMM8_SIGNED<td>U32<td>U8
+    <tr><td>S32<td>U32<td>U8
+    <tr><td>F16<td>U32<td>U8
+    <tr><td>F32<td>U32<td>U8
+    </table>
 <tr>
   <td rowspan="2">Transpose
   <td rowspan="2" style="width:200px;"> Function to transpose a 2D tensor.
 
@@ -2453,6 +2453,27 @@
           ]
         }
       },
+      "TopKV": {
+        "files": {
+          "common": [
+            "src/cpu/kernels/CpuTopKVKernel.cpp",
+            "src/cpu/operators/CpuTopKV.cpp",
+            "src/runtime/NEON/functions/NETopKV.cpp"
+          ],
+          "neon": {
+            "fp16": [ "src/cpu/kernels/topkv/generic/neon/fp16.cpp" ],
+            "fp32": [ "src/cpu/kernels/topkv/generic/neon/fp32.cpp" ],
+            "integer":["src/cpu/kernels/topkv/generic/neon/integer.cpp"],
+            "qasymm8": [
+              "src/cpu/kernels/topkv/generic/neon/qasymm8.cpp"
+            ],
+            "qasymm8_signed": [
+              "src/cpu/kernels/topkv/generic/neon/qasymm8_signed.cpp"
+            ]
+          }
+
+        }
+      },
       "Transpose": {
         "files": {
           "common": [
 
@@ -738,6 +738,7 @@ filegroup(
 	"cpu/kernels/CpuScatterKernel.cpp",
 	"cpu/kernels/CpuSoftmaxKernel.cpp",
 	"cpu/kernels/CpuSubKernel.cpp",
+	"cpu/kernels/CpuTopKVKernel.cpp",
 	"cpu/kernels/CpuTransposeKernel.cpp",
 	"cpu/kernels/CpuWeightsReshapeKernel.cpp",
 	"cpu/kernels/CpuWinogradConv2dKernel.cpp",
@@ -848,6 +849,10 @@ filegroup(
 	"cpu/kernels/sub/neon/qasymm8.cpp",
 	"cpu/kernels/sub/neon/qasymm8_signed.cpp",
 	"cpu/kernels/sub/neon/qsymm16.cpp",
+	"cpu/kernels/topkv/generic/neon/fp32.cpp",
+	"cpu/kernels/topkv/generic/neon/integer.cpp",
+	"cpu/kernels/topkv/generic/neon/qasymm8.cpp",
+	"cpu/kernels/topkv/generic/neon/qasymm8_signed.cpp",
 	"cpu/operators/CpuActivation.cpp",
 	"cpu/operators/CpuAdd.cpp",
 	"cpu/operators/CpuAddMulAdd.cpp",
@@ -886,6 +891,7 @@ filegroup(
 	"cpu/operators/CpuScatter.cpp",
 	"cpu/operators/CpuSoftmax.cpp",
 	"cpu/operators/CpuSub.cpp",
+	"cpu/operators/CpuTopKV.cpp",
 	"cpu/operators/CpuTranspose.cpp",
 	"cpu/operators/CpuWinogradConv2d.cpp",
 	"cpu/operators/internal/CpuGemmAssemblyDispatch.cpp",
@@ -994,6 +1000,7 @@ filegroup(
 	"runtime/NEON/functions/NEStackLayer.cpp",
 	"runtime/NEON/functions/NEStridedSlice.cpp",
 	"runtime/NEON/functions/NETile.cpp",
+	"runtime/NEON/functions/NETopKV.cpp",
 	"runtime/NEON/functions/NETranspose.cpp",
 	"runtime/NEON/functions/NEUnstack.cpp",
 	"runtime/NEON/functions/NEWinogradConvolutionLayer.cpp",
@@ -1109,7 +1116,8 @@ filegroup(
 	"cpu/kernels/scatter/generic/neon/fp16.cpp",
 	"cpu/kernels/select/generic/neon/fp16.cpp",
 	"cpu/kernels/softmax/generic/neon/fp16.cpp",
-	"cpu/kernels/sub/neon/fp16.cpp"]  +
+	"cpu/kernels/sub/neon/fp16.cpp",
+	"cpu/kernels/topkv/generic/neon/fp16.cpp"]  +
     glob(["**/*.h",
     "**/*.hpp",
     "**/*.inl"]),
 
@@ -732,6 +732,7 @@ target_sources(
 	cpu/kernels/CpuScatterKernel.cpp
 	cpu/kernels/CpuSoftmaxKernel.cpp
 	cpu/kernels/CpuSubKernel.cpp
+	cpu/kernels/CpuTopKVKernel.cpp
 	cpu/kernels/CpuTransposeKernel.cpp
 	cpu/kernels/CpuWeightsReshapeKernel.cpp
 	cpu/kernels/CpuWinogradConv2dKernel.cpp
@@ -842,6 +843,10 @@ target_sources(
 	cpu/kernels/sub/neon/qasymm8.cpp
 	cpu/kernels/sub/neon/qasymm8_signed.cpp
 	cpu/kernels/sub/neon/qsymm16.cpp
+	cpu/kernels/topkv/generic/neon/fp32.cpp
+	cpu/kernels/topkv/generic/neon/integer.cpp
+	cpu/kernels/topkv/generic/neon/qasymm8.cpp
+	cpu/kernels/topkv/generic/neon/qasymm8_signed.cpp
 	cpu/operators/CpuActivation.cpp
 	cpu/operators/CpuAdd.cpp
 	cpu/operators/CpuAddMulAdd.cpp
@@ -880,6 +885,7 @@ target_sources(
 	cpu/operators/CpuScatter.cpp
 	cpu/operators/CpuSoftmax.cpp
 	cpu/operators/CpuSub.cpp
+	cpu/operators/CpuTopKV.cpp
 	cpu/operators/CpuTranspose.cpp
 	cpu/operators/CpuWinogradConv2d.cpp
 	cpu/operators/internal/CpuGemmAssemblyDispatch.cpp
@@ -988,6 +994,7 @@ target_sources(
 	runtime/NEON/functions/NEStackLayer.cpp
 	runtime/NEON/functions/NEStridedSlice.cpp
 	runtime/NEON/functions/NETile.cpp
+	runtime/NEON/functions/NETopKV.cpp
 	runtime/NEON/functions/NETranspose.cpp
 	runtime/NEON/functions/NEUnstack.cpp
 	runtime/NEON/functions/NEWinogradConvolutionLayer.cpp
@@ -1109,4 +1116,5 @@ target_sources(
 	cpu/kernels/select/generic/neon/fp16.cpp
 	cpu/kernels/softmax/generic/neon/fp16.cpp
 	cpu/kernels/sub/neon/fp16.cpp
+	cpu/kernels/topkv/generic/neon/fp16.cpp
 )
Original file line number	Diff line number	Diff line change
`@@ -1,5 +1,5 @@`
`1`	`1`	`/*`
`2`		`- * Copyright (c) 2016-2025 Arm Limited.`
	`2`	`+ * Copyright (c) 2016-2026 Arm Limited.`
`3`	`3`	`*`
`4`	`4`	`* SPDX-License-Identifier: MIT`
`5`	`5`	`*`
`@@ -112,6 +112,7 @@`
`112`	`112`	`#include "arm_compute/runtime/NEON/functions/NEStackLayer.h"`
`113`	`113`	`#include "arm_compute/runtime/NEON/functions/NEStridedSlice.h"`
`114`	`114`	`#include "arm_compute/runtime/NEON/functions/NETile.h"`
	`115`	`+#include "arm_compute/runtime/NEON/functions/NETopKV.h"`
`115`	`116`	`#include "arm_compute/runtime/NEON/functions/NETranspose.h"`
`116`	`117`	`#include "arm_compute/runtime/NEON/functions/NEUnstack.h"`
`117`	`118`	`#include "arm_compute/runtime/NEON/functions/NEWinogradConvolutionLayer.h"`
Original file line number	Diff line number	Diff line change
`@@ -1,5 +1,5 @@`
`1`	`1`	`/*`
`2`		`- * Copyright (c) 2021-2023, 2025 Arm Limited.`
	`2`	`+ * Copyright (c) 2021-2023, 2025-2026 Arm Limited.`
`3`	`3`	`*`
`4`	`4`	`* SPDX-License-Identifier: MIT`
`5`	`5`	`*`
`@@ -1033,6 +1033,16 @@`
`1033`	`1033`	`*`
`1034`	`1034`	`*/`
`1035`	`1035`
	`1036`	`+/** TopKV`
	`1037`	`+ *`
	`1038`	`+ * Description:`
	`1039`	`+ * Function to compute TopKV`
	`1040`	`+ *`
	`1041`	`+ * Equivalent Android NNAPI Op:`
	`1042`	`+ * ANEURALNETWORKS_TOPK_V2`
	`1043`	`+ *`
	`1044`	`+ */`
	`1045`	`+`
`1036`	`1046`	`/** Transpose`
`1037`	`1047`	`*`
`1038`	`1048`	`* Description:`