arm
diff --git a/‎clang/include/clang/Basic/arm_sve.td‎
Lines changed: 13 additions & 0 deletions b/‎clang/include/clang/Basic/arm_sve.td‎
Lines changed: 13 additions & 0 deletions
diff --git a/‎clang/test/CodeGen/AArch64/sve2p3-intrinsics/acle_sve2p3_addqp.c‎
Lines changed: 265 additions & 0 deletions b/‎clang/test/CodeGen/AArch64/sve2p3-intrinsics/acle_sve2p3_addqp.c‎
Lines changed: 265 additions & 0 deletions
diff --git a/‎clang/test/CodeGen/AArch64/sve2p3-intrinsics/acle_sve2p3_addsubp.c‎
Lines changed: 265 additions & 0 deletions b/‎clang/test/CodeGen/AArch64/sve2p3-intrinsics/acle_sve2p3_addsubp.c‎
Lines changed: 265 additions & 0 deletions
diff --git a/‎clang/test/CodeGen/AArch64/sve2p3-intrinsics/acle_sve2p3_subp.c‎
Lines changed: 928 additions & 0 deletions b/‎clang/test/CodeGen/AArch64/sve2p3-intrinsics/acle_sve2p3_subp.c‎
Lines changed: 928 additions & 0 deletions
diff --git a/‎clang/test/Sema/AArch64/arm_sve_feature_dependent_sve_AND_LP_sve2p3_OR_sme2p3_RP___sme_AND_LP_sve2p3_OR_sme2p3_RP.c‎
Lines changed: 241 additions & 0 deletions b/‎clang/test/Sema/AArch64/arm_sve_feature_dependent_sve_AND_LP_sve2p3_OR_sme2p3_RP___sme_AND_LP_sve2p3_OR_sme2p3_RP.c‎
Lines changed: 241 additions & 0 deletions
diff --git a/‎llvm/include/llvm/IR/IntrinsicsAArch64.td‎
Lines changed: 4 additions & 0 deletions b/‎llvm/include/llvm/IR/IntrinsicsAArch64.td‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td‎
Lines changed: 3 additions & 3 deletions b/‎llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎llvm/test/CodeGen/AArch64/sve2p3-intrinsics/sve2p3-intrinsics-addqp.ll‎
Lines changed: 40 additions & 0 deletions b/‎llvm/test/CodeGen/AArch64/sve2p3-intrinsics/sve2p3-intrinsics-addqp.ll‎
Lines changed: 40 additions & 0 deletions
diff --git a/‎llvm/test/CodeGen/AArch64/sve2p3-intrinsics/sve2p3-intrinsics-addsubp.ll‎
Lines changed: 40 additions & 0 deletions b/‎llvm/test/CodeGen/AArch64/sve2p3-intrinsics/sve2p3-intrinsics-addsubp.ll‎
Lines changed: 40 additions & 0 deletions
@@ -1421,6 +1421,19 @@ defm SVMINP_S : SInstPairwise<"svminp",   "csli",         "aarch64_sve_sminp", [
 defm SVMINP_U : SInstPairwise<"svminp",   "UcUsUiUl",     "aarch64_sve_uminp", [VerifyRuntimeMode]>;
 }
 
+////////////////////////////////////////////////////////////////////////////////
+// SVE2.3 - Add pairwise within quadword vector segments
+
+let SVETargetGuard = "sve2p3|sme2p3", SMETargetGuard = "sve2p3|sme2p3" in {
+def SVADDQP   : SInst<"svaddqp[_{d}]", "ddd", "csilUcUsUiUl", MergeNone, "aarch64_sve_addqp",
+                    [VerifyRuntimeMode]>;
+def SVADDSUBP : SInst<"svaddsubp[_{d}]", "ddd", "csilUcUsUiUl", MergeNone, "aarch64_sve_addsubp",
+                    [VerifyRuntimeMode]>;
+def SVSUBP_M  : SInst<"svsubp[_{d}]", "dPdd", "csilUcUsUiUl", MergeOp1,  "aarch64_sve_subp", [VerifyRuntimeMode]>;
+def SVSUBP_X  : SInst<"svsubp[_{d}]", "dPdd", "csilUcUsUiUl", MergeAny,  "aarch64_sve_subp", [VerifyRuntimeMode]>;
+def SVSUBP_Z  : SInst<"svsubp[_{d}]", "dPdd", "csilUcUsUiUl", MergeZero, "aarch64_sve_subp", [VerifyRuntimeMode]>;
+}
+
 ////////////////////////////////////////////////////////////////////////////////
 // SVE2 - Widening pairwise arithmetic
 
 
@@ -0,0 +1,241 @@
+// NOTE: File has been autogenerated by utils/aarch64_builtins_test_generator.py
+// RUN: %clang_cc1 %s -fsyntax-only -triple aarch64-none-linux-gnu -target-feature +sme -target-feature +sve -target-feature +sve2p3 -verify
+// RUN: %clang_cc1 %s -fsyntax-only -triple aarch64-none-linux-gnu -target-feature +sme -target-feature +sme2p3 -target-feature +sve -verify
+// expected-no-diagnostics
+
+// REQUIRES: aarch64-registered-target
+
+#include <arm_sve.h>
+
+// Properties: guard="sve,(sve2p3|sme2p3)" streaming_guard="sme,(sve2p3|sme2p3)" flags="feature-dependent"
+
+void test(void) {
+  svbool_t svbool_t_val;
+  svint8_t svint8_t_val;
+  svint16_t svint16_t_val;
+  svint32_t svint32_t_val;
+  svint64_t svint64_t_val;
+  svuint8_t svuint8_t_val;
+  svuint16_t svuint16_t_val;
+  svuint32_t svuint32_t_val;
+  svuint64_t svuint64_t_val;
+
+  svaddqp(svint8_t_val, svint8_t_val);
+  svaddqp(svint16_t_val, svint16_t_val);
+  svaddqp(svint32_t_val, svint32_t_val);
+  svaddqp(svint64_t_val, svint64_t_val);
+  svaddqp(svuint8_t_val, svuint8_t_val);
+  svaddqp(svuint16_t_val, svuint16_t_val);
+  svaddqp(svuint32_t_val, svuint32_t_val);
+  svaddqp(svuint64_t_val, svuint64_t_val);
+  svaddqp_s8(svint8_t_val, svint8_t_val);
+  svaddqp_s16(svint16_t_val, svint16_t_val);
+  svaddqp_s32(svint32_t_val, svint32_t_val);
+  svaddqp_s64(svint64_t_val, svint64_t_val);
+  svaddqp_u8(svuint8_t_val, svuint8_t_val);
+  svaddqp_u16(svuint16_t_val, svuint16_t_val);
+  svaddqp_u32(svuint32_t_val, svuint32_t_val);
+  svaddqp_u64(svuint64_t_val, svuint64_t_val);
+  svaddsubp(svint8_t_val, svint8_t_val);
+  svaddsubp(svint16_t_val, svint16_t_val);
+  svaddsubp(svint32_t_val, svint32_t_val);
+  svaddsubp(svint64_t_val, svint64_t_val);
+  svaddsubp(svuint8_t_val, svuint8_t_val);
+  svaddsubp(svuint16_t_val, svuint16_t_val);
+  svaddsubp(svuint32_t_val, svuint32_t_val);
+  svaddsubp(svuint64_t_val, svuint64_t_val);
+  svaddsubp_s8(svint8_t_val, svint8_t_val);
+  svaddsubp_s16(svint16_t_val, svint16_t_val);
+  svaddsubp_s32(svint32_t_val, svint32_t_val);
+  svaddsubp_s64(svint64_t_val, svint64_t_val);
+  svaddsubp_u8(svuint8_t_val, svuint8_t_val);
+  svaddsubp_u16(svuint16_t_val, svuint16_t_val);
+  svaddsubp_u32(svuint32_t_val, svuint32_t_val);
+  svaddsubp_u64(svuint64_t_val, svuint64_t_val);
+  svsubp_m(svbool_t_val, svint8_t_val, svint8_t_val);
+  svsubp_m(svbool_t_val, svint16_t_val, svint16_t_val);
+  svsubp_m(svbool_t_val, svint32_t_val, svint32_t_val);
+  svsubp_m(svbool_t_val, svint64_t_val, svint64_t_val);
+  svsubp_m(svbool_t_val, svuint8_t_val, svuint8_t_val);
+  svsubp_m(svbool_t_val, svuint16_t_val, svuint16_t_val);
+  svsubp_m(svbool_t_val, svuint32_t_val, svuint32_t_val);
+  svsubp_m(svbool_t_val, svuint64_t_val, svuint64_t_val);
+  svsubp_s8_m(svbool_t_val, svint8_t_val, svint8_t_val);
+  svsubp_s8_x(svbool_t_val, svint8_t_val, svint8_t_val);
+  svsubp_s16_m(svbool_t_val, svint16_t_val, svint16_t_val);
+  svsubp_s16_x(svbool_t_val, svint16_t_val, svint16_t_val);
+  svsubp_s32_m(svbool_t_val, svint32_t_val, svint32_t_val);
+  svsubp_s32_x(svbool_t_val, svint32_t_val, svint32_t_val);
+  svsubp_s64_m(svbool_t_val, svint64_t_val, svint64_t_val);
+  svsubp_s64_x(svbool_t_val, svint64_t_val, svint64_t_val);
+  svsubp_u8_m(svbool_t_val, svuint8_t_val, svuint8_t_val);
+  svsubp_u8_x(svbool_t_val, svuint8_t_val, svuint8_t_val);
+  svsubp_u16_m(svbool_t_val, svuint16_t_val, svuint16_t_val);
+  svsubp_u16_x(svbool_t_val, svuint16_t_val, svuint16_t_val);
+  svsubp_u32_m(svbool_t_val, svuint32_t_val, svuint32_t_val);
+  svsubp_u32_x(svbool_t_val, svuint32_t_val, svuint32_t_val);
+  svsubp_u64_m(svbool_t_val, svuint64_t_val, svuint64_t_val);
+  svsubp_u64_x(svbool_t_val, svuint64_t_val, svuint64_t_val);
+  svsubp_x(svbool_t_val, svint8_t_val, svint8_t_val);
+  svsubp_x(svbool_t_val, svint16_t_val, svint16_t_val);
+  svsubp_x(svbool_t_val, svint32_t_val, svint32_t_val);
+  svsubp_x(svbool_t_val, svint64_t_val, svint64_t_val);
+  svsubp_x(svbool_t_val, svuint8_t_val, svuint8_t_val);
+  svsubp_x(svbool_t_val, svuint16_t_val, svuint16_t_val);
+  svsubp_x(svbool_t_val, svuint32_t_val, svuint32_t_val);
+  svsubp_x(svbool_t_val, svuint64_t_val, svuint64_t_val);
+}
+
+void test_streaming(void) __arm_streaming{
+  svbool_t svbool_t_val;
+  svint8_t svint8_t_val;
+  svint16_t svint16_t_val;
+  svint32_t svint32_t_val;
+  svint64_t svint64_t_val;
+  svuint8_t svuint8_t_val;
+  svuint16_t svuint16_t_val;
+  svuint32_t svuint32_t_val;
+  svuint64_t svuint64_t_val;
+
+  svaddqp(svint8_t_val, svint8_t_val);
+  svaddqp(svint16_t_val, svint16_t_val);
+  svaddqp(svint32_t_val, svint32_t_val);
+  svaddqp(svint64_t_val, svint64_t_val);
+  svaddqp(svuint8_t_val, svuint8_t_val);
+  svaddqp(svuint16_t_val, svuint16_t_val);
+  svaddqp(svuint32_t_val, svuint32_t_val);
+  svaddqp(svuint64_t_val, svuint64_t_val);
+  svaddqp_s8(svint8_t_val, svint8_t_val);
+  svaddqp_s16(svint16_t_val, svint16_t_val);
+  svaddqp_s32(svint32_t_val, svint32_t_val);
+  svaddqp_s64(svint64_t_val, svint64_t_val);
+  svaddqp_u8(svuint8_t_val, svuint8_t_val);
+  svaddqp_u16(svuint16_t_val, svuint16_t_val);
+  svaddqp_u32(svuint32_t_val, svuint32_t_val);
+  svaddqp_u64(svuint64_t_val, svuint64_t_val);
+  svaddsubp(svint8_t_val, svint8_t_val);
+  svaddsubp(svint16_t_val, svint16_t_val);
+  svaddsubp(svint32_t_val, svint32_t_val);
+  svaddsubp(svint64_t_val, svint64_t_val);
+  svaddsubp(svuint8_t_val, svuint8_t_val);
+  svaddsubp(svuint16_t_val, svuint16_t_val);
+  svaddsubp(svuint32_t_val, svuint32_t_val);
+  svaddsubp(svuint64_t_val, svuint64_t_val);
+  svaddsubp_s8(svint8_t_val, svint8_t_val);
+  svaddsubp_s16(svint16_t_val, svint16_t_val);
+  svaddsubp_s32(svint32_t_val, svint32_t_val);
+  svaddsubp_s64(svint64_t_val, svint64_t_val);
+  svaddsubp_u8(svuint8_t_val, svuint8_t_val);
+  svaddsubp_u16(svuint16_t_val, svuint16_t_val);
+  svaddsubp_u32(svuint32_t_val, svuint32_t_val);
+  svaddsubp_u64(svuint64_t_val, svuint64_t_val);
+  svsubp_m(svbool_t_val, svint8_t_val, svint8_t_val);
+  svsubp_m(svbool_t_val, svint16_t_val, svint16_t_val);
+  svsubp_m(svbool_t_val, svint32_t_val, svint32_t_val);
+  svsubp_m(svbool_t_val, svint64_t_val, svint64_t_val);
+  svsubp_m(svbool_t_val, svuint8_t_val, svuint8_t_val);
+  svsubp_m(svbool_t_val, svuint16_t_val, svuint16_t_val);
+  svsubp_m(svbool_t_val, svuint32_t_val, svuint32_t_val);
+  svsubp_m(svbool_t_val, svuint64_t_val, svuint64_t_val);
+  svsubp_s8_m(svbool_t_val, svint8_t_val, svint8_t_val);
+  svsubp_s8_x(svbool_t_val, svint8_t_val, svint8_t_val);
+  svsubp_s16_m(svbool_t_val, svint16_t_val, svint16_t_val);
+  svsubp_s16_x(svbool_t_val, svint16_t_val, svint16_t_val);
+  svsubp_s32_m(svbool_t_val, svint32_t_val, svint32_t_val);
+  svsubp_s32_x(svbool_t_val, svint32_t_val, svint32_t_val);
+  svsubp_s64_m(svbool_t_val, svint64_t_val, svint64_t_val);
+  svsubp_s64_x(svbool_t_val, svint64_t_val, svint64_t_val);
+  svsubp_u8_m(svbool_t_val, svuint8_t_val, svuint8_t_val);
+  svsubp_u8_x(svbool_t_val, svuint8_t_val, svuint8_t_val);
+  svsubp_u16_m(svbool_t_val, svuint16_t_val, svuint16_t_val);
+  svsubp_u16_x(svbool_t_val, svuint16_t_val, svuint16_t_val);
+  svsubp_u32_m(svbool_t_val, svuint32_t_val, svuint32_t_val);
+  svsubp_u32_x(svbool_t_val, svuint32_t_val, svuint32_t_val);
+  svsubp_u64_m(svbool_t_val, svuint64_t_val, svuint64_t_val);
+  svsubp_u64_x(svbool_t_val, svuint64_t_val, svuint64_t_val);
+  svsubp_x(svbool_t_val, svint8_t_val, svint8_t_val);
+  svsubp_x(svbool_t_val, svint16_t_val, svint16_t_val);
+  svsubp_x(svbool_t_val, svint32_t_val, svint32_t_val);
+  svsubp_x(svbool_t_val, svint64_t_val, svint64_t_val);
+  svsubp_x(svbool_t_val, svuint8_t_val, svuint8_t_val);
+  svsubp_x(svbool_t_val, svuint16_t_val, svuint16_t_val);
+  svsubp_x(svbool_t_val, svuint32_t_val, svuint32_t_val);
+  svsubp_x(svbool_t_val, svuint64_t_val, svuint64_t_val);
+}
+
+void test_streaming_compatible(void) __arm_streaming_compatible{
+  svbool_t svbool_t_val;
+  svint8_t svint8_t_val;
+  svint16_t svint16_t_val;
+  svint32_t svint32_t_val;
+  svint64_t svint64_t_val;
+  svuint8_t svuint8_t_val;
+  svuint16_t svuint16_t_val;
+  svuint32_t svuint32_t_val;
+  svuint64_t svuint64_t_val;
+
+  svaddqp(svint8_t_val, svint8_t_val);
+  svaddqp(svint16_t_val, svint16_t_val);
+  svaddqp(svint32_t_val, svint32_t_val);
+  svaddqp(svint64_t_val, svint64_t_val);
+  svaddqp(svuint8_t_val, svuint8_t_val);
+  svaddqp(svuint16_t_val, svuint16_t_val);
+  svaddqp(svuint32_t_val, svuint32_t_val);
+  svaddqp(svuint64_t_val, svuint64_t_val);
+  svaddqp_s8(svint8_t_val, svint8_t_val);
+  svaddqp_s16(svint16_t_val, svint16_t_val);
+  svaddqp_s32(svint32_t_val, svint32_t_val);
+  svaddqp_s64(svint64_t_val, svint64_t_val);
+  svaddqp_u8(svuint8_t_val, svuint8_t_val);
+  svaddqp_u16(svuint16_t_val, svuint16_t_val);
+  svaddqp_u32(svuint32_t_val, svuint32_t_val);
+  svaddqp_u64(svuint64_t_val, svuint64_t_val);
+  svaddsubp(svint8_t_val, svint8_t_val);
+  svaddsubp(svint16_t_val, svint16_t_val);
+  svaddsubp(svint32_t_val, svint32_t_val);
+  svaddsubp(svint64_t_val, svint64_t_val);
+  svaddsubp(svuint8_t_val, svuint8_t_val);
+  svaddsubp(svuint16_t_val, svuint16_t_val);
+  svaddsubp(svuint32_t_val, svuint32_t_val);
+  svaddsubp(svuint64_t_val, svuint64_t_val);
+  svaddsubp_s8(svint8_t_val, svint8_t_val);
+  svaddsubp_s16(svint16_t_val, svint16_t_val);
+  svaddsubp_s32(svint32_t_val, svint32_t_val);
+  svaddsubp_s64(svint64_t_val, svint64_t_val);
+  svaddsubp_u8(svuint8_t_val, svuint8_t_val);
+  svaddsubp_u16(svuint16_t_val, svuint16_t_val);
+  svaddsubp_u32(svuint32_t_val, svuint32_t_val);
+  svaddsubp_u64(svuint64_t_val, svuint64_t_val);
+  svsubp_m(svbool_t_val, svint8_t_val, svint8_t_val);
+  svsubp_m(svbool_t_val, svint16_t_val, svint16_t_val);
+  svsubp_m(svbool_t_val, svint32_t_val, svint32_t_val);
+  svsubp_m(svbool_t_val, svint64_t_val, svint64_t_val);
+  svsubp_m(svbool_t_val, svuint8_t_val, svuint8_t_val);
+  svsubp_m(svbool_t_val, svuint16_t_val, svuint16_t_val);
+  svsubp_m(svbool_t_val, svuint32_t_val, svuint32_t_val);
+  svsubp_m(svbool_t_val, svuint64_t_val, svuint64_t_val);
+  svsubp_s8_m(svbool_t_val, svint8_t_val, svint8_t_val);
+  svsubp_s8_x(svbool_t_val, svint8_t_val, svint8_t_val);
+  svsubp_s16_m(svbool_t_val, svint16_t_val, svint16_t_val);
+  svsubp_s16_x(svbool_t_val, svint16_t_val, svint16_t_val);
+  svsubp_s32_m(svbool_t_val, svint32_t_val, svint32_t_val);
+  svsubp_s32_x(svbool_t_val, svint32_t_val, svint32_t_val);
+  svsubp_s64_m(svbool_t_val, svint64_t_val, svint64_t_val);
+  svsubp_s64_x(svbool_t_val, svint64_t_val, svint64_t_val);
+  svsubp_u8_m(svbool_t_val, svuint8_t_val, svuint8_t_val);
+  svsubp_u8_x(svbool_t_val, svuint8_t_val, svuint8_t_val);
+  svsubp_u16_m(svbool_t_val, svuint16_t_val, svuint16_t_val);
+  svsubp_u16_x(svbool_t_val, svuint16_t_val, svuint16_t_val);
+  svsubp_u32_m(svbool_t_val, svuint32_t_val, svuint32_t_val);
+  svsubp_u32_x(svbool_t_val, svuint32_t_val, svuint32_t_val);
+  svsubp_u64_m(svbool_t_val, svuint64_t_val, svuint64_t_val);
+  svsubp_u64_x(svbool_t_val, svuint64_t_val, svuint64_t_val);
+  svsubp_x(svbool_t_val, svint8_t_val, svint8_t_val);
+  svsubp_x(svbool_t_val, svint16_t_val, svint16_t_val);
+  svsubp_x(svbool_t_val, svint32_t_val, svint32_t_val);
+  svsubp_x(svbool_t_val, svint64_t_val, svint64_t_val);
+  svsubp_x(svbool_t_val, svuint8_t_val, svuint8_t_val);
+  svsubp_x(svbool_t_val, svuint16_t_val, svuint16_t_val);
+  svsubp_x(svbool_t_val, svuint32_t_val, svuint32_t_val);
+  svsubp_x(svbool_t_val, svuint64_t_val, svuint64_t_val);
+}
@@ -2561,6 +2561,10 @@ def int_aarch64_sve_sminp   : AdvSIMD_Pred2VectorArg_Intrinsic<[IntrSpeculatable
 def int_aarch64_sve_umaxp   : AdvSIMD_Pred2VectorArg_Intrinsic<[IntrSpeculatable]>;
 def int_aarch64_sve_uminp   : AdvSIMD_Pred2VectorArg_Intrinsic<[IntrSpeculatable]>;
 
+def int_aarch64_sve_addqp   : AdvSIMD_2VectorArg_Intrinsic<[IntrSpeculatable]>;
+def int_aarch64_sve_addsubp : AdvSIMD_2VectorArg_Intrinsic<[IntrSpeculatable]>;
+def int_aarch64_sve_subp    : AdvSIMD_Pred2VectorArg_Intrinsic<[IntrSpeculatable]>;
+
 //
 // SVE2 - Widening pairwise arithmetic
 //
 
@@ -4834,11 +4834,11 @@ let Predicates = [HasSVE2p2_or_SME2p2] in {
 //===----------------------------------------------------------------------===//
 let Predicates = [HasSVE2p3_or_SME2p3] in {
   // SVE2 Add pairwise within quadword vector segments (unpredicated)
-  defm ADDQP_ZZZ     : sve2_int_mul<0b110, "addqp",   null_frag>;
+  defm ADDQP_ZZZ     : sve2_int_mul<0b110, "addqp",   int_aarch64_sve_addqp>;
 
   // SVE2 Add subtract/subtract pairwise
-  defm ADDSUBP_ZZZ   : sve2_int_mul<0b111, "addsubp", null_frag>;
-  defm SUBP_ZPmZZ    : sve2_int_arith_pred<0b100001, "subp", null_frag>;
+  defm ADDSUBP_ZZZ   : sve2_int_mul<0b111, "addsubp", int_aarch64_sve_addsubp>;
+  defm SUBP_ZPmZZ    : sve2_int_arith_pred<0b100001, "subp", int_aarch64_sve_subp>;
 
   // SVE2 integer absolute difference and accumulate long
   defm SABAL_ZZZ : sve2_int_two_way_absdiff_accum_long<0b0, "sabal">;
 
@@ -0,0 +1,40 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 6
+; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve2p3 -enable-subreg-liveness -verify-machineinstrs < %s | FileCheck %s
+; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sme2p3 -force-streaming -verify-machineinstrs < %s | FileCheck %s
+; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sme,+sve2p3 -force-streaming -verify-machineinstrs < %s | FileCheck %s
+
+define <vscale x 16 x i8> @test_svaddqp_i8(<vscale x 16 x i8> %zn, <vscale x 16 x i8> %zm) {
+; CHECK-LABEL: test_svaddqp_i8:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    addqp z0.b, z0.b, z1.b
+; CHECK-NEXT:    ret
+  %res = call <vscale x 16 x i8> @llvm.aarch64.sve.addqp.nxv16i8(<vscale x 16 x i8> %zn, <vscale x 16 x i8> %zm)
+  ret <vscale x 16 x i8> %res
+}
+
+define <vscale x 8 x i16> @test_svaddqp_i16(<vscale x 8 x i16> %zn, <vscale x 8 x i16> %zm) {
+; CHECK-LABEL: test_svaddqp_i16:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    addqp z0.h, z0.h, z1.h
+; CHECK-NEXT:    ret
+  %res = call <vscale x 8 x i16> @llvm.aarch64.sve.addqp.nxv8i16(<vscale x 8 x i16> %zn, <vscale x 8 x i16> %zm)
+  ret <vscale x 8 x i16> %res
+}
+
+define <vscale x 4 x i32> @test_svaddqp_i32(<vscale x 4 x i32> %zn, <vscale x 4 x i32> %zm) {
+; CHECK-LABEL: test_svaddqp_i32:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    addqp z0.s, z0.s, z1.s
+; CHECK-NEXT:    ret
+  %res = call <vscale x 4 x i32> @llvm.aarch64.sve.addqp.nxv4i32(<vscale x 4 x i32> %zn, <vscale x 4 x i32> %zm)
+  ret <vscale x 4 x i32> %res
+}
+
+define <vscale x 2 x i64> @test_svaddqp_i64(<vscale x 2 x i64> %zn, <vscale x 2 x i64> %zm) {
+; CHECK-LABEL: test_svaddqp_i64:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    addqp z0.d, z0.d, z1.d
+; CHECK-NEXT:    ret
+  %res = call <vscale x 2 x i64> @llvm.aarch64.sve.addqp.nxv2i64(<vscale x 2 x i64> %zn, <vscale x 2 x i64> %zm)
+  ret <vscale x 2 x i64> %res
+}
@@ -0,0 +1,40 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 6
+; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve2p3 -enable-subreg-liveness -verify-machineinstrs < %s | FileCheck %s
+; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sme2p3 -force-streaming -verify-machineinstrs < %s | FileCheck %s
+; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sme,+sve2p3 -force-streaming -verify-machineinstrs < %s | FileCheck %s
+
+define <vscale x 16 x i8> @test_addsubp_i8(<vscale x 16 x i8> %zn, <vscale x 16 x i8> %zm) {
+; CHECK-LABEL: test_addsubp_i8:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    addsubp z0.b, z0.b, z1.b
+; CHECK-NEXT:    ret
+  %res = call <vscale x 16 x i8> @llvm.aarch64.sve.addsubp.nxv16i8(<vscale x 16 x i8> %zn, <vscale x 16 x i8> %zm)
+  ret <vscale x 16 x i8> %res
+}
+
+define <vscale x 8 x i16> @test_addsubp_i16(<vscale x 8 x i16> %zn, <vscale x 8 x i16> %zm) {
+; CHECK-LABEL: test_addsubp_i16:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    addsubp z0.h, z0.h, z1.h
+; CHECK-NEXT:    ret
+  %res = call <vscale x 8 x i16> @llvm.aarch64.sve.addsubp.nxv8i16(<vscale x 8 x i16> %zn, <vscale x 8 x i16> %zm)
+  ret <vscale x 8 x i16> %res
+}
+
+define <vscale x 4 x i32> @test_addsubp_i32(<vscale x 4 x i32> %zn, <vscale x 4 x i32> %zm) {
+; CHECK-LABEL: test_addsubp_i32:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    addsubp z0.s, z0.s, z1.s
+; CHECK-NEXT:    ret
+  %res = call <vscale x 4 x i32> @llvm.aarch64.sve.addsubp.nxv4i32(<vscale x 4 x i32> %zn, <vscale x 4 x i32> %zm)
+  ret <vscale x 4 x i32> %res
+}
+
+define <vscale x 2 x i64> @test_addsubp_i64(<vscale x 2 x i64> %zn, <vscale x 2 x i64> %zm) {
+; CHECK-LABEL: test_addsubp_i64:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    addsubp z0.d, z0.d, z1.d
+; CHECK-NEXT:    ret
+  %res = call <vscale x 2 x i64> @llvm.aarch64.sve.addsubp.nxv2i64(<vscale x 2 x i64> %zn, <vscale x 2 x i64> %zm)
+  ret <vscale x 2 x i64> %res
+}