pq-code-package
diff --git a/‎.github/workflows/hol_light.yml‎
Lines changed: 4 additions & 0 deletions b/‎.github/workflows/hol_light.yml‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎dev/aarch64_opt/src/arith_native_aarch64.h‎
Lines changed: 26 additions & 4 deletions b/‎dev/aarch64_opt/src/arith_native_aarch64.h‎
Lines changed: 26 additions & 4 deletions
diff --git a/‎mldsa/src/native/aarch64/src/arith_native_aarch64.h‎
Lines changed: 26 additions & 4 deletions b/‎mldsa/src/native/aarch64/src/arith_native_aarch64.h‎
Lines changed: 26 additions & 4 deletions
diff --git a/‎nix/s2n_bignum/default.nix‎
Lines changed: 2 additions & 2 deletions b/‎nix/s2n_bignum/default.nix‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎proofs/cbmc/rej_uniform_eta_native_aarch64/Makefile‎
Lines changed: 54 additions & 0 deletions b/‎proofs/cbmc/rej_uniform_eta_native_aarch64/Makefile‎
Lines changed: 54 additions & 0 deletions
diff --git a/‎proofs/cbmc/rej_uniform_eta_native_aarch64/rej_uniform_eta_native_aarch64_harness.c‎
Lines changed: 29 additions & 0 deletions b/‎proofs/cbmc/rej_uniform_eta_native_aarch64/rej_uniform_eta_native_aarch64_harness.c‎
Lines changed: 29 additions & 0 deletions
diff --git a/‎proofs/hol_light/README.md‎
Lines changed: 2 additions & 0 deletions b/‎proofs/hol_light/README.md‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎proofs/hol_light/aarch64/Makefile‎
Lines changed: 2 additions & 0 deletions b/‎proofs/hol_light/aarch64/Makefile‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎proofs/hol_light/aarch64/mldsa/rej_uniform_eta2_aarch64_asm.S‎
Lines changed: 124 additions & 0 deletions b/‎proofs/hol_light/aarch64/mldsa/rej_uniform_eta2_aarch64_asm.S‎
Lines changed: 124 additions & 0 deletions
@@ -103,6 +103,10 @@ jobs:
             needs: ["mldsa_specs.ml", "aarch64_utils.ml", "subroutine_signatures.ml"]
           - name: poly_use_hint_88_aarch64_asm
             needs: ["mldsa_specs.ml", "aarch64_utils.ml", "subroutine_signatures.ml"]
+          - name: rej_uniform_eta2_aarch64_asm
+            needs: ["mldsa_specs.ml", "aarch64_utils.ml", "mldsa_rej_uniform_eta_table.ml", "subroutine_signatures.ml"]
+          - name: rej_uniform_eta4_aarch64_asm
+            needs: ["mldsa_specs.ml", "aarch64_utils.ml", "mldsa_rej_uniform_eta_table.ml", "subroutine_signatures.ml"]
           - name: keccak_f1600_x1_scalar_aarch64_asm
             needs: ["keccak_spec.ml", "keccak_constants.ml", "subroutine_signatures.ml"]
           - name: keccak_f1600_x1_v84a_aarch64_asm
 
@@ -113,15 +113,37 @@ __contract__(
   MLD_NAMESPACE(rej_uniform_eta2_aarch64_asm)
 MLD_MUST_CHECK_RETURN_VALUE
 uint64_t mld_rej_uniform_eta2_aarch64_asm(int32_t *r, const uint8_t *buf,
-                                          unsigned buflen,
-                                          const uint8_t *table);
+                                          unsigned buflen, const uint8_t *table)
+/* This must be kept in sync with the HOL-Light specification
+ * in proofs/hol_light/aarch64/proofs/mldsa_rej_uniform_eta2.ml */
+__contract__(
+  requires(buflen % 8 == 0)
+  requires(buflen >= 8)
+  requires(memory_no_alias(r, sizeof(int32_t) * MLDSA_N))
+  requires(memory_no_alias(buf, buflen))
+  requires(memory_no_alias(table, 4096)) /* check-magic: 4096 == 256 * 16 */
+  assigns(memory_slice(r, sizeof(int32_t) * MLDSA_N))
+  ensures(return_value <= MLDSA_N)
+  ensures(array_abs_bound(r, 0, return_value, MLDSA_ETA + 1))
+);
 
 #define mld_rej_uniform_eta4_aarch64_asm \
   MLD_NAMESPACE(rej_uniform_eta4_aarch64_asm)
 MLD_MUST_CHECK_RETURN_VALUE
 uint64_t mld_rej_uniform_eta4_aarch64_asm(int32_t *r, const uint8_t *buf,
-                                          unsigned buflen,
-                                          const uint8_t *table);
+                                          unsigned buflen, const uint8_t *table)
+/* This must be kept in sync with the HOL-Light specification
+ * in proofs/hol_light/aarch64/proofs/mldsa_rej_uniform_eta4.ml */
+__contract__(
+  requires(buflen % 8 == 0)
+  requires(buflen >= 8)
+  requires(memory_no_alias(r, sizeof(int32_t) * MLDSA_N))
+  requires(memory_no_alias(buf, buflen))
+  requires(memory_no_alias(table, 4096)) /* check-magic: 4096 == 256 * 16 */
+  assigns(memory_slice(r, sizeof(int32_t) * MLDSA_N))
+  ensures(return_value <= MLDSA_N)
+  ensures(array_abs_bound(r, 0, return_value, MLDSA_ETA + 1))
+);
 #endif /* !MLD_CONFIG_NO_KEYPAIR_API */
 
 #if !defined(MLD_CONFIG_NO_SIGN_API)
 
@@ -113,15 +113,37 @@ __contract__(
   MLD_NAMESPACE(rej_uniform_eta2_aarch64_asm)
 MLD_MUST_CHECK_RETURN_VALUE
 uint64_t mld_rej_uniform_eta2_aarch64_asm(int32_t *r, const uint8_t *buf,
-                                          unsigned buflen,
-                                          const uint8_t *table);
+                                          unsigned buflen, const uint8_t *table)
+/* This must be kept in sync with the HOL-Light specification
+ * in proofs/hol_light/aarch64/proofs/mldsa_rej_uniform_eta2.ml */
+__contract__(
+  requires(buflen % 8 == 0)
+  requires(buflen >= 8)
+  requires(memory_no_alias(r, sizeof(int32_t) * MLDSA_N))
+  requires(memory_no_alias(buf, buflen))
+  requires(memory_no_alias(table, 4096)) /* check-magic: 4096 == 256 * 16 */
+  assigns(memory_slice(r, sizeof(int32_t) * MLDSA_N))
+  ensures(return_value <= MLDSA_N)
+  ensures(array_abs_bound(r, 0, return_value, MLDSA_ETA + 1))
+);
 
 #define mld_rej_uniform_eta4_aarch64_asm \
   MLD_NAMESPACE(rej_uniform_eta4_aarch64_asm)
 MLD_MUST_CHECK_RETURN_VALUE
 uint64_t mld_rej_uniform_eta4_aarch64_asm(int32_t *r, const uint8_t *buf,
-                                          unsigned buflen,
-                                          const uint8_t *table);
+                                          unsigned buflen, const uint8_t *table)
+/* This must be kept in sync with the HOL-Light specification
+ * in proofs/hol_light/aarch64/proofs/mldsa_rej_uniform_eta4.ml */
+__contract__(
+  requires(buflen % 8 == 0)
+  requires(buflen >= 8)
+  requires(memory_no_alias(r, sizeof(int32_t) * MLDSA_N))
+  requires(memory_no_alias(buf, buflen))
+  requires(memory_no_alias(table, 4096)) /* check-magic: 4096 == 256 * 16 */
+  assigns(memory_slice(r, sizeof(int32_t) * MLDSA_N))
+  ensures(return_value <= MLDSA_N)
+  ensures(array_abs_bound(r, 0, return_value, MLDSA_ETA + 1))
+);
 #endif /* !MLD_CONFIG_NO_KEYPAIR_API */
 
 #if !defined(MLD_CONFIG_NO_SIGN_API)
 
@@ -4,12 +4,12 @@
 { stdenv, fetchFromGitHub, writeText, ... }:
 stdenv.mkDerivation rec {
   pname = "s2n_bignum";
-  version = "f3c5acff6948d559194245237f6aaa7ebf7fcae8";
+  version = "ccef24569ed5c41f4e7fcb19965bf48eff3fdaa0";
   src = fetchFromGitHub {
     owner = "awslabs";
     repo = "s2n-bignum";
     rev = "${version}";
-    hash = "sha256-kfc8X2e+voefttshSUdifDc3Qn+dx0Gq5ENNLhWIdw0=";
+    hash = "sha256-1KHAmHtBKMO+8Ea+1TTF6adKW3XKRmfcJC1vNZ/guRA=";
   };
   setupHook = writeText "setup-hook.sh" ''
     export S2N_BIGNUM_DIR="$1"
 
@@ -0,0 +1,54 @@
+# Copyright (c) The mldsa-native project authors
+# SPDX-License-Identifier: Apache-2.0 OR ISC OR MIT
+
+include ../Makefile_params.common
+
+HARNESS_ENTRY = harness
+HARNESS_FILE = rej_uniform_eta_native_aarch64_harness
+
+# This should be a unique identifier for this proof, and will appear on the
+# Litani dashboard. It can be human-readable and contain spaces if you wish.
+PROOF_UID = rej_uniform_eta_native_aarch64
+
+# We need to set MLD_CHECK_APIS as otherwise mldsa/src/native/api.h won't be
+# included, which contains the CBMC specifications.
+DEFINES += -DMLD_CONFIG_USE_NATIVE_BACKEND_ARITH -DMLD_CONFIG_ARITH_BACKEND_FILE="\"$(SRCDIR)/mldsa/src/native/aarch64/meta.h\"" -DMLD_CHECK_APIS
+INCLUDES +=
+
+REMOVE_FUNCTION_BODY +=
+UNWINDSET +=
+
+PROOF_SOURCES += $(PROOFDIR)/$(HARNESS_FILE).c
+PROJECT_SOURCES += $(SRCDIR)/mldsa/src/poly_kl.c
+
+# ML-DSA-44 and ML-DSA-87 use eta=2; ML-DSA-65 uses eta=4.
+ifeq ($(MLD_CONFIG_PARAMETER_SET),44)
+    CHECK_FUNCTION_CONTRACTS=mld_rej_uniform_eta2_native
+    USE_FUNCTION_CONTRACTS=mld_rej_uniform_eta2_aarch64_asm
+else ifeq ($(MLD_CONFIG_PARAMETER_SET),65)
+    CHECK_FUNCTION_CONTRACTS=mld_rej_uniform_eta4_native
+    USE_FUNCTION_CONTRACTS=mld_rej_uniform_eta4_aarch64_asm
+else ifeq ($(MLD_CONFIG_PARAMETER_SET),87)
+    CHECK_FUNCTION_CONTRACTS=mld_rej_uniform_eta2_native
+    USE_FUNCTION_CONTRACTS=mld_rej_uniform_eta2_aarch64_asm
+endif
+USE_FUNCTION_CONTRACTS += mld_sys_check_capability
+APPLY_LOOP_CONTRACTS=on
+USE_DYNAMIC_FRAMES=1
+
+# Disable any setting of EXTERNAL_SAT_SOLVER, and choose SMT backend instead
+EXTERNAL_SAT_SOLVER=
+CBMCFLAGS=--bitwuzla
+
+FUNCTION_NAME = rej_uniform_eta_native_aarch64
+
+# If this proof is found to consume huge amounts of RAM, you can set the
+# EXPENSIVE variable. With new enough versions of the proof tools, this will
+# restrict the number of EXPENSIVE CBMC jobs running at once. See the
+# documentation in Makefile.common under the "Job Pools" heading for details.
+# EXPENSIVE = true
+
+# This function is large enough to need...
+CBMC_OBJECT_BITS = 8
+
+include ../Makefile.common
@@ -0,0 +1,29 @@
+// Copyright (c) The mldsa-native project authors
+// SPDX-License-Identifier: Apache-2.0 OR ISC OR MIT
+
+#include <stdint.h>
+#include "cbmc.h"
+#include "params.h"
+
+#if MLDSA_ETA == 2
+int mld_rej_uniform_eta2_native(int32_t *r, unsigned len, const uint8_t *buf,
+                                unsigned buflen);
+#elif MLDSA_ETA == 4
+int mld_rej_uniform_eta4_native(int32_t *r, unsigned len, const uint8_t *buf,
+                                unsigned buflen);
+#endif
+
+void harness(void)
+{
+  int32_t *r;
+  unsigned len;
+  const uint8_t *buf;
+  unsigned buflen;
+  int t;
+
+#if MLDSA_ETA == 2
+  t = mld_rej_uniform_eta2_native(r, len, buf, buflen);
+#elif MLDSA_ETA == 4
+  t = mld_rej_uniform_eta4_native(r, len, buf, buflen);
+#endif
+}
@@ -126,6 +126,8 @@ echo '1+1;;' | nc -w 5 127.0.0.1 2012
   * AArch64 pointwise multiplication-accumulation (l=5): [mld_polyvecl_pointwise_acc_montgomery_l5_aarch64_asm.S](aarch64/mldsa/mld_polyvecl_pointwise_acc_montgomery_l5_aarch64_asm.S)
   * AArch64 pointwise multiplication-accumulation (l=7): [mld_polyvecl_pointwise_acc_montgomery_l7_aarch64_asm.S](aarch64/mldsa/mld_polyvecl_pointwise_acc_montgomery_l7_aarch64_asm.S)
   * AArch64 rejection sampling: [rej_uniform_aarch64_asm.S](aarch64/mldsa/rej_uniform_aarch64_asm.S)
+  * AArch64 rejection sampling (eta=2): [rej_uniform_eta2_aarch64_asm.S](aarch64/mldsa/rej_uniform_eta2_aarch64_asm.S)
+  * AArch64 rejection sampling (eta=4): [rej_uniform_eta4_aarch64_asm.S](aarch64/mldsa/rej_uniform_eta4_aarch64_asm.S)
 - FIPS202:
   * Keccak-F1600 using lazy rotations[^HYBRID]: [keccak_f1600_x1_scalar_aarch64_asm.S](aarch64/mldsa/keccak_f1600_x1_scalar_aarch64_asm.S)
   * Keccak-F1600 using v8.4-A SHA3 instructions: [keccak_f1600_x1_v84a_aarch64_asm.S](aarch64/mldsa/keccak_f1600_x1_v84a_aarch64_asm.S)
 
@@ -63,6 +63,8 @@ OBJ = mldsa/intt_aarch64_asm.o \
       mldsa/mld_polyvecl_pointwise_acc_montgomery_l4_aarch64_asm.o \
       mldsa/mld_polyvecl_pointwise_acc_montgomery_l5_aarch64_asm.o \
       mldsa/mld_polyvecl_pointwise_acc_montgomery_l7_aarch64_asm.o \
+      mldsa/rej_uniform_eta2_aarch64_asm.o \
+      mldsa/rej_uniform_eta4_aarch64_asm.o \
       mldsa/keccak_f1600_x1_scalar_aarch64_asm.o \
       mldsa/keccak_f1600_x1_v84a_aarch64_asm.o \
       mldsa/keccak_f1600_x2_v84a_aarch64_asm.o \
 
@@ -0,0 +1,124 @@
+/*
+ * Copyright (c) The mldsa-native project authors
+ * Copyright (c) The mlkem-native project authors
+ * SPDX-License-Identifier: Apache-2.0 OR ISC OR MIT
+ */
+
+/*
+ * Standalone assembly for mld_rej_uniform_eta2_asm for HOL Light proofs.
+ * This file is assembled to produce the object file that
+ * define_assert_from_elf reads to extract the bytecodes being verified.
+ *
+ * Source: dev/aarch64_opt/src/rej_uniform_eta2_asm.S
+ */
+
+#define MLDSA_N 256
+
+.text
+.balign 4
+
+// uint64_t mld_rej_uniform_eta2_asm(int32_t *r, const uint8_t *buf,
+//                                   unsigned buflen, const uint8_t *table);
+.global mld_rej_uniform_eta2_asm
+mld_rej_uniform_eta2_asm:
+        sub     sp, sp, #0x240
+        mov     x7, #0x1
+        movk    x7, #0x2, lsl #16
+        movk    x7, #0x4, lsl #32
+        movk    x7, #0x8, lsl #48
+        mov     v31.d[0], x7
+        mov     x7, #0x10
+        movk    x7, #0x20, lsl #16
+        movk    x7, #0x40, lsl #32
+        movk    x7, #0x80, lsl #48
+        mov     v31.d[1], x7
+        movi    v30.8h, #15
+        mov     x8, sp
+        mov     x7, x8
+        mov     x11, #0
+        eor     v16.16b, v16.16b, v16.16b
+.Lzero:
+        str     q16, [x7], #64
+        str     q16, [x7, #-48]
+        str     q16, [x7, #-32]
+        str     q16, [x7, #-16]
+        add     x11, x11, #32
+        cmp     x11, #MLDSA_N
+        b.lt    .Lzero
+        mov     x7, x8
+        mov     x9, #0
+        mov     x4, #MLDSA_N
+.Lloop:
+        cmp     x9, x4
+        b.hs    .Lcopy
+        sub     x2, x2, #8
+        ld1     {v0.8b}, [x1], #8
+        movi    v26.8b, #0x0F
+        and     v27.8b, v0.8b, v26.8b
+        ushr    v28.8b, v0.8b, #4
+        zip1    v26.8b, v27.8b, v28.8b
+        zip2    v29.8b, v27.8b, v28.8b
+        ushll   v16.8h, v26.8b, #0
+        ushll   v17.8h, v29.8b, #0
+        cmhi    v4.8h, v30.8h, v16.8h
+        cmhi    v5.8h, v30.8h, v17.8h
+        and     v4.16b, v4.16b, v31.16b
+        and     v5.16b, v5.16b, v31.16b
+        uaddlv  s20, v4.8h
+        uaddlv  s21, v5.8h
+        fmov    w12, s20
+        fmov    w13, s21
+        ldr     q24, [x3, x12, lsl #4]
+        ldr     q25, [x3, x13, lsl #4]
+        cnt     v4.16b, v4.16b
+        cnt     v5.16b, v5.16b
+        uaddlv  s20, v4.8h
+        uaddlv  s21, v5.8h
+        fmov    w12, s20
+        fmov    w13, s21
+        tbl     v16.16b, {v16.16b}, v24.16b
+        tbl     v17.16b, {v17.16b}, v25.16b
+        st1     {v16.8h}, [x7]
+        add     x7, x7, x12, lsl #1
+        st1     {v17.8h}, [x7]
+        add     x7, x7, x13, lsl #1
+        add     x12, x12, x13
+        add     x9, x9, x12
+        cmp     x2, #8
+        b.hs    .Lloop
+.Lcopy:
+        cmp     x9, x4
+        csel    x9, x9, x4, lo
+        // Barrett reduction constants for mod 5
+        movz    w7, #6554
+        dup     v26.8h, w7
+        movi    v27.8h, #5
+        movi    v7.8h, #2
+        mov     x11, #0
+        mov     x7, x8
+.Lcopy_loop:
+        ldr     q16, [x7], #32
+        ldr     q18, [x7, #-16]
+        // Barrett reduction: val mod 5
+        sqdmulh v28.8h, v16.8h, v26.8h
+        mls     v16.8h, v28.8h, v27.8h
+        sqdmulh v28.8h, v18.8h, v26.8h
+        mls     v18.8h, v28.8h, v27.8h
+        // eta - (val mod 5) = 2 - (val mod 5)
+        sub     v16.8h, v7.8h, v16.8h
+        sub     v18.8h, v7.8h, v18.8h
+        // Sign-extend 16->32 bit
+        sshll2  v17.4s, v16.8h, #0
+        sshll   v16.4s, v16.4h, #0
+        sshll2  v19.4s, v18.8h, #0
+        sshll   v18.4s, v18.4h, #0
+        str     q16, [x0], #64
+        str     q17, [x0, #-48]
+        str     q18, [x0, #-32]
+        str     q19, [x0, #-16]
+        add     x11, x11, #16
+        cmp     x11, #MLDSA_N
+        b.lt    .Lcopy_loop
+        mov     x0, x9
+        add     sp, sp, #0x240
+        ret