llama tests and upload stable stack manifest

mailvijayasingh · mailvijayasingh · commit 517bcbbb20c3 · 2025-05-01T16:56:30.000Z
diff --git a/.github/workflows/run_maxtext_jetstream_tests.yaml b/.github/workflows/run_maxtext_jetstream_tests.yaml
@@ -43,10 +43,17 @@ jobs:
     runs-on: ["self-hosted", "tpu", "v6e-8"]
     env:
       LOCAL_IMAGE_TAG: jetstream-maxtext-stable-stack/tpu:github_${{ github.run_id }}
+      OUTPUT_DIR: /output_dir
+    outputs:
+      manifest_name: ${{ steps.copy_build_manifest.outputs.manifest_name }}
     steps:
     - uses: actions/checkout@v4
     - name: Authenticate gcloud
       run: gcloud auth configure-docker gcr.io --quiet
+    - name: Prepare output directory
+      run: |
+          rm -rf ${OUTPUT_DIR}
+          mkdir -p ${OUTPUT_DIR}
     - name: Build
       run: |
           pushd experimental/jetstream-maxtext-stable-stack
@@ -64,6 +71,19 @@ jobs:
           UPLOAD_IMAGE_TAG=gcr.io/cloud-ml-auto-solutions/${LOCAL_IMAGE_TAG}
           docker tag ${LOCAL_IMAGE_TAG} ${UPLOAD_IMAGE_TAG}
           docker push ${UPLOAD_IMAGE_TAG}
+    - name: Copy build manifest
+      id: copy_build_manifest
+      run: |
+          TEMP_CONTAINER_ID=$(docker create ${LOCAL_IMAGE_TAG} bash -c 'ls jetstream_maxtext_manifest*')
+          MANIFEST_NAME=$(docker start -a $TEMP_CONTAINER_ID)
+          docker cp $TEMP_CONTAINER_ID:/jetstream_maxtext_stable_stack/$MANIFEST_NAME ${OUTPUT_DIR}
+          docker rm $TEMP_CONTAINER_ID
+          echo "manifest_name=${MANIFEST_NAME}" >> $GITHUB_OUTPUT
+    - name: Upload build artifact
+      uses: actions/upload-artifact@v4
+      with:
+        name: build_manifest
+        path: ${{ env.OUTPUT_DIR }}
 
   benchmark_report:
     name: Benchmark Report
@@ -72,7 +92,7 @@ jobs:
     env:
       OUTPUT_DIR: ./test_dir
     steps:
-    - name: Test MOEBenchmarks
+    - name: Test MOE Benchmarks
       run: |
         rm -rf ${OUTPUT_DIR}
         mkdir -p ${OUTPUT_DIR}
@@ -87,6 +107,19 @@ jobs:
           bash -c "
             bash JetStream/.github/workflows/test_moe_benchmarks.sh
           "
+    - name: Test llama 70b Benchmarks
+      run: |
+        # sync with the image uploaded from build_stable_stack stage
+        # Report should generated in OUTPUT_DIR depend on ENV
+        DOCKER_OUTPUT_DIR=/output
+        docker run \
+          -v ${OUTPUT_DIR}:${DOCKER_OUTPUT_DIR} \
+          --env OUTPUT_DIR=${DOCKER_OUTPUT_DIR} \
+          --privileged --net=host --rm -i \
+          gcr.io/cloud-ml-auto-solutions/jetstream-maxtext-stable-stack/tpu:github_${{ github.run_id }} \
+          bash -c "
+            bash JetStream/.github/workflows/test_llama_benchmarks.sh
+          "
     - name: Upload build artifact
       uses: actions/upload-artifact@v4
       with:
@@ -134,14 +167,22 @@ jobs:
     runs-on: ["self-hosted", "tpu", "v6e-8"]
     env:
       BENCHMARK_REPORT_DIR: ./benchmark_report
+      BUILD_MANIFEST_DIR: ./build_manifest
     steps:
     - name: Clean previous artifact
-      run: rm -rf ${{ env.BENCHMARK_REPORT_DIR }}
+      run: |
+        rm -rf ${{ env.BENCHMARK_REPORT_DIR }}
+        rm -rf ${{ env.BUILD_MANIFEST_DIR }}
     - name: Download benchmark artifact
       uses: actions/download-artifact@v4
       with:
         name: benchmark_report
         path: ${{ env.BENCHMARK_REPORT_DIR }}
+    - name: Download build manifest
+      uses: actions/download-artifact@v4
+      with:
+        name: build_manifest
+        path: ${{ env.BUILD_MANIFEST_DIR }}
     - name: Check whether one of the jobs failed
       if: ${{ failure() }}
       uses: jayqi/failed-build-issue-action@1a893bbf43ef1c2a8705e2b115cd4f0fe3c5649b  # v1.2.0
@@ -161,5 +202,5 @@ jobs:
         to: singhvijaya@google.com, yuyanpeng@google.com, vipannalla@google.com
         from: JetStream Runs
         secure: true
-        attachments: ${{ env.BENCHMARK_REPORT_DIR }}/moe_8x7b.txt,${{ env.BENCHMARK_REPORT_DIR }}/moe_8x22b.txt,${{ env.BENCHMARK_REPORT_DIR }}/moe_8x22b_long_context_8k_prefill.txt,${{ env.BENCHMARK_REPORT_DIR }}/moe_8x7b_jetstream.txt
+        attachments: ${{ env.BUILD_MANIFEST_DIR }}/${{ needs.build_stable_stack.outputs.manifest_name }},${{ env.BENCHMARK_REPORT_DIR }}/moe_8x7b.txt,${{ env.BENCHMARK_REPORT_DIR }}/moe_8x22b.txt,${{ env.BENCHMARK_REPORT_DIR }}/moe_8x22b_long_context_8k_prefill.txt,${{ env.BENCHMARK_REPORT_DIR }}/moe_8x7b_jetstream.txt,${{ env.BENCHMARK_REPORT_DIR }}/llama_70b_jetstream.txt
         body: workflow for ${{github.repository}} completed successfully!
diff --git a/.github/workflows/test_llama_benchmarks.sh b/.github/workflows/test_llama_benchmarks.sh
@@ -0,0 +1,32 @@
+#!/bin/bash
+
+OUTPUT_DIR=${OUTPUT_DIR:-$(pwd)/test_dir}
+
+pip install nltk==3.8.1
+python -c "import nltk; nltk.download('punkt')"
+
+cd maxtext
+
+export TOKENIZER_PATH=assets/tokenizer.llama2
+export MAX_PREFILL_PREDICT_LENGTH=1024
+export MAX_TARGET_LENGTH=2048
+export MODEL_NAME=llama2-70b
+export ICI_FSDP_PARALLELISM=1
+export ICI_AUTOREGRESSIVE_PARALLELISM=1
+export ICI_TENSOR_PARALLELISM=-1
+export SCAN_LAYERS=false
+export WEIGHT_DTYPE=bfloat16
+export PER_DEVICE_BATCH_SIZE=54
+export LOAD_PARAMETERS_PATH=gs://jetstream-runner/llama-70B-int8/int8_
+
+python -m MaxText.maxengine_server MaxText/configs/base.yml   tokenizer_path=${TOKENIZER_PATH}   load_parameters_path=${LOAD_PARAMETERS_PATH}   max_prefill_predict_length=${MAX_PREFILL_PREDICT_LENGTH}   max_target_length=${MAX_TARGET_LENGTH}   model_name=${MODEL_NAME}   ici_fsdp_parallelism=${ICI_FSDP_PARALLELISM}   ici_autoregressive_parallelism=${ICI_AUTOREGRESSIVE_PARALLELISM}   ici_tensor_parallelism=${ICI_TENSOR_PARALLELISM}   scan_layers=${SCAN_LAYERS}   weight_dtype=${WEIGHT_DTYPE}   per_device_batch_size=${PER_DEVICE_BATCH_SIZE} checkpoint_is_quantized=True quantization=int8 quantize_kvcache=True  enable_jax_profiler=True &
+
+sleep 800
+
+cd ..
+
+python JetStream/benchmarks/benchmark_serving.py   --tokenizer maxtext/assets/tokenizer.llama2 --save-result   --save-request-outputs   --request-outputs-file-path outputs.json   --num-prompts 1200   --max-output-length 1024  --dataset openorca --run-eval True > ${OUTPUT_DIR}/llama_70b_jetstream.txt
+tail -n25 ${OUTPUT_DIR}/llama_70b_jetstream.txt > ${OUTPUT_DIR}/llama_70b_jetstream.tmp && mv ${OUTPUT_DIR}/llama_70b_jetstream.tmp ${OUTPUT_DIR}/llama_70b_jetstream.txt
+
+# kill Jetstream server
+kill -9 %%