aws
diff --git a/‎.github/actions/build-image/action.yml‎
Lines changed: 5 additions & 0 deletions b/‎.github/actions/build-image/action.yml‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎.github/config/vllm-omni-ec2-amzn2023.yml‎
Lines changed: 26 additions & 0 deletions b/‎.github/config/vllm-omni-ec2-amzn2023.yml‎
Lines changed: 26 additions & 0 deletions
diff --git a/‎.github/config/vllm-omni-model-tests.yml‎
Lines changed: 57 additions & 0 deletions b/‎.github/config/vllm-omni-model-tests.yml‎
Lines changed: 57 additions & 0 deletions
diff --git a/‎.github/config/vllm-omni-sagemaker-amzn2023.yml‎
Lines changed: 26 additions & 0 deletions b/‎.github/config/vllm-omni-sagemaker-amzn2023.yml‎
Lines changed: 26 additions & 0 deletions
diff --git a/‎.github/scripts/build_image.sh‎
Lines changed: 8 additions & 0 deletions b/‎.github/scripts/build_image.sh‎
Lines changed: 8 additions & 0 deletions
@@ -69,6 +69,10 @@ inputs:
     description: 'Transformers library version (e.g., 4.28.1)'
     required: false
     default: ''
+  runtime-base:
+    description: 'Pre-built runtime base image URI. When set, skips compile stages.'
+    required: false
+    default: ''
 
 outputs:
   image-uri:
@@ -120,3 +124,4 @@ runs:
         INFERENCE_TOOLKIT_VERSION: ${{ inputs.inference-toolkit-version }}
         TORCHSERVE_VERSION: ${{ inputs.torchserve-version }}
         TRANSFORMERS_VERSION: ${{ inputs.transformers-version }}
+        RUNTIME_BASE: ${{ inputs.runtime-base }}
@@ -0,0 +1,26 @@
+# vLLM-Omni EC2 AL2023 Image Configuration
+
+image:
+  name: "vllm-omni-ec2-amzn2023"
+  description: "vLLM-Omni for EC2 instances (AL2023, omni-modality serving)"
+
+common:
+  framework: "vllm-omni"
+  framework_version: "0.18.0"
+  job_type: "general"
+  python_version: "py312"
+  cuda_version: "cu129"
+  os_version: "amzn2023"
+  customer_type: "ec2"
+  arch_type: "x86"
+  prod_image: "vllm-omni:0.18-gpu-py312-ec2"
+  device_type: "gpu"
+  contributor: "None"
+
+release:
+  release: false
+  force_release: false
+  public_registry: false
+  private_registry: true
+  enable_soci: true
+  environment: production
@@ -0,0 +1,57 @@
+# vLLM-Omni Model Test Configuration
+# Tests for omni-modality models (TTS, image generation, video, omni-chat)
+#
+# Each model defines its test_request (sent to /invocations via middleware)
+# and the route for the SageMaker routing middleware.
+#
+# Models use s3_model (pre-cached in S3) downloaded by the download-model action.
+
+s3_prefix: "s3://dlc-cicd-models/omni-models"
+
+smoke-test:
+  codebuild-fleet:
+    # --- TTS models (route: /v1/audio/speech) ---
+    - name: "qwen3-tts-1.7b-customvoice"
+      s3_model: "qwen3-tts-1.7b-customvoice.tar.gz"
+      fleet: "x86-g6xl-runner"
+      extra_args: ""
+      route: "/v1/audio/speech"
+      test_request: '{"input": "Hello, how are you?", "voice": "vivian", "language": "English"}'
+      validate: "binary_size_gt:1000"
+
+    # --- Image generation models (route: /v1/images/generations) ---
+    - name: "flux2-klein-4b"
+      s3_model: "flux2-klein-4b.tar.gz"
+      fleet: "x86-g6xl-runner"
+      extra_args: ""
+      route: "/v1/images/generations"
+      test_request: '{"prompt": "a red apple on a white table", "size": "512x512", "n": 1}'
+      validate: "json_field:data[0].b64_json"
+
+    # --- Video generation models (route: /v1/videos) ---
+    - name: "wan2.1-t2v-1.3b"
+      s3_model: "wan2.1-t2v-1.3b.tar.gz"
+      fleet: "x86-g6exl-runner"
+      extra_args: ""
+      route: "/v1/videos"
+      content_type: "multipart/form-data"
+      test_request: 'prompt=a dog running on a beach&num_frames=17&num_inference_steps=4&size=480x320&seed=42'
+      validate: "json_field:id"
+
+    # --- Omni chat models (route: /v1/chat/completions, fallthrough) ---
+    # model is big, won't run for now
+    # - name: "bagel-7b-mot"
+    #   s3_model: "bagel-7b-mot.tar.gz"
+    #   fleet: "x86-g6e4xl-runner"
+    #   extra_args: ""
+    #   route: "/v1/chat/completions"
+    #   test_request: '{"messages": [{"role": "user", "content": [{"type": "text", "text": "<|im_start|>A cute cat<|im_end|>"}]}], "modalities": ["image"], "height": 512, "width": 512, "num_inference_steps": 4, "seed": 42}'
+    #   validate: "json_field:choices[0].message.content"
+
+    - name: "qwen2.5-omni-3b"
+      s3_model: "qwen2.5-omni-3b.tar.gz"
+      fleet: "x86-g6e12xl-runner"
+      extra_args: ""
+      route: "/v1/chat/completions"
+      test_request: '{"messages": [{"role": "user", "content": "Say hello in one sentence."}], "max_tokens": 64}'
+      validate: "json_field:choices[0].message.content"
@@ -0,0 +1,26 @@
+# vLLM-Omni SageMaker AL2023 Image Configuration
+
+image:
+  name: "vllm-omni-sagemaker-amzn2023"
+  description: "vLLM-Omni for SageMaker (AL2023, omni-modality serving)"
+
+common:
+  framework: "vllm-omni"
+  framework_version: "0.18.0"
+  job_type: "general"
+  python_version: "py312"
+  cuda_version: "cu129"
+  os_version: "amzn2023"
+  customer_type: "sagemaker"
+  arch_type: "x86"
+  prod_image: "vllm-omni:0.18-gpu-py312-sagemaker"
+  device_type: "gpu"
+  contributor: "None"
+
+release:
+  release: false
+  force_release: false
+  public_registry: false
+  private_registry: true
+  enable_soci: true
+  environment: production
@@ -26,6 +26,7 @@ CUSTOMER_TYPE="${CUSTOMER_TYPE:-}"
 INFERENCE_TOOLKIT_VERSION="${INFERENCE_TOOLKIT_VERSION:-}"
 TORCHSERVE_VERSION="${TORCHSERVE_VERSION:-}"
 TRANSFORMERS_VERSION="${TRANSFORMERS_VERSION:-}"
+RUNTIME_BASE="${RUNTIME_BASE:-}"
 
 # Resolve image URI
 CI_IMAGE_URI="${AWS_ACCOUNT_ID}.dkr.ecr.${AWS_REGION}.amazonaws.com/ci:${TAG_PR}"
@@ -67,6 +68,13 @@ BUILD_CMD="docker buildx build --progress plain \
   --build-arg FRAMEWORK=\"${FRAMEWORK}\" \
   --build-arg FRAMEWORK_VERSION=\"${FRAMEWORK_VERSION}\""
 
+# Use pre-built runtime base if available (skips compile stages)
+if [[ -n "${RUNTIME_BASE}" ]]; then
+  echo "Using pre-built runtime base: ${RUNTIME_BASE}"
+  BUILD_CMD="${BUILD_CMD} \
+  --build-arg RUNTIME_BASE=\"${RUNTIME_BASE}\""
+fi
+
 # Add SageMaker labels if customer-type is 'sagemaker'
 if [[ "${CUSTOMER_TYPE}" == "sagemaker" ]]; then
   BUILD_CMD="${BUILD_CMD} \