SemiAnalysisAI
diff --git a/‎.github/configs/runners.yaml‎
Lines changed: 1 addition & 8 deletions b/‎.github/configs/runners.yaml‎
Lines changed: 1 addition & 8 deletions
diff --git a/‎benchmarks/single_node/dsr1_fp4_b200.sh‎
Lines changed: 1 addition & 1 deletion b/‎benchmarks/single_node/dsr1_fp4_b200.sh‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎benchmarks/single_node/dsr1_fp4_b200_trt.sh‎
Lines changed: 1 addition & 1 deletion b/‎benchmarks/single_node/dsr1_fp4_b200_trt.sh‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎benchmarks/single_node/dsr1_fp4_b200_trt_mtp.sh‎
Lines changed: 1 addition & 1 deletion b/‎benchmarks/single_node/dsr1_fp4_b200_trt_mtp.sh‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎benchmarks/single_node/dsr1_fp4_b300.sh‎
Lines changed: 1 addition & 1 deletion b/‎benchmarks/single_node/dsr1_fp4_b300.sh‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎benchmarks/single_node/dsr1_fp4_mi355x.sh‎
Lines changed: 1 addition & 1 deletion b/‎benchmarks/single_node/dsr1_fp4_mi355x.sh‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎benchmarks/single_node/dsr1_fp8_b200.sh‎
Lines changed: 1 addition & 1 deletion b/‎benchmarks/single_node/dsr1_fp8_b200.sh‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎benchmarks/single_node/dsr1_fp8_b200_mtp.sh‎
Lines changed: 1 addition & 1 deletion b/‎benchmarks/single_node/dsr1_fp8_b200_mtp.sh‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎benchmarks/single_node/dsr1_fp8_b200_trt.sh‎
Lines changed: 1 addition & 1 deletion b/‎benchmarks/single_node/dsr1_fp8_b200_trt.sh‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎benchmarks/single_node/dsr1_fp8_b200_trt_mtp.sh‎
Lines changed: 1 addition & 1 deletion b/‎benchmarks/single_node/dsr1_fp8_b200_trt_mtp.sh‎
Lines changed: 1 addition & 1 deletion
@@ -79,17 +79,10 @@ b200:
 - 'b200-dgxc_07'
 - 'b200-dgxc_08'
 - 'b200-dgxc_09'
-- 'b200-dgxc_10'
-- 'b200-dgxc_11'
-- 'b200-dgxc_12'
-- 'b200-dgxc_13'
-- 'b200-dgxc_14'
-- 'b200-dgxc_15'
-- 'b200-dgxc_16'
 b200-multinode:
-- 'b200-dgxc-slurm_6'
 - 'b200-dgxc-slurm_7'
 - 'b200-dgxc-slurm_8'
+- 'b200-dgxc-slurm_9'
 mi300x:
 - 'mi300x-amds_00'
 - 'mi300x-amds_01'
 
@@ -16,7 +16,7 @@ if [[ -n "$SLURM_JOB_ID" ]]; then
   echo "JOB $SLURM_JOB_ID running on $SLURMD_NODENAME"
 fi
 
-hf download "$MODEL"
+if [[ "$MODEL" != /* ]]; then hf download "$MODEL"; fi
 
 nvidia-smi
 
 
@@ -20,7 +20,7 @@ fi
 
 echo "TP: $TP, CONC: $CONC, ISL: $ISL, OSL: $OSL, EP_SIZE: $EP_SIZE, DP_ATTENTION: $DP_ATTENTION"
 
-hf download "$MODEL"
+if [[ "$MODEL" != /* ]]; then hf download "$MODEL"; fi
 
 # ========= Determine other parameters based on ISL, OSL, CONC =========
 CUDA_GRAPH_MAX_BATCH_SIZE=$CONC
 
@@ -20,7 +20,7 @@ fi
 
 echo "TP: $TP, CONC: $CONC, ISL: $ISL, OSL: $OSL, EP_SIZE: $EP_SIZE, DP_ATTENTION: $DP_ATTENTION"
 
-hf download "$MODEL"
+if [[ "$MODEL" != /* ]]; then hf download "$MODEL"; fi
 
 # ========= Determine MOE_BACKEND and MTP based on DP_ATTENTION =========
 MOE_BACKEND="TRTLLM"
 
@@ -20,7 +20,7 @@ if [[ -n "$SLURM_JOB_ID" ]]; then
   echo "JOB $SLURM_JOB_ID running on $SLURMD_NODENAME"
 fi
 
-hf download "$MODEL"
+if [[ "$MODEL" != /* ]]; then hf download "$MODEL"; fi
 
 nvidia-smi
 
 
@@ -15,7 +15,7 @@ if [[ -n "$SLURM_JOB_ID" ]]; then
   echo "JOB $SLURM_JOB_ID running on $SLURMD_NODENAME"
 fi
 
-hf download "$MODEL"
+if [[ "$MODEL" != /* ]]; then hf download "$MODEL"; fi
 
 export SGLANG_USE_AITER=1
 export ROCM_QUICK_REDUCE_QUANTIZATION=INT4
 
@@ -18,7 +18,7 @@ fi
 
 nvidia-smi
 
-hf download "$MODEL"
+if [[ "$MODEL" != /* ]]; then hf download "$MODEL"; fi
 
 export SGL_ENABLE_JIT_DEEPGEMM=false
 export SGLANG_ENABLE_FLASHINFER_GEMM=true
 
@@ -18,7 +18,7 @@ fi
 
 nvidia-smi
 
-hf download "$MODEL"
+if [[ "$MODEL" != /* ]]; then hf download "$MODEL"; fi
 
 export SGLANG_ENABLE_JIT_DEEPGEMM=false
 
 
@@ -20,7 +20,7 @@ fi
 
 echo "TP: $TP, CONC: $CONC, ISL: $ISL, OSL: $OSL, EP_SIZE: $EP_SIZE, DP_ATTENTION: $DP_ATTENTION"
 
-hf download "$MODEL"
+if [[ "$MODEL" != /* ]]; then hf download "$MODEL"; fi
 
 # temporary, avoids risk of OOM error
 export TLLM_OVERRIDE_LAYER_NUM=61
 
@@ -20,7 +20,7 @@ fi
 
 echo "TP: $TP, CONC: $CONC, ISL: $ISL, OSL: $OSL, EP_SIZE: $EP_SIZE, DP_ATTENTION: $DP_ATTENTION"
 
-hf download "$MODEL"
+if [[ "$MODEL" != /* ]]; then hf download "$MODEL"; fi
 
 # ========= Determine other parameters based on ISL, OSL, CONC =========
 MOE_BACKEND="TRTLLM"