Tencent
diff --git a/‎README.md‎
Lines changed: 130 additions & 52 deletions b/‎README.md‎
Lines changed: 130 additions & 52 deletions
diff --git a/‎README_cn.md‎
Lines changed: 126 additions & 52 deletions b/‎README_cn.md‎
Lines changed: 126 additions & 52 deletions
@@ -594,65 +594,143 @@ Other models such as GLM-4.6, Qwen2.5, and Seed-OSS have been evaluated on bench
 
 #### 2.1 Qwen3 Series Models
 
-Benchmark results for Qwen3 series models with `Eagle3` speculative decoding algorithm on datasets including `MT-bench`, `HunmanEval`, `GSM8K`, and `Alpaca`:
+**vLLM v0.11.2 Benchmark Results**
 
-<table>
-  <thead>
-    <tr>
-        <th>&nbsp</th><th>&nbsp</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">MT-bench</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">HumanEval</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">GSM8K</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">Alpaca</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">Mean</th></tr>
-    <tr><th>Temperature</th><th>Model</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th></tr>
-  </thead>
-  <tbody>
-    <!-- <tr><td colspan="12" style="text-align: center; vertical-align: middle;"><strong>Temperature=0</strong></td></tr> -->
-    <tr><td rowspan="6"><strong>T=0</strong></td>
-    <td>Qwen3-1.7B</td><td>2.05x</td><td>2.81</td><td>2.07x</td><td>2.93</td><td>2.11x</td><td>2.98</td><td>1.93x</td><td>2.69</td><td>2.04x</td><td>2.85</td></tr>
-    <tr> <td>Qwen3-4B</td><td>2.21x</td><td>3.01</td><td>2.36x</td><td>3.24</td><td>2.42x</td><td>3.13</td><td>2.32x</td><td>2.75</td><td>2.33x</td><td>3.03</td></tr>
-    <tr><td>Qwen3-8B</td><td>2.63x</td><td>3.65</td><td>2.76x</td><td>3.85</td><td>2.82x</td><td>3.90</td><td>2.62x</td><td>3.48</td><td>2.70x</td><td>3.72</td></tr>
-    <tr><td>Qwen3-14B</td><td>2.23x</td><td>3.30</td><td>2.53x</td><td>3.74</td><td>2.56x</td><td>3.79</td><td>2.16x</td><td>3.13</td><td>2.37x</td><td>3.49</td></tr>
-    <tr><td>Qwen3-32B</td><td>2.39x</td><td>2.78</td><td>2.37x</td><td>2.81</td><td>2.47x</td><td>2.92</td><td>2.42x</td><td>2.53</td><td>2.41x</td><td>2.76</td></tr>
-    <tr><td>Qwen3-30B-A3B</td><td>2.84x</td><td>3.63</td><td>2.27x</td><td>3.09</td><td>2.64x</td><td>3.42</td><td>2.83x</td><td>3.56</td><td>2.64x</td><td>3.42</td></tr>
-    <!-- <tr><td colspan="12" style="text-align: center; vertical-align: middle;"><strong>Temperature=1</strong></td></tr> -->
-    <tr><td rowspan="6"><strong>T=1</strong></td>
-    <td>Qwen3-1.7B</td><td>1.74x</td><td>2.53</td><td>1.86x</td><td>2.70</td><td>1.82x</td><td>2.69</td><td>1.72x</td><td>2.46</td><td>1.93x</td><td>2.60</td></tr>
-    <tr><td>Qwen3-4B</td><td>1.93x</td><td>2.60</td><td>2.00x</td><td>2.84</td><td>2.11x</td><td>2.82</td><td>2.34x</td><td>2.50</td><td>1.75x</td><td>2.69</td></tr>
-    <tr><td>Qwen3-8B</td><td>1.98x</td><td>2.75</td><td>2.25x</td><td>3.11</td><td>2.31x</td><td>3.15</td><td>2.10x</td><td>2.76</td><td>2.90x</td><td>2.94</td></tr>
-    <tr><td>Qwen3-14B</td><td>1.71x</td><td>2.61</td><td>1.95x</td><td>2.87</td><td>2.04x</td><td>3.08</td><td>1.68x</td><td>2.55</td><td>2.90x</td><td>2.78</td></tr>
-    <tr><td>Qwen3-32B</td><td>1.62x</td><td>1.91</td><td>1.71x</td><td>2.05</td><td>1.78x</td><td>2.10</td><td>1.80x</td><td>1.95</td><td>1.62x</td><td>2.00</td></tr>
-    <tr><td>Qwen3-30B-A3B</td><td>1.91x</td><td>2.46</td><td>2.00x</td><td>2.64</td><td>1.90x</td><td>2.53</td><td>1.80x</td><td>2.32</td><td>1.90x</td><td>2.48</td></tr>
-  </tbody>
-</table>
-
-#### 2.2 Hunyuan Series Models
-
-Benchmark results for Hunyuan series models with `Eagle3` speculative decoding algorithm on datasets including `MT-bench`, `HunmanEval`, `GSM8K`, and `Alpaca`:
+We report benchmark results of the Qwen3 series models using the Eagle3 speculative decoding algorithm across multiple evaluation suites, including **MT-bench**, **HumanEval**, **GSM8K**, and **Alpaca**.
+All experiments were conducted on a single NVIDIA H20 GPU with the configuration:
+**tp=1, ep=1, num_speculative_tokens=2, batch_size=1, output_len=1024**.
 
 <table>
   <thead>
     <tr>
-        <th>&nbsp</th><th>&nbsp</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">MT-bench</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">HumanEval</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">GSM8K</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">Alpaca</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">Mean</th></tr>
-    <tr><th>Temperature</th><th>Model</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th></tr>
+      <th>Model</th>
+      <th>Method</th>
+      <th colspan="2" style="text-align:center;">GSM8K</th>
+      <th colspan="2" style="text-align:center;">Alpaca</th>
+      <th colspan="2" style="text-align:center;">HumanEval</th>
+      <th colspan="2" style="text-align:center;">MT-bench</th>
+      <th colspan="2" style="text-align:center;">Mean</th>
+    </tr>
+    <tr>
+      <th></th><th></th>
+      <th>throughput (tokens/s)</th><th>accept length</th>
+      <th>throughput (tokens/s)</th><th>accept length</th>
+      <th>throughput (tokens/s)</th><th>accept length</th>
+      <th>throughput (tokens/s)</th><th>accept length</th>
+      <th>throughput (tokens/s)</th><th>accept length</th>
+    </tr>
   </thead>
+
   <tbody>
-    <!-- <tr><td colspan="12" style="text-align: center; vertical-align: middle;"><strong>Temperature=0</strong></td></tr> -->
-    <tr><td rowspan="3"><strong>T=0</strong></td>
-    <td>Hunyuan-1.8B-Instruct</td><td>1.97x</td><td>2.90</td><td>2.58x</td><td>3.73</td><td>2.61x</td><td>3.71</td><td>1.71x</td><td>2.43</td><td>2.22x</td><td>3.19</td></tr>
-    <tr> <td>Hunyuan-4B-Instruct</td><td>1.77x</td><td>2.60</td><td>2.64x</td><td>3.35</td><td>2.14x</td><td>3.17</td><td>1.72x</td><td>2.57</td><td>2.07x</td><td>2.92</td></tr>
-    <tr><td>Hunyuan-7B-Instruct</td><td>2.22x</td><td>3.58</td><td>3.59x</td><td>5.47</td><td>2.96x</td><td>4.68</td><td>1.64x</td><td>2.56</td><td>2.60x</td><td>4.07</td></tr>
-    <!-- <tr><td colspan="12" style="text-align: center; vertical-align: middle;"><strong>Temperature=1</strong></td></tr> -->
-    <tr><td rowspan="3"><strong>T=1</strong></td>
-    <td>Hunyuan-1.8B-Instruct</td><td>1.58x</td><td>2.36</td><td>2.35x</td><td>3.56</td><td>2.23x</td><td>3.38</td><td>1.26x</td><td>1.87</td><td>1.86x</td><td>2.79</td></tr>
-    <tr><td>Hunyuan-4B-Instruct</td><td>1.36x</td><td>2.05</td><td>1.97x</td><td>2.86</td><td>1.72x</td><td>2.68</td><td>1.14x</td><td>1.76</td><td>1.55x</td><td>2.34</td></tr>
-    <tr><td>Hunyuan-7B-Instruct</td><td>1.90x</td><td>3.11</td><td>3.12x</td><td>5.09</td><td>2.74x</td><td>4.34</td><td>1.47x</td><td>2.39</td><td>2.31x</td><td>3.73</td></tr>
+    <!-- Qwen3-1.7B -->
+    <tr>
+      <td rowspan="2">Qwen3-1.7B</td>
+      <td>Vanilla</td>
+      <td>376.42</td><td>1</td>
+      <td>378.86</td><td>1</td>
+      <td>378.38</td><td>1</td>
+      <td>390.53</td><td>1</td>
+      <td>318.05</td><td>1</td>
+    </tr>
+    <tr>
+      <td>Eagle3</td>
+      <td>616.9</td><td>2.13</td>
+      <td>653.29</td><td>2.19</td>
+      <td>680.1</td><td>2.2</td>
+      <td>621.44</td><td>2.17</td>
+      <td>642.93</td><td>2.18</td>
+    </tr>
+    <!-- Qwen3-4B -->
+    <tr>
+      <td rowspan="2">Qwen3-4B</td>
+      <td>Vanilla</td>
+      <td>229.05</td><td>1</td>
+      <td>235.29</td><td>1</td>
+      <td>234.66</td><td>1</td>
+      <td>234.04</td><td>1</td>
+      <td>233.26</td><td>1</td>
+    </tr>
+    <tr>
+      <td>Eagle3</td>
+      <td>389.35</td><td>2.07</td>
+      <td>395.97</td><td>2.1</td>
+      <td>377.84</td><td>2.08</td>
+      <td>384.6</td><td>2.07</td>
+      <td>386.94</td><td>2.08</td>
+    </tr>
+    <!-- Qwen3-8B -->
+    <tr>
+      <td rowspan="2">Qwen3-8B</td>
+      <td>Vanilla</td>
+      <td>149.63</td><td>1</td>
+      <td>149.93</td><td>1</td>
+      <td>153.85</td><td>1</td>
+      <td>153.81</td><td>1</td>
+      <td>151.81</td><td>1</td>
+    </tr>
+    <tr>
+      <td>Eagle3</td>
+      <td>257.32</td><td>2</td>
+      <td>266.69</td><td>2.02</td>
+      <td>244.89</td><td>1.97</td>
+      <td>258.2</td><td>1.97</td>
+      <td>257.52</td><td>1.99</td>
+    </tr>
+    <!-- Qwen3-14B -->
+    <tr>
+      <td rowspan="2">Qwen3-14B</td>
+      <td>Vanilla</td>
+      <td>92.97</td><td>1</td>
+      <td>92.66</td><td>1</td>
+      <td>92.94</td><td>1</td>
+      <td>94.46</td><td>1</td>
+      <td>93.26</td><td>1</td>
+    </tr>
+    <tr>
+      <td>Eagle3</td>
+      <td>153.72</td><td>1.87</td>
+      <td>140.46</td><td>1.78</td>
+      <td>144.68</td><td>1.76</td>
+      <td>142.45</td><td>1.74</td>
+      <td>145.33</td><td>1.79</td>
+    </tr>
+    <!-- Qwen3-32B -->
+    <tr>
+      <td rowspan="2">Qwen3-32B</td>
+      <td>Vanilla</td>
+      <td>43.49</td><td>1</td>
+      <td>43.38</td><td>1</td>
+      <td>43.19</td><td>1</td>
+      <td>43.3</td><td>1</td>
+      <td>43.32</td><td>1</td>
+    </tr>
+    <tr>
+      <td>Eagle3</td>
+      <td>80.43</td><td>2.01</td>
+      <td>72.49</td><td>1.9</td>
+      <td>71.57</td><td>1.86</td>
+      <td>74.1</td><td>1.86</td>
+      <td>74.1</td><td>1.91</td>
+    </tr>
+    <!-- Qwen3-30B-A3B -->
+    <tr>
+      <td rowspan="2">Qwen3-30B-A3B</td>
+      <td>Vanilla</td>
+      <td>311.84</td><td>1</td>
+      <td>320.43</td><td>1</td>
+      <td>325.77</td><td>1</td>
+      <td>325.42</td><td>1</td>
+      <td>320.87</td><td>1</td>
+    </tr>
+    <tr>
+      <td>Eagle3</td>
+      <td>453.97</td><td>2.1</td>
+      <td>432.45</td><td>2.04</td>
+      <td>428.81</td><td>2.02</td>
+      <td>437.06</td><td>2.01</td>
+      <td>438.07</td><td>2.04</td>
+    </tr>
+
   </tbody>
 </table>
 
 
@@ -601,65 +601,139 @@ Qwen3-Omni系列模型的`BF16`、`FP8-Static`、`FP8-Dynamic`在`aime25`、`gpq
 
 #### 2.1 Qwen3系列模型
 
-Qwen3系列的Eagle3模型在MT-bench/HunmanEval/GSM8K/Alpaca上的加速结果如下：
+我们使用vLLM(v0.11.2)评测了Qwen3系列Eagle3模型在**MT-bench**、 **HumanEval**、 **GSM8K**、**Alpaca**等数据集上的接收长度和吞吐。全部结果都是在单张H20上用以下设置测得：**tp=1, ep=1, num_speculative_tokens=2, batch_size=1, output_len=1024**。
 
 <table>
   <thead>
     <tr>
-        <th>&nbsp</th><th>&nbsp</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">MT-bench</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">HumanEval</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">GSM8K</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">Alpaca</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">Mean</th></tr>
-    <tr><th>Temperature</th><th>Model</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th></tr>
-  </thead>
-  <tbody>
-    <!-- <tr><td colspan="12" style="text-align: center; vertical-align: middle;"><strong>Temperature=0</strong></td></tr> -->
-    <tr><td rowspan="6"><strong>T=0</strong></td>
-    <td>Qwen3-1.7B</td><td>2.05x</td><td>2.81</td><td>2.07x</td><td>2.93</td><td>2.11x</td><td>2.98</td><td>1.93x</td><td>2.69</td><td>2.04x</td><td>2.85</td></tr>
-    <tr> <td>Qwen3-4B</td><td>2.21x</td><td>3.01</td><td>2.36x</td><td>3.24</td><td>2.42x</td><td>3.13</td><td>2.32x</td><td>2.75</td><td>2.33x</td><td>3.03</td></tr>
-    <tr><td>Qwen3-8B</td><td>2.63x</td><td>3.65</td><td>2.76x</td><td>3.85</td><td>2.82x</td><td>3.90</td><td>2.62x</td><td>3.48</td><td>2.70x</td><td>3.72</td></tr>
-    <tr><td>Qwen3-14B</td><td>2.23x</td><td>3.30</td><td>2.53x</td><td>3.74</td><td>2.56x</td><td>3.79</td><td>2.16x</td><td>3.13</td><td>2.37x</td><td>3.49</td></tr>
-    <tr><td>Qwen3-32B</td><td>2.39x</td><td>2.78</td><td>2.37x</td><td>2.81</td><td>2.47x</td><td>2.92</td><td>2.42x</td><td>2.53</td><td>2.41x</td><td>2.76</td></tr>
-    <tr><td>Qwen3-30B-A3B</td><td>2.84x</td><td>3.63</td><td>2.27x</td><td>3.09</td><td>2.64x</td><td>3.42</td><td>2.83x</td><td>3.56</td><td>2.64x</td><td>3.42</td></tr>
-    <!-- <tr><td colspan="12" style="text-align: center; vertical-align: middle;"><strong>Temperature=1</strong></td></tr> -->
-    <tr><td rowspan="6"><strong>T=1</strong></td>
-    <td>Qwen3-1.7B</td><td>1.74x</td><td>2.53</td><td>1.86x</td><td>2.70</td><td>1.82x</td><td>2.69</td><td>1.72x</td><td>2.46</td><td>1.93x</td><td>2.60</td></tr>
-    <tr><td>Qwen3-4B</td><td>1.93x</td><td>2.60</td><td>2.00x</td><td>2.84</td><td>2.11x</td><td>2.82</td><td>2.34x</td><td>2.50</td><td>1.75x</td><td>2.69</td></tr>
-    <tr><td>Qwen3-8B</td><td>1.98x</td><td>2.75</td><td>2.25x</td><td>3.11</td><td>2.31x</td><td>3.15</td><td>2.10x</td><td>2.76</td><td>2.90x</td><td>2.94</td></tr>
-    <tr><td>Qwen3-14B</td><td>1.71x</td><td>2.61</td><td>1.95x</td><td>2.87</td><td>2.04x</td><td>3.08</td><td>1.68x</td><td>2.55</td><td>2.90x</td><td>2.78</td></tr>
-    <tr><td>Qwen3-32B</td><td>1.62x</td><td>1.91</td><td>1.71x</td><td>2.05</td><td>1.78x</td><td>2.10</td><td>1.80x</td><td>1.95</td><td>1.62x</td><td>2.00</td></tr>
-    <tr><td>Qwen3-30B-A3B</td><td>1.91x</td><td>2.46</td><td>2.00x</td><td>2.64</td><td>1.90x</td><td>2.53</td><td>1.80x</td><td>2.32</td><td>1.90x</td><td>2.48</td></tr>
-  </tbody>
-</table>
-
-#### 2.2 Hunyuan系列模型
-
-Hunyuan系列的Eagle3模型在MT-bench/HunmanEval/GSM8K/Alpaca上的加速结果如下：
-
-<table>
-  <thead>
+      <th>Model</th>
+      <th>Method</th>
+      <th colspan="2" style="text-align:center;">GSM8K</th>
+      <th colspan="2" style="text-align:center;">Alpaca</th>
+      <th colspan="2" style="text-align:center;">HumanEval</th>
+      <th colspan="2" style="text-align:center;">MT-bench</th>
+      <th colspan="2" style="text-align:center;">Mean</th>
+    </tr>
     <tr>
-        <th>&nbsp</th><th>&nbsp</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">MT-bench</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">HumanEval</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">GSM8K</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">Alpaca</th>
-        <th colspan="2" style="text-align: center; vertical-align: middle;">Mean</th></tr>
-    <tr><th>Temperature</th><th>Model</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th><th>Speedup</th><th>τ</th></tr>
+      <th></th><th></th>
+      <th>throughput (tokens/s)</th><th>accept length</th>
+      <th>throughput (tokens/s)</th><th>accept length</th>
+      <th>throughput (tokens/s)</th><th>accept length</th>
+      <th>throughput (tokens/s)</th><th>accept length</th>
+      <th>throughput (tokens/s)</th><th>accept length</th>
+    </tr>
   </thead>
+
   <tbody>
-    <!-- <tr><td colspan="12" style="text-align: center; vertical-align: middle;"><strong>Temperature=0</strong></td></tr> -->
-    <tr><td rowspan="3"><strong>T=0</strong></td>
-    <td>Hunyuan-1.8B-Instruct</td><td>1.97x</td><td>2.90</td><td>2.58x</td><td>3.73</td><td>2.61x</td><td>3.71</td><td>1.71x</td><td>2.43</td><td>2.22x</td><td>3.19</td></tr>
-    <tr> <td>Hunyuan-4B-Instruct</td><td>1.77x</td><td>2.60</td><td>2.64x</td><td>3.35</td><td>2.14x</td><td>3.17</td><td>1.72x</td><td>2.57</td><td>2.07x</td><td>2.92</td></tr>
-    <tr><td>Hunyuan-7B-Instruct</td><td>2.22x</td><td>3.58</td><td>3.59x</td><td>5.47</td><td>2.96x</td><td>4.68</td><td>1.64x</td><td>2.56</td><td>2.60x</td><td>4.07</td></tr>
-    <!-- <tr><td colspan="12" style="text-align: center; vertical-align: middle;"><strong>Temperature=1</strong></td></tr> -->
-    <tr><td rowspan="3"><strong>T=1</strong></td>
-    <td>Hunyuan-1.8B-Instruct</td><td>1.58x</td><td>2.36</td><td>2.35x</td><td>3.56</td><td>2.23x</td><td>3.38</td><td>1.26x</td><td>1.87</td><td>1.86x</td><td>2.79</td></tr>
-    <tr><td>Hunyuan-4B-Instruct</td><td>1.36x</td><td>2.05</td><td>1.97x</td><td>2.86</td><td>1.72x</td><td>2.68</td><td>1.14x</td><td>1.76</td><td>1.55x</td><td>2.34</td></tr>
-    <tr><td>Hunyuan-7B-Instruct</td><td>1.90x</td><td>3.11</td><td>3.12x</td><td>5.09</td><td>2.74x</td><td>4.34</td><td>1.47x</td><td>2.39</td><td>2.31x</td><td>3.73</td></tr>
+    <!-- Qwen3-1.7B -->
+    <tr>
+      <td rowspan="2">Qwen3-1.7B</td>
+      <td>Vanilla</td>
+      <td>376.42</td><td>1</td>
+      <td>378.86</td><td>1</td>
+      <td>378.38</td><td>1</td>
+      <td>390.53</td><td>1</td>
+      <td>318.05</td><td>1</td>
+    </tr>
+    <tr>
+      <td>Eagle3</td>
+      <td>616.9</td><td>2.13</td>
+      <td>653.29</td><td>2.19</td>
+      <td>680.1</td><td>2.2</td>
+      <td>621.44</td><td>2.17</td>
+      <td>642.93</td><td>2.18</td>
+    </tr>
+    <!-- Qwen3-4B -->
+    <tr>
+      <td rowspan="2">Qwen3-4B</td>
+      <td>Vanilla</td>
+      <td>229.05</td><td>1</td>
+      <td>235.29</td><td>1</td>
+      <td>234.66</td><td>1</td>
+      <td>234.04</td><td>1</td>
+      <td>233.26</td><td>1</td>
+    </tr>
+    <tr>
+      <td>Eagle3</td>
+      <td>389.35</td><td>2.07</td>
+      <td>395.97</td><td>2.1</td>
+      <td>377.84</td><td>2.08</td>
+      <td>384.6</td><td>2.07</td>
+      <td>386.94</td><td>2.08</td>
+    </tr>
+    <!-- Qwen3-8B -->
+    <tr>
+      <td rowspan="2">Qwen3-8B</td>
+      <td>Vanilla</td>
+      <td>149.63</td><td>1</td>
+      <td>149.93</td><td>1</td>
+      <td>153.85</td><td>1</td>
+      <td>153.81</td><td>1</td>
+      <td>151.81</td><td>1</td>
+    </tr>
+    <tr>
+      <td>Eagle3</td>
+      <td>257.32</td><td>2</td>
+      <td>266.69</td><td>2.02</td>
+      <td>244.89</td><td>1.97</td>
+      <td>258.2</td><td>1.97</td>
+      <td>257.52</td><td>1.99</td>
+    </tr>
+    <!-- Qwen3-14B -->
+    <tr>
+      <td rowspan="2">Qwen3-14B</td>
+      <td>Vanilla</td>
+      <td>92.97</td><td>1</td>
+      <td>92.66</td><td>1</td>
+      <td>92.94</td><td>1</td>
+      <td>94.46</td><td>1</td>
+      <td>93.26</td><td>1</td>
+    </tr>
+    <tr>
+      <td>Eagle3</td>
+      <td>153.72</td><td>1.87</td>
+      <td>140.46</td><td>1.78</td>
+      <td>144.68</td><td>1.76</td>
+      <td>142.45</td><td>1.74</td>
+      <td>145.33</td><td>1.79</td>
+    </tr>
+    <!-- Qwen3-32B -->
+    <tr>
+      <td rowspan="2">Qwen3-32B</td>
+      <td>Vanilla</td>
+      <td>43.49</td><td>1</td>
+      <td>43.38</td><td>1</td>
+      <td>43.19</td><td>1</td>
+      <td>43.3</td><td>1</td>
+      <td>43.32</td><td>1</td>
+    </tr>
+    <tr>
+      <td>Eagle3</td>
+      <td>80.43</td><td>2.01</td>
+      <td>72.49</td><td>1.9</td>
+      <td>71.57</td><td>1.86</td>
+      <td>74.1</td><td>1.86</td>
+      <td>74.1</td><td>1.91</td>
+    </tr>
+    <!-- Qwen3-30B-A3B -->
+    <tr>
+      <td rowspan="2">Qwen3-30B-A3B</td>
+      <td>Vanilla</td>
+      <td>311.84</td><td>1</td>
+      <td>320.43</td><td>1</td>
+      <td>325.77</td><td>1</td>
+      <td>325.42</td><td>1</td>
+      <td>320.87</td><td>1</td>
+    </tr>
+    <tr>
+      <td>Eagle3</td>
+      <td>453.97</td><td>2.1</td>
+      <td>432.45</td><td>2.04</td>
+      <td>428.81</td><td>2.02</td>
+      <td>437.06</td><td>2.01</td>
+      <td>438.07</td><td>2.04</td>
+    </tr>
+
   </tbody>
 </table>