Merge pull request #298 from InfiniTensor/issue/297

wooway777 · web-flow · commit f73e18b9a13a · 2026-04-13T16:38:58.000+08:00
issue/297 - compile all paged batch sizes up to 64
diff --git a/csrc/engine/compiler/paged_compiler.cpp b/csrc/engine/compiler/paged_compiler.cpp
@@ -18,10 +18,7 @@ inline void set_minus_one(infinicore::Tensor &tensor) {
 namespace infinilm::engine {
 PagedCompiler::PagedCompiler(const std::shared_ptr<InfinilmModel> &model, RankBarrier *barrier)
     : GraphCompiler(model, barrier) {
-    for (size_t b = 1; b < 32; b++) {
-        decode_batch_sizes_.push_back(b);
-    }
-    for (size_t b = 32; b < 64; b += 8) {
+    for (size_t b = 1; b < 64; ++b) {
         decode_batch_sizes_.push_back(b);
     }
     for (size_t b = 64; b < 128; b += 16) {