用4张A100 直接运行:sh run_demo_instruct.sh 发现 混元Image3.0 instruct 在A100显卡下,运行不了FlashInfer模式,只能运行Eager模式。Eager模型下 速度较慢,请问一下有什么时候支持FlashInfer模式呢? 问题2:混元Image3.0 instruct 有没有其他的加速框架啊?比如:vLLM、Sglang、。。。
用4张A100 直接运行:sh run_demo_instruct.sh
发现 混元Image3.0 instruct 在A100显卡下,运行不了FlashInfer模式,只能运行Eager模式。Eager模型下 速度较慢,请问一下有什么时候支持FlashInfer模式呢?
问题2:混元Image3.0 instruct 有没有其他的加速框架啊?比如:vLLM、Sglang、。。。