Skip to content

用A100推理,只支持Eager模式,不只支持FlashInfer模式吗? #88

@biubiobiu

Description

@biubiobiu

用4张A100 直接运行:sh run_demo_instruct.sh
发现 混元Image3.0 instruct 在A100显卡下,运行不了FlashInfer模式,只能运行Eager模式。Eager模型下 速度较慢,请问一下有什么时候支持FlashInfer模式呢?

问题2:混元Image3.0 instruct 有没有其他的加速框架啊?比如:vLLM、Sglang、。。。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions