fr2的asr效果非常好,但在实际应用时遇到并发卡点,请问大佬们后续有考虑做decoder-only架构的asr嘛,目前最常见的推理框架vllm和trt-llm对enc-dec架构的支持都不完善,很多加速的trick例如投机采样都没法应用
fr2的asr效果非常好,但在实际应用时遇到并发卡点,请问大佬们后续有考虑做decoder-only架构的asr嘛,目前最常见的推理框架vllm和trt-llm对enc-dec架构的支持都不完善,很多加速的trick例如投机采样都没法应用