inference_prune.py比inference.py显存多?多出400多M,这是为啥呢?
inference_prune.py比inference.py显存多?多出400多M,这是为啥呢?