请问能release一下BFCL的evaluation的代码吗？

作者您好，很棒😊的work！我看到您在其他issue里面提到了BFCL的eval结果不一样是因为为了适配AWM的框架，对BFCL的evaluation代码进行了修改。请问您能release一下evaluation的代码吗？或者，您能说一下，两者的eval框架区别是什么，应该怎么去修改代码来进行evaluation呢？（BFCL以及tau^2等bench）
期待您的回复！