作者您好,很棒😊的work!我看到您在其他issue里面提到了BFCL的eval结果不一样是因为为了适配AWM的框架,对BFCL的evaluation代码进行了修改。请问您能release一下evaluation的代码吗?或者,您能说一下,两者的eval框架区别是什么,应该怎么去修改代码来进行evaluation呢?(BFCL以及tau^2等bench) 期待您的回复!
作者您好,很棒😊的work!我看到您在其他issue里面提到了BFCL的eval结果不一样是因为为了适配AWM的框架,对BFCL的evaluation代码进行了修改。请问您能release一下evaluation的代码吗?或者,您能说一下,两者的eval框架区别是什么,应该怎么去修改代码来进行evaluation呢?(BFCL以及tau^2等bench)
期待您的回复!