示例中的reward_metric的函数,好像只传了训练集的预测值和实际值?
示例中的reward_metric的函数,好像只传了训练集的预测值和实际值?