请教下,我看苏剑林的代码,loss在计算相似度前其实还有个归一化,你这里没有?是不是需要加上?应该能有一些提升的
请教下,我看苏剑林的代码,loss在计算相似度前其实还有个归一化,你这里没有?是不是需要加上?应该能有一些提升的