我们有一个简单的数据集users U & of items I & binary outcomes Y。数据集很大(10万个用户,1000万个项目,15亿次交互),并按时间顺序排序。我们正在训练一些模型,比如说一个简单的MF模型,它给出了预测f(U, I) = Yhat。 当训练完成后,我们希望在曲线pér项下有一个面积。因此,我们希望有一个项目i到AUC的映射。现在,使用映射器{i: tf.keras.metrics.AUC}并屏蔽每一批的答案会给我们
在某些情况下,tf.metrics.auc与sklearn.metrics.roc_auc_score相比产生了非常不同的值。import tensorflow as tfimport numpy as np
def auc(y_true, y_pred):(变更-请求/侧注:我的数据只有65个样本,所以有65个阈值就可以计算理想的sklearn.metric