# 数组使用np.delete(data,[1,2,3等列],axis=1) 删除原来的时间戳
# 3,目标值处理
# 目标值过多,单有的目标值数量太少,可以忽略...删除原来的时间戳,
# 数组使用np.delete(data,[1,2,3等列],axis=1) 删除原来的时间戳
# 3,目标值处理
# 目标值过多,单有的目标值数量太少,可以忽略...from sklearn.metrics.classification import classification_report
tf = TfidfVectorizer()
#以训练集中词的列表进行...(猫) 假例(不是猫)
真实结果 20正例(猫) 真正例(15) 伪反例(5)
真实结果 80假例(不是猫) 伪正例(60) 真反例(20)
"""
精确率...:预测为正例的样本中,真正例的比例
召回率:真实值正例中,预测为正例的比例 15/20 越高越好
其他分类标准F1-SCORE 反映了模型的稳健性
F1 = 2*精确率*召回率/(精确率+召回率