多类分类规则的含义
Example: I have two classification rules (Refund is a predictor and Cheat is a binary response):
(Refund, No) → (Cheat, No) Support = 0.4, Confidence = 0.57
(Refund, No) → (Cheat, Yes) Support = 0.3, Confidence = 0.43
=>多类分类规则:
(Refund, No) → (Cheat, No) v (Cheat, Yes)
当对测试数据进行预测分类时,(欺骗,否)将被选择优先级,所以为什么我们需要在多类分类规则中有(欺骗,是)?
发布于 2014-11-08 18:33:37
(Cheat, No) will be selected (cheat will be classified as No) for the rule (Refund, No).
在二进制响应变量中,如作弊,所有信息都可以从第一条规则中推断:
(Refund, No) → (Cheat, No) Support = 0.4, Confidence = 0.57
另一条规则是多余的。
但是,在多类响应变量的情况下,我们希望将所有规则都写出来,这样我们就可以准确地知道规则在响应变量中暗示每个不同类的可能性。为了保持一致,在响应变量是二进制变量的情况下也会这样做。
发布于 2014-12-10 07:12:33
如果目标列的一种状态比其他状态更重要,那么查看所有规则是很重要的。例如,如果您预测的是欺诈性交易,即使is有5%的概率,您也可能希望将某些事情标记为欺诈。
https://datascience.stackexchange.com/questions/2427
复制相似问题