我有一个分类问题,把肿瘤分为良或恶性。不过,我想更进一步,把这些肿瘤列为最恶性至最良性的肿瘤。有什么好的算法来帮助这个排名吗?有什么建议吗?
数据集的特征是肿瘤半径、肿瘤周长、凹度、平滑度等。
发布于 2020-06-15 12:02:31
大多数分类算法实际上提供连续的分数,并将其与给定的阈值进行比较,从而给出二进制输出。用这个分数直接给你排名。但是,除非你给我们一个具体的算法,否则很难进一步帮助你。
您通常可以在性能度量中发现这一点。以AUC为例,通过改变上述阈值得到了一个一般的定义。然而,当您使用基于个人分数的定义时,它有一个更自然的解释(以及更快的近似)。
有些模型甚至可以用概率进行校准。这意味着,在某些条件下,连续分数可以作为给定类的概率进行整数。
https://datascience.stackexchange.com/questions/76025
复制相似问题