我的样本可以属于类0或类1,但是对于我的一些样本,我只有一个属于类1的概率。到目前为止,我已经通过应用一个阈值离散化了我的目标变量,即分配给类1的所有y >= t i,并且我已经丢弃了属于类1的所有具有非零概率的样本。然后,我使用scitkit-learn对数据进行了线性支持向量机拟合。
当然,通过这种方式,我可以删除相当多</em
我试着使用Weka的NaiveBayesUpdateable分类器。我的数据包含名义和数字属性: @attribute country {FR, UK, ...}我知道我不能在Weka中使用数值型属性进行贝叶斯分类。一种技术是将数值属性值划分为长度为k的N个区间,并使用标称属性,其中n是类名,如@ attribute class {1,2,3,...N}。然而,我需要预测的数值属性的范围从0到1,
如何检验线性回归模型中的预测值是否与实际值相匹配?regressor.predict(iv_test)It结果- LR 7837176694.18的精度这是不正确的。下面是我的样本数据集-
longitude latitude housing_median_age total_rooms total_b