SVC找不到属性'_probA‘_使用promisify时找不到属性'svc‘_为什么sklearn.svm.SVC.predict()的结果和sklearn.svm.SVC.predict_proba()不一致？ - 腾讯云开发者社区

python、scikit-learn

我的目标是有三个最准确的预测标签。通过使用此解决方案 clf = svm.SVC( kernel='rbf', C=51, gamma=1, probability=True ).fit(X,y) predictions=[] with open('model.pkl', 'rb') as f: clf = pickle.load(f) for line i

浏览 169提问于2021-07-16得票数 0

回答已采纳

2回答

如何计算python和NLTK中的预测概率？

python、python-3.x、machine-learning、nltk

我试图用LinearSVC和OneVsRestClassifier计算支持向量机模型中的每一种预测概率，但得到了误差。 AttributeError: 'LinearSVC' object has no attribute 'predict_proba' 尝试过的代码： model = Pipeline([('vectorizer', CountVectorizer(ngram_range=(1,2))), ('tfidf', TfidfTransformer(use_idf=True)), ('clf&#

浏览 1提问于2018-10-29得票数 1

回答已采纳

1回答

为什么sklearn.svm.SVC.predict()的结果和sklearn.svm.SVC.predict_proba()不一致？

python、scikit-learn、svm

我使用sklearn.svm.SVC构建支持向量分类器，如下所示。 import numpy as np from sklearn.svm import SVC svc=SVC(probability=True) X = np.random.randint(0, 100, [100, 3]) y = np.random.choice([0, 1, 2], 100, replace=True) svc.fit(X, y) print(svc.predict([[10, 20, 30]]), svc.predict_proba([[10, 20, 30]])) 输出为 [2] [[

浏览 252提问于2020-12-24得票数 0

3回答

识别滑雪板模型的类

python、scikit-learn、svm

上的文档意味着存在一个名为classes_的属性，该属性据称揭示了模型如何在内部表示类。我希望获得这些信息，以便解释像predict_proba这样的函数的输出，它为许多示例生成类的概率。希望，知道这一点，给出一些说明的价值： model.classes_ >>> [1, 2, 4] 意味着我可以假设： model.predict_proba([[1.2312, 0.23512, 6.01234], [3.7655, 8.2353, 0.86323]]) >>> [[0.032, 0.143, 0.825], [0.325, 0.143, 0.532]

浏览 16提问于2015-05-12得票数 4

回答已采纳

1回答

如何找到将输入分类为[0,1]的模型的概率？

python、machine-learning、scikit-learn、svm

我正在研究一个分类问题，在这个问题中，我希望找到“输入被分类为1,0”和"not 1,0“的概率。我尝试使用SVC的predict_proba方法，它给出了我不想要的类的概率 from sklearn.svm import SVC model = SVC(probability=True) model.fit(final_data,foreclosure_y) results = model.predict_proba(final_data_test)[0] 我希望我的输出是这样的 index,y --------- 0,0.45 1,0.62 2,0.43 3,0.12

浏览 1提问于2019-03-23得票数 0

回答已采纳

2回答

predict_proba在支持向量机情感分析中的应用

python、machine-learning、scikit-learn、svm、sentiment-analysis

我在分类问题上应用了predict_proba。我有一些在R中构建分类模型的经验，但这是我第一次使用Python的sklearn。所以问题是:在sklearn中，在拟合之后，我找不到一种方法来获取概率。有可能吗？有一个方法，顾名思义，就是predict_proba()，它就是but...as。这是我的代码： import pandas as pd from sklearn.svm import SVC from sklearn.svm import LinearSVC import pickle from nltk.tokenize import sent_tokenize from M

浏览 103提问于2019-09-11得票数 1

1回答

在SVC中用predict_proba解释class_weights结果

python、scikit-learn、classification

我要执行概率二进制分类(0,1)。我的数据集是imbalanced.Thus，我使用SVC并为每个类分配了一些类权重。在对测试数据集进行SVC拟合后，利用predict_proba得到概率分类结果。然而，SVC预测训练实例为1，概率分类结果高于0.4。我认为predict_proba的默认阈值是0.5。我想知道在使用class_weights的情况下，默认阈值是否是自动的？例如： 0.58497606，0.41502394 >> predict_probaba函数结果的预测标签为1。

浏览 2提问于2021-12-21得票数 0

1回答

我是否可以显式地为sklearn设置可能的类列表？

python、scikit-learn、classification、svm

我有一个程序，使用SVC类从滑雪。实际上，我使用的是OneVsRestClassifier类，它使用SVC类。我的问题是，predict_proba()方法有时返回的向量太短。这是因为classes_属性缺少一个类，这是在培训期间标签不存在时发生的。请考虑下面的示例(代码如下所示)。假设所有可能的类都是1、2、3和4。现在假设训练数据恰好不包含任何以类3标记的数据。这很好，除非我调用predict_proba()，我想要一个长度为4的向量。相反，我得到一个长度为3的向量。也就是说，predict_proba()返回p(1) p(2) p(4)，但我想要p(1) p(2) p(3) p(4)，

浏览 1提问于2015-05-04得票数 7

1回答

如何在使用科学学习的LinearSVC分类器时启用概率估计

scikit-learn、probability、svc

如何以类似于sklearn.svm.LinearSVC的probability=True选项的方式从sklearn.svm.SVC模型中得到预测的概率估计?该选项允许predict_proba()，因为我的训练集很大，因此需要避免底层libsvm of SVC的二次拟合惩罚。

浏览 1提问于2019-01-28得票数 0

回答已采纳

1回答

使用SGD找到支持向量机最相关或最重要的特征(loss=hinge)

python、machine-learning、scikit-learn、text-classification、sklearn-pandas

我正在研究一个文本分类问题，并发现SVM在我的文本分类问题上执行得最好。但是，我使用sklearn的SGD分类器(loss=hinge)进行了实验。似乎提供了一种方法来分析实例，并显示给定实例的每个类的分析结果。然而，石灰的问题是： exp = explainer.explain_instance(test_document, c.predict_proba) 在explainer.explain_instance函数中，它需要一个概率分布作为第二个参数(c.predict_proba)，并且没有predict_proba可用于SGD (loss=hinge)。我试过使用Calibrated

浏览 0提问于2019-05-08得票数 0

1回答

使用for循环从多个列表创建列名

python、pandas、list、for-loop

假设我有多个列表： names1 = [name11, name12, etc] names2 = [name21, name22, etc] names3 = [name31, name32, etc] 如何创建按顺序('name11name21name31‘、'name11name21name32’等)组合列表组件的for循环？当我将列添加到数据框中时，我想用它来命名列。我试过这样做： Results['{}' .format(model_names[j]) + '{}' .format(Data_names[i])] = proba.t

浏览 38提问于2020-07-25得票数 0

回答已采纳

2回答

用Python绘制ROC曲线

python、scikit-learn、roc

我试图绘制一个分类器的ROC曲线，它只使用数据集的两个特征。有人能告诉我怎么解决下面的错误吗？ from sklearn.metrics import roc_curve, auc from scipy import interp from sklearn.cross_validation import StratifiedKFold from sklearn.svm import SVC X_train2 = X_train[:, [0, 1]] X_train2 cv = StratifiedKFold(y_train, n_folds=3, random_state=1) fig =

浏览 2提问于2017-04-15得票数 0

1回答

有没有办法在PyCharm中回滚python包的更新？

python、pycharm、pickle、cv2

我正在做一个项目，它工作得很好，直到我决定更新我的Pycharm虚拟环境中的所有包。现在，它给了我错误的功能，以前是正常工作的。我得到了 'SVC' object has no attribute '_probA' 在这行代码中 pickle.loads(open(rec, "rb").read()).predict_proba(vec)[0] 有没有回滚包更新的方法，或者有什么新的属性可以工作？

浏览 18提问于2020-09-13得票数 2

回答已采纳

1回答

基于预测概率的滑雪板实例排序方法

python、scikit-learn、classification、cross-validation

我正在使用sklearn的支持向量机(SVC)，如下所示，使用10-fold cross validation获得数据集中实例的预测概率。 from sklearn import datasets iris = datasets.load_iris() X = iris.data y = iris.target clf=SVC(class_weight="balanced") proba = cross_val_predict(clf, X, y, cv=10, method='predict_proba') print(clf.classes_) pri

浏览 0提问于2019-08-24得票数 1

回答已采纳

1回答

SKLearn支持向量机proba阈值= 0.5？

machine-learning、scikit-learn、svm

我有一个我训练过的支持向量机模型(SVC(class_ SVM =‘balanced’))。我使用predict_proba()来获得计算ROC AUC的概率，并使用predict()来获得对f1_score的预测。从文档中可以看到(predict_proba() > 0.5).astype(int) ==预测()，但是情况并非如此。谁能帮我理解为什么不呢？我的f1_score和中华民国的成绩仍然有效吗？ a = svm.predict_proba(vec.transform(X))[:,1] b = svm.predict(vec.transform(X)) print(np.mean

浏览 8提问于2022-11-18得票数 -1

1回答

如何与概率分类一起学习SVC？

numpy、machine-learning、scipy、nlp、scikit-learn

首先，我的数据如下： label|instances(sentences) 5 |1190 4 |839 3 |239 2 |204 1 |127 然后我通过验证： from sklearn import cross_validation kf = cross_validation.KFold(n=len(y),n_folds=10) for train_index, test_index in kf: print "\nTRAIN:\n", train_index, "\n TEST:\n", test_index

浏览 4提问于2015-10-19得票数 1

5回答

使SVM在python中运行得更快

python、scikit-learn、svm

在python中对svm使用下面的代码： from sklearn import datasets from sklearn.multiclass import OneVsRestClassifier from sklearn.svm import SVC iris = datasets.load_iris() X, y = iris.data, iris.target clf = OneVsRestClassifier(SVC(kernel='linear', probability=True, class_weight='auto')) clf.fit(X,

浏览 2提问于2015-07-28得票数 57

回答已采纳

2回答

具有召回率=0的SVM和随机森林

python、machine-learning、scikit-learn、svm、random-forest

我正在尝试从两个值中预测一个值，这两个值可以出现在“退出”列中。我有干净的数据(大约20列和4k行包含客户的典型信息，如‘性别’，‘年龄’...)。在训练数据集中，约有20%的客户被鉴定为'1‘。我建立了两个模型--支持向量机和随机森林--但这两个模型对测试数据集的预测基本上都是'0‘(几乎每次都是)。两个模型的召回率为0。我把代码放在我认为我可以犯一些愚蠢错误的地方。你知道为什么在80%的准确率下召回率这么低吗？ def ml_model(): print('sklearn: %s' % sklearn.__version__) df = pd

浏览 0提问于2019-11-13得票数 1

2回答

如何在SVC模型中为一个特定的阈值设置一个值并生成一个混淆矩阵？

python、machine-learning、scikit-learn

我需要为一个特定的阈值设置一个值，并生成一个混淆矩阵。数据位于csv文件(11，1MB)中，下载的链接是：首先，我收到了一条错误消息：“AttributeError: predict_proba在probability=False时不可用”，所以我用它来更正： svc = SVC(C=1e9,gamma= 1e-07) scv_calibrated = CalibratedClassifierCV(svc) svc_model = scv_calibrated.fit(X_train, y_train) 我在互联网上看到了很多，但我不太明白一个特定的阈值是如何被巴氏化的。听起来挺难的。现在

浏览 2提问于2019-10-24得票数 5

回答已采纳

2回答

具有n重交叉验证的精度召回曲线，显示标准偏差

python、machine-learning、scikit-learn、cross-validation、precision-recall

我想生成一个精度-召回曲线，具有5倍交叉验证，显示标准偏差，就像在example ROC curve code here中一样。下面的代码(改编自How to Plot PR-Curve Over 10 folds of Cross Validation in Scikit-Learn)给出了每一次交叉验证的PR曲线以及平均PR曲线。我还想用灰色显示平均PR曲线上下一个标准差的区域。但它给出了以下错误(代码下面的链接中有详细信息)： ValueError: operands could not be broadcast together with shapes (91,) (78,) im

浏览 26提问于2019-04-06得票数 4

2回答

更新scikit-学习：'SVC‘对象没有属性'_probA'？

python、scikit-learn

我们更新到Python3.8.2，并得到了一个与scikit有关的错误-学习： Traceback (most recent call last): File "manage.py", line 16, in <module> execute_from_command_line(sys.argv) File "/home/ubuntu/myWebApp/.venv/lib/python3.8/site-packages/django/core/management/__init__.py", line 381, in execute_from_com

浏览 0提问于2020-09-08得票数 4

回答已采纳

1回答

运行我的代码时获取predict_proba不可用

python、machine-learning、svm

我正在为不太大的数据集(1000条记录)构建算法但它有大约2000列我得到了这个错误 File "C:\Users\User\anaconda3\lib\site-packages\sklearn\svm\_base.py", line 603, in _check_proba raise AttributeError("predict_proba is not available when " AttributeError: predict_proba is not available when probability=False 这是我

浏览 60提问于2020-07-09得票数 0

回答已采纳

2回答

校准分类器ValueError:无法将字符串转换为浮动

scikit-learn、text-mining、text-classification

Dataframe： id review name label 1 it is a great product for turning lights on. Ashley 2 plays music and have a good sound. Alex 3 I love it, lots of fun. Peter

浏览 0提问于2021-09-23得票数 0

回答已采纳

1回答

SVC能给出不同的结果吗？[scikit-learn v0.14]

svm、scikit-learn

我注意到，对于，给定相同的特征表(训练数据)和特征向量，predict_proba输出将得到不同的结果。这是SVC的预期行为，还是我应该得到一致的结果？谢谢你的帮忙!

浏览 2提问于2013-10-21得票数 0

回答已采纳

1回答

寻找支持向量机模型的AUC得分

python、scikit-learn

我知道支持向量机算法不计算概率，这是找到AUC值所需的，有没有其他方法可以找到AUC分数？ from sklearn.svm import SVC model_ksvm = SVC(kernel = 'rbf', random_state = 0) model_ksvm.fit(X_train, y_train) model_ksvm.predict_proba(X_test) 我不能得到SVM算法的概率输出，没有概率输出我不能得到AUC分数，这是我可以用其他算法得到的。

浏览 0提问于2021-01-18得票数 3

2回答

校准分类器ValueError:无法将字符串转换为浮动

scikit-learn、text-classification、valueerror

Dataframe： id review name label 1 it is a great product for turning lights on. Ashley 2 plays music and have a good sound. Alex 3 I love it, lots of fun. Peter

浏览 3提问于2021-09-23得票数 2

回答已采纳

1回答

支持向量机在多类分类中的预测

python、machine-learning、scikit-learn、svm

In:svc1.predict([X_poly[25].reshape(1,-1)) Out:array([3], dtype=int64) In:svc1.decision_function([X_poly[25]]) Out:array([[ 0.58348329, -0.99979492, 0.08571431, -0.99996706, -0.52397444, 0.99959056]]) In:svc1.predict_proba(X_poly[25].reshape(1,-1)) Out:array([[ 0.48373954, 0.11870606, 0

浏览 1提问于2018-01-22得票数 0

回答已采纳

1回答

如何在支持向量机中使用OneVsRestClassifier来解决多标签问题？

svm、scikit-learn

我正在使用OneVsRestClassifier进行多标签分类。它适用于LinearSVC，但当我将其应用于SVC时，出现以下错误： classifier = OneVsRestClassifier(SVC(class_weight='balanced')) classifier.fit(X1, y1) y2 = classifier.predict(X2) Traceback (most recent call last): ... File "/usr/local/lib/python2.7/dist-packages/sklearn/multiclass.py&

浏览 0提问于2013-05-06得票数 3

回答已采纳

2回答

预测概率

python、machine-learning

尝试使用来自sklearn的sklearn进行分类问题。给出一堆数据和信息，告诉我某个学科是否在某个类别中，我想给出一个概率，一个新的，未知的主题在一个类中。我只有两个类，所以问题是二进制的。这是我的代码和一些错误 from sklearn.svm import SVC clf=SVC() clf=clf.fit(X,Y) SVC(probability=True) print clf.predict_proba(W) #Error is here 但是它返回以下错误： NotImplementedError: probability estimates must be enabled

浏览 2提问于2013-11-09得票数 2

回答已采纳

1回答

如何计算小数据集SVM分类的概率(置信度)？

python、machine-learning、scikit-learn、artificial-intelligence、svm

用例：我有一个小数据集，每个类大约有3-10个样本。我使用sklearn SVC对那些带有径向基函数内核的人进行分类。I需要与预测类一起预测的可信度。我使用了SVC的predict_proba方法。我得到了奇怪的结果。我搜索了一下，发现它只对较大的数据集有意义。在堆栈上找到了这个问题。问题的作者通过乘以数据集来验证这一点，从而复制了数据集。我的问题： 1)如果我把数据集乘以100，假设每个样本有100次，就会提高"predict_proba“的”正确性“。会有什么副作用？不合身？ 2)还有其他方法可以计算分类器的置信度吗？就像离超平面的距离一样？ 3)对于这个小样本，支持向量机

浏览 3提问于2016-12-14得票数 5

1回答

带向量器的酸洗模型

python、machine-learning、scikit-learn

我正在腌制一个型号供以后使用。然后加载模型并在其上运行predict_proba。我得到了ValueError: X has 1 features per sample; expecting 319。不确定我是否正确地转换了它 import csv, pickle from sklearn import svm from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.calibration import CalibratedClassifierCV import numpy as np import o

浏览 0提问于2018-04-15得票数 0

回答已采纳

1回答

如何知道在Scikit-learn中从predict_proba返回数组中表示了哪些类

python、scikit-learn

我从Scikit-learn开始... >>> import sklearn >>> sklearn.__version__ '0.13.1' >>> from sklearn import svm >>> model = svm.SVC(probability=True) >>> X = [[1,2,3], [2,3,4]] # feature vectors >>> Y = ['apple', 'orange'] # classes &

浏览 0提问于2013-06-05得票数 13

回答已采纳

1回答

scikit的predict_proba的混淆概率- svm

python、scikit-learn、svm、libsvm

我的目的是根据特定类的每个样本的排序概率绘制PR曲线。但是，当我使用两个不同的标准数据集:虹膜和数字时，我发现svm的predict_proba()获得的概率有两种不同的行为。第一个案例使用下面python代码的"iris“案例进行评估，类获得最大的概率是合理的。 D = datasets.load_iris() clf = SVC(kernel=chi2_kernel, probability=True).fit(D.data, D.target) output_predict = clf.predict(D.data) output_proba = clf.predict_pro

浏览 1提问于2015-06-05得票数 3

回答已采纳

1回答

ValueError: X.shape[1] = 15应该等于700，即训练时的特性数。

python、machine-learning、scikit-learn

更新我正在进行机器学习文本分类，我用它来做svc线性内核，除了最后一行代码(打印(svm_model_linear.predict_proba(测试)，实际上我正在构建一个分类器，其中有自行车、足球和羽毛球三种类型，我有一些facebook上的人状态，被标记在这些类别上，我训练过分类器，也用train_test_split训练过分类器，在这之后，我有一些状态没有标记，我想分类，但是最后一行代码给了我错误。 from sklearn.feature_extraction.text import CountVectorizer cv = CountVectorizer(max_features

浏览 2提问于2017-11-03得票数 5

回答已采纳

1回答

scikit学习/svm-在“predict_proba”之后获取概率和相关标签

python-2.7、scikit-learn、libsvm

我正在使用scikit学习支持向量机进行文本分类，并遵循准则.但是，对于如何使用predict_proba方法获取概率、与正确的标签相关联以及如何获取前3，我感到困惑。 vectorizer = HashingVectorizer() clf = svm.SVC(probability=True,class_weight='balanced') test_data = [...] test_vectors = vectorizer.transform(test_data) predicted = clf.predict_proba(test_vectors) for doc

浏览 6提问于2017-02-27得票数 0

回答已采纳

2回答

在支持向量机中，奇怪的错误"ValueError：'x‘不能用于种子numpy.random.RandomState实例“？

python、error-handling、scikit-learn

贝娄，当我在应用程序中使用这段代码时，代码抛出一个奇怪的错误--它抛出一个错误，如下所示。此错误是由于SVC分类器()的"random_state“参数造成的。 from sklearn.svm import SVC import pandas as pd from sklearn.metrics import * from sklearn.model_selection import train_test_split def Fit_Model(TrainData, Algo): print Algo df = pd.read_csv(TrainData, se

浏览 0提问于2019-12-05得票数 1

回答已采纳

1回答

学习:在默认情况下，当needs_threshold=True被提供给记分员的值是什么？

scikit-learn

在二进制分类设置中，基于区域的模型调优需要一个可以阈值化的模型输出。但是，在scikit学习中，支持向量分类器在默认情况下不会生成类概率。例如，使用GridSearchCV和scoring=make_scorer(roc_auc_score, needs_threshold=False)对SVC模型进行调优是不正确的，因为AUC的分数将根据每个CV折叠中的预测类来计算。无论我们使用SVC(probability=True)还是SVC(probability=False)，都会发生这种情况。另一方面，scoring=make_scorer(roc_auc_score, needs_thres

浏览 1提问于2018-08-18得票数 2

回答已采纳

1回答

predict_proba打印特定类的可能性

machine-learning、python

我有16个标签，predict_proba给了我数组中所有16个类别的可能性。有没有办法，如果我传递特定的标签给predict_proba，它只能打印我的可能性，该类别？ preds = model.predict(dataframe) # getting predicted class , am interested in knowing probablity of this class. print(preds) # it is printing array for all 16 labels, I am keen to pass above predicted class and ret

浏览 0提问于2020-04-29得票数 0

回答已采纳

1回答

如何将SVM类概率转换为logits？

python-2.7、scikit-learn、libsvm、softmax

我想将SVM输出的概率类转换为logits。为了得到每一类的概率 model = svm.SVC(probability=True) model.fit(X, Y) results = model.predict_proba(test_data)[0] # gets a dictionary of {'class_name': probability} prob_per_class_dictionary = dict(zip(model.classes_, results)) # gets a list of ['most_probable_class', &

浏览 54提问于2018-09-16得票数 1

回答已采纳

1回答

无法理解sklearn的支持向量机的predict_proba函数

python、machine-learning、scikit-learn、classification、probability

我有困难理解一个函数从雪板，并希望得到一些澄清。起初，我认为sklearn的支持向量机的predict_proba函数给出了分类器预测的可信度，但在玩了我的情感识别程序之后，我开始产生怀疑，觉得我误解了predict_proba函数的用法和工作原理。例如，我的代码设置如下： # Just finished training and now is splitting data (cross validation) # and will give an accuracy after testing the accuracy of the test data features_train, fe

浏览 5提问于2015-07-01得票数 4

回答已采纳

2回答

sci-kit学习中SVC概率输出的网格搜索交叉验证

python、machine-learning、scikit-learn

我想对SVC分类器的概率输出运行网格搜索交叉验证。特别是，我想最小化负对数可能性。从文档中可以看出，GridSearchCV调用了被传递的估计器的predict()方法，SVC的predict()方法返回类预测，而不是概率(predict_proba()返回类概率)。 1)我是否需要继承SVC的子类，并为其提供一个返回概率而不是类的predict()方法来完成对数似然交叉验证？我想我需要编写自己的score_func或loss_func 2)对这个负对数可能性进行交叉验证是愚蠢的吗？我这样做的b/c数据集是: a)不平衡的5:1和b)根本不可分离，即即使是“最差”的观察值也有> 50%的

浏览 1提问于2013-05-21得票数 1

回答已采纳

5回答

属性错误：‘LinearSVC’对象没有属性'predict_proba‘

python、scikit-learn、nltk

我正在尝试使用LinearSVC分类器。更新：添加导入 import nltk from nltk.tokenize import word_tokenize from nltk.classify.scikitlearn import SklearnClassifier from sklearn.svm import LinearSVC, SVC LinearSVC_classifier = SklearnClassifier(LinearSVC()) LinearSVC_classifier.train(featuresets) 但当我试图用概率分类的时候 LinearSVC_class

浏览 8提问于2017-11-15得票数 12

回答已采纳

1回答

如何知道0级是多少，1级是多少？

python、machine-learning、scikit-learn、svm、prediction

我有一个代码，给我一个支持向量机的准确性，但我想知道多少是0和1类。这是代码 from sklearn.svm import SVC from sklearn.metrics import accuracy_score clf = SVC(C=10000.0, kernel='rbf') t0 = time() clf.fit(features_train, labels_train) print "training_time:", round(time()-t0, 3), "s" t0 = time() pred = clf.predict

浏览 1提问于2018-12-11得票数 0

回答已采纳

2回答

获取与predict_proba (GridSearchCV sklearn)相应的类

python、scikit-learn、text-classification

我使用GridSearchCV和管道对一些文本文档进行分类。代码片段： clf = Pipeline([('vect', TfidfVectorizer()), ('clf', SVC())]) parameters = {'vect__ngram_range' : [(1,2)], 'vect__min_df' : [2], 'vect__stop_words' : ['english'], 'vect__lowercase' : [True],

浏览 8提问于2015-07-20得票数 4

回答已采纳

1回答

使用不同的核构建SVM (RBF)

python、arrays、for-loop、machine-learning、svm

我用python写了这个 from sklearn.svm import SVC from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score, roc_auc_score X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3) # The gamma parameter is the kernel coefficient for kernels rbf/poly/s

浏览 26提问于2021-08-12得票数 0

2回答

如何确定roc_auc_score中的阳性类？

machine-learning、scikit-learn、svm、auc

我想使用roc_auc_score来评估分类器的性能，但是我不确定给出正确的参数是什么。这是文档：中对此函数的描述。正如您所看到的，它需要y_score，这是正类的概率估计，但是如何确定哪个类是正的？例如，当我使用predict_proba**，时，我应该使用哪个列？** 现在，我使用这个函数的方式如下： clf = SVC( kernel = 'linear', probability = True, random_state = 1 )

浏览 2提问于2020-01-08得票数 1

1回答

返回概率的python中的多类线性支持向量机

python、scipy、scikit-learn

如何实现多类线性支持向量机，返回测试样本的可支持性矩阵。列车样本: mxn列车标签: mxc测试标签: mxc，其中列有每个类的概率。 sklearn中的函数执行“1-vs-therest”，它不为每个示例返回可能数组，比如具有predict_proba的。编辑代码： print X_train.shape,y.shape svc = LinearSVC() clf = CalibratedClassifierCV(svc, cv=10) clf.fit(X_train, y) 输出： (7112L, 32L) (7112L,

浏览 5提问于2015-07-24得票数 3

回答已采纳

1回答

为什么Logistic回归和支持向量机预测最终要乘以常数？

python、text-classification、kaggle

我目前正试图理解某些高级分类问题，并在2012年的Kaggle竞赛中遇到了一些代码。竞赛讨论板是()，获胜代码是()。在第223行代码的末尾，两个数组列表中的预测值分别乘以0.4和0.6，然后相加在一起。这是行final_pred = preds[0] * 0.4 + preds[1] * 0.6。我的问题是，为什么值在作为数组返回到调用函数之前被乘以？返回数组后，它的值将保存到CSV，因此不再进行“处理”。所使用的模型是Logistic回归和SVM.svc，但这是在所有模型使用数据完成其业务之后，以及在使用pred = model.predict_proba(X_test)对数据进行预测之后

浏览 2提问于2017-08-25得票数 0

回答已采纳

3回答

学习predict_proba给出错误的答案

python、scikit-learn

这是的后续问题。在这个问题中，我引用了以下代码： >>> import sklearn >>> sklearn.__version__ '0.13.1' >>> from sklearn import svm >>> model = svm.SVC(probability=True) >>> X = [[1,2,3], [2,3,4]] # feature vectors >>> Y = ['apple', 'orange'] # cla

浏览 0提问于2013-06-10得票数 49

回答已采纳

1回答

错误：“y_true中的类数不等于‘y_score’中的列数”

python、roc、multiclass-classification、imbalanced-data

我有一个不平衡的多类数据集，当我试图计算分数时，我得到了这个错误: ValueError: y_true中的类数不等于‘y_ roc_auc_score’中的列数。代码如下： model = svm.SVC(kernel='linear', probability=True) model.fit(X_train, y_train) y_prob = model.predict_proba(X_test) macro_roc_auc_ovr = roc_auc_score(y_test, y_prob, multi_class="ovr",

浏览 19提问于2020-12-16得票数 3