sklearn GLM分类_sklearn svm 多分类_sklearn中的分层分类 - 腾讯云开发者社区

python、machine-learning、scikit-learn、classification、glm

有没有办法在sklearn中实现一个通用的线性模型来解决分类问题？由于没有分类类，因此我想将sigmoid函数应用于回归结果。有没有一种简单的方法可以用sklearn做到这一点？我尝试过堆叠，但StackingClassifier不支持将回归器作为估计器。 glm = TweedieRegressor() logit = LogisticRegression(penalty = 'none') GLM_logistic = StackingClassifier(estimators = [('glm', glm)], final_estimator = l

浏览 28提问于2021-04-11得票数 0

1回答

使用sklearn/Scikit-Learn执行自定义GLM

python-3.x、scikit-learn、statsmodels

我希望使用sklearn/Scikit-learn实现自定义的GLM。使用statsmodel也是可能的，例如使用statsmodel，我们可以使用下面的代码 import pandas as pd import statsmodels.api as sm data = [(300,1),(200,0),(170,1),(420,1),(240,1),(133,0),(323,1),(150,0),(230,0),(499,0)] Labels = ['datapoint','value'] df = pd.DataFrame.from_records(dat

浏览 47提问于2020-09-25得票数 1

2回答

如何从对象列表中导入类对象？

python、python-3.x、scikit-learn

使用以下代码： from sklearn.utils import all_estimators from sklearn import base # Print all regressors estimators = all_estimators(type_filter="regressor") for name in estimators: print(name[0], name[1]) ...renders这个响应： ARDRegression <class 'sklearn.linear_model._bayes.ARDRegression

浏览 2提问于2021-10-01得票数 0

回答已采纳

1回答

覆盖statsmodels GLM中的predict()以在sklearn上下文中使用

python、scikit-learn、overriding、glm、statsmodels

为了在sklearn的上下文中使用统计模型的泊松GLM模型，我试图建立一个自己的模型，它继承自GLM，BaseEstimator和RegressorMixin。我的目标是做一些像交叉验证这样的事情。这是我的代码： import statsmodels.api as sm from sklearn.base import BaseEstimator, RegressorMixin class GLM_sklearn(sm.GLM, BaseEstimator, RegressorMixin): def __init__(self, X, y, family=sm.families.Po

浏览 0提问于2017-11-21得票数 0

1回答

多项式模型可以用广义线性模型来估计吗？

r、logistic-regression、glm

在分类数据分析中，我们经常使用逻辑回归来估计二项式结果与一个或多个协变量之间的关系。我知道这是一种广义线性模型(GLM)。在R中，这是通过使用参数family=binomial的glm函数实现的。另一方面，在分类数据分析中使用多项式模型。这些不是GLM吗？不能使用glm函数在R中估计它们吗？ (在此中。作者使用了一个外部包mlogit，它似乎也过时了) 为什么这类GLMs仅限于两种结果？这是因为多类分类可以被视为多个二分类模型吗？

浏览 0提问于2017-02-08得票数 22

回答已采纳

2回答

基于logistic回归的分类任务R、状态模型、滑雪板的比较

python、r、scikit-learn、logistic-regression

我在R，python状态模型和sklearn中做了一些logistic回归的实验。虽然R和状态模型给出的结果是一致的，但与滑雪板返回的结果有一定的差异。我想知道这些结果为何不同。据我所知，这可能不是相同的优化算法下使用的木材。具体来说，我使用标准的Default数据集(在中使用)。下面的Python代码将数据读入数据Default。 import pandas as pd # data is available here Default = pd.read_csv('https://d1pqsl2386xqi9.cloudfront.net/notebooks/Default.cs

浏览 0提问于2015-02-26得票数 12

回答已采纳

1回答

在Python中用GLM回归模型进行交叉验证

python、regression、cross-validation

如何使用GLM回归模型进行交叉验证？我已经创建了一个glm模型sm.GLM(endog, exog, family=sm.families.Gamma(link=sm.families.links.log())).fit()，我需要交叉验证结果，但是我无法找到一种使用sm.GLM模型的方法。找到使用model = LogisticRegression()的多个示例，但这不适用于我的数据。以下是代码： import pandas as pd import statsmodels.api as sm from sklearn.model_selection import train_test_

浏览 1提问于2021-12-03得票数 0

回答已采纳

1回答

将sklearn RFE与另一个包中的估计器一起使用

scikit-learn、statsmodels、rfe

是否可以将sklearn递归特征消除(RFE)与来自另一个软件包的估计器一起使用？具体地说，我想使用statsmodel包中的GLM，并将其包装在sklearn RFE中。若有，可否举出一些例子？

浏览 4提问于2018-08-04得票数 3

回答已采纳

1回答

多标签文本分类与科学学习，哪些分类器使用？

python、scikit-learn、classification、text-classification

我已经使用scikit-learn库进行了文本分类，导入了以下分类器： from sklearn.linear_model import RidgeClassifier from sklearn.svm import LinearSVC from sklearn.linear_model import SGDClassifier from sklearn.linear_model import Perceptron from sklearn.linear_model import PassiveAggressiveClassifier from sklearn.naive_bayes impo

浏览 0提问于2018-02-16得票数 2

回答已采纳

1回答

可视化滑雪板堆垛分类器模型流水线构造

scikit-learn、pipeline

使用Sklearn管道，我们可以可视化我们的管道构造。见下面的短图。我找不到类似的绘图功能的Sklearn堆叠分类器。如何用Sklearn堆叠分类器来表示集成模型构造？我在google上进行了研究，但没有找到任何关于如何绘制Sklearn堆叠分类器构造的例子。

浏览 1提问于2022-11-16得票数 1

1回答

构建一个sklearn文本分类器并使用coremltools进行转换

python、scikit-learn、text-classification

我想要建立一个文本分类器与学习，然后将它转换为iOS11机器学习文件使用包。我用、和构建了三个不同的分类器，它们都在Python中工作得很好。问题在于coremltools包及其将sklearn模型转换为iOS文件的方式。正如所说，它只支持这些模型：线性和Logistic回归 LinearSVC和LinearSVR SVC和SVR NuSVC和NuSVR 梯度增强分类器与回归器决策树分类器与回归器随机森林分类与回归正火器进位机标准标尺 DictVectorizer 一个热编码器因此，它不允许我将文本数据集向量化(我在分类器中

浏览 3提问于2017-06-08得票数 0

1回答

如何对分类模型执行前向回归

我正在尝试基于我的csv中的不同分类执行前向回归。有没有可能做到这一点？因为它不是线性模型，所以我不能只使用lm()函数。我已经做了很多研究，但这些研究并没有告诉我如何在内部适应分类模型。这是我尝试构建分类模型的代码： XBC <- read.csv("C:/Users/SFASi/Desktop/Fusarium Project September/XBC2/XBC(Raw) - Copy.csv") XBC <- XBC[ -c(1:3) ] glimpse(XBC) names <- c(1,2,5,6,8,10) XBC[,names] <

浏览 0提问于2021-10-18得票数 0

1回答

如何在H2O python中应用ordianal回归？

python-3.x、classification、h2o

我有一个由5个类组成的目标，其中有序数关系。对于这个多类分类问题，我想实现序数回归。在这里，我尝试过： train['target'] = train['target'].asfactor() valid['target'] = valid['target'].asfactor() test['target'] = test['target'].asfactor() from h2o.estimators.glm import H2OGeneralizedLinearEstimator hype

浏览 1提问于2019-03-13得票数 1

回答已采纳

1回答

如何计算"OneVsRestClassifier“分类器的准确度？

python、machine-learning、scikit-learn、multiclass-classification

我有一个多类分类问题，下面的代码可以在多类级别对数据进行分类。 from sklearn import datasets from sklearn.preprocessing import label_binarize from sklearn.multiclass import OneVsRestClassifier from sklearn.model_selection import cross_val_predict from sklearn.discriminant_analysis import QuadraticDiscriminantAnalysis as QDA iris

浏览 0提问于2019-08-31得票数 0

4回答

在Scikit管道中使用partial_fit

python、scikit-learn

如何在包装在()中的scikit learn分类器上调用partial_fit()？我正在尝试使用SGDClassifier构建一个可增量训练的文本分类器，如下所示： from sklearn.linear_model import SGDClassifier from sklearn.pipeline import Pipeline from sklearn.feature_extraction.text import HashingVectorizer from sklearn.feature_extraction.text import TfidfTransformer from sk

浏览 0提问于2013-07-30得票数 18

2回答

使用不同分类器的sklearn precision_recall_curve函数

python、scikit-learn、precision、precision-recall

这可能是一个简单的问题，但我需要帮助了解如何在sklearn中使用sklearn函数。我有一个二进制数据集，并使用三个分类器(SVM，RF，LR)对其进行分类。 sklearn文档中的示例显示了如何使用如下函数： y_score = classifier.decision_function(X_test) precision_recall_curve(y_test, y_score) 在本例中，decision_function是SVM分类器的内置函数.但是，我没有看到类似于随机森林分类器或线性回归的函数。有人能帮助我理解y_score和决策函数的真正含义，以及如何为任何分类器计算

浏览 0提问于2018-11-22得票数 1

回答已采纳

3回答

在scikit learn库中使用sgd求解器的SGDClassifier与LogisticRegression

python、machine-learning、scikit-learn

scikit-learn库有以下类似的分类器： Logistic回归分类器有不同的求解器，其中之一是“sgd”。 http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression 它也有一个不同的分类器'SGDClassifier‘，损失参数可以作为逻辑回归的'log’提到。 http://scikit-learn.org/stable/modules/generated/sk

浏览 42提问于2017-05-14得票数 14

1回答

是否应该规范或标准化knn的数据集？

python、python-3.x、machine-learning、scikit-learn、knn

我尝试使用knn进行分类任务，我的数据集包含分类特征，这些特征是一个热门的编码、数字特征(如价格等).以及文本列的向量。我知道knn受缩放的影响。所以我搞不懂这里用什么？ from sklearn.preprocessing import StandardScaler from sklearn.preprocessing import Normalizer from sklearn.preprocessing import normalize

浏览 0提问于2019-03-09得票数 4

回答已采纳

1回答

添加某些数据后OneVsRest分类器失败

python-2.7、pandas、scikit-learn

我试图让一个非常简单的scikit OneVsRest分类器工作，但遇到了一个奇怪的问题。以下是代码 import numpy as np import pandas as pd from sklearn.pipeline import Pipeline from sklearn.feature_extraction.text import CountVectorizer from sklearn.feature_extraction.text import TfidfTransformer from sklearn.naive_bayes import MultinomialNB fro

浏览 1提问于2015-07-12得票数 0

1回答

使用easystats检查parsnip对象中的glmnet模型时出错：$ operator无效

r、tidymodels、r-parsnip

尝试使用一个非常简单的glmnet分类任务进行check_model。取自此处的一些代码： library(magrittr) library(tidymodels) library(performance) data(two_class_dat) glm_spec <- logistic_reg() %>% set_engine("glmnet") norm_rec <- recipe(Class ~ A + B, data = two_class_dat) %>% step_normalize(all_predictors()) g

浏览 15提问于2021-05-19得票数 1

1回答

RandomForestClassifier是如何进行分类的？

machine-learning、scikit-learn、classification、random-forest、multiclass-classification

我了解到Sklearn将多类分类问题视为二进制问题的集合。引用Sklearn用户指南：在将二进制度量扩展到多类或多标签问题时，数据被视为二进制问题的集合，每个类都有一个问题。因此，像LogisticRegression或支持向量矩阵这样的二进制分类模型可以通过使用1-VS-1或1-VS-Rest策略来支持多类情况。我想知道RandomForestClassifier是否也是这样？在Sklearn中的其他分类器呢?在处理多类问题时，它们是否都被用作隐藏的二进制分类器？

浏览 9提问于2021-06-02得票数 0

回答已采纳

0回答

在R=1的情况下使用逻辑回归预测概率

r、probability、glm

我有一个简单的glm模型，如下所示： glm.fit=glm(Retention2~Email+Pay.method, data=train, family = binomial) 所有的DV和DV都是具有两个水平的分类变量。 glm的结果是：当我计算预测概率时，当Pay.Method为0时，概率值为1.000。语法和输出如下所示： glm.fit.prob=predict(glm.fit, newdata = test2, type="response") 似乎无论何时pay.method ="EZ PAY"，概率都将为0。我认为从数学上

浏览 12提问于2016-06-27得票数 0

回答已采纳

1回答

用Pandas‘范畴’dtype和sklearn

python、pandas、scikit-learn、categorical-data

在滑雪板中是否支持直接使用熊猫的分类数据类型来拟合模型？据我所见，sklearn不支持这种数据类型，这是不幸的，因为分类数据类型既编码分类数据，又包含数据的映射方案。此外，分类编码纯粹是一个数据处理/处理问题，因此由Pandas来处理似乎更自然。 Note 我意识到在Pandas和sklearn中有几种编码分类变量的方法--这不是我要问的。

浏览 3提问于2015-06-15得票数 16

回答已采纳

2回答

如何用机器学习算法设置多个类？

machine-learning、svm、random-forest、xgboost、mlp

我使用XGboost、Randomforest(sklearn)、SVM(sklearn)和MLPclassifier(sklearn)作为分类器。我想为多标签类设置这些模型。我该怎么做？ import xgboost as xgb from sklearn.svm import SVC from sklearn.neural_network import MLPClassifier from sklearn.ensemble import RandomForestClassifier xgb.XGBClassifier() SVC() MLPClassifier() RandomFores

浏览 1提问于2018-11-30得票数 0

回答已采纳

1回答

文本分类:原始字典输入和文本向量化

scikit-learn、natural-language-processing

我正在使用一系列sklearn分类器进行一些文本处理。在我在互联网上找到的example中，我注意到分类器的输入是一系列字典条目： ({'my': True, 'first': True, 'visit': True, 'was': True, ...}, 'pos') ({'wowjust': True, 'wow': True, 'who': True, 'would': True,..}, 'pos') 这些项目被传递到分类模型

浏览 6提问于2019-06-03得票数 0

1回答

英特尔daal4py分类器与scikit学习

scikit-learn、artificial-intelligence、random-forest

我正在测试最新版本的英特尔daal4py分类器与sklearn兼容的包装器。英特尔k-最近分类器可以很好地工作在sklearn的cross_val_score()和GridSearchCV中。英特尔分类器的性能提升是显著的，而英特尔和sklearn模型在10个不同的大型公共数据集和一些模拟数据集上提供了一般可比较的结果。用于英特尔随机林分类器的与sklearn兼容的包装器似乎完全崩溃了。score()方法不起作用，因此我不能继续使用intel随机森林包装器类。我在英特尔人工智能开发者论坛上发布了这篇文章，但我想知道这里是否有人让英特尔滑板兼容的随机森林分类器起作用了。我的下一步是测试本机d

浏览 4提问于2019-10-05得票数 0

回答已采纳

1回答

带虚拟变量的多元Logistic回归

r、variables、regression

我将在序言中说，我对R相当陌生，在这个问题上被困了几个星期，而且似乎没有进展。我希望进行多变量logistic回归，以确定水的主要物质和土壤类型是否在我的研究区域的水主断裂的位置发挥一个因素。我有417个正水主断裂位置，并在我的分析中创建了另外400个假位置。我知道，水主料和土壤类型都是分类变量，在使用GLM模型之前，应该将它们重新编码成虚拟变量。那就是我遇到麻烦的地方。到目前为止，我还没有使用虚拟变量，并且似乎无法理解它们是如何在R中创建的。下面是我所拥有的数据的分解以及我正在使用的GLM模型。指示符:0或1(指示XY是否为水主断裂位置) 主要材料:位于XY位置的主水管材料(分类值-约8

浏览 0提问于2019-02-28得票数 2

回答已采纳

1回答

学习分类器中的分数函数在哪里？

python、function、machine-learning、scikit-learn、cross-validation

当在scikit-learn内运行交叉验证时，所有分类器都有一个工厂函数score()，我可以很容易地检查分类器的准确性，例如从。 >>> import numpy as np >>> from sklearn import cross_validation >>> from sklearn import datasets >>> from sklearn import svm >>> iris = datasets.load_iris() >>> iris.data.shape, i

浏览 5提问于2015-11-16得票数 1

回答已采纳

2回答

使用集成投票分类器查找前3个特征重要性

python、machine-learning、scikit-learn、classification、ensemble-learning

我有一个分类问题，我必须使用投票分类器方法找到前3个特征，其中包含PCA，xgboost，随机森林，逻辑注册和决策树。我是一个初学者，我不知道如何使用投票分类器来获得特征重要性。 from sklearn.linear_model import LogisticRegression from sklearn.ensemble import RandomForestClassifier from sklearn.ensemble import GradientBoostingClassifier from sklearn.decomposition import PCA fro

浏览 0提问于2019-10-30得票数 1

2回答

如何在H20中将枚举数据类型转换为Numric

h2o

我已经将我的数据集导入到h2o流中，我有一个列是分类类型的，我想将它转换为数字数据类型。如果我用熊猫做这个任务，我会这样做， df['category_column'] = df['category_column'].astype('category') df['category_column'] = df['category_column'].apply(lambda x: x.cat.codes) 如何在h2o流中做到这一点，我试过跟随，在解析数据时，我将数据类型从枚举更改为数字，但数据显示的·如下所

浏览 0提问于2018-06-20得票数 4

回答已采纳

1回答

将对象存储到列表中，并为其提供存储在R中的字符矢量中的名称

r、list、model、glm、named

我正在运行glm分类器，我想将模型存储在一个命名列表中，为每个模型提供分类器中使用的预测器的名称--从字符向量中提取。但是我得到了一个错误。作为一个可重现的例子，我使用mtcars数据集(基数R)： > data(mtcars) > results <- list() > model1 <- glm(am ~ hp, mtcars, family ="binomial") > results <- list() > names <- c("hp" , "cyl") > results

浏览 2提问于2017-06-24得票数 0

回答已采纳

1回答

回归模型的性能会因具有更多级别的因素而失败

r、machine-learning、regression、glm、data-science

我有一个混合的数据(包括定量和分类)来预测一个定量变量。在输入R中的glm模型之前，我已经将分类数据转换为因子。我的数据具有分类变量，其中大多数具有超过150个级别。当我尝试将它们提供给glm模型时，由于这些因素具有更多的级别，它失败了，并出现了内存问题。我们可以设定一个阈值，并且只接受一定数量的变量。但是，我需要将这些具有更多层次的因素嵌入到模型中。有什么方法可以解决这个问题吗？编辑:数据集有120000行和50列。当使用model.matrix扩展数据时，有4772列。

浏览 0提问于2017-03-11得票数 0

4回答

R中引导库cv.glm中的代价函数

r、glm、cross-validation

我试图使用R中引导库中的交叉验证cv.glm函数来确定应用glm逻辑回归时错误分类的数量。该函数具有以下签名： cv.glm(data, glmfit, cost, K) 前两个表示数据和模型，K指定k-折叠。我的问题是成本参数，其定义为：成本:由两个向量参数组成的函数，用于指定交叉验证的代价函数。成本的第一个参数应对应于观察到的响应，第二个参数应对应于广义线性模型预测或拟合的响应。成本必须返回一个非负标量值.缺省值是平均平方误差函数. 我想对于分类来说，有一个函数返回错误分类的比率是有意义的，比如： nrow(subset(data, (predict >= 0.5 &a

浏览 2提问于2013-05-27得票数 7

回答已采纳

1回答

如何在滑雪交叉验证中获得多类roc_auc？

python、machine-learning、scikit-learn、classification、cross-validation

我有一个分类问题，我希望在sklearn中使用roc_auc值来获得cross_validate值。我的代码如下。 from sklearn import datasets iris = datasets.load_iris() X = iris.data[:, :2] # we only take the first two features. y = iris.target from sklearn.ensemble import RandomForestClassifier clf=RandomForestClassifier(random_state = 0, class_weig

浏览 2提问于2020-03-24得票数 2

回答已采纳

1回答

Sklearn问题分类

machine-learning、python、scikit-learn、dataset、text-classification

因此，我发现使用sklearn的SVM算法对单词进行分类有很多种方法。但是，我想按分类法对问题进行分类，如以下数据集所示： 📷 这个任务的目标是预测给定pdf文件/字符串(问题)的分类法。问题如下：如何修改下面的代码来训练一个基于问题的分类模型？如何利用支持向量机训练问题分类模型？对于此任务，我使用了以下Python库 import pandas as pd import numpy as np from nltk.tokenize import word_tokenize, sent_tokenize from sklearn.feature_extraction.text impor

浏览 0提问于2020-07-11得票数 -1

1回答

如何使用predict.glm()对非中心化的术语预测进行评分

r、glm

我正在构建一个简单的GLM模型，如下所示： model1 = glm(y ~ x1 + x2 + x3, data=train) 并且我使用预测函数来给新的预测打分 newpred = predict(object=model1, newdata= validation, type = 'term') 通过指定选项type = 'term'，我希望获得单个术语预测(即beta1 * x1、beta2 * x2等)。然而，事实证明，type = 'term'选项将返回以0为中心的“Centerized”预测(如此处所述：What does pre

浏览 24提问于2020-09-28得票数 2

1回答

使用tidymodel的GLM系列

r、glm、tidymodels

我正在尝试使用GLM的tidymodels包，并希望使用Gamma或泊松发行版。使用glm时，我将使用类似以下内容的内容 # using glm mdl <- glm(data = data, y ~ x, family = Gamma(link = "inverse")) mdl <- glm(data = data, y ~ x, family = poisson(link = "log")) # using glmnet library(glmnet) mdl <- glmnet(data$x, data$y, family = G

浏览 22提问于2021-02-03得票数 1

回答已采纳

1回答

fit_params在神经轴系管道中的应用

machine-learning、scikit-learn、neuraxle

我想在神经轴管道中使用分类器，例如sklearn.linear_model.SGDClassifier，并使用partial_fit在线安装它。我将分类器封装在带有SKLearnWrapper的use_partial_fit=True中，如下所示： from neuraxle.pipeline import Pipeline from neuraxle.steps.sklearn import SKLearnWrapper from sklearn.linear_model import SGDClassifier p = Pipeline([ SKLearnWrapper(SGDC

浏览 2提问于2020-10-22得票数 1

回答已采纳

1回答

Python sklearn ValueError:数组太大

python、scikit-learn、geospatial

我在Python (3.7版)上做了一个简单的脚本来对卫星图像进行分类，但它只能对卫星图像的剪辑进行分类。当我尝试对整个卫星图像进行分类时，它返回以下内容： Traceback (most recent call last): File "v0-3.py", line 219, in classification_tool File "sklearn\cluster\k_means_.py", line 972, in fit File "sklearn\cluster\k_means_.py", line 312, in k_m

浏览 22提问于2019-10-14得票数 1

8回答

将分类数据传递给Sklearn决策树

python、scikit-learn、decision-tree

有几篇关于如何将分类数据编码到Sklearn决策树的文章，但是从Sklearn文档中，我们得到了以下内容决策树的一些优点是： (...) 能够处理数字和分类数据。其他技术通常专门用于分析只有一种类型变量的数据集。有关更多信息，请参见算法。但是运行以下脚本 import pandas as pd from sklearn.tree import DecisionTreeClassifier data = pd.DataFrame() data['A'] = ['a','a','b','a'] data

浏览 10提问于2016-06-29得票数 102

回答已采纳

3回答

使用sklearn预测多标签数据

python、scikit-learn

根据文档，OneVsRest分类器支持多标签分类：下面是我要运行的代码： from sklearn import metrics from sklearn.preprocessing import MultiLabelBinarizer from sklearn.multiclass import OneVsRestClassifier from sklearn.cross_validation import train_test_split from sklearn.svm import SVC x = [[1,2,3],[3,3,2],[8,8,7],[3,7,1],[4,5,6]]

浏览 3提问于2016-05-06得票数 7

回答已采纳

1回答

如何检查一个对象是RandomizedSearchCV还是RandomForestClassifier？

python-2.7、types、scikit-learn、random-forest、grid-search

我有一些使用创建的分类器，还有一些直接作为创建的分类器。随机林返回类型sklearn.ensemble.forest.RandomForestClassifier，以及使用gridSearch返回类型sklearn.grid_search.RandomizedSearchCV创建的随机林。我正在尝试以编程方式检查估计器的类型(以确定是否需要在上使用)，但似乎找不到一个很好的方法。 if type(estimator) == 'sklearn.grid_search.RandomizedSearchCV'是我最初的猜测，但显然是错的。

浏览 0提问于2015-09-14得票数 0

回答已采纳

2回答

如果我已经有了泡菜的模型，为什么我需要在码头集装箱中学习滑雪呢？

python、python-3.x、docker、scikit-learn、pickle

我对模型进行了腌制，只想公开用prediction编写的Flask api。但是，当我编写一个没有sklearn的文件来生成一个图像时，我会得到一个错误ModuleNotFoundError: No module named 'sklearn.xxxx'，其中xxx引用了sklearn的ML算法类，此时我使用像classifier = pickle.load(f)这样的泡菜加载模型。当我重写dockerfile以生成具有sklearn的映像时，即使在API 从不导入sklearn中，也不会得到错误。我的泡菜概念非常简单，它将用它的所有数据序列化分类器类。因此，当我们解开它时

浏览 1提问于2018-10-22得票数 4

回答已采纳

2回答

精度、召回和F1可以是相同的值吗？

machine-learning、scikit-learn、classification、precision、precision-recall

我目前正在处理一个ML分类问题，我正在使用sklearn库的以下导入和相应的代码计算精度、召回和sklearn。 from sklearn.metrics import precision_recall_fscore_support print(precision_recall_fscore_support(y_test, prob_pos, average='weighted')) 结果 0.8806451612903226, 0.8806451612903226, 0.8806451612903226 对于ML分类问题，是否有可能获得所有3种类型的精度、召回和F1值？对

浏览 0提问于2019-01-07得票数 15

回答已采纳

1回答

为hyperopt-sklearn设置评分方法

scikit-learn、hyperparameters、hyperopt

当使用hyperopt-sklearn作为分类器时，有没有一种方法来定义评分方法？默认情况下，它似乎是sklearn的model.score方法，因此分类器的准确性。但是对于一些问题(例如:不平衡的类)，准确性不是最好的度量…

浏览 12提问于2019-11-13得票数 0

2回答

sklearn.ensemble ImportError中的VotingClassifier

python、machine-learning、classification、python-import、random-forest

我正在尝试用python实现多个学习分类器。我在代码中有5个随机的森林分类器，但是现在我不能从sklearn.ensemble导入VotingClassifier函数。当我写下这篇文章时： from sklearn.ensemble import VotingClassifier 错误信息为： ImportError: cannot import name VotingClassifier 我该如何解决这个问题呢？

浏览 2提问于2015-05-27得票数 2

1回答

如何在Sklearn管道中进行Onehotencoding

python、scikit-learn、pipeline、sklearn-pandas

我正在尝试oneHotEncode我的Pandas数据帧的分类变量，其中包括分类变量和连续变量。我意识到使用pandas .get_dummies()函数可以很容易地做到这一点，但我需要使用管道，以便稍后可以生成PMML文件。这是创建映射器的代码。我想要编码的分类变量存储在一个名为'dummies‘的列表中。 from sklearn_pandas import DataFrameMapper from sklearn.preprocessing import OneHotEncoder from sklearn.preprocessing import LabelEncoder

浏览 15提问于2017-02-13得票数 13

回答已采纳

1回答

如何从Matlab广义线性模型对象中删除训练数据集

matlab

我有一个在matlab2015a中生成的分类模型 glm = fitglm(Ttrain,...) 我想保留glm并传递给它，但是matlab也将训练数据(Ttrain一个表)绑定到对象上。如果您有许多模型+大型培训数据集(您可以很容易地耗尽内存)，这可能会变得非常困难。然而，做一些天真的事情，比如设置： glm.Variables= []; 给出 Error using classreg.regr.FitObject/subsasgn (line 753) The Variables property for class GeneralizedLinearModel is read-onl

浏览 0提问于2015-03-19得票数 0

回答已采纳

1回答

随机森林和集合学习者给出了相似的精度。

python、matlab、machine-learning、scikit-learn、deep-learning

我有一个工业数据集和测试分类性能使用决策树(DT)，随机森林(RF)和集成分类器(EL)，如套袋，提升等。，，问题是，对于所有的分类器，我都得到了相当相似的准确性。RF和EL依赖DT吗？在学术论文中比较DT、RF和EL的性能是否公平？我查看了现有的问题()，()，但目标与我的问题不同。Python from sklearn.tree import DecisionTreeClassifier % Decision Tree from sklearn.ensemble import RandomForestClassifier % Random forest from sklearn.ens

浏览 3提问于2021-08-04得票数 0

2回答

使用sklearn和Python进行大型应用程序分类/抓取练习

python、scrapy、classification、scikit-learn

我正在研究一个相对较大的基于文本的web分类问题，我计划在python中的sklearn中使用多项式朴素贝叶斯分类器，并使用scrapy框架进行爬行。然而，我有点担心sklearn/python对于一个可能涉及数百万网站分类的问题来说可能太慢了。我已经在DMOZ的数千个网站上训练了分类器。研究框架如下： 1)爬虫登陆一个域名，抓取网站上20个链接的文本(深度不超过1个)。(对于爬虫的示例运行，这里的标记化单词数量似乎在几千到150K之间变化) 2)运行具有大约50,000个特征的sklearn多项NB分类器，并根据结果记录域名我的问题是，对于如此大规模的应用程序，基于Python的分类器是否

浏览 0提问于2013-04-13得票数 5