是否适合并行的scikit-learn模型？_我的数据模型是否适合这个目的？_停止显示适合模型的报告 - 腾讯云开发者社区

、、

有没有可能并行地建立一个scikit-learn模型？类似于model.fit(X, y, n_jobs=20)的东西

浏览 17提问于2021-02-05得票数 0

回答已采纳

1回答

对内循环和外循环都使用n_jobs = -1有意义吗？

、、

我想使用scikit-learn并行化我的模型构建过程。我想知道将外循环和内循环都并行化是否有意义(即同时为GridSearchCV和cross_validate设置n_jobs = -1 )？

浏览 0提问于2019-07-03得票数 2

1回答

有没有办法在Python中将循环并行化以进行集成学习？

、、

我想同时训练多个LightGBM模型。prediction=model.predict(test_df.drop([target], axis=1)) test_predictions[:, m] = prediction 有没有办法让我把上面的循环并行化

浏览 7提问于2021-04-22得票数 0

3回答

将python scikit learn模型导出到pmml中

、、

我想将python scikit-learn模型导出到PMML中。我读过关于的文章，但我找不到任何使用scikit学习模型的例子。

浏览 2提问于2015-10-20得票数 21

1回答

如何管理回归的大数据集？

、、、

我的问题与我在Python中运行回归的一个非常大的数据集有关。我有分类数据(性别、行业、地区、薪资分组等)我想用统计模型对其进行回归。/All_Regression_Amounts_v1.xlsx') print('\nEnd Time: ', dt.now()) 我遇到的问题是在运行statsmodel回归时内存耗尽我在Windows上使用的是64位版本的Python，有32 GB的内存

浏览 22提问于2020-01-03得票数 0

1回答

使用scikit的多级并行化-学习

、、、、

我在一个多核服务器上使用scikit-learn的来适应大型数据集，所以我利用它的并行化特性设置了n_jobs = -1。同时，我希望执行交叉验证(使用)，并利用其并行化特性(同样，通过设置n_jobs = -1)。我的问题是，使用这两种类型的并行化是否会显著提高模型构建的速度，而不是只使用一种类型的并行化。如果后者是正确的，那么我不确定我应该

浏览 6提问于2015-04-27得票数 2

回答已采纳

1回答

Spark实现Scala的并行交叉验证

、、、

Pyspark提供了一个很大的可能性，可以通过将模型的交叉验证并行化，简单地用我如何才能实现类似的功能，斯派克的ScalaCrossValidator，即并行化每一个折叠？

浏览 1提问于2017-01-05得票数 3

回答已采纳

1回答

CV如何决定使用哪个函数？

我认为它接受一个回归器或分类器模型，就像scikit-learn中那样。然而，在简历的输入中，我没有发现任何这样的模型。你能告诉我CV类是如何决定适合哪个模型的吗？

浏览 1提问于2019-03-29得票数 0

1回答

基于scikit的逆高斯回归

、、、、

我正在尝试使用sci工具包训练数据，我想使用逆高斯作为回归变量，但我在软件包中看不到这一点，但我确实在文档中看到了提到GLM()的部分。是否有一种方法可以将其中给出的现有技术修改为逆高斯？还有没有其他使用scikit的方法。谢谢

浏览 1提问于2015-04-13得票数 1

3回答

非常短的刑期

、、

我正在尝试构建一个回归模型，其中一个特性包含文本数据。我在考虑使用scikit-learn的sklearn.feature_extraction.text.TfidfVectorizer。然而，问题是实际字符串包含的单词非常少。平均1.8。这是一个样本：1 car stereo3 refrigeratorTfidfVectorizer或者，这种稀疏的结果矩阵不会对

浏览 0提问于2019-09-06得票数 4

1回答

如何在图形核心议会联盟上实现模型并行性？

、

我成功地将我的TensorFlow模型的一个版本移植到了Graphcore议会联盟，并运行了数据并行性。然而，全尺寸模型并不适合于单一的议会联盟，我正在寻找实现模型并行性的策略。到目前为止，我还没有找到关于模型并行方法的信息，除了中的TensorFlow指南中针对议会联盟的信息之外，在该指南中引入了切分的概念。

浏览 2提问于2020-06-23得票数 2

回答已采纳

1回答

超选择与星火MlLib的集成

、、

有没有人有一个很好的例子，将Hyperopt集成到星火的MlLib中？我一直试图在Databricks上这样做，并继续获得相同的错误。我不确定这是否与我的目标函数有关，或者它是否与火星之火上的Spark有关，以及它是如何连接到Databricks的。

浏览 2提问于2020-02-13得票数 3

1回答

我的任务是使用scikit-learn、python和mapreduce解决情感分类问题。我需要使用mapreduce来并行化项目，从而创建多个SVM分类器。然后我应该将分类器“平均”在一起，但我不确定这是如何工作的，甚至不确定它是否可能。分类的结果应该是一个分类器，经过训练的平均分类器。我已经使用scikit-learn SVM线性内核编写了代码，它可以工作，但现在我需要将它放入map-reduce，并行化的上下文

浏览 2提问于2015-10-31得票数 1

1回答

TensorFlow中模型并行和流水线训练的示例代码

、、、、

朴素模型-跨多个GPU进行分区会导致工作负载在向前和向后传递期间从GPU移动到GPU。在任何时刻，都有一个GPU在忙碌。这是一个简单的版本。(0.5))我们需要示例代码(模板)来流水线工作，并通过发送批处理波和协调每个GPU上的工作通过使用data_flow_ops.StagingArea提供了提示，但具体的示例会很有帮助。我知道数据分区(或数据并行)是可行的</

浏览 11提问于2018-08-08得票数 0

1回答

如何给出选择模型的逻辑理由

我使用机器学习来训练与抑郁相关的句子。表现最好的是LinearSVC。除了LinearSVC之外，我还尝试了MultinomialNB和LogisticRegression，我选择了这三个模型中精度最高的模型。顺便说一句，我想要做的是能够提前考虑哪种模型适合，就像Scikit-learn提供的ml_map一样。我可以从哪里获得这些信息？我搜索了几篇论文，但除了SVM适合用于文本分类之外，找不到任何包

浏览 0提问于2020-11-12得票数 0

1回答

Scikit和Pandas:拟合大数据

、、、、

如何使用-学习在没有遇到内存问题的情况下训练大型csv数据(~75 on )上的模型？我使用IPython笔记本作为编程环境，使用pandas+sklearn软件包分析kaggle数字识别器教程中的数据。为了暂时绕过这个问题，我必须重新启动内核，然后read_csv函数成功地加载文件，但是当我再次运行相同的单元时，同样的错误会发生。当read_csv函数成功加载文件时，在对dataframe进行更改之后，我可以将这些特性和标签传递给KNeighborsClassifier的</e

浏览 2提问于2012-07-29得票数 14

回答已采纳

1回答

面对此错误: AttributeError:无法在<模块'sklearn.utils.deprecation‘上获取属性'DeprecationDict’

、

在运行代码加载ML模型pickle文件时遇到此问题。，，AttributeError:无法获取属性'DeprecationDict‘on

浏览 0提问于2019-11-03得票数 1

1回答

在选择最佳超参数组合后，SparkML CrossValidator是否重新适合完整的训练数据集？

、、、、

在训练数据集上交叉验证超参数网格后，SparkML的CrossValidator是否重新适合整个训练数据集？如果不是，它会从交叉验证的哪一部分中选择用于推断的bestModel？拟合的CrossValidator使.transform()方法可用。为此，CrossValidator是否使用最佳超参数在整个训练/交叉验证数据集上重新训练，并使用重新拟合的模型进行推理？或者，bestModel用于推断所有交叉验证文件夹中

浏览 22提问于2021-03-23得票数 0

3回答

将csv文件与python很好地连接在一起

、、、

我的程序首先在100个集群中集群一个大数据集，然后使用multiprocessing在每个集群上运行一个模型。我的目标是连接在一个大csv文件中的所有输出值，这是所有输出数据的连接，从100个拟合的模型。现在，我只是创建100个csv文件，然后在包含这些文件的文件夹上循环，然后逐个复制它们，然后在一个大文件中逐行复制它们。我的问题是:在不导出100个文件的情况下，是否有更聪明的方法

浏览 2提问于2015-10-10得票数 0

回答已采纳

1回答

_base”的模块--为什么在我的ec2 ubuntu云服务器上发现了这个错误？

、、、

在我的AWS ec2云服务器(Ubuntu)上，当我运行server.py文件来运行我的服务器时，会显示以下错误： File "server.py", line 31, in <module>

浏览 12提问于2022-02-06得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云