在Apache Spark中并行训练Keras模型_在python中并行训练两个keras模型_Keras模型在训练后未学习 - 腾讯云开发者社区

python、apache-spark、pyspark、deep-learning

\我正在尝试使用Apache Spark和Elephas并行训练多个Keras模型。(keras_model=model_duration_time, rdd = rdd2) spark_model_3 = fit_to_spark_model(keras_model=model_avg_duration_time/stats_app.py 很多代码都被抽象出来了，但基本上train_LSTM_model(

浏览 29提问于2019-10-05得票数 0

2回答

在Apache Spark & Elephas中使用Keras模型作为广播变量

apache-spark、keras、broadcast

我有一个keras模型，预训练权重h5df约为700mb。我想在Apache Spark中使用它作为广播变量。1.这似乎是不可能的，因为keras模型本身不是spark感知的，也是不可序列化的。2.我在谷歌上搜索了一下，发现了Elephas库。因此，尝试在ElephasTransformer中包装Keras预训练模型。这抛出了多个错误(我使用的是

浏览 6提问于2017-09-30得票数 3

3回答

在同一个大规模数据集上对数百个模型进行评分的最佳实践？

scoring

我有预测各种事物的500+模型，以及一个由400m+个人和大约5,000个可能的自变量组成的大型数据库。目前，我的评分过程大约需要5天，操作方法是将400m+记录分块成10万人的片段，并旋转n个线程，每个线程都有一个特定的500+模型子集，并以这种方式运行，直到所有模型的所有记录都得分为止。每个线程都是一个Python进程，它提交R代码(即加载一个R .rds模型和相关的数据集转换逻辑)。这个过程耗时太长，容易出错(更多的是它变成的复杂代码网络的一个指标)，代价很高(需要大量的云实例)，并且只允许在R<e

浏览 0提问于2020-01-21得票数 2

1回答

在R中并行预测

r、hadoop、apache-spark、parallel-processing、predict

我正在使用R中的预测模型，并且我正在使用mgcv包。当前的预测模型与GAM一起运行。然而，使用R需要很多天的时间，我想优化命令。PS2:花费很多时间的代码(实际上只在R服务器上运行，只使用一台

浏览 0提问于2017-06-20得票数 0

2回答

Azure ML:如何在多个实例上训练模型

azure-machine-learning-service

当我执行管道时，我希望集群并行地在两个实例上运行训练。但是集群状态报告只有一个节点繁忙，另一个节点空闲。这是我提交管道的代码，正如你所看到的，我正在解析集群名称并将其传递给我的Step1，这是在Keras上训练模型。

浏览 11提问于2020-07-09得票数 1

回答已采纳

2回答

如何加载逻辑回归模型？

apache-spark、apache-spark-ml

我想用Java中的Apache Spark训练逻辑回归模型。作为第一步，我想只训练模型一次，并保存模型参数(截距和系数)。随后，使用保存的模型参数在稍后的时间点进行评分。我可以使用以下代码将模型保存在parquet文件中trainedLRModel.writeat

浏览 3提问于2017-12-07得票数 4

1回答

SparkML (Scala)中并行训练独立模型

scala、apache-spark、apache-spark-mllib、apache-spark-ml

假设我有3个简单的SparkML模型，它们将使用相同的DataFrame作为输入，但完全独立于彼此(无论是在运行的序列中还是在所使用的数据列中)。我想到的第一件事就是创建一个管道数组，其中包含三个阶段数组中的模型，并运行总体拟合/转换来获得完整的预测等等。但是，我的理解是，因为我们将这些模型作为一个序列堆叠在一个管道中，所以Spark不一定会并行运行这些模型，尽管它们完全独立于彼此。话虽如此，是否有办法<

浏览 3提问于2021-01-04得票数 0

回答已采纳

1回答

在PyTorch中组合在数据集不同部分中训练的多个模型

machine-learning、pytorch

在PyTorch中，理论上是否有可能将多个模型“合并”成一个模型--有效地将迄今学到的所有数据结合起来？模型是完全相同的，然而，训练的不同部分的培训数据。如果是这样的话，是否有可能将数据集分割成相同的部分，并以类似于折叠@home的方式在多台计算机之间分发培训？新的模型会像没有分发一样好吗？

浏览 4提问于2021-04-10得票数 0

回答已采纳

1回答

Apache MLlib随机森林的并行训练

java、apache-spark、machine-learning、random-forest、apache-spark-mllib

我有一个Java应用程序，它在一个包含200K样本的训练集上训练一个MLlib随机森林(org.apache.spark.mllib.tree.RandomForest)。我注意到在训练过程中只使用了一个CPU核心。鉴于随机森林是N个决策树的集合，人们可能会认为这些树可以并行训练，从而利用所有可用的核心。是否有配置选项或API调用或其他任何东西可以启用决策树的并行训练？

浏览 0提问于2016-11-05得票数 0

1回答

使用已保存的模型对新数据进行预测时，spark数据帧格式错误

scala、dataframe、apache-spark、apache-spark-sql、apache-spark-mllib

我能够训练模型并保存模型(Train.scala)。现在我想使用这个经过训练的模型来预测新数据(Predict.scala)。我在Predict.scala中创建了一个新的VectorAssembler来特色化新数据。我是否应该在Train.scala中对Predict.scala文件使用相同的VectorAssembler？因为我在转换后发现了特征数据类型的问题。例如:当我读入训练好的模型并尝试对

浏览 2提问于2019-08-24得票数 1

1回答

如何用不同的数据在不同的GPU上独立并行运行相同的Keras模型？

python、tensorflow、parallel-processing、keras

假设我有两个keras模型实例model0和model1以及数据集data0和data1。如果我有两个或更多的GPU，有没有一种方法可以在GPU0上并行训练model0，在GPU1上并行训练data1上的model1？到目前为止，我发现的所有方法都将单个模型的训练分散到多个gpus上。

浏览 2提问于2018-08-09得票数 0

1回答

与Keras并行读取行(GPU)

machine-learning、keras、gpu

我想知道是否有可能在Keras中用我的GPU并行读取文件中的几行。假设我有一个有50个特征(即50列)和10k行的文件，我想要并行处理，使用Keras最有效的方法是什么？此外，我不想训练我的模型，因为我已经处于项目的部署阶段。

浏览 0提问于2017-09-25得票数 0

1回答

是否可以在Keras中并行运行多个已保存的模型？

python、keras、neural-network

对于每个特征，我都训练了一个不同的神经网络模型，并将其保存为HDF5文件。现在我加载它们是为了进行预测，但我问自己，我是否不能并行运行它们，同时相应地显示所有功能，因为输入是相同的？

浏览 14提问于2020-03-24得票数 0

回答已采纳

1回答

其他模型中的Keras 1.2.2模型

python、keras、neural-network

我有一个Keras 2.3代码的工作片段，它构建:一个编码器，一个解码器，并使用Functional API和以下方法将它们合并到一个模型(自动编码器)中：现在，我想尝试在Hadoop集群上分发此模型的训练过程。为此，我选择了 (0.6.0)框架，使用Spark实现分布式训练，并提供一些高级API来构建模型。更具体

浏览 4提问于2019-11-07得票数 0

回答已采纳

2回答

如何将滑雪板管道转换成火花放电管道？

python、pyspark、scikit-learn、databricks、apache-spark-ml

我们有一个机器学习分类器模型，我们已经训练了一个熊猫数据和一个标准的学习管道(StandardScaler，RandomForestClassifier，GridSearchCV等)。我们正在研究Databricks，并希望使用并行计算火花提供的方法将这个管道扩展到一个大型数据集。 clf.fit(iris.data, iris.target)py4j.security.

浏览 3提问于2020-09-01得票数 6

回答已采纳

2回答

多个小ML模型的分布式训练

data、distributed-computing、machine-learning

我有一个数据科学应用程序，涉及到训练数以万计的小个体高斯模型。所谓“小”，我的意思是，任何单独的模型都可以很容易地在我们的一个工人服务器上训练。事实上，我们应该能够在每一个节点上同时训练几个。我一直在探索与Yarn一起使用Spark，但是Spark似乎真的是为了训练多台机器上的大型模型，而不是包含在单个机器上的许多小型模型。我正在想象一个工作流程，看起来像：按键

浏览 0提问于2018-09-17得票数 2

回答已采纳

1回答

用tensorflow和keras并行化数据准备

python-3.x、tensorflow、keras、training-data、tensorflow2.x

我正在使用Tensorflow Keras在GPU上训练一个LSTM模型。在调用model.fit()时开始训练之前，需要大约30分钟才能开始训练过程。如果是，我如何使用多核并行化这个数据准备过程？

浏览 0提问于2020-03-05得票数 0

回答已采纳

1回答

MLlib模型(RandomForestModel)使用大量小拼图文件保存模型

apache-spark、parquet、apache-spark-mllib

我正在尝试使用RandomForest.trainRegressor应用编程接口训练MLlib RandomForestRegression模型。这是预期的行为吗？

浏览 3提问于2016-01-31得票数 1

1回答

_thread.lock模型: TypeError: can't pickle Keras objects

python、apache-spark、keras、pyspark、keras-2

我在PySpark中使用训练有素的Keras模型时遇到了问题。使用以下版本的库：h5py==2.7.0另外，我使用的是Spark 2.4.0。from pyspark.sql import SparkSessionfrom keras.models import load_model() my_model = load_mode

浏览 1提问于2018-12-10得票数 0

1回答