为什么线性回归对pyspark是错误的？

线性回归对pyspark并不是错误的，相反，pyspark提供了强大的机器学习库，包括线性回归模型。线性回归是一种常见的机器学习算法，用于建立变量之间的线性关系模型。

然而，可能存在一些情况下，线性回归在pyspark中的应用可能不适合或不合适。以下是一些可能的原因：

数据不满足线性关系假设：线性回归假设自变量和因变量之间存在线性关系。如果数据不满足这个假设，线性回归模型可能无法准确地拟合数据。
数据具有高度非线性关系：如果数据具有复杂的非线性关系，线性回归模型可能无法捕捉到这些关系。在这种情况下，可以考虑使用其他更复杂的模型，如决策树、支持向量机或神经网络。
数据存在多重共线性：多重共线性指自变量之间存在高度相关性。在这种情况下，线性回归模型可能无法准确估计自变量的系数。可以通过特征选择或使用正则化技术（如岭回归或Lasso回归）来解决多重共线性问题。
数据具有异方差性：异方差性指误差项的方差不是恒定的。线性回归模型假设误差项具有恒定的方差。如果数据存在异方差性，线性回归模型的参数估计可能不准确。可以使用加权最小二乘法或转换变量来处理异方差性。

总结来说，线性回归在pyspark中并不是错误的，但在某些情况下可能不适合或不合适。在选择模型时，需要根据数据的特点和问题的要求来决定是否使用线性回归以及是否需要考虑其他更适合的模型。

为什么线性回归对pyspark是错误的？

pyspark、linear-regression

我不断得到错误的答案，所以我尝试了一些非常，非常基本的东西，它仍然是错误的。input file:2 1:24 1:4 # Load training

浏览 7提问于2019-07-13得票数 0

回答已采纳

1回答

我怎样才能引进弹性网，拉索和岭回归在火花公子？

machine-learning、pyspark、linear-regression、apache-spark-ml、lasso-regression

你能告诉我如何使用Elastic-Net，Lasso和岭回归吗？实际上，我选择了线性，弹性网，拉索和岭回归这4种算法，根据机器学习的小计。然而，我不知道如何导入Elastic，Lasso和Ridge回归，在Pyspark，不能谷歌正确的答案。我只知道在Pyspark中使用线性回归。

浏览 1提问于2020-06-01得票数 1

1回答

当新数据出现时，如何将保存好的线性回归ML模型重新组合在火花放电中

python、machine-learning、pyspark

我训练了一个线性回归的模型，使用pyspark 并保存it.now，我想在新的数据批处理的基础上对进行再训练。有可能吗？？

浏览 5提问于2017-07-12得票数 1

2回答

我正在处理一个数据集，我使用线性回归来拟合一个模型。在注销之前，我想尝试使用超参数调优来获得最佳可用模型。我一直在通过管道运行数据，首先将字符串转换为数字，然后对其进行编码，然后向量化所有列，然后在应用线性回归之前对其进行缩放。我很想知道如何设置网格来启动超参数滚球(可以这么说)。import pyspark.ml.feature as ft WD_indexer = ft.StringIndexer(inputCol="Wind_Direction"

浏览 1提问于2018-02-16得票数 4

1回答

写一个联非新议程来对火花数据进行滚动回归有意义吗？

scala、apache-spark、pyspark、window、aggregate

我需要对数据的子集执行滚动回归，对每个“文件”进行整个时间值。在做了大量的研究之后，我计划创建一个窗口对象，创建一个UDF，指定我希望线性回归发生的方式(使用函数中的spark线性回归)，然后将数据返回到dataframe。这将发生在.withColumn()操作的上下文中。这是有道理的，我觉得这种方法是正确的。我发现，目前火花放电不支持创建联新

浏览 3提问于2017-10-17得票数 0

回答已采纳

8回答

线性与非线性神经网络？

neural-network、tensorflow

我对机器学习和神经网络很陌生。我知道如何建立一个非线性分类模型，但我目前的问题有一个连续的输出。我一直在寻找关于神经网络回归的信息，但我所遇到的只是关于线性回归的信息--没有关于非线性情况的信息。这很奇怪，因为为什么会有人用神经网络来解决简单的线性回归呢？这不就像用核弹杀死苍蝇吗？所以我的问

浏览 12提问于2016-12-20得票数 37

回答已采纳

1回答

用CrossValidator拟合PySpark训练数据误差

python、machine-learning、pyspark、cross-validation

我在这里发现了很多关于从合适的CrossValidator对象中提取最佳模型参数的问题，但是我没有发现任何关于这个特定错误的问题。我正在尝试创建一个CrossValidator对象，并将其与我的培训数据相匹配，然后再对我最初的线性回归模型进行评估。我的数据集被转换成适当的格式，分为训练集和测试集，并成功地应用于第一个线性回归模型。我不知怎么搞错了，因为最后一行代码

浏览 4提问于2020-10-13得票数 0

回答已采纳

2回答

spark.read.format('libsvm')不使用python

pyspark、jupyter、pyspark-dataframes

我正在学习PYSPARK，遇到了一个我无法修复的问题。我按照这段视频从PYSPARK文档中复制代码来加载线性回归的数据。我从文档中得到的代码是spark.read.format('libsvm').load('file.txt')。我在这个btw之前创建了一个spark数据帧。当我在Jupyter notebook中运行这段代码时，它总是给我一些java错误，这个视频中的人和我做了完全相同<em

浏览 0提问于2019-12-09得票数 2

1回答

logistic回归的PySpark mllib p值

apache-spark、apache-spark-mllib、logistic-regression、apache-spark-ml

我目前正在使用ML包(SparkVersion2.1)在PySpark中运行一个逻辑回归。为了理解系数并检验它们的统计意义，我想研究相应的p-值。有没有任何方法可以使用ML包获得p-vales？

浏览 0提问于2018-11-07得票数 4

回答已采纳

1回答

回归:什么定义线性和非线性模型或函数？

regression、linear-regression、terminology

当输入和输出变量之间存在线性关系时，使用线性回归。这种线性关系是否意味着对变量或参数没有幂？在m的理解中，线性是指相对于参数(无幂)的线性。如果错了，请纠正我。，但如果函数是三次或更高次多项式(对变量的幂)，我们还可以使用线性回归吗？我在这里看到了一个类似的问题，“曲线”被认为是“线性”吗？，

浏览 0提问于2019-10-28得票数 0

回答已采纳

1回答

线性回归与logistic回归中误差值的分布

machine-learning、linear-regression、logistic-regression、distribution

为什么线性回归中的误差值必须是正态分布的，为什么在logistic回归中不能？

浏览 0提问于2019-04-10得票数 0

1回答

对数变换后的线性回归不良结果

machine-learning、regression、statistics、linear-regression

以下是日志转换前后的房租列和区域列的分布情况。📷后：📷📷📷

浏览 0提问于2021-04-22得票数 4

1回答

如何选择有噪声(散乱)数据的回归算法？

machine-learning、regression、linear-regression

我要用多个变量进行回归分析。在我的数据中，我有n=23个特性和m= 13000个训练示例。以下是我的培训数据(房屋面积与价格对比)：关于这个情节有13000个训练例子。正如你所看到的，它是相对嘈杂的数据。我的问题是，在我的情况下，哪种回归算法更合适、更合理。我的意思是，使用简单的线性回归算法还是一些非线性

浏览 0提问于2015-12-26得票数 1

回答已采纳

1回答

如何选择有噪声(散乱)数据的回归算法？

machine-learning、regression、linear-regression、non-linear-regression

我要用多个变量进行回归分析。在我的数据中，我有n =23个特性和m = 13000训练示例。以下是我的培训数据(房屋面积与价格对比)：关于这个情节有13000个训练例子。正如你所看到的，它是相对嘈杂的数据。我的问题是，在我的情况下，哪种回归算法更合适、更合理。我的意思是，使用简单的线性回归算法还是一些非线性<

浏览 3提问于2015-12-26得票数 1

回答已采纳

2回答

如何将ML VectorUDT要素从.mllib类型转换为.ml类型

machine-learning、pyspark

在2.0.0版本中使用pySpark ML对于一个线性回归的简单示例，我在新的ML库中得到一个错误。代码是：sqlContext =SQLContext(sc) from pyspark.mllib.linalg import VectorssqlContext.createDataFrame(Lp,["label","feature

浏览 1提问于2016-08-11得票数 8

2回答

神经网络与线性回归梯度下降的反向传播

machine-learning、neural-network、linear-regression、backpropagation、gradient-descent

我试图理解“反向传播”，因为它是使用梯度下降优化的神经网络。读一读文学作品，似乎做了几件事。上述步骤似乎是线性模型的精确求解过程(例如，回归)。安德鲁·吴的“机器学习课程”与线性回归课程完全一样。所以，我想弄清楚BackPropag

浏览 11提问于2016-06-28得票数 4

回答已采纳

2回答

LabeledPoint在pyspark.mllib中的类型转换误差，用于pyspark.ml中的线性回归模型

pyspark、linear-regression

我有以下使用pyspark.ml包进行线性回归的代码。但是，当模型适合时，我得到了最后一行的错误消息： org.apache.spark.mllib.linalg.VectorUDT@f71b0bce.：U‘IllegalArgumentException:列特性必须是org.apache.spark.ml.linalg.VectorUDT@3bfc3ba7类型，但实际上是org.apache.spark.ml.linalg.VectorUDT<em

浏览 5提问于2017-02-14得票数 8

回答已采纳

1回答

比较pls包中PCR函数中的所有变量，R

r、regression、pca、multivariate-testing、pls

我试图在R中进行主成分回归分析( PCR )，通常我会做主成分分析( PCA )，但是我有多重共线性，并且读到PCR可以处理这个问题。 geom_point(aes(fill=iris$Species),shape=21,colour='black',size=3)#plot points我的理解是，在公式中包含.后的

浏览 0提问于2017-08-25得票数 0

回答已采纳

1回答

如何在火花放电中不使用参数生成器执行交叉验证？

pyspark、apache-spark-mllib

我想在不使用ParamGrid Builder的情况下，在火花放电中进行一种简单的交叉验证。from pyspark.ml.tuning import CrossValidator, ParamGridBuilderlr = LinearRegression(regParam=0

浏览 1提问于2018-10-10得票数 2

1回答

PySpark应用程序创建了许多pyspark-shell会话

apache-spark、pyspark、apache-spark-ml

我正在开发一个使用SparkML线性回归API的应用程序。当我在YARN集群模式下提交作业时，在执行阶段，许多pyspark-shell应用程序都是以YARN为用户创建的。它们最终以成功状态完成，而我实际提交的主应用程序最终以成功状态完成。这是一种预期的行为吗？这对我来说有点有趣，因为我创建了单例sparkSession实例，并在整个应用程序中使用它，所以我不知道为什么要创建pyspark-shell会话/应用程序。

浏览 2提问于2017-09-09得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

为什么线性回归对pyspark是错误的？

相关·内容

为什么线性回归对pyspark是错误的？

我怎样才能引进弹性网，拉索和岭回归在火花公子？

当新数据出现时，如何将保存好的线性回归ML模型重新组合在火花放电中

基于火花的超参数整定

写一个联非新议程来对火花数据进行滚动回归有意义吗？

线性与非线性神经网络？

用CrossValidator拟合PySpark训练数据误差

spark.read.format('libsvm')不使用python

logistic回归的PySpark mllib p值

回归:什么定义线性和非线性模型或函数？

线性回归与logistic回归中误差值的分布

对数变换后的线性回归不良结果

如何选择有噪声(散乱)数据的回归算法？

如何选择有噪声(散乱)数据的回归算法？

如何将ML VectorUDT要素从.mllib类型转换为.ml类型

神经网络与线性回归梯度下降的反向传播

LabeledPoint在pyspark.mllib中的类型转换误差，用于pyspark.ml中的线性回归模型

比较pls包中PCR函数中的所有变量，R

如何在火花放电中不使用参数生成器执行交叉验证？

PySpark应用程序创建了许多pyspark-shell会话

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐