使用火花DataSet设置LinearRegression的X1-Xn和Y

可以通过以下步骤完成：

导入所需的库和模块：

from pyspark.sql import SparkSession
from pyspark.ml.feature import VectorAssembler
from pyspark.ml.regression import LinearRegression

创建SparkSession对象：

spark = SparkSession.builder.appName("LinearRegressionExample").getOrCreate()

加载数据集，并转换为DataFrame：

data = spark.read.format("csv").option("header", "true").option("inferSchema", "true").load("data.csv")

定义特征向量汇总器，将X1-Xn列合并为一个特征向量列：

assembler = VectorAssembler(inputCols=["X1", "X2", ... , "Xn"], outputCol="features")
data = assembler.transform(data)

划分数据集为训练集和测试集：

(trainingData, testData) = data.randomSplit([0.7, 0.3])

创建线性回归模型对象：

lr = LinearRegression(featuresCol="features", labelCol="Y")

训练模型：

model = lr.fit(trainingData)

进行预测：

predictions = model.transform(testData)

至此，我们完成了使用火花DataSet设置LinearRegression的X1-Xn和Y的流程。这个过程中，我们使用了Spark的机器学习库（MLlib）中的线性回归算法。线性回归模型可以用于预测因变量Y和自变量X1-Xn之间的线性关系。在实际应用中，可以通过修改输入数据的X1-Xn值，以及训练数据和测试数据的划分比例等，来调整模型的准确性和性能。

腾讯云相关产品推荐：

腾讯云数据库 TencentDB：提供可扩展、安全可靠的云数据库服务，支持多种数据库引擎和存储类型。产品介绍链接：https://cloud.tencent.com/product/cdb
腾讯云人工智能平台 AI Lab：提供多种人工智能服务，包括图像识别、语音识别、自然语言处理等，可以满足各类人工智能应用的需求。产品介绍链接：https://cloud.tencent.com/product/ailab
腾讯云物联网开发平台 IoT Hub：提供全球化部署的稳定可靠的物联网云服务，支持设备连接、数据采集、消息通信等功能，适用于各类物联网应用场景。产品介绍链接：https://cloud.tencent.com/product/iothub
腾讯云服务器 CVM：提供高性能、可扩展的云服务器，支持多种操作系统和应用场景，具备弹性计算和可靠性高的特点。产品介绍链接：https://cloud.tencent.com/product/cvm

请注意，以上推荐的腾讯云产品仅供参考，具体选择应根据实际需求进行评估和决策。

我写了这段代码，但是很小的改动造成了一点不同，并产生了一个错误

、、

我写了 import numpy as np import matplotlib.pyplot as plt import pandas as pd dataset=pd.read_csv("Salary_Data.csv") X= dataset.iloc[:,:-1].values y= dataset.iloc[:,1].values from sklearn.cross_validation import train_test_split X_train,X_test,y_train,y_test= train_test_split(X, y, te

浏览 5提问于2017-06-20得票数 1

1回答

错误:形状(1,4)和(14,14)未对齐

、、、

所以我是机器学习的新手，对这个错误有点困惑：形状(1,4)和( 14 ,14)不对齐:4 (dim 1) != 14 (dim 0) 以下是完整的错误：文件"/Users/jim/anaconda3/lib/python3.6/site-packages/sklearn/utils/extmath.py"，第140行，在safe_sparse_dot中返回np.dot(a，b) ValueError:形状(1,4)和( 14 ,14)不对齐:4 (dim 1) != 14 (dim 0) 我的测试集有4行数据和14行数据，如(1,4)和(14,14)所示。至少我觉得这就是我

浏览 0提问于2017-12-31得票数 1

回答已采纳

1回答

在选择一片熊猫数据时保留索引

、、

因此，我正在创建我的训练和测试集，以便在使用sklearn的多元线性回归模型中使用。我的数据集包含182个特征，如下所示； id feature1 feature2 .... feature182 Target D24352 145 8 7 1 G09340 10 24 0 0 E40988 6 42 8 1 H42093 238 234 2 1

浏览 1提问于2019-01-07得票数 2

回答已采纳

1回答

学习LinearRegression，为什么模型只返回一个系数？

、、

我正在一个简单的数据集上试用LinearRegression模型(来自Andrew课程，我并不重要，请看图以供参考) 这是我的剧本 import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression dataset = np.loadtxt('../mlclass-ex1-008/mlclass-ex1/ex1data1.txt', delimiter=',') X = dataset[:, 0] Y = dataset[:,

浏览 5提问于2015-04-17得票数 14

3回答

如何将标量数组转换为二维数组？

、、、、

我是机器学习的新手，在将标量数组转换为2d数组时，我还面临一些问题。我试图在spyder中实现多项式回归。这是我的密码，请帮忙！ # Polynomial Regression # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the dataset dataset = pd.read_csv('Position_Salaries.csv') X = dataset.iloc[:, 1:2].values y

浏览 3提问于2019-03-08得票数 1

1回答

执行多项式线性回归时Matplotlib上的x轴不正确

、、

下面的代码得到一个从8到18的x轴。x轴的数据实际上是从1,000到5,000万。我期望对数刻度显示(10,000)、(100,000)、(1,000,000) (10,000,000)等。如何修复x轴？ dataset = pandas.DataFrame(Transactions, Price) dataset = dataset.drop_duplicates() import numpy as np import matplotlib.pyplot as plt X=dataset[['Transactions']] y=dataset[['Price&

浏览 9提问于2020-07-06得票数 0

2回答

sklearn:发现样本数量不一致的输入变量：[1，99]

、、、

我正试着在spyder中用熊猫建立一条简单的回归线。在执行下面的代码后，我得到了这个错误： Found input variables with inconsistent numbers of samples: [1, 99] 代码： import numpy as np import pandas as pd dataset = pd.read_csv('Phil.csv') x = dataset.iloc[:, 0].values y = dataset.iloc[:, 2].values from sklearn.linear_model import Linea

浏览 2提问于2017-08-16得票数 6

回答已采纳

2回答

在python中使用LinearRegression时，我收到消息“内核已死，正在重新启动”。

、、、

我是python的新手。在下面的代码中，每当我运行最后一行时，我都会收到消息"Kernel died，restarting“，然后Kernel就会重新启动。 import numpy as np import matplotlib.pyplot as plt import pandas as pd import traceback dataset = pd.read_csv('Salary_Data.csv') X = dataset.iloc[:, :-1].values y = dataset.iloc[:, 1].values from sklearn.cr

浏览 0提问于2017-11-12得票数 1

3回答

在Python中获取回归模型的beta系数

、、

dataset = pd.read_excel('dfmodel.xlsx') X = dataset.iloc[:, :-1].values y = dataset.iloc[:, -1].values from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0) from sklearn.linear_model import LinearR

浏览 104提问于2020-09-30得票数 0

回答已采纳

1回答

Matplotlib正在缩小图的比例。

、、、

我使用以下代码生成一个情节： import pandas as pd import numpy as np import matplotlib.pyplot as plt dataset = pd.read_csv('Position_Salaries.csv') X = dataset.iloc[: , 1:2].values y = dataset.iloc[: , 2:3].values from sklearn.linear_model import LinearRegression l_regressor = LinearRegression() l_regr

浏览 2提问于2022-09-04得票数 0

2回答

应用模型后，如何从滑雪板中导出数据集？

、、

我参加了一个与sklearn/python有关的机器学习课程。我理解模型的预处理、选择和运行等，但是现在我已经遍历了这些数据，我不知道如何：导出此数据，或如何查找特定行(ID)的预测。这是我的密码： import numpy as np import matplotlib.pyplot as plt import pandas as pd dataset = pd.read_csv('test_dataset.csv') dataset.set_index('ID', inplace=True) # replace ID with identifier f

浏览 4提问于2021-08-11得票数 1

2回答

ValueError:形状(1, 10 )和( 20 ,20)不对齐:10 (dim 1) != 20 (dim 0)

、、

我是机器学习新手，当我尝试在.predict()上执行X_test方法时，我会遇到这个错误。我也不理解reshape的概念:为什么我们需要这样做？ # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the dataset dataset = pd.read_csv('Salary_Data.csv') X = dataset.iloc[:,-1].values y = dataset.iloc[:,1].

浏览 0提问于2019-01-26得票数 0

1回答

LinearRegression()和脊(alpha=0)的区别

、、、、

当α参数接近于零时，Tikhonov (脊)代价与最小二乘代价等价。上的所有内容都表示相同。所以我以为 sklearn.linear_model.Ridge(alpha=1e-100).fit(data, target) 相等于 sklearn.linear_model.LinearRegression().fit(data, target) 但事实并非如此。为什么？用代码更新的： import pandas as pd from sklearn.linear_model import Ridge, LinearRegression from sklearn.preprocessing im

浏览 17提问于2016-11-13得票数 6

回答已采纳

1回答

在Python中将分类数据转换为数值数据

、、、、

我有一个数据集。它的一个列--“关键字”--包含分类数据。我尝试使用的机器学习算法只接受数字数据。我想把"Keyword“列转换成数值-我该怎么做呢？使用NLP？一袋话？我尝试了下面的方法，但我得到了ValueError: Expected 2D array, got 1D array instead。 from sklearn.feature_extraction.text import CountVectorizer count_vector = CountVectorizer() dataset['Keyword'] = count_vector.fit_tra

浏览 0提问于2019-10-07得票数 2

回答已采纳

1回答

使用.fit (线性回归)时的误差

、、、、

import pandas as pd from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split dataset = pd.read_csv('C:/Users/seemarahul/Downloads/adult-1.csv') X = dataset.iloc[:,0:15].values Y = dataset['income'] y_train: object X_train,X_test,y_tr

浏览 0提问于2020-06-25得票数 0

1回答

在单变量和三个自变量的多元回归中实现OLS时，存在numpy的Patsy误差。

、

在对因变量和三个自变量的多元回归中实现OLS时，将面临以下代码 PatsyError:错误评估因子: IndexError:只有整数、切片(:)、省略号(...)、numpy.newaxis (None)和整数或布尔数组才是有效的索引。 Y~ X1 ^ #Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the dataset dataset = pd.read_csv('data1.csv') X = d

浏览 4提问于2020-01-22得票数 0

2回答

多元线性回归100%准确率

、、

我在多元线性回归中得到了100%的准确率。我正在学习去年的一个教程。他在相同的模型上不能达到100%的准确率，但我现在得到了。在我看来很奇怪。这是我的代码。我做的是对的，还是我的代码有问题？ import numpy as np import matplotlib.pyplot as plt import pandas as pd dataset = pd.read_csv('M_Regression.csv') X = dataset.iloc[:, :-1].values Y = dataset.iloc[:, :1].values from sklearn.mod

浏览 94提问于2020-10-19得票数 2

2回答

“值错误:x和y必须相同大小”错误。多元线性回归

、、

import numpy as np import matplotlib.pyplot as plt import pandas as pd dataset=pd.read_csv("Marketing_Data.csv") X = dataset.iloc[:, :-1].values y = dataset.iloc[:, -1].values from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, te

浏览 67提问于2021-04-07得票数 2

1回答

多项式回归图的多重迹

、、、

我正在实现简单的多项式回归来预测给定大小的视频的时间，这是我自己的数据集。现在，由于某些原因，我的图得到了多个踪迹。 # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the dataset dataset = pd.read_csv('estSize.csv') X = dataset.iloc[:, 0].values.reshape(-1,1) y = dataset.iloc[:, 1].values.

浏览 2提问于2018-08-08得票数 3

回答已采纳

1回答

在预测测试结果时，整形函数导致错误。(AttributeError：'Series‘对象没有’reshape‘属性)

、、、、

导入库 import numpy as np import matplotlib.pyplot as plt import pandas as pd 导入数据集 dataset = pd.read_csv("50_Startups.csv") x = dataset.iloc[:, :-1] y = dataset.iloc[:, -1] print(x) print(y) 处理分类数据 from sklearn.compose import ColumnTransformer from sklearn.preprocessing import OneHotEnco

浏览 9提问于2020-08-03得票数 0

1回答

我怎样才能让我受过训练的模特做好生产准备？

、

我成功地使用sklearn的多元线性回归训练了我的模型。这是我使用的代码： import pandas as pd dataset = pd.read_csv('C:\\mylocation\\myfile.csv') dataset2 = pd.get_dummies(dataset) y = dataset.iloc[:, 31:32].values dataset2.pop('Target') X = dataset2.iloc[:, :180].values #Split the dataset from sklearn.cross_validati

浏览 0提问于2018-12-31得票数 0

回答已采纳

1回答

多项式回归不接受我的数据，因为它认为日期是字符串

、、

我为一个学校项目做了这个程序，它工作得很好，但是我的数据应该以日期的形式出现，但是每次我把日期作为变量插入时，它只是用一个错误提示我说(不能浮动字符串"2022-05-16“)。提前感谢 import numpy as np import matplotlib.pyplot as plt import pandas as pd import datetime dataset = pd.read_csv('/content/Position_Salaries.csv') X = dataset.iloc[:, 1:2].values y = dataset.iloc

浏览 4提问于2022-05-17得票数 0

回答已采纳

1回答

对数线性回归

、、

我有一个数据集，我正在尝试对数据集进行对数转换，但我一直收到一个错误，指出预期的2D数组，而不是1D数组： dataset3 = df_sheet_map['Set 3'] dataset3 X2 = dataset3.x Y2 = dataset3.Y plt.plot(X2, Y2, 'o') plt.xlabel('x') plt.ylabel('y') plt.show() print('A logarthimic regression model will be used for this data set&#

浏览 3提问于2019-11-11得票数 1

1回答

使用Sklearn to和多项式回归来拟合/预测曲线方程。无限循环错误

、、、、

我得到了一个数据集，我正在尝试寻找一些X和Y数据之间的关系。我希望能够使用sklearn库来绘制数据，并预测/plt方程的曲线。然而，当我尝试在将多项式回归模型拟合到我的数据集之后绘制我的预测值时，我的代码陷入了无限循环。最终目标是，一旦我预测/绘制了曲线，我希望能够知道曲线的完整方程。这是我的代码。 import numpy as np import matplotlib.pyplot as plt import pandas as pd Dataset = pd.DataFrame() Dataset["X"] = [6377, 6378, 6379, 6380, 6

浏览 1提问于2017-09-27得票数 0

1回答

在简单回归模型中使用预测函数时出错(形状未对齐)

、、、

有没有人可以帮我解决上面的错误。我实际上是在使用机器学习中使用的简单回归模型中的预测函数，并提出了一个错误。我已经使用了重塑函数来转换我的测试和训练数据，并相应地使用它们。执行的代码是：- import pandas as pd from numpy import * import matplotlib.pyplot as plt dataset=pd.read_csv("Salary_Data.csv") X=dataset.iloc[:,0].values X Y=dataset.iloc[:,1].values datas

浏览 1提问于2019-12-07得票数 0

1回答

ValueError:无法将字符串转换为浮动：'2021-09-22‘

、

我试着运行这个python脚本， import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression from sklearn.metrics import r2_score dataset= pd.read_csv('Desktop/Yahoo_Finance.csv') dataset.head() X = dataset.iloc[:, 0:2].values y = dataset['Clo

浏览 6提问于2022-04-22得票数 -3

1回答

多项式回归度递增误差

、、

我正在试着预测波士顿的房价。当我选择多项式回归度为1或2时，R2得分是可以的。但第三度会降低R2得分。 # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the dataset from sklearn.datasets import load_boston boston_dataset = load_boston() dataset = pd.DataFrame(boston_dataset.data, columns =

浏览 11提问于2019-07-28得票数 0

回答已采纳

1回答

为什么多项式回归对于不同的年级返回相同的结果？

、、、、

我有这个数据框架，我想计算臭氧的多项式回归。我将o3作为y值传递，将日期作为x值传递。为什么我的多项式回归在2到15年级看起来是一样的？我已经比较了4年级和15年级，没有区别...我将得到的回归与CurveExpert软件进行了比较，它们是完全不同的。如何解决问题，如何看待4年级和15年级之间的差异？ import matplotlib.pyplot as plt import datetime as dt import pandas as pd # Importing the dataset dataset = pd.read_csv('https://raw.githubuse

浏览 13提问于2020-06-22得票数 1

回答已采纳

1回答

找到样本数目不一致的输入变量：[159，40]

、

我对ML很陌生。尝试线性回归，面对下面的误差。请帮我解决这个问题。这是我的代码： x=dataset.iloc[:,1:-1].values y=dataset.iloc[:,-1].values from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression x_train,y_train,x_test,y_test=train_test_split(x,y,test_size=0.2) regressor=LinearRegression() r

浏览 0提问于2018-12-24得票数 0

1回答

科学学习中线性回归的误差

、

我试图在虹膜数据集上实现简单的线性回归。我的代码是： from sklearn.linear_model import LinearRegression df = sns.load_dataset('iris') x = df['sepal_length'] y = df['sepal_width'] model = LinearRegression() model.fit(x,y) 但是，我得到了以下错误：如果数据具有单个特性，则使用array.reshape(-1，1)或array.reshape(1，-1)对数据进行整形。

浏览 0提问于2022-02-04得票数 0

回答已采纳

1回答

Sklearn.linear_model : ValueError:发现样本数量不一致的输入变量：[1，20]

、、、、

我试图实现线性回归，但是当我运行代码时，我得到了这个错误ValueError: Found input variables with inconsistent numbers of samples: [1, 20] in line-->linear.fit(x_train1,y_train1) [data type of x_train1,x is series & y_ is series]。我将x=dataset.iloc[:,:-1]数据类型更改为x_train，将x更改为dataframe(y_仍为系列)，并正常工作那么，为什么即使y仍然是系列的，它也只有在x是数据帧

浏览 1提问于2017-12-23得票数 1

回答已采纳

1回答

sc未在SparkContext中定义

、、、、

我的星火包是火花-2.2.0bin-hadoop2.7。我将火花变量导出为 export SPARK_HOME=/home/harry/spark-2.2.0-bin-hadoop2.7 export PATH=$SPARK_HOME/bin:$PATH 我打开了火花笔记本 pyspark 我可以用火花装载包裹。 from pyspark import SparkContext, SQLContext from pyspark.ml.regression import LinearRegression print(SQLContext) 输出是 <class 'pyspark.

浏览 0提问于2018-02-13得票数 1

回答已采纳

0回答

如何在python中用真实数据测试机器学习模型

、

我是机器学习和python的新手。我已经用python创建了一个简单的线性回归模型。我可以测试我的模型的准确性，但只针对我的数据集中的数据，我的数据集是一个csv文件，其中包含工资和多年经验之间的关系。但我想在实际生活中使用它。例如，我将输入多年的经验，输出将是预测的工资。以下是我到目前为止所做的工作 import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the dataset dataset = pd.read_csv('Salary_Data.csv') X =

浏览 5提问于2017-12-04得票数 1

回答已采纳

8回答

ValueError:预期的2D数组，得到1D数组，而不是：

、、

在练习简单线性回归模型时，我得到了这个错误，我认为我的数据集有问题。这是错误正文： ValueError: Expected 2D array, got 1D array instead: array=[ 7. 8.4 10.1 6.5 6.9 7.9 5.8 7.4 9.3 10.3 7.3 8.1]. Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a sin

浏览 0提问于2018-07-03得票数 32

回答已采纳

1回答

有没有人能帮我解决多项式回归模型的特征缩放和变换问题？

、、、

我得到的错误是： ValueError: shapes (1,2) and (15,) not aligned: 2 (dim 1) != 15 (dim 0) 代码： import numpy as np import pandas as pd dataset = pd.read_csv('music.csv') X = dataset.iloc[:, :-1].values y = dataset.iloc[:, -1].values from sklearn.preprocessing import LabelEncoder le = LabelEncoder()

浏览 9提问于2021-03-15得票数 0

3回答

如何用线性回归模型进行预测？

、、、

我目前正在从事一个线性回归项目，在这个项目中，我需要收集数据，将其拟合到一个模型中，然后根据测试数据进行预测。如果我是正确的，简单线性回归对两个变量，X(独立)和Y(相依)起作用。我有以下数据集，其中我认为time列为X，value列为Y： +-----+------+ |value|minute| +-----+------+ | 5000| 672| | 6000| 673| | 7000| 676| | 8000| 678| | 9000| 680| +-----+------+ 我不知道的是如何正确地将这个数据集拟合成线性回归模型。我以前使用过k-means，我用

浏览 8提问于2017-06-27得票数 3

回答已采纳

1回答

用线性回归方法处理缺失值

、、、

我试图用线性回归方法处理列中缺少的值。列名为"Landsize“，我试图使用其他几个变量使用线性回归预测NaN值。这是林。回归码： # Importing the dataset dataset = pd.read_csv('real_estate.csv') from sklearn.linear_model import LinearRegression linreg = LinearRegression() data = dataset[['Price','Rooms','Distance','La

浏览 0提问于2019-08-25得票数 1

回答已采纳

2回答

在Python中如何在预测函数中传递浮动参数？

、、

我正在学习一门关于机器学习的课程，老师在多项式线性回归的预测函数中传递一个浮动参数，这对他是有效的。但是，当我传递代码时，它会抛出一个错误 “期望的二维数组，得到标量数组”。我尝试过将标量使用到数组中，但它似乎不起作用。 # Polynomial Regression # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the dataset dataset = pd.read_csv('Position_S

浏览 3提问于2019-07-26得票数 1

1回答

获取形状未对齐错误sklearn。

、、、、

import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression Dataset = pd.read_csv('Salary_Data.csv') Salary , YearsExperience = Dataset['Salary'] ,Dataset['YearsExperience'] X_train, X_test, y_train, y_test = tra

浏览 1提问于2018-03-01得票数 1

1回答

错误ValueError:当尝试使用cross_val_score和线性回归时不支持连续

、、、、

我使用了load_boston数据集从学习和线性回归。守则： from sklearn.datasets import load_boston import pandas as pd import numpy as np %matplotlib inline from sklearn.model_selection import train_test_split, KFold,cross_val_score,cross_validate from sklearn.linear_model import LinearRegression #Loading the dataset x = loa

浏览 4提问于2020-04-21得票数 0

回答已采纳

1回答

为什么有时在机器学习模型中重塑(-1，1)而有时不是？

、、、、

当在机器学习模型中指定X和y数组时，我看到它们有时从数据中获取列，如df.iloc:,2.values，中的“值”，有时将其重新定义为2D数组，如df.iloc:,2.values.reshape(-1,1). 什么时候用哪种？有时我用任何一种方法，它们都能起作用。为什么未成形的一个在有这样的语句时工作，比如“scikit-学习转换器期望输入数据是行和列的矩阵，因此目标变量的一维数组必须在转换之前被重塑为2D数组”。编辑： X=dataset.iloc[:,1:23].values y=dataset.iloc[:,0].values #%% from sklearn.preproces

浏览 11提问于2019-09-27得票数 0

1回答

用线性回归模型预测单个值时的误差

、、、

我是个初学者，建立了一个线性回归模型，当我根据测试集进行预测时，效果很好。但当我试图预测某一特定值时。它带来了一个错误。我正在看的教程，他们没有任何错误。 dataset = pd.read_csv('Position_Salaries.csv') X = dataset.iloc[:, 1:2].values y = dataset.iloc[:, 2].values # Fitting Linear Regression to the dataset from sklearn.linear_model import LinearRegression lin_reg = L

浏览 1提问于2019-07-18得票数 1

回答已采纳

1回答

在Python中使用切片

、、、、

我使用来自UCI repo：的数据集，然后执行下一步： from pandas import * from sklearn.neighbors import KNeighborsRegressor from sklearn.linear_model import LinearRegression, LogisticRegression from sklearn.svm import SVR from sklearn.ensemble import RandomForestRegressor from sklearn.metrics import r2_score from sklearn.cr

浏览 4提问于2016-08-30得票数 0

回答已采纳

1回答

我不能用linear_model.fit来拟合我的模型

、、

我从sklearn.model_selection家族引进了train_test_split，我想对我的模型进行训练和测试，以便预测变量y。我将字符串数据类型指定为我的X ( dataset的特性/变量)，而我的y是一个整数数据集(响应)。在这样做之后，我从LinearRegression家族导入了sklearn.linear_model函数/方法，现在当我试图拟合模型时，它会显示一个错误。 can’t convert strings(X) to variable y 为什么？ X = df[['Avg. Area Income', 'Avg. Area House

浏览 2提问于2022-07-11得票数 1

1回答

如何处理线性回归中的日期字段

、、

我有以下的数据，并计划实现线性回归出来。我已经开始编写脚本，并停止了它，因为日期字段(自变量)抛出了一个错误。有人能帮我修改代码来转换日期字段吗？ import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from sklearn.metrics imp

浏览 3提问于2020-09-24得票数 0

1回答

Scikit-Learn LinearRegression:从coef和intercept计算预测

、、、

在我训练了LinearRegression模型之后，如何将coef和intercept与我的predict结果关联起来？我使用的数据集：我的代码： import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression from sklearn import metrics

浏览 2提问于2021-09-30得票数 1

8回答

如何修复数字字符串：-不支持的操作数类型：'str‘和'str’

、、、

我一直在尝试在spyder IDE上用python实现多项式回归模型，一切工作正常，最后当我尝试从numpy添加排列函数时，它给了我以下错误!！ import pandas as pd import matplotlib.pyplot as plt import numpy as np dataset = pd.read_csv("Position_Salaries.csv") X = dataset.iloc[:, 1:2] y = dataset.iloc[:, 2] #fitting the linear regression model from sklearn.

浏览 0提问于2019-07-06得票数 2

2回答

简单线性回归-如何使我的模型更有效？

、

我在做一个简单的线性回归模型，这是我的Python代码： import numpy as np import matplotlib.pyplot as plt import pandas as pd dataset=pd.read_csv('sample.csv') X=dataset.iloc[:,:-1].values Y=dataset.iloc[:,1].values from sklearn.model_selection import train_test_split X_train,X_test,Y_train,Y_test=train_test_split

浏览 0提问于2018-05-28得票数 1

4回答

Weka线性回归ClassNotFoundException

String filePath = new File("").getAbsolutePath(); DataSource source = new DataSource(filePath + "\\src\\data\\data.arff"); Instances dataset = source.getDataSet(); // set class dataset.setClassIndex(0); // build model **LinearRegression lr = new LinearRegression();** lr.buildClassif

浏览 11提问于2017-02-11得票数 4

1回答

套索回归目标不收敛

、、、、

这是我的代码。当我运行它的时候，脊线是正常的，但是对于套索，我得到了错误消息： ConvergenceWarning: Objective did not converge. You might want to increase the number of iterations. 请帮帮忙。 from sklearn.linear_model import LinearRegression, Lasso, Ridge, RidgeCV, LassoCV from sklearn.model_selection import cross_val_score import numpy as np

浏览 1提问于2019-12-19得票数 2