Python3.9.1-使用StandardScaler()缩放单行浮点数_如何使用StandardScaler缩放因变量_使用StandardScaler通过特定功能缩放具有不同形状的数组 - 腾讯云开发者社区

、、

当我尝试使用sklearn StandardScaler缩放我的因变量时，我遇到了错误。我的代码is_ # Scale the data using sklearn StandardScaler from sklearn.preprocessing import StandardScaler #Creating object of StandardScaler scale=StandardScaler() # Scale the dependent variable data using sklearn StandardScaler y = scale.fit_transform(y)

浏览 17提问于2020-11-16得票数 1

回答已采纳

1回答

学习StandardScaler，不允许直接转换，我们需要fit_transform

、、、

fit_transform和transform有什么区别？为什么转换不能直接工作呢？ from sklearn.preprocessing import StandardScaler X_scaler = StandardScaler() X_train = X_scaler.fit_transform(X_train) X_test = X_scaler.transform(X_test) 如果直接转换，则会产生以下错误 NotFittedError:这个StandardScaler实例还没有安装。在使用此方法之前，使用适当的参数调用“fit”。

浏览 1提问于2018-08-23得票数 3

回答已采纳

1回答

StandardScaler()在x_train和x_test上使用的正确代码是什么？

、

在以下三个选项中，我很难找到正确的代码标准化我的数据： # Option 1 from sklearn.preprocessing import StandardScaler sc = StandardScaler() X_train_std = sc.fit_transform(X_train) X_test_std = sc.transform(X_test) # Option 2 from sklearn.preprocessing import StandardScaler sc = StandardScaler().fit(X_train) X_train_std = sc.tra

浏览 39提问于2022-08-17得票数 0

回答已采纳

1回答

MinMaxScaler与StandardScaler的缩放特性？

、、

我正在训练一个神经网络来预测比特币的收盘价，我正在测试MinMaxScaler和StandardScaler的输入特性(高、低、波动率)和均方误差来评估结果。 MinMaxScaler StandardScaler 我的问题：在图片中注意到，MinMaxScaler在预测价格方面做得更差。然而，MSE是0.107，而另一方面，StandardScaler的MSE是0.2。为什么会这样呢？是因为StandardScaler在0,1之间缩放，所以结果比MinMaxScaler更接近在研究论文中使用哪种类型的缩放，因为其中大多数没有提到这些信息，而且我无法判断我的结果比他们的好还是差？

浏览 2提问于2021-08-29得票数 0

1回答

如何根据巨蟒列车组的均值和std对测试集进行标度？

、、、

我读了一个解释"“的答案，答案是”使用训练集的方法和标准偏差来标准化任何测试集“。因此，我试图修复以前的错误操作。但是，我检查了 of StandardScaler()，它不能用给定的平均值和std进行扩展。就像这样： from sklearn.preprocessing import StandardScaler sc = StandardScaler(mean = train_x.mean(), var_x = train.std()) sc.fit(test_x) # this code is incorrect, but what is the correct code?

浏览 3提问于2021-03-17得票数 0

回答已采纳

1回答

如何在PySpark中使用StandardScaler标准化测试数据集？

、、

我有如下的训练和测试数据集： x_train： inputs [2,5,10] [4,6,12] ... x_test： inputs [7,8,14] [5,5,7] ... inputs列是将VectorAssembler类应用于3个单独的列后包含模型特征的向量。当我尝试使用StandardScaler转换测试数据时，如下所示，我得到一个错误，指出它没有transform方法： from pyspark.ml.feature import StandardScaler scaler = StandardScaler(inputCol="inputs", outputC

浏览 52提问于2021-01-02得票数 0

回答已采纳

1回答

何时以及如何将StandardScaler与目标数据一起进行预处理

、、

我试图弄清楚何时以及如何使用scikit-learn's StandardScaler转换器，以及如何将其应用于目标变量。我读过这个职位，虽然公认的答案认为没有必要对目标向量进行标准化，但其他答案表明它仍然是有益的。因此，让我们假设，我想继续，并标准化目标向量。根据语法，StandardScaler实例的D3方法既可以取特征矩阵X，也可以取目标向量y作为有监督的学习问题。但是，当我应用它时，该方法只返回一个数组。如果我试图解压缩两个值，如下面的代码所示，我会得到一个"ValueError:太多的值而无法解压(预期的2)“错误： from sklearn.preproces

浏览 0提问于2021-07-05得票数 2

回答已采纳

1回答

sklearn Standardscaler()可以影响测试矩阵结果

、、、

我不是来自统计学，然而，通过使用机器学习和神经网络进行一项工作，我看到缩放数据可能会产生很多危害。据我所知，在训练测试之前缩放数据并不是一个好的选择，但当在训练-测试分离之后进行缩放时，请查看此示例。 import numpy as np from sklearn.preprocessing import StandardScaler train_matrix = np.array([[1,2,3,4,5]]).T test_matrix = np.array([[1]]).T e =StandardScaler() train_matrix = e.fit_transform(tr

浏览 9提问于2017-07-19得票数 2

回答已采纳

2回答

Python sklearn缩放器

如果我先定义scaler，然后再调用它，一切都会正常工作： scaler = StandardScaler() X_scaled = scaler.fit_transform(X) 但是打电话给 X_scaled = StandardScaler.fit_transform(X) 返回错误: fit_transform()缺少1个必需的位置参数：'X‘

浏览 13提问于2020-03-13得票数 0

1回答

Sklearn: pipeline transform()？

、

这是我的预处理列车数据的代码： stock_pipeline = Pipeline([ ('std_scaler', StandardScaler()), ]) train_pipelined_features_np = stock_pipeline.fit_transform(train_features_df) 在我训练之后，我即将对测试数据进行预处理。但奇怪的是，我必须使用stock_pipeline.fit_transform(test_features_df)或stock_pipeline.transform(test_features_df)... 由于流水

浏览 7提问于2017-08-02得票数 0

回答已采纳

1回答

如何仅对某些值在管道内使用StandardScaler？

、、、、

我有个问题。我想使用StandardScaler()，但是我的数据集包含某些OneHotEncoding值和其他应该是而不是的值。但是，如果我运行的是StandardScaler()，那么所有的值都是缩放的。那么，是否有选项只在管道内的某些值上运行此方法？我发现了以下问题：和下面的代码 columns = ['rank'] columns_to_scale = ['gre', 'gpa'] scaler = StandardScaler() ohe = OneHotEncoder(sparse=False) # Concatenat

浏览 4提问于2021-12-18得票数 1

回答已采纳

1回答

Python：'StandardScaler‘对象没有'_validate_data’属性

、、、

我最近更新了我的sklearn。然而，自从升级以来，我得到了错误"'StandardScaler‘对象没有’_validate_data‘属性“。以下是代码的一部分： Xs = pd.DataFrame([[10,20], [20,30], [30,40], [40,50]]) scalerx = preprocessing.StandardScaler() scalerx.fit(Xs)

浏览 18提问于2020-07-04得票数 2

1回答

标准定标器和规范化器为什么需要不同的数据输入？

、、、

我尝试了下面的代码，发现StandardScaler(or MinMaxScaler)和来自sklearn的Normalizer处理数据的方式非常不同。这个问题使得管道建设更加困难。我想知道这种设计上的差异是否有意的。 from sklearn.preprocessing import StandardScaler, Normalizer, MinMaxScaler 对于Normalizer，数据被读为“水平”。 Normalizer(norm = 'max').fit_transform([[ 1., 1., 2., 10],

浏览 0提问于2019-01-09得票数 3

回答已采纳

1回答

何时应用主成分分析PCA

、、、

何时应用PCA，是在预处理(即删除空值、编码等)之后还是在此之前？在我对数据集做了全面的预处理之后， from sklearn.preprocessing import StandardScaler sc = StandardScaler() x_train[:,0:14] = sc.fit_transform(x_train[:,0:14]) x_test[:,0:14] = sc.transform(x_test[:,0:14]) 我被留下的形状，113126x91

浏览 2提问于2021-10-14得票数 0

1回答

我可以在整个数据集上使用StandardScaler()吗，或者我应该在列车和测试集上分别计算吗？

、、、、

我正在为大约100个连续的特征和一个连续的标签开发一个SVR。为了扩展数据，我写道： #Read in df = pd.read_csv(data_path,sep='\t') features = df.iloc[:,1:-1] #100 features target = df.iloc[:,-1] #The label names = df.iloc[:,0] #Column names #Scale features scaler = StandardScaler() scaled_df = scaler.fit_transform(features) # r

浏览 16提问于2021-03-05得票数 0

回答已采纳

1回答

在Pandas中使用带Groupby函数的Keras StandardScaler

、、、

我有一个有多列的熊猫数据框。我需要在每一列上使用groupby函数，然后使用Keras StandardScaler函数来转换数据帧中的每一列。我尝试了以下代码： from sklearn.preprocessing import StandardScaler scaler=StandardScaler() df2= df.groupby('Sector').apply(lambda x: scaler.fit_transform(x.astype(float))) 但是它按组返回数据列表，但是，我需要保留数据帧的初始结构。我特别需要使用StandardScaler，因为之

浏览 20提问于2020-07-29得票数 2

1回答

可训练的R学习StandardScaler

、、、、

在R中是否有类似的东西允许将 (结果为mean=0和标准的deviation=1特性)与训练数据相匹配，并使用这个标度模型来转换测试数据？没有提供一种基于训练数据的均值和标准差来转换测试数据的方法。用于Python的片段 from sklearn.preprocessing import StandardScaler scaler = StandardScaler() scaler.fit(X_train) X_train_scaled = scaler.transform(X_train) X_test_scaled = scaler.transform(X_test) 因为我很确定这是

浏览 0提问于2018-03-13得票数 10

回答已采纳

1回答

NotFittedError说这个StandardScaler实例在使用inverse_transform()时还没有安装

、、、、

我有一个数据集，我使用了支持向量Regression.So，我需要使用来自sklearn.preprocessing的StandardScaler模块进行功能缩放。在训练我的模型之后，当我开始预测它时，它给出了一个特性缩放的预测，这就是为什么我使用了inverse_transformfrom StandardScaler()，并得到一个错误的说法 NotFittedError:这个StandardScaler实例还没有安装。在使用此估计器之前，使用适当的参数调用“fit”。我已经尝试过几种解决方案，但也出现了同样的错误。我现在能做什么？我的数据集这是我的代码： import numpy

浏览 0提问于2020-08-09得票数 1

回答已采纳

1回答

当使用标准缩放器时，为什么我的模型的预测在缩放数据和未缩放数据之间发生变化？

当我尝试使用标准缩放器缩放我的数据时，模型给出了一个错误的预测： from sklearn.preprocessing import StandardScaler st=StandardScaler() x_train=st.fit_transform(x_train) x_test=st.transform(x_test) arry = [51,1,0,140,261,0,186,1,0,2,0,2] tes = np.asarray(arry) se = tes.reshape(1,-1) svc_load.predict(se) 输出: array(，dtype=int64) 但使用

浏览 0提问于2021-05-24得票数 0

1回答

科奇学习管道是否将StandardScaler应用于y？

、、

考虑到我的管道 pipe = Pipeline([('scaler', StandardScaler()), ('regressor', LinearRegression())]) 然后我调用pipe.fit(X_train, y_train)，管道是将定标器应用于特性和目标，还是只应用于特性？如果不是，y参数在StandardScaler的fit_transform方法中起什么作用？这些文档确实让人困惑。对于fit，它说y被忽略了。对于fit_transform，它写着“适合X和y的转换器”。对于transform，它说y是不可取的。我试着在github

浏览 0提问于2019-03-21得票数 4

回答已采纳

1回答

Standardscaler()不是标准缩放吗？

、

我有以下管道： estimators = [] estimators.append(('standardize', StandardScaler())) prepare_data = Pipeline(estimators) 最初，数据看起来像是 📷 在应用估计量/StandardScaler()后 X_train = prepare_data.fit_transform(X_train_raw) 📷 为什么现在的数值大多/总是为负值？当我查看X_train中的另一个变量时，它看起来就像它应该做的那样(我猜)：在此之前 📷 之后 📷

浏览 0提问于2019-11-22得票数 2

2回答

用回归数据模型预测价格

、、、、

建立了基于多个自变量预测房价的回归数据模型。我得到了回归方程和系数。在拆分数据集之前，我使用了StandardScaler()来缩放变量。现在我想用我的回归模型来预测房价，当给出自变量的新值时，我能直接用自变量的值来计算价格吗？或者在包含自变量的值之前，我应该通过StandardScaler()方法传递这些值吗？

浏览 1提问于2020-02-24得票数 0

回答已采纳

2回答

python大熊猫标准化的回归列

、、、、

我有以下df： Date Event_Counts Category_A Category_B 20170401 982457 0 1 20170402 982754 1 0 20170402 875786 0 1 我正在准备用于回归分析的数据，并希望标准化列Event_Counts，使其具有与类别类似的规模。我使用以下代码： from sklearn import preprocessing df['scaled_even

浏览 3提问于2017-04-17得票数 2

回答已采纳

1回答

我可以标准化我的PCA应用计数向量吗？

、、、

我在我的X_train上应用了CountVectorizer()，它返回了一个稀疏矩阵。通常，如果我们想标准化稀疏矩阵，我们会传入with_mean=False参数。 scaler = StandardScaler(with_mean=False) X_train = scaler.fit_transform() 但在我的例子中，在我的X_train上应用了CountVectorizer之后，我还执行了主成分分析(TruncatedSVD)来减少维数。现在我的数据不是稀疏矩阵。所以现在我可以不传递with_mean=False (i.e with_mean=True)而直接应用Stand

浏览 10提问于2019-03-07得票数 2

回答已采纳

3回答

标准化Python Pandas dataframe中的一些列？

、、、

下面的Python代码只返回一个数组，但我希望缩放后的数据替换原始数据。 from sklearn.preprocessing import StandardScaler df = StandardScaler().fit_transform(df[['cost', 'sales']]) df 输出 array([[ 1.99987622, -0.55900276], [-0.49786658, -0.45658181], [-0.5146864 , -0.505097 ], [-0.48104676, -0.4781

浏览 0提问于2018-04-04得票数 10

回答已采纳

1回答

线性模型文本分类中的特征重要性，StandardScaler(with_mean=False)是或否

、、、、

在使用线性模型对词袋的TF-IDF线性模型进行二进制文本分类时，我希望通过模型系数获得每类的特征重要性。我听到了不同的意见，对于这种情况，列(特性)是否应该使用(with_mean=False)进行缩放。对于稀疏数据，无法在缩放之前将数据居中( with_mean=False部分)。默认情况下，也L2行已经对每个实例进行了标准化。基于经验结果，例如下面的自包含示例，似乎每个类的顶级功能在不使用StandardScaler时更直观。例如，'nasa‘和'space’是sci.space的顶级标志，而‘talk.religion.misc’和'christians‘是最重

浏览 42提问于2019-10-30得票数 1

回答已采纳

3回答

标准定标器与MinMaxScaler的区别

、

MinMaxScaler和标准缩放器的区别是什么？ MMS= MinMaxScaler(feature_range = (0, 1)) (在Program1中使用) sc = StandardScaler() (在另一个程序中，他们使用标准缩放器，而不是minMaxScaler)

浏览 2提问于2018-07-09得票数 25

回答已采纳

1回答

使用fit_transform()和transform()

、、、、

from sklearn.preprocessing import StandardScaler sc = StandardScaler() X_train = sc.fit_transform(X_train) X_test = sc.transform(X_test) 我所知道的是fit()方法计算特征的均值和标准差，然后transform()方法使用它们将特征转换为新的缩放特征。fit_transform()只不过是在一行中调用fit() & transform()方法。但是为什么我们只调用fit()来训练数据而不是测试数据呢？这是否意味着我们正在使用训练数据的均值和标准差来

浏览 11提问于2022-06-16得票数 2

回答已采纳

2回答

StandardScaler没有正确地缩放

、、、、

我正在尝试使用StandardScaler来扩展神经网络的特征。那么说，神经网络具有以下特点： 1.0 2.0 3.0 4.0 5.0 6.0 4.0 11.0 12.0 etc ... 当我将StandardScaler应用于整个事物(所有行)时，我得到了第一行的以下结果： ['-0.920854068785', '-0.88080603151', '-0.571888559111'] 当我试图仅将StandardScaler应用于第一行时(矩阵仅由第一行组成)，结果就完全不同了。 ['0.0', '0

浏览 1提问于2018-01-13得票数 1

回答已采纳

1回答

为什么Python的'StandardScaler‘和Matlab 'zscore’之间的标准化有区别？

、、、

为什么Python中的sklearn.preprocessing.StandardScaler与Matlab中的zscore不同？在Python中使用sklearn.preprocessing的示例： >>> from sklearn.preprocessing import StandardScaler >>> data = [[0, 0], [0, 0], [1, 1], [1, 1]] >>> scaler = StandardScaler() >>> scaler.fit(data) >>> p

浏览 0提问于2018-03-07得票数 3

回答已采纳

1回答

在稀疏输入上使用Spark的StandardScaler有效吗？

、、

虽然我知道在StandardScaler列上使用SparseVector是可能的，但我现在想知道这是否是一个有效的转换。我的理由是输出(很可能)不会很少。例如，如果特征值是严格正的，那么输入中的所有0's都应该转换为负值，这样就不再有稀疏的向量了。那么，为什么在Spark中允许这样做，如果您需要稀疏特性，那么使用StandardScaler不是一个好主意吗？

浏览 0提问于2022-12-01得票数 1

回答已采纳

2回答

python: DataConversionWarning:输入数据类型为uint8、int64的数据都被StandardScaler转换为float64

我不明白这条消息/opt/conda/envs/Python36/lib/python3.6/site-packages/sklearn/preprocessing/data.py:645: DataConversionWarning: Data with input dtype uint8, int64 were all converted to float64 by StandardScaler. return self.partial_fit(X, y) /opt/conda/envs/Python36/lib/python3.6/site-packages/ipykernel/_

浏览 45提问于2019-12-22得票数 1

1回答

Python -适合于对部分数据进行转换的标准定标器

、

具有以下DF： A B c 0 1 1 21 1 2 12 122 2 3 3 23 3 4 14 124 4 5 5 25 我的“火车组”已经用StandardScaler进行了改造。转换后的特性具有以下值： array([[-1.41421356, -1.17669681, -0.85696442], [-0.70710678, 0.98058068, 1.20383097], [ 0. , -0.78446454, -0.81615659], [ 0.70710678,

浏览 6提问于2022-03-08得票数 0

回答已采纳

2回答

保存StandardScaler()模型以便在新数据集上使用

、

如何在Sklearn中保存StandardScaler()模型？我需要使模型具有可操作性，并且不想一次又一次地加载训练数据，以便StandardScaler学习，然后应用于我想要进行预测的新数据。 from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split #standardizing after splitting X_train, X_test, y_train, y_test = train_test_split(data, target) s

浏览 0提问于2018-11-05得票数 16

回答已采纳

1回答

如何复制岭(normalize=True)的行为？

、、、

这段代码： from sklearn.pipeline import make_pipeline from sklearn.preprocessing import StandardScaler from sklearn.linear_model import Ridge X = 'some_data' y = 'some_target' penalty = 1.5e-5 A = Ridge(normalize=True, alpha=penalty).fit(X, y) 触发以下警告： FutureWarning: 'normalize'

浏览 4提问于2022-09-02得票数 3

回答已采纳

1回答

如何强制所有字符串浮动？

、、、

我有一个小的dataframe，只包含两个列，其中应该有所有的浮点数。因此，我有两个字段“Price”和“Score”。当我看数据的时候，对我来说，这一切都是浮动的，但是很明显，有些东西是字符串。有什么方法可以把这些字符串的东西踢出去，但看起来却像浮标？或者，有没有办法强迫一切都浮起来？该错误发生在这里显示的最后一行，然后其他任何操作都无效。 df = pd.read_csv('C:\\my_path\\analytics.csv') print('done!') modDF = df[['Price', 'Score']].co

浏览 1提问于2020-01-14得票数 7

回答已采纳

1回答

Python3.9.1-使用StandardScaler()缩放单行浮点数

、

我输入了以下python命令和示例数据。 >>> import numpy >>> from sklearn.preprocessing import StandardScaler >>> input_scaler = StandardScaler() >>> data = numpy.array([1.24, 0.91, 1.77, 0.7]) >>> data.shape (4,) >>> reshapedData = data.reshape(1, 4) >>>

浏览 10提问于2021-05-08得票数 0

回答已采纳

2回答

如何使用scikit学习具有新值inverse_transform

、、

我有一组数据，我使用了scikit learn PCA。在使用StandardScaler()执行主成分分析之前，我对数据进行了缩放。 variance_to_retain = 0.99 np_scaled = StandardScaler().fit_transform(df_data) pca = PCA(n_components=variance_to_retain) np_pca = pca.fit_transform(np_scaled) # make dataframe of scaled data # put column names on scaled data for us

浏览 5提问于2018-04-18得票数 5

1回答

MLPRegressor -为什么没有人转换目标数据？

、

我不明白为什么在训练机器学习算法(如MLPRegressor (SKLearn) )时，没有人缩放目标数据？我总是看到这样的事情： # separate array into input and output components X = array[:,0:8] Y = array[:,8] scaler = StandardScaler().fit(X) StandardX = scaler.transform(X) 但也会期待这样的事情： # separate array into input and output components X = array[:,0:8] Y = arr

浏览 1提问于2018-10-18得票数 0

回答已采纳

1回答

使用python StandardScaler进行特性缩放会产生负值。

、、

我是机器学习方面的新手。我试图使用python StandardScaler类对我的输入、培训和测试数据使用特性缩放。但是，当我看到缩放值时，有些值是负值，即使输入值没有负值。这是正常还是我在代码中遗漏了什么。下面给出了用于特性缩放的相关代码。 from sklearn.preprocessing import StandardScaler sc = StandardScaler() train = sc.fit_transform(train) //train contains training feature matrix test = sc.transform(test) //tes

浏览 2提问于2017-12-25得票数 3

回答已采纳

1回答

在Python中对不同维数的数据进行标准化

、、

我在每一行的维度上有一个不同的数据帧。正如我所承认的，我认为我应该使行维度的数量彼此相等。因此，在使用任何数据分析方法之前，我对数据执行了sklearn.preprocessing.StandardScaler。 0 1 2 3 4 5 6 7 8 0.00 5.00 16.00 13.00 18.00 34.00 33.00 24.00 19.00 0.00 6.00 17.00 27.00 9.00 7.00 0.00

浏览 0提问于2017-09-05得票数 0

1回答

我们能否将特征缩放应用于数据集中的“自变量”？

、、

我有一个包含8个因变量的数据集(2个分类数据)。我已经应用ExtraTreeClassifier()消除了一些因变量。我还用了X，y的标度。 from sklearn.preprocessing import StandardScaler sc = StandardScaler() X = sc.fit_transform(X) X = sc.transform(X) y = sc.fit_transform(y) y = sc.transform(y) 在此之后，我将数据集拆分为 from sklearn.cross_validation import train_test_sp

浏览 0提问于2018-09-21得票数 2

回答已采纳

1回答

什么是关于StandardScaler()的“数据缩放”？

、

我正试图找出StandardScaler()在滑雪中的用途。我所遵循的教程说 “请记住，您还需要再次执行缩放，因为您的红色和白色葡萄酒的一些值有很大的差异” 所以我在sklearn文档中查找了函数。 “通过删除均值和缩放到单位方差来标准化特性”https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler.html 去掉这个平均数有什么好处呢？什么是缩放数据？很难用谷歌搜索。 # Scale the data with `StandardScaler` X = StandardSc

浏览 0提问于2019-08-28得票数 0

回答已采纳

2回答

当我尝试训练模型时，输入包含NaN

、、

你能告诉我如何纠正这个错误吗?我使用决策树来训练笔划模型。数据集在kaggle上，但是..我不明白这个问题。 import pandas as pd import numpy as np import matplotlib.pyplot as plt dataset = pd.read_csv("train.csv") X = dataset.iloc[:,[0,12]].values Y = dataset.iloc[:,13].values from sklearn.preprocessing import StandardScaler SC = StandardScale

浏览 0提问于2021-05-17得票数 0

1回答

正确使用LinearSVC

、、、、

我正在尝试实现一种机器学习算法来检测不规则的心电信号。我提取了一些特征，但我不知道如何为分类器管理正确的输入。我有20k个不同的心电信号，每个信号有1000个值。它们都被标记为正确或不正确。我选择了heart_rate和xposition_of_3_highest_peaks这两个特性，但是如何将它们输入分类器呢？接下来您可以看到我的尝试，但是每次我添加第二个功能时，分数都会下降。为什么？ clf = svm.SVC() #[64,70,48,89...74,58] X_train_heartRate = StandardScaler().fit_transform(fe.get

浏览 9提问于2022-09-16得票数 1

1回答

用于缩放数据的Fit_transform方法引发值错误。请帮我解决这个问题

、

我正在从一本书中从头开始学习机器。如果这是一个幼稚的问题或已经在这里讨论过的问题，我很抱歉。我在这里回顾了其他类似的文章，并了解到我需要使用Label来解决这个问题，但我不知道如何编码LabelEn编码器，并希望这里的人能帮我。我真的很感激你的时间和你在这方面的帮助。代码： housing_feature_engineered = pd.read_csv("todaytest.csv") from sklearn.preprocessing import StandardScaler scaler = StandardScaler() housing_scaled = sca

浏览 2提问于2022-06-14得票数 0

2回答

scikit-learn:如何缩小'y‘预测结果

、、、

我正在尝试通过使用波士顿住房数据集来学习scikit-learn和机器学习。 # I splitted the initial dataset ('housing_X' and 'housing_y') from sklearn.cross_validation import train_test_split X_train, X_test, y_train, y_test = train_test_split(housing_X, housing_y, test_size=0.25, random_state=33) # I scaled those two

浏览 1提问于2016-06-28得票数 42

回答已采纳

1回答

Spark MLlib packages NaN权重

、、、

我正在尝试用一个测试机器学习数据集在pyspark中运行Spark MLlib包。我将数据集分为一半的训练数据集和一半的测试数据集。下面是我构建模型的代码。但是，它显示了NaN，NaN的权重。所有因变量。找不到原因。但是，当我尝试使用StandardScaler函数标准化数据时，它会起作用。 model = LinearRegressionWithSGD.train(train_data, step = 0.01) # evaluate model on test data set valuesAndPreds = test_data.map(lambda p: (p.label, mod

浏览 0提问于2015-04-17得票数 3

1回答

如何将StandardScaler()转换转换回dataframe？

、、、、

我正在使用一个模型，在分割成训练和测试之后，我想应用StandardScaler()。但是，这个转换将我的数据转换为一个数组，我希望保留以前的格式。我该怎么做？基本上，我有： from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split X = df[features] y = df[["target"]] X_train, X_test, y_train, y_test = train_test_split( X, y,

浏览 1提问于2020-10-01得票数 1

回答已采纳

7回答

当缩放数据时，为什么训练数据集使用“fit”和“transform”，而测试数据集只使用“transform”？

、

当缩放数据时，为什么训练数据集使用“fit”和“transform”，而测试数据集只使用“transform”？ SAMPLE_COUNT = 5000 TEST_COUNT = 20000 seed(0) sample = list() test_sample = list() for index, line in enumerate(open('covtype.data','rb')): if index < SAMPLE_COUNT: sample.append(line) else: r = ran

浏览 152提问于2017-04-28得票数 33

回答已采纳