input contains nan, infinity or a value too large for dtype('float64')_input contains nan, infinity or a value too large for dtype('float64')._train input contains nan, infinity or a value too large for dtype('float32') - 腾讯云开发者社区

python

我尝试计算不同深度的决策树的测试和训练误差。 train_error = [] test_error = [] for i in range (3,21): X_train, X_test, y_train, y_test = train_test_split(womendata, womeny, test_size=0.4, random_state=1 ) decitiontree = tree.DecisionTreeClassifier(criterion='gini', splitter='best', max_depth=i,

浏览 0提问于2017-01-22得票数 0

2回答

从numpy数组float32到numpy数组float64的转换

python、numpy、scikit-learn、sklearn-pandas

我正在尝试用Python实现随机森林。在运行代码时，我得到了这个错误。尽管我已经使用以下命令从float32转换为float64： x_arr = np.array(train_df, dtype='float64') Traceback(most recent call last): File "C:\Python27\randomforest.py", line 67, in <module> forest=forest.fit(x_array[0::,1::],x_array[0::,0]) File "C:

浏览 0提问于2016-07-13得票数 2

18回答

sklearn错误ValueError:输入包含NaN、无穷大或对于dtype('float64')来说太大的值

python、python-2.7、scikit-learn、valueerror

我正在使用sklearn，但在亲和力传播方面遇到了问题。我已经构建了一个输入矩阵，并且一直收到以下错误。 ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). 我跑过了 np.isnan(mat.any()) #and gets False np.isfinite(mat.all()) #and gets True 我试着用 mat[np.isfinite(mat) == True] = 0 删除无限值，但这也不起作用。我该怎么做才能去掉矩阵中的无限值，以便可以使用

浏览 289提问于2015-07-10得票数 199

回答已采纳

1回答

如何在numpy数组中找到对于dtype('float64')来说是NaN/无穷大/太大的值？

python、pandas、numpy、nan、numpy-dtype

我正在尝试适应一个简单的机器学习模型，使用科学工具学习。在这一行上： clf.fit(features, labels) 我遇到了一个熟悉的错误： Input contains NaN, infinity or a value too large for dtype('float64'). 每当我遇到这种情况之前，当我的数据中有NaN值的时候。我已经证实数据中没有NaNs。.fit()方法(特性和标签)的两个输入是np数组，但它们是从熊猫数据中生成的。在提取我打印的NaN值之前： print(features_df[features_df.isnull().any(axis=

浏览 0提问于2019-03-16得票数 11

回答已采纳

3回答

Python - Input包含NaN、无穷大或对于dtype('float64')来说太大的值

python、pandas、machine-learning、scikit-learn、k-means

我对Python是个新手。我正在尝试使用sklearn.cluster。下面是我的代码： from sklearn.cluster import MiniBatchKMeans kmeans=MiniBatchKMeans(n_clusters=2) kmeans.fit(df) 但我得到以下错误： 50 and not np.isfinite(X).all()): 51 raise ValueError("Input contains NaN, infinity" ---> 52

浏览 1提问于2015-12-18得票数 5

2回答

StandardScaler -ValueError:输入包含NaN、无穷大或对dtype太大的值(“float64”)

python、nan

我有以下代码 X = df_X.as_matrix(header[1:col_num]) scaler = preprocessing.StandardScaler().fit(X) X_nor = scaler.transform(X) 并得到以下错误： File "/Users/edamame/Library/python_virenv/lib/python2.7/site-packages/sklearn/utils/validation.py", line 54, in _assert_all_finite " or a value too lar

浏览 2提问于2016-04-10得票数 3

回答已采纳

2回答

将简单的计算机与Pandas数据帧一起使用？

python、pandas、scikit-learn

我正在使用以下数据集： https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data 它说它有一些缺失值，用"?“标记。我想要应用SimpleImputer库，我的代码如下： file="breast_cancer" df=pd.read_csv(file,names=['id', 'clump_thickness','unif_cell_size',

浏览 19提问于2019-09-05得票数 2

回答已采纳

1回答

simpleimputer不能处理我的数据

scikit-learn、sklearn-pandas、imputation、data-wrangling

全, 我的数据中有np.nans和np.infs。我想将这些替换为0，但是当我执行下面的操作时，我得到以下错误： imputer = SimpleImputer(missing_values=np.nan, strategy='constant', fill_value=0) features_to_impute = data_fe.columns.tolist() data_fe[features_to_impute] = pd.DataFrame(imputer.fit_transform(data_fe[features_to_impute]),

浏览 16提问于2020-10-09得票数 0

1回答

SimpleImputer如何替换数据帧中的NaN值？

python-3.x、scikit-learn

我有一个形状为(10，3)的ndarray，其中包含一些缺失值(Nan)。我想用各自列的平均值替换缺少的值。为此，我使用了SimpleImpueter。我的代码如下： from sklearn.impute import SimpleImputer imputer = SimpleImputer(missing_values = 'nan',strategy='mean') 此代码不工作，并显示以下值错误： ValueError: Input contains NaN, infinity or a value too large for dtype('

浏览 25提问于2019-10-11得票数 1

回答已采纳

3回答

如何更改pandas中多列的数据类型

python、pandas、machine-learning、jupyter-notebook、random-forest

我正在尝试在熊猫数据帧上运行随机森林。我知道数据帧中没有空值或无穷大，但当我符合模型时，会不断获得ValueError。这大概是因为我使用的是flaot64列，而不是int列；我还有很多bool和float32类型的列。有没有办法把所有的浮点列都改成float32？我已经尝试过重写CSV，并且相对确定问题不在于此。我以前在float64s上运行随机森林从来没有遇到过问题，所以我不确定这一次出了什么问题。 labels = electric['electric_ratio'] electric = electric[[x for x in electric.columns i

浏览 46提问于2019-04-24得票数 2

1回答

我是Jupyter的新手，不知道我所做的事情有什么问题

python、jupyter-notebook、sklearn-pandas

我试图使用sklearn，但遇到了错误，但我不知道哪里出了问题。这是我的代码： import pandas as pdd from sklearn.tree import DecisionTreeClassifier df = pd.read_csv('vgsales.csv') X = df.drop(columns=['Name','Platform','Publisher','Genre'])#input y = df['Rank']#output model = DecisionTreeCl

浏览 1提问于2020-12-21得票数 0

1回答

在Pandas中追加对象

python、pandas

我刚刚开始使用熊猫，当我在一个熊猫系列中添加多个物体时，我遇到了一个问题。我知道您可以先创建一个大对象，然后调用pd.Series(large object)，但是，我只想知道是否可以将多个对象附加到一起。(我们是否使用DataFrame进行此操作？) def foo(): Points = pd.Series({}) for i in range(len(df)): givenVal = {} givenVal[str(df.index[i])] = int(3*df.iloc[i]['somedata']) P

浏览 1提问于2019-04-04得票数 0

6回答

Python熊猫:如何删除nan和-inf值

python、python-3.x、pandas、numpy、dataframe

我有以下数据 time X Y X_t0 X_tp0 X_t1 X_tp1 X_t2 X_tp2 0 0.002876 0 10 0 NaN NaN NaN NaN NaN 1 0.002986 0 10 0 NaN 0 NaN NaN NaN 2 0.037367 1 10 1 1.000000 0 NaN

浏览 4提问于2017-08-17得票数 55

回答已采纳

1回答

使用Pandas dataframe尝试删除包含nan或inf的行时发出

python、python-3.x、pandas、dataframe

我从scikit那里得到了这个错误--学习： ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). 这是检查的结果。基于这个，我可以使用df.replace([np.inf, -np.inf], np.nan).dropna(axis=1)，因为我想检测任何nan或inf值，然后删除包含其中任何一个的行。但是，我使用Python3.6，因此错误说： AttributeError: 'NoneType' object has no attribute

浏览 0提问于2018-05-11得票数 1

回答已采纳

2回答

尝试运行随机林回归时出错

python、scikit-learn、random-forest

这是我试图运行的代码 model = RandomForestRegressor(n_estimators=100) model.fit(X_train, Y_train) r2 = model.score(X_test, Y_test) r2 这是我收到的错误。这似乎是由于我的数据集中存在无穷大或NaN，但是我不知道如何删除它们。 ValueError: Input contains NaN, infinity or a value too large for dtype('float32'). 如何修复此错误？

浏览 0提问于2021-04-05得票数 1

1回答

logistic.fit() erorr在LogisticRegression中

python、logistic-regression

我正在尝试使用logistic.fit()，我得到了下面的错误。如何修正错误？ Input contains NaN, infinity or a value too large for dtype('float64'). 下面是我代码的一部分：(地板和姓氏是字符串) xtr = pd.get_dummies([['Age','Fee', 'Size','Floor', 'Class', 'Surname' ]]) import pandas as pd fr

浏览 4提问于2016-12-27得票数 0

回答已采纳

11回答

ValueError:输入包含NaN、无穷大或对dtype太大的值(‘float32’)

python、scikit-learn、pandas、random-forest、python-3.x

在使用ValueError模型预测测试数据时，我得到了RandomForest。我的代码： clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2) clf.fit(X_fit, y_fit) df_test.fillna(df_test.mean()) X_test = df_test.values y_pred = clf.predict(X_test) 错误： ValueError: Input contains NaN, infinity or a value too larg

浏览 0提问于2016-05-26得票数 94

回答已采纳

2回答

在要素中使用NaN值拟合模型

python、machine-learning、scikit-learn

我会知道是否有一种方法来拟合模型，即使一些特征包含一些NaN值。 X Feature1 Feature2 Feature3 Feature4 Feature5 0 0.1 NaN 0.3 NaN 4.0 1 4.0 6.0 6.6 99.0 2.0 2 11.0 15.0 2.2 3.3 NaN 3 1.0 6.0 2.0

浏览 0提问于2021-07-22得票数 0

3回答

在DataFrame中查找第一次出现的索引

python、pandas、dataframe

我有一个数据帧，看起来像这样： 0 1 2 3 4 5 6 0 a(A) b c c d a a 1 b h w k d c(A) k 2 g e(A) s g h s f 3 f d s h(A) c w n 4 e g s b c e w 我想要获取在每一列中包含(A)的单元格的索引。

浏览 62提问于2019-07-17得票数 2

回答已采纳

1回答

AttributeError: numpy.ndarray对象没有属性“nan_to_num”

python、scikit-learn、pandas、random-forest、numpy

我试图从雪橇运行一个随机森林模型，但是我一直收到一个错误：ValueError: Input contains NaN, infinity or a value too large for dtype('float32'). 我尝试在ValueError:输入包含NaN、无穷大或对dtype太大的值(‘输入包含’)中执行以下步骤 fillna(0)对我的熊猫数据仍然给予了ValueError。因此，我尝试使用我的numpy数组： val = setTo.ravel().nan_to_num(0) 但我一直有个错误：'numpy.ndarray' object

浏览 0提问于2021-01-06得票数 2

回答已采纳

2回答

如何解决dtype(‘float32’)值过大的问题？

python、numpy、scikit-learn

我读过许多类似的问题，但仍然无法理解。 clf = DecisionTreeClassifier() clf.fit(X_train, y_train) X_to_predict = array([[ 1.37097033e+002, 0.00000000e+000, -1.82710826e+296, 1.22703799e+002, 1.37097033e+002, -2.56391552e+001, 1.11457878e+002, 1.37097033e+002, -2.56391552e+001, 9.

浏览 0提问于2019-07-04得票数 4

回答已采纳

2回答

Gridsearch ValueError:输入包含无穷大的值，对于dtype('float64')来说太大了。-使用管道

machine-learning、scikit-learn、logistic-regression、data-science-model、grid-search

更新:我有非NAN值，所以填充不成问题。干净数据集。当我试图使用我的网格最佳参数进行预测时，就会出现这个错误。当我把它与训练数据相吻合时，我会得到一个分数。然而，当我试图在X_test上进行预测时，我会得到这个错误。很困惑。我试图对数据集使用管道和网格搜索相结合的方法。代码工作到训练部分和分数。它是一个干净的数据集，没有NAN值。我的代码是 classifiers = [AdaBoostClassifier(), XGBClassifier(), LogisticRegression(), D

浏览 0提问于2022-01-27得票数 0

1回答

ValueError:输入包含NaN、无穷大或对于dtype('float64')来说太大的值。对于我的knn模型

python、pandas、scikit-learn

df1_fit=pd.DataFrame(scaled_features,columns=df1.columns[:-1]) df1_fit.head() from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test=train_test_split(scaled_features,df1['Sales'],test_size=0.30) from sklearn.neighbors import KNeighborsClassifier knn=KNeig

浏览 11提问于2019-12-18得票数 0

1回答

在我的数据集中出错

python、pandas

目前，我的代码中出现了这个错误。 'ValueError: Input contains NaN, infinity or a value too large for dtype('float64')' 当我想运行这段代码时 import pandas as pd train=pd.read_csv('C:\Users\ABDILLAH\Desktop\datasets\Rails\RailsDataset.csv') features_col=['Num_comments', 'Num_Commits',&#

浏览 0提问于2018-02-24得票数 0

回答已采纳

2回答

.mean()方法从.pct_change()返回nan值

python、pandas、mean、series、yfinance

我目前正在试图得到一个熊猫系列的平均值，表示另一个熊猫系列的百分比变化，也就是原始系列的百分比变化；然而，当我试图通过使用acc.mean()获得平均值时，它返回了nan。pct_returns.mean()的情况并非如此，它返回平均值。另外，这两个系列图都是正确的(，)，所以我不知道为什么不能正确地取平均值。下面是一些示例代码作为示例： import yfinance as yf, pandas as pd, numpy as np from matplotlib import pyplot as plt tick = yf.Ticker('AAPL') data = t

浏览 4提问于2022-05-10得票数 1

1回答

获取错误时如何删除NaN : ValueError: Input包含NaN

python、nan

我正在尝试使用MinMaxScaler()将我的数据缩放到0-1之间，使用： x_scaling = x_scale.transform(x) print("Min:", np.min(x_scaling)) print("Max:", np.max(x_scaling)) 我的trackback错误消息是： --------------------------------------------------------------------------- ValueError

浏览 272提问于2018-07-28得票数 0

1回答

执行kmeans聚类时的Sklearn inifinity值

python、scikit-learn

我正在尝试通过以下方式聚集超过200k个点： km = KMeans(n_clusters=5) km.fit_transform(ends) 但我得到以下错误: km.fit_transform(ends) 所以矩阵的维数是200kX2 File "/Users/fleh/anaconda/lib/python2.7/site-packages/sklearn/cluster/k_means_.py", line 814, in fit_transform X = self._check_fit_data(X) ... ValueError: Input co

浏览 0提问于2015-09-28得票数 2

3回答

ValueError在钛管道中的应用

python、pipeline、valueerror

我正在研究我的第一条管道，但我无法让它在泰坦尼克号数据集上工作。有人能解释一下我做错了什么吗?我怎样才能解决这个问题？我从dataframe中删除了一些特性，并使用get假人来转换分类特性。 titanic_dummies = titanic.copy() titanic_dummies = titanic_dummies.drop([ 'Name', 'Ticket','Cabin', "Fare"], axis=1) titanic_dummies = pd.get_dummies(titanic_dummies, drop

浏览 0提问于2020-07-05得票数 2

2回答

为什么NaN被认为是浮点数？

python、pandas、numpy

在pandas中，当我们尝试将包含NaN值的系列转换为整数时，可以使用如下所示的片段 df.A = df.A.apply(int)，我经常看到一条错误消息 ValueError: cannot convert float NaN to integer 我知道NaN值不能转换为整数。但我很好奇在这种情况下抛出的ValueError。它说float NaN不能转换为整数。 NaN值被视为浮点对象有什么具体原因吗？或者这是错误消息显示的问题吗？

浏览 2提问于2018-02-01得票数 16

回答已采纳

3回答

如何处理熊猫数据中很小的(-322个)浮动值？

python、python-3.x、pandas、numpy

我有一只熊猫数据，它的特征值非常小-322。我试图标准化这些特性，但是 ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). 来自dataframe的几个值如下： 3.962406e-321 3.310240e-322 3.962406e-321 3.310240e-322 3.962406e-321 3.310240e-322 3.962406e-321 3.310240e-322 3.962406e-321 3.310240e-322 我假设我正在处理价

浏览 0提问于2019-08-07得票数 3

1回答

岭和套索回归- ValueError:输入包含NaN、无穷大或对于dtype来说太大的值(‘float64’)

python-3.x、pandas、lasso-regression、gridsearchcv

需要有关错误消息的帮助 params = {'alpha': [0.0001, 0.001, 0.01, 0.05, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0, 20, 50, 100, 500, 1000 ]} ridge = Ridge() # cross validation folds = 5 model_cv = GridSearchCV(estimator =

浏览 0提问于2020-07-11得票数 1

2回答

Ngboost算法可以自动处理缺失值吗？

python、algorithm、gradient、boosting

我得到了一个由stanfordmlgroup发明的新的GBDT算法，名为Ngboost。我想使用它并调用encode pip install ngboost==0.2.0 来安装它。然后我训练一个不会计算或删除缺失值的数据集。然而，我得到了一个错误： Input contains NaN, infinity or a value too large for dtype('float32'). 这是不是意味着Ngboost不能像xgboost那样自动处理缺失值？

浏览 10提问于2020-07-09得票数 0

1回答

python、machine-learning、scikit-learn、naivebayes

这是我的代码： #Naive Bayes from sklearn.naive_bayes import GaussianNB clf = GaussianNB() clf.fit(X_train, y_train) prediction = clf.predict(X_test) scores = cross_val_score(clf, X, y, cv=5) print(accuracy_score(prediction, y_test)) 这是我的错误： ValueError Traceback ( most recent call last ) <ipython-input-4

浏览 37提问于2021-05-12得票数 0

1回答

用Pandas中的容忍值计算值的变化

python、pandas

我有一个pd.Series对象，它的pd.DatetimeIndex包含日期。我想计算一下与过去值的差额，例如一个月前的数值。这些值与月份不完全对齐，所以我不能简单地添加一个月日期偏移。也可能缺少数据。所以我想用一个偏移量和一个公差来匹配以前的值。一种方法是将.reindex()方法与method='nearest'一起使用，它与前面的数据点相匹配，就像我想要的那样： shifted = data.copy() shifted.index = shifted.index + pd.DateOffset(months=1) shifted = shifted.reindex(

浏览 1提问于2022-08-10得票数 0

2回答

python、machine-learning、smote

在培训之前，我尝试过采样我的数据集，但是我得到了这个错误"ValueError: Input包含NaN，无穷大或值过大，以至于dtype('float64'“)，即使没有NAN值。这是给出错误的代码 sm = SMOTE(random_state=42) X_res, y_res = sm.fit_resample(X, y) y_res = pd.DataFrame(y_res) print(y_res[0].value_counts()) 这就是我所犯的错误 ValueError Traceback (

浏览 10提问于2022-03-13得票数 0

1回答

浮点和无类型之间的标准化

python、function、pine-script、tradingview-api、ta-lib

我已经将代码从Pine脚本转换为Python，但我面临一些问题。我不擅长Python。 import pandas as pd import pandas_ta as ta close = pd.read_csv('close-MATIC.csv') def Z_4(src, length, smooth): mean = ta.sma(src, length) vlo = src - mean std = ta.stdev(vlo, length) value = (src - mean) / std Wema = ta.ema(t

浏览 7提问于2022-11-05得票数 0

回答已采纳

1回答

连接后保持数据格式数值

pandas、numpy、dataframe、concatenation

在连接一个数字数据和一个空数据后，是否有一种方法来保持结果数据数据的数值？ df1 = pd.DataFrame(data=[[1,2],[3,4]], columns=['a','b'], index=[0,1]) df1.dtypes Out[25]: a int64 b int64 dtype: object df2 = pd.DataFrame(columns=['c','d']) df2.dtypes Out[27]: c object d object dtype: object df

浏览 0提问于2017-10-26得票数 1

回答已采纳

2回答

在熊猫中，如何将群体聚合的结果分配给原始df中的下一组？

python、pandas

使用熊猫，我喜欢使用groupby和一个聚合函数，例如，均值，然后将结果返回到原始数据，但是在next组中，而不是在组本身中。如何用矢量化的方式实现这一点？我有这样一只熊猫： data = {'Group': ['A','A','B','B','B','B', 'C','C', 'D','D'], 'Value': [1.1,1.3,9.1,9.2,9.5,9.4,6.2,6.4,2.2

浏览 3提问于2020-06-27得票数 5

2回答

python、pandas、dataframe

我有脚本来填充从文件(df4)到现有的数据have (df3)的值。但是dataframe df3包含已经填充了值的列，这些现有值被设置为"NaN“，脚本如下： df5 = df4.pivot_table(index='source', columns='plasmidgene', values='identity').reindex(index=df3.index, columns=df3.columns) 如何避免我现有的值被覆盖？谢谢例如，我有df1 a b c d e f 1 1 30 Nan

浏览 3提问于2017-04-06得票数 1

回答已采纳