丢弃NaN但不保留_xlsread [num]丢弃NaN_将NaN替换为值，但不保留结果 - 腾讯云开发者社区

python、pandas、dataframe

我有一台1600x115,316的DataFrame，大部分是NaN。我想删除其中不超过两个值的每一列。我已经写了一些可以工作的代码，但活着的人需要很长时间。 for eachColumn in df.columns: if np.sum(df[eachColumn]) <= 2: df.drop(eachColumn, axis=1, inplace=True) 有没有更好的方法来完成我想要做的事情？

浏览 4提问于2015-02-15得票数 1

1回答

熊猫.dropna行为

python、pandas

我有一个数组，用来描述熊猫Panel中的一些数据。我想删除NaNs (它们是沿长轴的行)，并保持数据完整，但是调用.dropna(axis=1, how='any')似乎会从有10个好行的项中丢弃一行，而调用.dropna(axis=1, how='all')将在有9个好行的项上留下一行NaNs。如何在不丢失数据的情况下处理NaN？

浏览 0提问于2014-05-07得票数 0

回答已采纳

1回答

在保留NaN的同时用数值替换字符串

python、pandas

我需要在多个列中替换字符串值：替换每列所需的值，以保留现有的NaN 对我来说，我有一系列的步骤似乎应该有效，但没有；“内置”步骤不起作用。一些虚拟测试代码：做一个数据文件 df = pd.DataFrame([[np.nan, 2, np.nan, np.nan], [3, 4, np.nan, 1], [np.nan, np.nan, np.nan, 5], [np.nan, 3, np.nan, 'foo']], colu

浏览 1提问于2020-02-15得票数 0

回答已采纳

1回答

JSON在不同的细胞中不分裂

python、json、pandas

我有个问题。我有一个包含日志的json。每个logs都可以有一个change，但不必这样做。所以我想在一只熊猫上展示logs和changes。但不幸的是，这些变化并没有分裂在不同的细胞(如id和operation)。所以完整的changes是一个细胞。如何获得如下输出？ {'model': {'logs': [{'id': '001', 'changes': [{'id': '101

浏览 7提问于2022-03-28得票数 1

回答已采纳

1回答

检查哪些功能是学习计算机弃置物

python、python-3.x、scikit-learn

科学学习的的计算变压器说当axis=0时，只包含fit缺失值的列在转换时被丢弃。既然imputer返回一个numpy数组，我如何检查哪些特征在计算过程中被丢弃，或者相应地，哪些特征在计算后被保留？下面是一个简单的例子： import pandas as pd import numpy as np from sklearn.preprocessing import Imputer df = pd.DataFrame(np.random.randn(10, 5), columns=['a', 'b', 'c', 'd'

浏览 3提问于2016-07-09得票数 2

回答已采纳

1回答

如何防止Scikit-学习输入从删除NaN行？

python、numpy、scikit-learn、imputation

我的一个项目是使用scikit-learn来处理NaN值，但是，它似乎删除了完全由NaN组成的行，如下所示： tmp = [[math.nan, 3.0],[math.nan, 5.0],[math.nan, math.nan]] imp = SimpleImputer(missing_values=np.nan, strategy='mean') imp_tmp = imp.fit_transform(np.asarray(tmp, dtype=np.float_)) print(np.asarray(tmp, dtype=np.float_)) print(np.asa

浏览 1提问于2021-04-20得票数 0

回答已采纳

1回答

python的max函数如何处理np.nan？

python、numpy

最近，我无意中发现了这种非常不直观的行为： import numpy as np max([0, np.nan]) # 0 max([np.nan, 0.0]) # np.nan 我假设max函数将两个条目视为最大值，并且--根据文档--返回第一个条目。我不得不承认，我不知道Python函数max一般不知道如何处理numpy类型。当然，np.max返回预期的结果(np.nan)。我正在使用Python 3。有人知道这里发生了什么事吗？

浏览 16提问于2022-06-29得票数 1

回答已采纳

2回答

Array.prototype.filter(数字)中的“数字”是如何工作的？

javascript、arrays

我发现了一种使用Array.prototype.filter方法从字符串中删除所有非数字的很酷的方法，但不完全确定它是如何使用Number原型来实现这一点的： var arr = '75number9'; arr.split(/[^\d]/).filter(Number); // returns [75, 9] 当我检查typeof Number时，我会得到'function'。这里发生什么事情？更让我困惑的是，如果我用Number替换String，结果是相同的。还能用！ arr.split(/[^\d]/).filter(String); // retur

浏览 2提问于2014-04-04得票数 10

回答已采纳

2回答

如何使用Pandas在csv中查找丢失的行？

python、pandas、numpy

我的CSV文件如下所示 location StartDate EndDate Austin 10/24/20. 10/31/20 Austin 11/28/20. 12/05/20 Austin 12/26/20. 01/02/21 Austin 10/10/20 10/17/20 Austin 10/03/20. 10/10/20 Kansas 10/24/20. 10/31/20 Kansas 11/28/20. 12/05/20 Kansas 12/26/20. 01/02/21 Kansas 10/03/20. 10/10/20 Tampa 10/24/20.

浏览 11提问于2020-09-30得票数 2

2回答

Pandas中的float()的文本无效

python、python-2.7、pandas

我正在处理一个超过6000万行的Pandas数据集。在我的一个数字列中，我怀疑有一个非数字字符，它给出了错误消息"invalid literal for float()：4010146209+“。我可以将列作为obj加载，但不能作为float或int加载。我已尝试将r"\d“和"+”替换为"“。我需要删除已定义列中包含非数字字符的行，或者删除所有字符，以防止将列加载为float或int。该列包含NaN，但在我尝试将其转换为float之前，它们已被删除。

浏览 2提问于2016-06-11得票数 3

1回答

在Pandas Dataframe中将HTML字符转换为字符串

python、html、pandas、google-cloud-translate

我想在dataframe中将html字符替换为string。我尝试了下面的代码，但不能更改为stirng。 import html html.unescape(data) 这是我的数据帧，我该怎么做呢？供您参考，此结果来自Google Cloud的翻译API。 ID A1 A2 A3 1我不知道它是不是不满足实际上我很难理解...我不知道它是不是不符合我的经验。2 NaN 3我认为这是一个正确的网页设计，至少...NaN这一件售价400元或4£。

浏览 25提问于2020-02-06得票数 1

回答已采纳

1回答

R与Excel:筛选后结果不一致

r、excel、filtering

这是我的第一篇文章，如果它不符合标准，或者有什么难以遵循的地方，请告诉我。谢谢！给定差异基因表达结果的data.table (或data.frame) (来自CuffDiff)，我想通过Q值截止值<= 0.05和>= 2的折叠变化或折叠变化<= 0.5来过滤这些结果，产生两个表(一个上调，一个下调基因)。我使用data.table sample1_sample2 ()函数通过拆分比较对这些结果进行了拆分，这个函数似乎做得很好，但为了简单起见，假设我们只讨论一个向上列表和一个向下列表：问题是，当我使用data选项卡中的filter工具对Excel中未过滤的数据应用相同的过

浏览 32提问于2020-10-12得票数 0

1回答

直方图特征的计算误差

matlab、image-processing、histogram

我只得到251块的峰度值，因为我把图像分割成块，我不知道出了什么问题，实际上它应该显示在252块上，请提前检查代码，谢谢。 clear all; close all; x = imread('image009.png'); rgb = imresize(x,0.5); green = rgb(:,:,2); [m,n]=size(green); imnum=input('enter image number'); g=1; q=1; scaler=36; scalec=37.5; bno=1; g=1; for i=1:scaler:(m-scaler)

浏览 4提问于2014-11-20得票数 0

回答已采纳

2回答

在Python语言中等效于Matlab的fread() 'float64‘

python、matlab、numpy、fread

我有一个二进制文件，可以在MATLAB中打开，但不能在Python中打开。二进制文件被编码为“双精度浮点数”，因此由MATLAB用下面的代码行读取： fread(fopen(fileName), 'float64'); 在Python中，我真的不确定如何复制这行代码。我认为使用Numpy将是一个很好的起点，所以我尝试了以下几行，但没有得到我期望的输出。每行有6个数字，我只得到了第一个数字和一个‘NaN’。 from numpy import * f = open('filename', 'rb') a = fromfile(f, doubl

浏览 0提问于2013-07-17得票数 2

回答已采纳

4回答

熊猫:用南所有的栏

python、pandas、dataframe、in-place

我意识到从数据文件中删除NaN和df.dropna一样容易，但出于某些原因，这并不适用于我，我也不知道为什么。这是我的原始数据： fish_frame1: 0 1 2 3 4 5 6 7 0 #0915-8 NaN NaN NaN NaN NaN NaN NaN 1 NaN NaN NaN LIVE WGT NaN AMOUNT NaN TOTAL 2

浏览 7提问于2017-07-17得票数 106

回答已采纳

2回答

在Python中，如何选择满足NaN数量条件的数据框中的列？

python、apply、nan

我希望有人能帮助我。我是Python的新手，我有一个包含111列和超过40000行的数据帧。所有列都包含NaN值(有些列比其他列包含更多的NaN )，所以我想删除那些至少有80%的NaN值的列。我该怎么做呢？为了解决我的问题，我尝试了以下代码 df1=df.apply(lambda x : x.isnull().sum()/len(x) < 0.8, axis=0) 函数x.isnull().sum()/len(x)是将列x中的NaN的数量除以x的长度，< 0.8的部分是选择那些包含少于80%的NaN的列。问题是，当我运行这段代码时，我只得到列的名称和布尔值"True“

浏览 3提问于2016-08-23得票数 0

回答已采纳

3回答

用Nan值计数最频繁的组

python、pandas、dataframe、scipy、pandas-groupby

基本上，我想数的最频繁的项目分组为2个变量。我使用以下代码： dfgrouped = data[COLUMNS.copy()].groupby(['Var1','Var2']).agg(lambda x: stats.mode(x)[1]) 此代码工作，但不工作的列有南值，因为Nan值是浮动的，而其他是str。因此，显示了此错误： '<' not supported between instances of 'float' and 'str' 我想省略NaN值和其余的计数模式。因此str(x)不是一个解决方案

浏览 0提问于2018-07-02得票数 2

回答已采纳

1回答

使用SimpleImputer后丢失一列

python、scikit-learn

我在一些数据文件上使用了SimpleImputer。没有。计算的数据中的列的值小于原始数据。 cat_cols是DataFrame X_valid分类列的列表，有43个元素。即原始DataFrame： X_valid[cat_cols] 有146行×43列推测的DataFrame： cat_imputer=SimpleImputer(strategy='most_frequent') pd.DataFrame(cat_imputer.fit_transform(X_valid[cat_cols])) 有146行×42列。

浏览 8提问于2021-12-24得票数 -1

2回答

combine_first似乎对数据帧没有任何影响

python、pandas、pandas-groupby

我有一个有多行的表，应该根据第一列中的数字进行分组。在其他列中，有我需要合并到单行的数据。我试过combine_first函数，但不明白为什么它不工作。我正在试着做这个： df6=pd.DataFrame({'JobNumber':[647,817,915], 'Column6':['KT35','KT35','KT35'],'Column7':[1, 4, 1], 'Column8':[1.5, 1.7 ,1], 'Column9

浏览 5提问于2020-06-25得票数 1

1回答

Dropna在df中只有一个NaN值

pandas

我在迭代中搜索和选择数据框中的值，在选择中，我可能只有一行具有NAN值，并且我似乎无法摆脱if。使用dropna和id似乎没有起到作用。 df2=df1.dropna(subset=['x']) 我打印出了其他值，看起来nan除了这个大小写之外都被删除了。

浏览 0提问于2020-05-14得票数 0

1回答

删除重复项时合并数据格式

python、pandas、dataframe、merge

我无法使我的头在合并和加入。我有一个初始数据框架，如下所示： Car Units Month BMW 800 Jan Lexus 150 Jan Audi 210 Feb Mustang 90 Mar Bentley 110 Feb Jaguar 90 Jan 我将陆续获得更多的数据文件来附加到这个初始的df中。我只需要附加那些在“汽车”栏和“月份”栏中唯一的值。假设我有另一个数据文件要追加： Car Units Month BMW 130 Jan Tata 150 Jan Maruti 11

浏览 3提问于2022-04-02得票数 0

回答已采纳

2回答

缺省情况下，pd.read_csv将整数视为浮点数

python、csv、pandas、integer

我有一个标题，看起来像( csv =第一行)： name,a,a1,b,b1 arnold,300311,arnld01,300311,arnld01 sam,300713,sam01,300713,sam01 当我运行时： df = pd.read_csv('file.csv') 列a和b在末尾附加了一个.0，如下所示： df.head() name,a,a1,b,b1 arnold,300311.0,arnld01,300311.0,arnld01 sam,300713.0,sam01,300713.0,sam01 列a和b是整数或空白，那么为什么pd.read_csv(

浏览 17提问于2016-09-24得票数 21

1回答

pandas多索引数据帧条件列连接

python、pandas、dataframe

我有2个多索引数据帧 df2 = pd.DataFrame({'Country': [ 'US', 'IT', 'FR'], 'Unit': [ 'USD', 'EUR', 'EUR'], 'Location': [ 'Hawai', 'Torino', 'Paris'], '2000'

浏览 10提问于2019-02-23得票数 1

1回答

使用规范化在sklearn预处理中保留列名

python、pandas、numpy、scikit-learn、sklearn-pandas

我有一个熊猫数据框架，如下所示。 data = {'First Column Name': ['12.513362', '13.081390', '15.045193'], 'Second Column Name': ['24.597206', '25.526964', '29.153882'], '3rd Column Name': ['nan', 'nan', 'nan&#

浏览 0提问于2020-07-11得票数 0

1回答

在熊猫中读取数据时，将"NA“项解析为NaN值

python、pandas、dataframe、nan

我对熊猫很陌生。我已经使用pandas.read_csv加载了csv。我试图不指定dtype，但它太慢了。因为它是一个非常大的文件，所以我也指定了数据类型。然而，有时在数字列中，它包含"NA“。我使用了na_values = 'NA'，它会影响我的数据帧吗？我还是想保留这些行。我的问题是，如果我指定数据类型并添加na_values = ' NA '，NA会被丢弃吗？如果是，我如何在不失去这些na的情况下保持类似的处理时间？非常感谢!

浏览 0提问于2017-08-30得票数 0

1回答

如何在第二级下删除多索引数据帧中的第一列排除部分列

python、pandas、multi-index

这是我的数据框架。我想删除级别1中的“YTD2017”列，红色不包括绿色，因为数字就是我需要的。我知道“drop”函数，并尝试将其放入我的程序中。然而，所有的"YTD2017“都下降了，包括绿色区域。那么，如何去掉红色区域而保留绿色区域呢？换句话说，有没有办法根据我传递的列名删除列，而不影响其他列？谢谢。 overall.drop('YTD2017',axis=1,level = 1 ,inplace = True) ?

浏览 10提问于2019-12-05得票数 1

回答已采纳

1回答

从数据框中提取值

python、pandas、dataframe

第一个和第二个数据帧如下： import pandas as pd d = {'0': [2154,799,1023,4724], '1': [27, 2981, 952,797],'2':[4905,569,4767,569]} df1 = pd.DataFrame(data=d) 和 d={'PART_NO': ['J661-03982','661-08913', '922-8972','661-00352','661-06291','&#

浏览 0提问于2018-08-15得票数 1

2回答

R gamma函数NaN警告

我正在尝试编写一个R程序来优化函数，但我总是得到伽马(k+1) NaNs产生的警告。我不知道为什么，因为k+1应该非常小，但不是零。代码如下： x<-rlnorm(100,0,1) y<-x/(1+x) bernsum<-array(1:100) cvise1<-array(1:100) cvise2=0 cvise<-0 bernsum_temp1=0 bernsum_temp2=0 cvise1_temp1=0 cvise1_temp2=0 func_bernise<-function(bigm) { #Calculate the second p

浏览 1提问于2013-04-27得票数 1

1回答

不要在二维热图上显示零值

python、matplotlib

我想要绘制一张西利康晶片模具的2D地图。因此，只有中心部分有值，角有值0。我使用matplotlib的plt.imshow获得一个简单的地图，如下所示： data = np.array([[ 0. , 0. , 1. , 1. , 0. , 0. ], [ 0. , 1. , 1. , 1. , 1. , 0. ], [ 1. , 2. , 0.1, 2. , 2. , 1. ], [ 1. , 2. , 2. , 0.1, 2. , 1. ], [ 0. , 1. , 1. , 1. ,

浏览 14提问于2016-10-09得票数 8

回答已采纳

3回答

如何在不考虑NaN值的情况下计算Pandas DataFrame中特定列的mean()

python、pandas、dataframe

根据我的理解，axis=0是垂直向下跨行运行，axis =1是水平跨列运行，例如： In [55]: df1 Out[55]: x y z 0 1 3 8 1 2 4 NaN 2 3 5 7 3 4 6 NaN 4 5 7 6 5 NaN 1 9 6 NaN 9 5 因此，跨列均值(axis=0)df.mean给出了如下结果： x 3 y 5 z 7 但是如果我想按列删除缺少的值，如 y 0 3 1 4 2 5 3 6 4 7 5

浏览 1提问于2016-09-02得票数 2

1回答

如何使用熊猫分解()保留NaN值？

pandas、nan

我有一个有几个列的Pandas数据框架，其中一些列包含分类条目。我使用因式分解()将这些条目转换(或编码)为数值，如下所示： for column in df.select_dtypes(['category']): df[column] = df[column].factorize(na_sentinel=None)[0] 这些列有几个NaN条目，所以我让na_sentinel=None保留NaN条目。但是，NaN值没有被保留(它们被转换为数字条目)，这不是我想要的。我的熊猫版是1.3.5。我遗漏了什么吗？

浏览 3提问于2022-02-05得票数 0

1回答

熊猫DataFrame DatetimeIndex切片误差

python、python-3.x、pandas、dataframe、datetimeindex

我很好奇为什么我可以给一个切片赋值，但不能直接打印出来。以下代码显示了详细信息： import pandas as pd import numpy as np from datetime import datetime dt_start = datetime.strptime("20171010", "%Y%m%d") dt_end = datetime.strptime("20171020", "%Y%m%d") df = pd.DataFrame(np.nan, index=pd.date_range(start=dt_s

浏览 3提问于2017-10-11得票数 2

回答已采纳

1回答

更改Python中C()删除的变量

python、dataframe

我正在尝试将单列数据转换为分类数据，以运行回归。我一直在使用c()运算符。 import statsmodels.formula.api as smf results2 = smf.ols('risk ~ age + sex + EQIP + CRP + C(educ) + C(sales)', data = data1_clean).fit() print(results2.summary()) 它会自动删除其中一个类别，但我想删除另一个类别。结果如下所示。 coef std err t P>

浏览 8提问于2021-02-10得票数 0

2回答

Python将数据集反规范化为类似矩阵的视图

python、matrix、normalization、denormalization

我有一个规范化的(DB wise)数据集，其中我有3列(~5000行)，例如： user phrase tfw 517187571 able 1 517187571 abroad 0.4 1037767202 abuse 0.272727 517187571 accuse 0.8 803230586 acknowledge 0.4 ... 我需要将其转换为一个类似于视图的矩阵，其中行将是用户，列将是短语，并且在矩阵内部，在适当的行/列索引中将有tfw的值。有没有人知道如何在python中高效地做到这一点？所需的输出将是(对于上面的示例)： use

浏览 1提问于2014-12-15得票数 3

1回答

MATLAB的NaN替换

matlab、correlation

当我使用执行两个矩阵之间的相关时，我得到了NaNs，但我想忽略它们，我在一些MATLAB论坛上读到，用nanmean获得的方法替换NaNs是一个很好的替代方法。所以我执行了下面的代码，但我的结果中仍然有NaNs。为什么会发生这种情况？ cor1nan=nanmean(correlations1); mod1cor=isnan(correlations1); for z=1:264 for a=1:264 if(mod1cor(a,z)==1) correlations1(a,z)=cor1nan(z); end end end 我只是注意到cor1nan中的一些值本身就是

浏览 12提问于2012-04-16得票数 2

回答已采纳

2回答

复制pandas数据帧中的列

python、python-3.x、python-2.7、pandas、dataframe

我想对Python Dataframe中的列进行切片和复制。我的数据框如下所示： 1928 1928.1 1929 1929.1 1930 1930.1 0 0 0 0 0 0 0 1 1 3 3 2 2 2 2 4 1 3 0 1 2 我想把它做成表格 1928 1928.1 1929 1929.1 1930 1930.1 0 0 0 1 1

浏览 47提问于2018-05-26得票数 1

回答已采纳

1回答

熊猫:如何只保留独特的行？

python、pandas

我有一个这样的数据格式df： x 1 paris 2 paris 3 lyon 4 lyon 5 toulouse 我只想保留不重复的行，例如上面我只想保留‘图卢兹’行。我试过删除重复的熊猫功能，但不起作用： df.drop_duplicates(subset=['x'], inplace=True) 预期产出： x 5 toulouse 我该怎么做？

浏览 1提问于2021-01-06得票数 0

回答已采纳

2回答

在MATLAB中裁剪点周围的圆形感兴趣区域

matlab、image-processing

我有一张图像，我想要裁剪一个点周围的圆形感兴趣区域。我在MATLAB中做了以下工作： vessel=imread('vessel.jpg'); imshow( vessel) t = 0:pi/20:2*pi; xc=230; % point around which I want to extract/crop image yc=79; r=20; %Radium of circular region of interest xcc = r*cos(t)+xc; ycc = r*sin(t)+yc; roimaskcc

浏览 1提问于2013-04-15得票数 3

回答已采纳

1回答

Keras模型预测NaN

python、tensorflow、keras

我正试图为我的二进制分类问题训练一个模型。我的数据有91列和5万行。其中一列是我的二进制目标变量，其他所有列都是数字的。以下是我如何努力训练； model = Sequential() model.add(Dense(20, input_dim=90, kernel_initializer='normal', activation='relu')) model.add(Dense(20, kernel_initializer='normal', activation='relu')) model.add(Dense(20, ke

浏览 0提问于2021-02-06得票数 3

回答已采纳

4回答

Matlab:将相同大小的数组与不同位置的NaN合并

arrays、matlab

我有这样的数组： [1 NaN NaN] [NaN 2 NaN] [NaN NaN 3] 如何将它们合并到 [1 2 3]

浏览 42提问于2016-08-03得票数 0

回答已采纳

2回答

计数范围内发生的事件

python、pandas、numpy、matplotlib

我有一个数据集： ID Amt TYPE 1 1000 A 2 200 NA 3 1100 S 我需要计算每种类型在特定范围内发生的次数： Range A_Count NA_Count S_Count 0-1000 1 1 0 1001-2000 0 0 1 我是类推得到这个，这样我就可以用这个数据绘制一个图，范围为x轴，计数为y轴。我怎样才能做到这一点？

浏览 8提问于2021-07-19得票数 2

回答已采纳

1回答

协方差矩阵中的nan

matlab、nan、covariance

我有下面的协方差矩阵 a b c d a 0.0161 0.0009 0.0008 0.0000001 b 0.0009 0.0163 NaN 0.0006 c 0.0008 NaN 0.0209 NaN d 0 0.0006 NaN 0.0077 我想过滤这个矩阵，这样就只剩下那些非NaN的列和行了，有没有一种方法可以做到这一点，而不是嵌套循环？所以这应该变成 a b d a 0.0161 0.0009 0.0

浏览 0提问于2017-07-20得票数 1

1回答

将熊猫数据中的最后2个数值逐行替换为NAN的

python-3.x、pandas、numpy、dataframe

我的每一行数据中的最后两个实数都是用误差测量的。我想用np.NAN替换它们。实数的数目随行而异(也就是说，每行已经有不同数量的NAN)。列标题表示测量号，索引是一个在单元格中的实验trial.Values，等于测量读数。有些试验的测量读数比其他的要多；因此，有些行的测量读数比其他的多。下面的代码创建了一个类似于我的数据框架。 import pandas as pd import numpy as np data = np.array(([1,2,3,4,5,2,np.NaN], [2,2,3,2,3,np.NaN,np.NaN],[4,4,5,1,np.NaN,np.

浏览 0提问于2018-04-24得票数 2

回答已采纳

2回答

如何将多个dataframe列组合成一个给定每个列都有nan值的列

python、pandas、dataframe

我有一个名为“main_df”的数据文件，其中包含3列X、Y、Z。 X Y Z NaN NaN ZVal1 NaN NaN ZVal2 XVal1 NaN NaN NaN YVal1 NaN 每一列都带有特定类型的数据( X，Y，Z)，因此如果某一行的X列中有数据，则Y/Z列中将没有数据，因为它不是X类型的。如果将所有3列组合在一起，它们就会“互相滑动”，这样你就会得到所有的值。我如何将这3列组合成第4列，这样就可以忽略NaN值，并且只得到该行的3列中存在的任何单个值？预期产出： X

浏览 2提问于2021-06-16得票数 2

回答已采纳

1回答

Pandas比较()函数的结果总结

pandas、dataframe、compare

我试图比较两个数据格式，下面的图片显示了Pandas ()函数的结果。现在，我试图总结结果，并希望计数所有不匹配的值，即NaN =正确。我知道如何访问列，但不知道“子列”self / other。

浏览 4提问于2022-05-05得票数 0

2回答

用熊猫阅读结构混乱的csv文件

python、csv、pandas、import-from-csv

我在csv文件中阅读有困难。这个问题是由于文件的结构造成的。我想把它读到熊猫的dataframe对象中，但是有些行有更多的列。例如，我可能期望大多数数据以如下形式出现： Col1,Col2,Col3 a,b,c, a,b,c, a,a,b,c, a,b,c,c, a,b,c 我是否可以逐行读取csv文件，以便创建两个数据帧，一个具有预期的列数，另一个具有需要进一步检查的行数？

浏览 4提问于2014-12-30得票数 0

回答已采纳

1回答

从pandas dataframe中选择并忽略具有零值的列

pandas、boolean、slice

我使用datetimeindex从dataframe中选择行。选择时，我希望自动排除那些只有零值的列。我想出了一个做测试的列表理解。 test = [data[i].isin([1]).any(0) for i in data.columns] 现在如何在数据帧的切片上应用此测试？ data[test] 给我一个ValueError:项目长度错误。谢谢!

浏览 2提问于2015-05-19得票数 0

1回答

以Pandas/Python中最有效的方式根据条件复制最后一次看到的列的非空值

python、python-3.x、pandas、dataframe

我需要根据条件复制和粘贴列的前一个非空值。我需要用最有效的方法来做，因为行数是几百万。使用for loop将在计算上花费很大。因此，如果有人能在这方面帮助我，我们将不胜感激。 |Col_A |Col_B | |--------|--------| |10.2.6.1| NaN | | NaN | 51 | | NaN | NaN | |10.2.6.1| NaN | | NaN | 64 | | NaN | NaN | | NaN | NaN | |10.2.6.1| NaN | 根据该条件，每当Col

浏览 1提问于2021-03-08得票数 1

回答已采纳

1回答

用元组替换单元格

python、pandas

如何获得由index元素和当前元素本身组成的元组：使用以下代码： import numpy as np import pandas as pd df = pd.DataFrame([[None, 'y', None], [None, None, 'x'], ['z', None, None]], index=['a', 'b', 'c'], columns=['X', 'Y', 'Z&#

浏览 0提问于2019-09-20得票数 0

回答已采纳

2回答

不复制粘贴完整文件路径的git签出修改文件

git、git-checkout

git status显示的情况如下 git status # On branch icc-server-send-metric-values # Changes not staged for commit: # (use "git add <file>..." to update what will be committed) # (use "git checkout -- <file>..." to discard changes in working directory) # # modified: java/

浏览 4提问于2015-02-23得票数 3

回答已采纳