从pandas中选择的数据中删除NaNs_从多个Pandas系列中删除NaNs_从pandas数据帧的所有列的列表中删除nans (pythonic方式) - 腾讯云开发者社区

python、dictionary、nan

我有一个字典，里面填满了我导入的两个文件中的数据，但其中一些数据是nan。如何使用nan删除数据片段？我的代码是： import matplotlib.pyplot as plt from pandas.lib import Timestamp import numpy as np from datetime import datetime import pandas as pd import collections orangebook = pd.read_csv('C:\Users\WEGWEIS_JAKE\Desktop\Work Programs\Code File

浏览 1提问于2014-06-06得票数 9

1回答

对Pandas数据透视表应用筛选器将数据清空

python、pandas、scipy

使用以下csv数据：我已经将数据从csv加载到Pandas Pivot Table中，输出如下： [[nan nan nan ... nan nan 0.] [nan 21 nan ... nan 0. nan] [nan nan nan ... 0. nan nan] ... [23. nan 13. ... nan nan nan] [nan nan nan ... nan nan nan] [nan 14 nan ... nan nan nan]] 但在对结果使用Scipy高斯滤波器后，数据随后被消隐，如下所示： [[nan nan nan ... nan nan

浏览 13提问于2021-03-02得票数 0

1回答

对pandas dataframe json列进行切片时，类型为“”float“”的对象没有len()错误

python、json、pandas、list、dataframe

我的数据看起来像这样。在每一列中，有不同长度的值/键。有些行也是NaN的。 like match 0 [{'timestamp', 'type'}] [{'timestamp', 'type'}] 1 [{'timestamp', 'comment', 'type'}] [{'timestamp', 'type'}] 2 NaN

浏览 2提问于2020-12-15得票数 1

1回答

NaN值未替换到dask数据帧中

python、pandas、dataframe、dask、nan

我正在尝试使用以下代码将dask数据帧转换为pandas数据帧： import dask.dataframe as dd uri = "mysql+pymysql://myUser:myPassword@myHost:myPort/myDatabase" dataframe = dd.read_sql_table("myTable", uri, "id", columns=["id", "name", "type_id"]) df = dataframe.fillna(0) print(len(d

浏览 33提问于2021-10-06得票数 0

2回答

Pandas删除所有0，直到每个多索引级别中的第一个非零值

python、pandas、pandas-groupby、multi-index

我正在处理一个pandas MultiIndex数据集，其中有许多不同的数据组(项目1、项目2等)。有0。我只想删除0的行，其中0位于项目组的开头。如果0跟在一个非零数后面，我不想删除它。如何删除每个组(索引外部)中直到第一个非零值的所有零？原始数据 Quantity Item1 2016-05-08 0.0 2016-05-15 0.0 2016-05-22 0.0 2016-05-29 456

浏览 26提问于2019-09-10得票数 2

回答已采纳

2回答

如何处理将不同文件中的列合并到一个文件中的NaN

python、pandas

我对python很陌生，并且使用python 3.9.6。我有一个以Cam_Cantera_IDT_output_800K_开头的每个文件的代码，它接受每个文件的第一列t和列X_ch2，并使用pd.merge将它们合并在一起。代码可以做我想做的事情，但是在我的输出中，我会弹出许多NaN。当我打开csv文件时，我有许多空单元格。我需要所有的数据，以便稍后进行一些计算。我是否需要考虑诸如合并而不是合并之类的选项？任何帮助都将是非常感谢的，因为我真的不知道如何解决这个问题。谢谢。 import glob import pandas as pd import os file_extension =

浏览 7提问于2021-12-02得票数 0

回答已采纳

1回答

Python将Pandas浮点数转换为字符串

python、unicode、pandas、ipython

Hi有一个数据框架(df)，其中包含两个列(日期、文本)，从Excel电子表格中读取到Python/Pandas。 xl = pd.ExcelFile(dir+"file.xlsx") df = xl.parse(xl.sheet_names[0]) date text 0 2013-08-06 NaN 1 2013-08-06 Text with unicode 2 ... 文本包含不需要的unicode字符，我通常使用 df['text'] = df[&

浏览 3提问于2014-09-04得票数 0

回答已采纳

4回答

如何删除包含至少一个缺失元素的数据帧的列

python、pandas

我模拟一个数据框架如下： import pandas as pd import numpy as np # Create Missing Values in DataFrame df = pd.DataFrame(np.random.randn(5,5)) df[df > 0.9] = pd.np.nan df.columns = ['A', 'B','C','D','E'] df 我给了一个列名为A，B，C，D，E。我有这个python代码来删除至少包含一个丢失值的行，如下所示 df.loc[(~pd.i

浏览 0提问于2018-10-20得票数 2

回答已采纳

1回答

NaNs的问题: set_index().reset_index()会损坏数据

indexing、pandas、nan

我读到NaNs是有问题的，但下面这些会导致我的数据实际损坏，而不是错误。这是一个bug吗？我是否遗漏了文档中的一些基本内容？我希望第二个命令给出一个错误，或者给出与第一个命令相同的响应： ipdb> df year PRuid QC data 18 2007 nonQC 0 8.014261 19 2008 nonQC 0 7.859152 20 2010 nonQC 0 7.468260 21 1985 10 NaN 0.861403 22 1985 11 NaN 0.878531 23 1985

浏览 0提问于2013-05-13得票数 1

回答已采纳

2回答

如何确保从csv文件加载的dataframe中的列被格式化为整数(不含小数字符)

python、pandas、csv、dataframe

我使用的是Python 3.7 我需要从两个不同的源(都是csv)加载数据，并确定一个源中的哪些行不在第二个源中。我使用pandas数据帧加载数据，并在两个数据源之间进行比较。我从csv文件中加载了数据，在data-frame列中，类似2010392的值变成了2010392.0。我读过很多关于格式化数据帧列的文章；不幸的是，大多数都是关于日期和时间转换的。我在上偶然看到一篇文章《在Python pandas中格式化整数列数据框》，这篇文章并没有解决我的问题基于上面提到的文章，我尝试了以下几种方法： pd.to_numeric(data02['IDDLECT'], do

浏览 30提问于2019-07-09得票数 0

回答已采纳

1回答

如何使用Pandas按两列分组？

excel、python-3.x、pandas

我正在研究一种算法，它需要按两列分组。熊猫支持按两栏分组，方法是： df.groupby([col1, col2]) 但是产生的dataframe不是必需的dataframe 工作设置： Python : v3.5 Pandas : v0.18.1 Pandas Dataframe -输入数据： Type Segment id 1 Domestic 1 2 Salary 3 3 NRI

浏览 2提问于2016-12-13得票数 3

回答已采纳

1回答

以字符串形式读取包含数字值和缺失数据的pandas列

python、pandas

我的数据框中有一个Id列，如下所示： A= pandas.DataFrame(12673，44,847) 此数据有一些缺失值。如果I Keep_default_NA = True，则由NaN填充缺少的值，并将数据读取为浮点型，因此这些值将更改为 12673.0 , 44.0, 847.0 这并不是我们想要的(我想去掉nA值并将其转换为str/obj，因为id可以是任何长度)。如果I keep_default_NA = False，那么其他列(如布尔值)都变成对象，我必须比较字符串值以找出true/false值。

浏览 0提问于2018-08-24得票数 0

3回答

Python直方图ValueError:范围参数必须是有限的

python-3.x、pandas、matplotlib

当使用直方图绘制Pandas数据帧时，示例数据帧数据 distance 0 5.680195 2 0.000000 3 7.974658 4 2.461387 5 9.703089 我用来绘制的代码 import matplotlib.pyplot as plt plt.hist(df['distance'].values) plt.show() 我有这个错误 "ValueError: range parameter must be finite." 我的尝试 df['Round_Distance'

浏览 14提问于2018-08-02得票数 3

1回答

使用pandas丢弃超过25%的缺失数据

python、pandas

我有一个超过30K行的csv文件。其中一些行包含NA值，我想丢弃缺失值超过25%的行。我已经尝试使用pandas命令dropna()，但我只能使用命令"any“或"all”。我应该使用哪行代码来区分缺失值超过25%的行？谢谢

浏览 2提问于2020-06-28得票数 0

2回答

为什么pd.concat将结果数据类型从整型更改为浮点型？

python、pandas、dataframe、concat

我有三个数据帧: timestamp (带有时间戳)，dataSun (带有日出和日落的时间戳)，dataData (带有不同的气候数据)。数据帧timestamp的数据类型为"int64"。 timestamp.head() timestamp 0 1521681600000 1 1521681900000 2 1521682200000 3 1521682500000 4 1521682800000 Dataframe dataSun也有数据类型"int64"。 dataSun.head() sunrise

浏览 0提问于2018-04-20得票数 18

回答已采纳

1回答

从pandas数据帧返回X大小的块

python、pandas、dataframe

我有一个PANDAS数据帧，其中我想返回时间序列中每X个项目的函数--例如，我的数据帧可能如下所示 date value 2017-01-01 1 2017-01-02 5 2017-01-03 2 2017-01-04 1 2017-01-05 6 2017-01-06 6 因此，例如，如果我希望能够拉取X为3的每个X值的滚动平均值，我会希望数据帧显示 date value 2017-01-03 2.666 2017-01-04 2.666 2017-01-05 3 2017-01-06 4.333

浏览 2提问于2017-12-11得票数 0

1回答

如何在Mongo shell中用null替换NaN？

python、pandas、mongodb

我已经使用pandas将另外两个pandas数据帧组合在一起，生成了一个json文件。但是在将其上传到服务器并使用mongoimport将其导入到新数据库的新集合后，我发现所有应该显示为null的空白字符串字段现在都显示为NaN。如何将这些NaN从mongo shell转换为null？请注意，我必须从服务器执行此操作，并且没有在服务器上安装MongoDBCompass。我必须从控制台(PuTTy)执行所有操作。

浏览 26提问于2021-01-25得票数 0

回答已采纳

1回答

如何使用read_sql在pandas中指定na_values？

python、pandas

我正在尝试从sql表创建一个pandas数据帧。我使用data=pd.read_sql(query,con=con)读取数据，它工作得很好。但是，我希望设置数据框中哪种类型的元素是NaN。读取csv时，可以使用pd.read_csv('file.csv',na_values=['',[]'])进行设置。使用read_sql有没有类似的标志？

浏览 2提问于2016-06-18得票数 5

2回答

熊猫-基于NaN数量的有条件下降复制

python-3.x、pandas、duplicates

我有一个用于Python3.7x的Pandas0.24.2数据文件，如下所示。我想使用基于条件逻辑的同名drop_duplicates()。在这里可以找到一个类似的问题：，但在我的情况下，它变得更复杂了。 import pandas as pd import numpy as np df = pd.DataFrame({ 'Id': [1, 2, 3, 4, 5, 6 ], 'Name': ['A', 'B', &

浏览 2提问于2019-10-09得票数 1

回答已采纳

1回答

考拉数据帧中的过滤索引值

python、pandas、dataframe、spark-koalas

我试着在科拉斯重现下面的操作，当我在考拉身上尝试同样的操作时，它会抛出一个错误。在Pandas上的尝试： df = pd.DataFrame({'foo':['a','b','c','d','e'], 'bar':['1', '2', '3','4','5']}) df1 = pd.DataFrame({'foo':['a','b','c'

浏览 4提问于2021-08-31得票数 0

回答已采纳

1回答

将数据框中的零替换为同一列中相邻行的平均值

python、pandas

我使用pandas将数据从excel文件导入到一个变量df中。其中一些值是零。我需要用同一列的上行和下行的值的平均值来替换此值。请建议我如何迭代和计算平均值。

浏览 24提问于2020-11-06得票数 0

1回答

当keyError试图删除熊猫专栏时。

python、pandas、numpy

我想从数据中删除一些行。我用的是以下代码- import pandas as pd import numpy as np vle = pd.read_csv('/home/user/Documents/MOOC dataset original/vle.csv') df = pd.DataFrame(vle) df.dropna(subset = ['week_from'],axis=1,inplace = True) df.dropna(subset = ['week_to'],axis=1

浏览 0提问于2018-07-08得票数 0

回答已采纳

2回答

将数据转换为熊猫DataFrame并删除一些

python、pandas、dataframe、autonumeric.js

我有一组测量数据来转换成浮点值的数据。但有时机器不测量和设置一个“--”字符给pandas.to_numeric ValueError。这里有一个简化的例子，我的问题是如何转换成浮动孔列，并删除我有字符串“--”字符集的位置： data = {'row_1': ["3.0", "2.4", "---", "0.0"], 'row_2': ['a', 'b', 'c', 'd']} df = pandas.DataFrame.from_d

浏览 9提问于2022-01-10得票数 -1

回答已采纳

1回答

pandas.errors.ParserError:标记数据时出错

python、pandas、csv

我在使用pandas读取一些txt文件时遇到了一个问题。我的文件内容如下所示。 WNS 01.20 57039 108.8833 34.0833 445.8 LC 20150322120000 OOBS 00100 ///// ///// ////// /// /// //////// 00160 216.3 003.7 0006.5 100 100 -1.2E+02 00220 258.9 006.7 0006.6 100 100 -1.3E+02 00280 263.9 007.9 0006.6 100 100 -1.3E+02 前3行不是我想要的，所以我忽略它。所以我从第"

浏览 0提问于2018-07-14得票数 0

1回答

向pandas DataFrame添加新列时的NaN值

python、pandas、dataframe、nan

我正在尝试在一个pandas DataFrame中生成一个新列，该列与另一个pandas DataFrame中的值相等。当我尝试创建新列时，我只得到新列值的NaNs。首先，我使用API调用来获取一些数据，'mydata‘DataFrame是按日期索引的一列数据。 mydata = Quandl.get(["YAHOO/INDEX_MXX.4"], trim_start="2001-04-01", trim_end="2014-03-31", collapse

浏览 1提问于2014-10-07得票数 26

回答已采纳

1回答

如何在MATLAB中从文件中读取行*列矩阵

matlab、file-io、matrix

我在一个文件中有以下数据。 1 3 5 2 6 8 10 12 14 16 18 20 我想用4*3维的矩阵来读取它。目前，我通过下面的代码读取这个矩阵，假设数据存储在名为"A.txt“的文件中。 A=textread('A.txt'); 但这段代码的问题是，如果文件最后有任何空格，MATLAB会将该输入视为零。例如，如果文件"A.txt“的数据后有一个空格，则通过这段代码，MATLAB将输入内容如下： 1 3 5 2 6 8 10 12 14 16 18 20 0 所以我想把矩阵读成row* col语法。你能帮帮我吗？

浏览 1提问于2014-07-09得票数 0

2回答

ValueError:凝聚距离矩阵必须只包含有限值。巨蟒

python、python-3.x、cluster-analysis、data-mining

我为分层聚类编写了以下代码，但我得到了以下错误，您能帮助我吗？ # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the Mall dataset with pandas dataset = pd.read_csv("https://raw.githubusercontent.com/akbarhusnoo/Chronic-Kidney-Disease-Prediction/main/chronic_kidne

浏览 4提问于2021-06-18得票数 0

回答已采纳

3回答

筛选出超过一定数量的NaN的行

python、pandas、dataframe、filter

在Pandas数据帧中，我想过滤掉所有超过2个NaN的行。本质上，我有4列，我只想保留那些至少有2列有限定值的行。有人能建议一下如何实现这一点吗？

浏览 10提问于2014-04-22得票数 9

回答已采纳

2回答

Pandas在if语句中设置新值

python、pandas

我正在尝试在Pandas数据帧中创建一个新字段，它是选定的其他字段的串联字符串，用逗号分隔，但仅在这些其他字段中存在值的情况下。 Name City Food1 Food2 Food3 Dave London cheese ham Stan Boston eggs cheese fish Jean Paris fish Name City Food1 Food2 Food3 concat Dave London cheese ham cheese,ham Stan Boston eggs cheese fish

浏览 1提问于2019-06-27得票数 0

1回答

为什么scipy.interpolate不打印散点图中的插值值？

python-3.x、scipy、interpolation、linear-interpolation

我正在尝试使用赋值线性插值来填补我的数据中的空白，这样我就可以绘制我的数据的散点图。我也想打印通过线性插值改变的值，但是我一点也不确定该怎么做。我的代码似乎一点也不插值-它生成的图形与原始数据中的空白是一样的。当我对缺失的数据点运行插值函数f6时，它会像以前一样返回nan。我会在下面粘贴我的代码。(我的数据从5分钟到1440分钟，间隔5分钟)。 import numpy as np import matplotlib.pyplot as plt import scipy.interpolate as interpolate node_6 = prob_1.iloc[:,1] t= np.a

浏览 6提问于2022-11-22得票数 0

4回答

如何用nans规范熊猫专栏？

python、numpy、pandas、scipy

我有一只熊猫数据，其中有一列我想要标准化的真实值： >> a array([ nan, 0.0767, 0.4383, 0.7866, 0.8091, 0.1954, 0.6307, 0.6599, 0.1065, 0.0508]) >> df = pandas.DataFrame({"a": a}) 问题是，单个nan值将使所有数组nan >> from scipy.stats import zscore >> zscore(df["a"]) array([ nan, na

浏览 1提问于2014-05-04得票数 25

回答已采纳

3回答

熊猫--如何在DataFrame系列中用零值替换字符串？

python、pandas、dataframe

我正在将一些csv数据导入到Pandas DataFrame中(用Python)。一个系列是指所有的数值。然而，它也包含一些虚假的"$-“元素，表示为字符串。这些都是从以前的格式中遗留下来的。如果我只是导入该系列，Pandas将其报告为一系列的“object”。用零替换这些"$-“字符串的最佳方法是什么？或者更广泛地说，我如何用数值替换一个系列(主要是数字)中的所有字符串，并将序列转换为浮点类型？史蒂夫

浏览 2提问于2015-10-30得票数 5

回答已采纳

1回答

仅更新到期日期大于python max date - 2261的行-无法将浮点型NaN转换为整数

python、pandas、dataframe

我希望更新任何晚于Python的最大日期的日期： display(df['maturity_date'].dtypes) dtype('O') display(df['maturity_date'].describe()) count 3488 unique 766 top 2166-09-23 00:00:00 freq 130 Name: maturity_date, dtype: object m =

浏览 31提问于2018-05-28得票数 1

回答已采纳

1回答

用大熊猫对丢失值的数据进行孤立点检测

python、pandas、outliers

我有几个长期数据系列与空白，并希望使用低通滤波器检测异常值。理论上，(数据中位数)>3西格玛似乎是一个合适的测试，但有两个问题：数据序列太长，变化太大，所以对整个系列只使用一个中位数和标准差是行不通的，使用pandas.rolling_median和pandas.rolling_std已经帮了我很大的忙，但是现在数据缺口成了一个问题，因为在每个有效间隔的末尾都缺少滚动值，因此没有值可以比较。下面的程序说明了这个问题(如果由于随机数据而在第一次尝试中捕获了所有异常值，则可能需要再次运行)： import numpy as np import pandas as pd

浏览 2提问于2016-07-22得票数 2

回答已采纳

1回答

Pandas Dataframe中不同列长的问题

python、pandas、dataframe、scipy

我知道解决这个问题很明显，但我没有办法. 我将一个带有Pandas的.csv文件导入到一个数据文件中。数据格式为:3列单标题，1列45行，2列40行，3列21行。该形状为(45,3)。“缺失”行充满了NAN，这里开始了我的问题。我想用不同的参与函数来评估一些统计数据，比如安德森达林测试等等，比如： for i in columns: print ([i]) a = stats.anderson(df[i], dist = 'norm') print (a) if a[0] > a[1][2]: print('The null hypothesis can

浏览 4提问于2022-08-05得票数 1

1回答

MATLAB时间序列回归，处理NaNs

matlab

为了提供一个最小的例子(我想在许多应用程序中使用这个解决方案)，我在MATLAB中使用了regress函数。我在MATLAB中拥有的数据是(月)时间序列，然而，某些数据点在某些序列的开头是缺失的。假设Y是任意回归模型中的一个因变量，我想运行10个回归模型， $$Y_t=\alpha+X_{i，t-1}$$ 因此，我想运行9个模型，其中Y是因变量，每个模型--解释性变量--从$X_2$更改为$X_10$。为了澄清，我想运行9种模型(见图)，我遇到的问题是，我希望第一个使用Y(即data(:,1))和X2 (即数据(：，2))的模型使用前1000个观测值，但是对于X3，

浏览 0提问于2018-12-04得票数 1

回答已采纳

3回答

使用协作过滤在Pandas Dataframe中填充NA值

python、pandas、machine-learning、collaborative-filtering、data-cleaning

我正在开发一个有机化合物数据库，其中一些单元具有NA值(请查看第二张图片中的HFUS列)：为了我的项目的目的，我想使用协同过滤来填补这些空白，而不是简单的均值或中位数推算。也就是说，对于NA值将被填充的列，我们应该找到包含其他列的最相似的行，然后从这些行中填充该属性。我想要递归地执行此操作，并填充所有的NA值。我该怎么做呢？我找到了对中的其他列执行corr()的代码，但除了创建corr值之外，我无法获得太多内容。下面是可以加载到Pandas的CSV (33kb)：

浏览 8提问于2017-10-20得票数 0

3回答

使用Pandas的NaNs过滤时间序列中的空洞

python、pandas

我在使用pandas NAs过滤数据时遇到了一些问题。我有一个数据框，如下所示： Jan Feb Mar Apr May June 0 0.349143 0.249041 0.244352 NaN 0.425336 NaN 1 0.530616 0.816829 NaN 0.212282 0.099364 NaN 2 0.713001 0.073601 0.242077 0.553908 NaN NaN 3 0.245295 0.007016 0.444352

浏览 0提问于2013-07-18得票数 1

回答已采纳

1回答

使用.to_csv保存文件时的语法

python、python-3.x

若要删除具有空单元格的CSV file中的行，请使用以下代码： import pandas as pd data = pd.read_csv("./test_1.csv", sep=";") data.dropna() data.dropna().to_csv("./test_2.csv", index=False, sep=";") 一切都很好，但我得到了一个新的CSV file与incorrect data 红色方格突出显示的内容我得到了以dot和zero .0的形式出现的附加符号。你能告诉我如何在没有.0的情

浏览 2提问于2022-02-16得票数 2

回答已采纳

1回答

如何从另一个DataFrame填充一个DataFrame，添加行和替换空值？

python、pandas

我有两个具有重叠列和索引的pandas.DataFrame，如 X = pandas.DataFrame({"A": ["A0", "A1", "A2"], "B": ["B0", None, "B2"]}, index=[0, 1, 2]) Y = pandas.DataFrame({"A": [V, "A3"], "B": ["B1", "B3"], "

浏览 3提问于2016-06-13得票数 0

回答已采纳

5回答

计算pandas DataFrame中的所有NaNs

python、pandas、dataframe

我正在尝试计算pandas系列中的NaN元素(数据类型类‘numpy.float64’)，以了解有多少个数据类型是类'pandas.core.series.Series‘ 这是为了计数pandas系列中的空值 import pandas as pd oc=pd.read_csv(csv_file) oc.count("NaN") 我期望oc,count("NaN")的输出是7，但它显示的是'Level NaN must be same as name (None)'

浏览 4提问于2019-05-23得票数 2

2回答

与Pandas行操作相关的查询

pandas、data-cleaning、numpy

我有一个关于Pandas数据操作的查询。假设我有一个具有以下结构的dataframe，df。 A B C 1 1 7 5 3 3 3 3 2 7 5 2 5 NaN 2 我们在数据A，B& C中有3列。 B列由平均值wrt A组成。例如, B在第3行(即3)是A (9/3)的前3行的平均值，同样，B在第4行的值=(A的第2、第3和第4行的值之和)/3 现在，假设B中有许多NaN值，而A中没有NaN值，那么如何按照上面讨论的逻辑编写函数或代码来填充NaN值呢？我试过使用loc和iloc，但我想我犯了一些错误。

浏览 0提问于2020-11-09得票数 0

回答已采纳

1回答

熊猫.agg()转换为列表，但跳过nans

python-3.x、pandas、dataframe、aggregate、nan

如何合并/减少一个DataFrame，以便它根据自定义列'id‘合并行，并将值放入一个列表中，如果它们不是Nan的话。到目前为止，我想出了这个问题，但它并没有消除南方人： x: pd.DataFrame = df_chunk.groupby('id', dropna=True).agg(lambda x: list(x)) for row in x.itertuples(): print(row) 结果是： Pandas(Index=1, surname=['Bruce', nan, nan], given_name=['Erin'

浏览 5提问于2022-01-10得票数 3

回答已采纳

1回答

Pandas聚合错误:在尝试计算模式时“没有找到匹配的签名”

python、pandas、group-by、aggregation、mode

我有一个熊猫数据列表，我想对所有的熊猫执行一个模式操作。所有数据文件都有相同的布局： date是dt.date对象，感情是整数(-1、0或1)。我想得到一个数据组的日期，情感是原始的模式(或一个模式的列表，如果有更多)。我用它来聚合： df = df.groupby('date').agg(pd.Series.mode) 它可以很好地处理几乎所有的数据文件，其中只有一个返回一个错误： File "..\lib\site-packages\pandas\core\apply.py", line 420, in agg_list_like rais

浏览 15提问于2022-11-04得票数 0

回答已采纳

1回答

避免在海运中标出丢失的值

python、time-series、visualization、seaborn

Problem：我有几天的timeseries数据，我使用Seaborn库的函数以facet形式绘制这些数据。在几种情况下，我发现前面提到的海运函数在两个读数之间绘制了连续行之间的连续缺失值(nan值)。虽然matplotlib将缺失的值显示为gap，但这是有意义的。演示示例如下所示 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # create timeseries data for 3 days such that day two contains N

浏览 5提问于2017-12-11得票数 6

回答已采纳

1回答

熊猫0.13.1 Python3 ValueError不能将南转换为整数

python-3.x、pandas

最近，我从2.7转到python 3，重新安装了我的所有库，并且一直在手工修复脚本而没有py2to3。我的脚本中的一部分，它对概率进行排序，甚至得到了一个ValueError: Cannot convert Nan to integer import pandas as pd def ExtractU(df): is_even = df['IDs'].str.extract('(\d+).*').astype(int) % 2 == 0 Even=df[is_even] Odd=df[~is_even] return Odd 因此，为了

浏览 1提问于2014-02-04得票数 0

2回答

为什么我从CSV文件python中读取的列长度错误

python、pandas、csv

我正在尝试从'.csv‘文件中读取一些数据(基因组名称)，我想找出每一列的长度，然后用这些数据构建一个条形图，但不知何故，我的脚本显示所有列都有相同的长度，这不是真的。我的文件中有4列，每列的每个单元中都有一个基因组名称。错误的列数随后也会显示在'.png‘文件中。我在我的文件中删除了曾经的'0‘值，但这个问题仍然没有消失。这是我的代码： import pandas as pd import numpy as np import matplotlib.pyplot as plt ca1 = [] casU3 =[] casU5 =[] casBig = [] df =

浏览 0提问于2020-11-26得票数 0

2回答

压缩缺少值的数据行

python、pandas、dataframe

我想挤一个这样的数据文件： import pandas as pd import numpy as np df1 = pd.DataFrame([[1,pd.NA,100],[2,20,np.nan],[np.nan,np.nan,300],[pd.NA,"bla",400]], columns=["A","B","C"]) df1 A B C 0 1 <NA> 100.0 1 2 20 NaN 2 NaN NaN 300.0 3 <NA

浏览 1提问于2022-03-10得票数 2

回答已采纳

2回答

如何在包含数据类型列表的pandas系列中为某些条件取值？

pandas、series

实际上，我知道在list和系列中使用数据类型(如float )的许多方法，但是如何才能使用包含数据类型Pandas的系列例如，我想： series = pd.Series([[1,2],[2,3,4],[4,6]]) series类似于： 0 [1, 2] 1 [2, 3, 4] 2 [4, 6] dtype: object 我希望有长度大于2的行，这实际上是行1。我试过了： series[len(series) > 2] 和 series[series.apply(lambda x : len(x) > 1)] 两种方法都不起作用。

浏览 0提问于2021-02-20得票数 1

1回答

对于协方差计算，Apache治疗差异Pandas与MLLib的确切值是多少？

python、pandas、apache-spark、pyspark、apache-spark-mllib

我最近观察到和在结果上有显著差异。对于完全指定的输入(即没有任何NAs)，结果是相当接近的，但对于缺失的值则有很大的偏差。，但是我不能用火花复制结果。我找不到RowMatrix().computeCovariance()在中对NAs到底做了什么的文档--但是我的Scala充其量是非常公平的，而且我不熟悉，也许我漏掉了一些东西。有一个BLAS警告无法追踪原因，因为我使用的是预构建的macOS火花设置： WARN BLAS: Failed to load implementation from: com.github.fommil.netlib.NativeSystemBLAS 考虑到协方差对于许

浏览 1提问于2021-10-15得票数 4