从多个Pandas系列中删除NaNs_从pandas中选择的数据中删除NaNs_从pandas系列中删除datetime索引范围 - 腾讯云开发者社区

python、pandas、dataframe

我正在将一些csv数据导入到Pandas DataFrame中(用Python)。一个系列是指所有的数值。然而，它也包含一些虚假的"$-“元素，表示为字符串。这些都是从以前的格式中遗留下来的。如果我只是导入该系列，Pandas将其报告为一系列的“object”。用零替换这些"$-“字符串的最佳方法是什么？或者更广泛地说，我如何用数值替换一个系列(主要是数字)中的所有字符串，并将序列转换为浮点类型？史蒂夫

浏览 2提问于2015-10-30得票数 5

回答已采纳

3回答

如何循环遍历Pandas DataFrame并在每个单元上调用一个函数

python、pandas、dataframe

我使用下面的代码对文本进行评级 import textstat import pandas as pd test_data = ("""Jonathan pushed back the big iron pot and stood up. There were no bears. But up the path came his father, carrying his gun. And with him were Jonathan's Uncle James and his Uncle Samuel, his Uncle John and his Uncle

浏览 2提问于2019-10-09得票数 0

回答已采纳

5回答

计算pandas DataFrame中的所有NaNs

python、pandas、dataframe

我正在尝试计算pandas系列中的NaN元素(数据类型类‘numpy.float64’)，以了解有多少个数据类型是类'pandas.core.series.Series‘ 这是为了计数pandas系列中的空值 import pandas as pd oc=pd.read_csv(csv_file) oc.count("NaN") 我期望oc,count("NaN")的输出是7，但它显示的是'Level NaN must be same as name (None)'

浏览 4提问于2019-05-23得票数 2

2回答

如何在包含数据类型列表的pandas系列中为某些条件取值？

pandas、series

实际上，我知道在list和系列中使用数据类型(如float )的许多方法，但是如何才能使用包含数据类型Pandas的系列例如，我想： series = pd.Series([[1,2],[2,3,4],[4,6]]) series类似于： 0 [1, 2] 1 [2, 3, 4] 2 [4, 6] dtype: object 我希望有长度大于2的行，这实际上是行1。我试过了： series[len(series) > 2] 和 series[series.apply(lambda x : len(x) > 1)] 两种方法都不起作用。

浏览 0提问于2021-02-20得票数 1

3回答

熊猫:将所有字符串组件放到带有整数和字符串的混合类型系列中。

python、pandas、series、mixed-type

这把我逼疯了。当我搜索关于在dataframe中删除元素的技巧时，没有关于混合类型系列的任何内容。假设这里有一个数据文件： import pandas as pd df = pd.DataFrame(data={'col1': [1,2,3,4,'apple','apple'], 'col2': [3,4,5,6,7,8]}) a = df['col1'] 然后“a”是由6个组件组成的混合类型系列。我怎样才能把所有的苹果从a中移除?我需要系列= 1,2,3,4。

浏览 8提问于2021-07-06得票数 2

回答已采纳

1回答

在Pandas中查找相邻数据集的长度

python、pandas、nan

是否有一种方法可以为每一列找出不带数据的连续周期的最大长度？df.isna().sum()‘给出了所有nan的编号，但在这里的示例中，我正在寻找一种获取A=3和B=2的方法： import pandas as pd import numpy as np i = pd.date_range('2018-04-09', periods=8, freq='1D') df = pd.DataFrame({'A': [1, 5, np.nan ,np.nan, np.nan, 2, 5, np.nan], 'B' : [np.nan, 2,

浏览 3提问于2022-02-05得票数 0

1回答

用大熊猫对丢失值的数据进行孤立点检测

python、pandas、outliers

我有几个长期数据系列与空白，并希望使用低通滤波器检测异常值。理论上，(数据中位数)>3西格玛似乎是一个合适的测试，但有两个问题：数据序列太长，变化太大，所以对整个系列只使用一个中位数和标准差是行不通的，使用pandas.rolling_median和pandas.rolling_std已经帮了我很大的忙，但是现在数据缺口成了一个问题，因为在每个有效间隔的末尾都缺少滚动值，因此没有值可以比较。下面的程序说明了这个问题(如果由于随机数据而在第一次尝试中捕获了所有异常值，则可能需要再次运行)： import numpy as np import pandas as pd

浏览 2提问于2016-07-22得票数 2

回答已采纳

2回答

在熊猫中，如何在缺少类别的分类系列上将数据转换成一个数据中心？

python、pandas、pivot、categorical-data

我有一个熊猫的数据与一个明确的系列，有遗漏的类别。在下面所示的示例中，group有"a"、"b"和"c"类别，但是在dataframe中没有"c"的情况。 import pandas as pd dfr = pd.DataFrame({ "id": ["111", "222", "111", "333"], "group": ["a", "a", "b", "b

浏览 3提问于2021-12-01得票数 5

回答已采纳

2回答

如何在熊猫数据栏中放置“nan”行？

python、pandas、dataframe、numpy

我有一个dataframe (表示为'df')，在列中缺少一些值(表示为'col1')。我应用了一个set函数来查找列中的唯一值： print(set(df['col1'])) Output: {0.0, 1.0, 2.0, 3.0, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan} 我正在尝试将这些'nan‘行从我尝试过的dataframe中删除： df['col1'] = df['col1'].dropna() 但是，列行保持不变。我认为上述重复的

浏览 8提问于2022-06-10得票数 0

回答已采纳

1回答

NaN-columns在pandas中绘制为全0列

pandas

在绘制整个列都填充了NaN的切片DataFrame时，我遇到了一些问题。怎么回事： pandas.DataFrame( dict( A=pandas.Series([np.NaN]*32), B=pd.Series(range(-1,32)) ) ).plot() 不同于： #Ugly fix pandas.DataFrame( dict( A=pandas.Series( [0] + [numpy.NaN]*32), B=pd.Series(range(-1,32)) ) ).plot() 通过

浏览 1提问于2012-07-27得票数 0

回答已采纳

2回答

生成缺失时间间隔的列表

python、pandas

我有Pandas系列，其中的一些缺失的数据代表了nans，并希望得到一个概览的数据是多长时间，通常是丢失和多少次一个例子是： 10:01 1.23 10:02 2.23 10:03 nan 10:04 nan 10:05 nan 10:06 6.23 10:07 nan 10:08 nan 10:09 9.23 那么愿望输出将是这样的一个列表 missing = [[10:03,10:05], [10:07,10:08]] N_missing = 2

浏览 0提问于2018-07-12得票数 2

回答已采纳

2回答

熊猫系列到numpy数组转换错误

python、numpy、pandas

我和foll有一个熊猫系列。value_counts输出()： NaN 2741 197 1891 127 188 194 42 195 24 122 21 当我在本系列中执行describe()时，我得到： df[col_name].describe() count 2738.000000 mean 172.182250 std 47.387496 min 0.000000 25% 171.250000 50% 197.000000 75% 197.

浏览 0提问于2015-09-04得票数 1

回答已采纳

2回答

添加潘达斯系列而不进行排序

python、pandas、sorting、add、series

我想在Pandas中添加两个系列，并使用add()函数这样做： import pandas as pd import numpy as np a = pd.Series([35000,71000,16000,5000],index=['Ohio','Texas','Oregon','Utah']) b = pd.Series([np.nan,71000,16000,35000],index=['California', 'Texas', 'Oregon', 'Ohio'

浏览 26提问于2022-01-24得票数 0

回答已采纳

1回答

使用pandas.Series.str.get:正确的方法是什么？

python、python-3.x、string、pandas

我正在关注韦斯·麦金尼( Wes )的精彩著作，以跟上pandas的步伐。然而，我似乎不明白为什么pandas.Series.str.get不能工作。我在这里看过几个Github的问题，但似乎都没有帮助。数据 data = pd.Series({'Dave': 'dave@google.com', 'Steve': 'steve@gmail.com', 'Rob': 'rob@yahoo.com', 'Wes': np.nan} ) 码 import pandas as pd im

浏览 1提问于2019-07-26得票数 2

回答已采纳

1回答

Numpy与Pandas和缺失值的结果不一致

python、pandas、numpy、missing-data

与访问序列的值相比，为什么numpy在使用Pandas系列时返回的结果不同，缺少值，如下所示： import pandas as pd import numpy as np data = pd.DataFrame(dict(a=[1, 2, 3, np.nan, np.nan, 6])) np.sum(data['a']) #12.0 np.sum(data['a'].values) #nan

浏览 28提问于2019-03-13得票数 5

回答已采纳

3回答

读取外部Excel文件后，我的Pandas dataframe列中的值不准确

python、python-3.x、pandas

我已将以下文件读取到Pandas数据帧中：我以前在Excel中查看过该文件，单元格包含字符串“...”(恰好3个点)来表示缺失值。我的问题是，在将文件读入名为'energy‘的Pandas数据帧后，一些缺少的值不再用'...’表示。，而不是一系列更多的点，例如：'.................................................'.这使得执行energy.replace('...', np.nan, inplace=True)是不准确的，因为并不是所有缺少的值都被替换。有人能解释为什么会发生这种行为吗?用熊猫

浏览 0提问于2019-05-15得票数 2

1回答

对pandas dataframe json列进行切片时，类型为“”float“”的对象没有len()错误

python、json、pandas、list、dataframe

我的数据看起来像这样。在每一列中，有不同长度的值/键。有些行也是NaN的。 like match 0 [{'timestamp', 'type'}] [{'timestamp', 'type'}] 1 [{'timestamp', 'comment', 'type'}] [{'timestamp', 'type'}] 2 NaN

浏览 2提问于2020-12-15得票数 1

2回答

如何通过从另一列复制值来填充丢失的DataFrame值

python、pandas、dataframe

米克·贾格尔的姓在一份数据中不见了。只指定了名字和乐队的名字 import pandas as pd df = pd.DataFrame({ 'fist': ['John', 'Mick'], 'last':['Lennon', ''], 'band':['Beatles', 'Rolling Stones'] }) 我可以轻松地为缺少的字段分配一个新值： df[&#

浏览 3提问于2016-10-26得票数 1

回答已采纳

4回答

有没有办法从充满数据的字典中删除nan？

python、dictionary、nan

我有一个字典，里面填满了我导入的两个文件中的数据，但其中一些数据是nan。如何使用nan删除数据片段？我的代码是： import matplotlib.pyplot as plt from pandas.lib import Timestamp import numpy as np from datetime import datetime import pandas as pd import collections orangebook = pd.read_csv('C:\Users\WEGWEIS_JAKE\Desktop\Work Programs\Code File

浏览 1提问于2014-06-06得票数 9

2回答

如何处理将不同文件中的列合并到一个文件中的NaN

python、pandas

我对python很陌生，并且使用python 3.9.6。我有一个以Cam_Cantera_IDT_output_800K_开头的每个文件的代码，它接受每个文件的第一列t和列X_ch2，并使用pd.merge将它们合并在一起。代码可以做我想做的事情，但是在我的输出中，我会弹出许多NaN。当我打开csv文件时，我有许多空单元格。我需要所有的数据，以便稍后进行一些计算。我是否需要考虑诸如合并而不是合并之类的选项？任何帮助都将是非常感谢的，因为我真的不知道如何解决这个问题。谢谢。 import glob import pandas as pd import os file_extension =

浏览 7提问于2021-12-02得票数 0

回答已采纳

1回答

对Pandas数据透视表应用筛选器将数据清空

python、pandas、scipy

使用以下csv数据：我已经将数据从csv加载到Pandas Pivot Table中，输出如下： [[nan nan nan ... nan nan 0.] [nan 21 nan ... nan 0. nan] [nan nan nan ... 0. nan nan] ... [23. nan 13. ... nan nan nan] [nan nan nan ... nan nan nan] [nan 14 nan ... nan nan nan]] 但在对结果使用Scipy高斯滤波器后，数据随后被消隐，如下所示： [[nan nan nan ... nan nan

浏览 13提问于2021-03-02得票数 0

1回答

Python将Pandas浮点数转换为字符串

python、unicode、pandas、ipython

Hi有一个数据框架(df)，其中包含两个列(日期、文本)，从Excel电子表格中读取到Python/Pandas。 xl = pd.ExcelFile(dir+"file.xlsx") df = xl.parse(xl.sheet_names[0]) date text 0 2013-08-06 NaN 1 2013-08-06 Text with unicode 2 ... 文本包含不需要的unicode字符，我通常使用 df['text'] = df[&

浏览 3提问于2014-09-04得票数 0

回答已采纳

2回答

压缩缺少值的数据行

python、pandas、dataframe

我想挤一个这样的数据文件： import pandas as pd import numpy as np df1 = pd.DataFrame([[1,pd.NA,100],[2,20,np.nan],[np.nan,np.nan,300],[pd.NA,"bla",400]], columns=["A","B","C"]) df1 A B C 0 1 <NA> 100.0 1 2 20 NaN 2 NaN NaN 300.0 3 <NA

浏览 1提问于2022-03-10得票数 2

回答已采纳

2回答

Python -如果用于熊猫数据文件中的列

python、pandas

我想将dataframe NaN (其中有22行)列中的GP值转换为0。我试过这些线路，但它们不起作用 import pandas as pd draft = pd.read_csv('Draft year.csv') if draft['GP'].isnull(): draft['GP'] = 0 在R中，有ifelse，它做得很好，但是我不知道在python中的等价性。真的很感谢你的帮助

浏览 5提问于2016-06-18得票数 0

回答已采纳

1回答

仅更新到期日期大于python max date - 2261的行-无法将浮点型NaN转换为整数

python、pandas、dataframe

我希望更新任何晚于Python的最大日期的日期： display(df['maturity_date'].dtypes) dtype('O') display(df['maturity_date'].describe()) count 3488 unique 766 top 2166-09-23 00:00:00 freq 130 Name: maturity_date, dtype: object m =

浏览 31提问于2018-05-28得票数 1

回答已采纳

1回答

NaNs的问题: set_index().reset_index()会损坏数据

indexing、pandas、nan

我读到NaNs是有问题的，但下面这些会导致我的数据实际损坏，而不是错误。这是一个bug吗？我是否遗漏了文档中的一些基本内容？我希望第二个命令给出一个错误，或者给出与第一个命令相同的响应： ipdb> df year PRuid QC data 18 2007 nonQC 0 8.014261 19 2008 nonQC 0 7.859152 20 2010 nonQC 0 7.468260 21 1985 10 NaN 0.861403 22 1985 11 NaN 0.878531 23 1985

浏览 0提问于2013-05-13得票数 1

回答已采纳

2回答

如何对连续的列值进行分组(np.nan)？

python-3.x、pandas、numpy、dataframe

我得到了以下pandas.DataFrame，其中列value是输入数据，group是所需的输出。 import pandas as pd import numpy as np df = pd.DataFrame({'value': [0.1, 0.2, np.nan, 0.2, 0.3, 0.5, np.nan, 0.1], 'group': [1, 1, np.nan, 2, 2, 2, np.nan, 3]}) 我想为用np.nan分隔的每个连续数字段分配一个唯一的ID。我可能需要一些聚类方法来实现这一点，但我还找

浏览 17提问于2020-10-08得票数 0

回答已采纳

1回答

为什么pandasUDF系列(PandasUDFType.SCALAR_ITER)系列的迭代器(PandasUDFType.SCALAR)是可用的？

apache-spark、pyspark、apache-spark-sql

根据函数的输入和输出类型，有不同类型的pandasUDFType。有：系列到系列PandasUDFType.SCALAR from pyspark.sql.functions import pandas_udf, PandasUDFType

浏览 5提问于2022-01-02得票数 3

回答已采纳

24回答

将包含NaNs的Pandas列转换为dtype `int`

python、pandas、na

我将数据从.csv文件读取到Pandas数据帧，如下所示。对于其中一列，即id，我希望将列类型指定为int。问题是id系列的值缺失/为空。在读取.csv时，当我尝试将id列转换为整数时，我得到： df= pd.read_csv("data.csv", dtype={'id': int}) error: Integer column has NA values 或者，我尝试在阅读后转换列类型，如下所示，但这一次我得到： df= pd.read_csv("data.csv") df[['id']] = df[['id&#

浏览 454提问于2014-01-22得票数 277

回答已采纳

2回答

Python移除nans的问题

python、pandas、dataframe、nan、series

我正努力把南安移除。已经花了一些时间来寻找解决方案，但似乎没有任何效果。下面是我的代码示例。整个笔记本都可以在我的GitHub上找到： import pandas as pd import seaborn as sns #not used in this sample, needed for plotting later on import matplotlib as mpl #as above import matplotlib.pyplot as plt #as above import numpy as np

浏览 2提问于2022-08-21得票数 1

回答已采纳

4回答

如何将整数类型数组(带有一些NaN)转换为字符串类型数组

python、python-3.x、pandas、numpy

我有一个数组x，其中一个值是NaN。 x = [1, 2, NaN, 3, 5] 除NaN外，所有元素都是整数。此数组类型被视为float64而不是int。我想把类型从浮点型转换成字符串。我试过astype(str)了。但这会产生小数点，如x = [1.0, 2.0, NaN, 3.0, 5.0] 我试过astype(int).astype(str)了。然而，在这种情况下，由于NaN元素，它不能工作。那么，我如何才能将一些元素为NaN的整数数组转换为没有小数点的字符串类型呢？感谢您的阅读。 import numpy as np import pandas as pd df = pd

浏览 87提问于2020-07-15得票数 2

回答已采纳

2回答

在Python中将2列的数据帧转换为一系列2列

python、pandas

我正在尝试处理一些时间序列数据，并且对pandas dataframe还是个新手。我有一个包含两列的数据帧，如下所示： +---+-----------------------+-------+--+ | | 0 | 1 | | +---+-----------------------+-------+--+ | 1 | 2018-08-02 23:00:00 | 456.8 | | | 2 | 2018-08-02 23:01:00 | 457.9 | | +---+-----------------------+------

浏览 0提问于2018-08-16得票数 0

1回答

如何与Pandas中的缺失值相加？

python、pandas

我想对Pandas系列对象进行求和，但我得到的结果似乎不像文档所描述的那样奇怪。在Pandas 0.19.2中，以下代码： a = pd.Series({1: 2, 3: 4}) b = pd.Series({3: 5, 4: 6}) print(a + b) 给我， 1 NaN 3 9.0 4 NaN dtype: float64 然而，说：当求和数据时，NA (缺失)值将被视为零。这似乎是将它们视为NaN而不是零。我期待着输出： 1 2.0 3 9.0 4 6.0 dtype: float64 在我的例子中，这个系列来自几个列上的value

浏览 2提问于2018-03-01得票数 3

回答已采纳

1回答

熊猫.agg()转换为列表，但跳过nans

python-3.x、pandas、dataframe、aggregate、nan

如何合并/减少一个DataFrame，以便它根据自定义列'id‘合并行，并将值放入一个列表中，如果它们不是Nan的话。到目前为止，我想出了这个问题，但它并没有消除南方人： x: pd.DataFrame = df_chunk.groupby('id', dropna=True).agg(lambda x: list(x)) for row in x.itertuples(): print(row) 结果是： Pandas(Index=1, surname=['Bruce', nan, nan], given_name=['Erin'

浏览 5提问于2022-01-10得票数 3

回答已采纳

2回答

熊猫-基于NaN数量的有条件下降复制

python-3.x、pandas、duplicates

我有一个用于Python3.7x的Pandas0.24.2数据文件，如下所示。我想使用基于条件逻辑的同名drop_duplicates()。在这里可以找到一个类似的问题：，但在我的情况下，它变得更复杂了。 import pandas as pd import numpy as np df = pd.DataFrame({ 'Id': [1, 2, 3, 4, 5, 6 ], 'Name': ['A', 'B', &

浏览 2提问于2019-10-09得票数 1

回答已采纳

2回答

python excel读取引擎(pandas/read_excel)将不完整列的布尔值(true/false)转换为浮点型(1.0/0.0

python、excel、pandas

对于pandas.read_excel()，部分填充的excel列中的布尔值将转换为浮点数，如以下比较所示：如上所示，当excel列完全充满布尔值时，引擎将按预期执行转换。当engine = None和'xlrd‘并将电子表格另存为1) Excel工作簿(.xlsx)、2) Excel 97-2003 (.xls)和3) 5.0/95工作簿时，问题仍然存在。 pd.__version__ = u'0.18.1' xlrd.__VERSION__ = '1.1.0' Excel Version 1805 显而易见的解决办法是在excel中完全填

浏览 2提问于2018-06-19得票数 0

1回答

考拉数据帧中的过滤索引值

python、pandas、dataframe、spark-koalas

我试着在科拉斯重现下面的操作，当我在考拉身上尝试同样的操作时，它会抛出一个错误。在Pandas上的尝试： df = pd.DataFrame({'foo':['a','b','c','d','e'], 'bar':['1', '2', '3','4','5']}) df1 = pd.DataFrame({'foo':['a','b','c'

浏览 4提问于2021-08-31得票数 0

回答已采纳

2回答

ValueError:凝聚距离矩阵必须只包含有限值。巨蟒

python、python-3.x、cluster-analysis、data-mining

我为分层聚类编写了以下代码，但我得到了以下错误，您能帮助我吗？ # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the Mall dataset with pandas dataset = pd.read_csv("https://raw.githubusercontent.com/akbarhusnoo/Chronic-Kidney-Disease-Prediction/main/chronic_kidne

浏览 4提问于2021-06-18得票数 0

回答已采纳

1回答

使用pandas丢弃超过25%的缺失数据

python、pandas

我有一个超过30K行的csv文件。其中一些行包含NA值，我想丢弃缺失值超过25%的行。我已经尝试使用pandas命令dropna()，但我只能使用命令"any“或"all”。我应该使用哪行代码来区分缺失值超过25%的行？谢谢

浏览 2提问于2020-06-28得票数 0

3回答

AttributeError：'float‘对象没有属性'max’

python、function

这是我以前的关于用负值的特定条件规范Pandas DataFrame的列的延续。我使用的DataFrame如下： import numpy as np import pandas as pd df = pd.DataFrame({'key' : [111, 222, 333, 444, 555, 666, 777, 888, 999], 'score1' : [-1, 0, 2, -1, 7, 0, 15, 0, 1], 'score2' : [2, 2, -1,

浏览 0提问于2019-09-09得票数 2

回答已采纳

1回答

对于协方差计算，Apache治疗差异Pandas与MLLib的确切值是多少？

python、pandas、apache-spark、pyspark、apache-spark-mllib

我最近观察到和在结果上有显著差异。对于完全指定的输入(即没有任何NAs)，结果是相当接近的，但对于缺失的值则有很大的偏差。，但是我不能用火花复制结果。我找不到RowMatrix().computeCovariance()在中对NAs到底做了什么的文档--但是我的Scala充其量是非常公平的，而且我不熟悉，也许我漏掉了一些东西。有一个BLAS警告无法追踪原因，因为我使用的是预构建的macOS火花设置： WARN BLAS: Failed to load implementation from: com.github.fommil.netlib.NativeSystemBLAS 考虑到协方差对于许

浏览 1提问于2021-10-15得票数 4

1回答

如何在滚动数据的子集上应用滚动聚合函数？

python、python-3.x、pandas、performance

假设我有一个大的数据集，并且我想要在一个长时间内应用一个滚动操作，但是我只想在少量的数据点上应用聚合。我能用pandas做这个吗？当我试图将切片程序应用于聚合函数的结果时，似乎为时已晚，整个计算已经发生： small = 10 big = 1000 bigger = 10000000 s = pd.Series(np.arange(bigger)) %time x = s.rolling(big).mean() %time x = s.rolling(big).mean()[:-small] 这方面的产出如下： CPU times: user 306 ms, sys: 162 ms, to

浏览 0提问于2019-04-27得票数 1

2回答

基于列表理解的线性插值

python、numpy

请考虑以下列表 import numpy as np import pandas as pd l = [1,4,6,np.NaN,20,np.Nan,24] 我知道我可以用pandas interpolate用简单的线性插值来替换nan值，如下所示 pd.Series([1,4,6,np.NaN,20,np.NaN,24]).interpolate() Out[38]: 0 1.0 1 4.0 2 6.0 3 13.0 4 20.0 5 22.0 6 24.0 dtype: float64 我的问题是：怎样才能获得相同的结果，只使用列表理解、

浏览 4提问于2022-04-21得票数 1

5回答

有没有从矩阵中删除NaNs的一般方法？

matlab、matrix、nan

有没有从矩阵中删除NaNs的一般方法？有时，我在一些代码中间遇到这个问题，然后它就会产生问题，无法获得适当的输出。有没有办法生成任何类型的检查，以避免在MATLAB代码中出现NaNs？这将是非常有帮助的，如果有人可以给我一些相关的想法的例子。

浏览 0提问于2016-02-11得票数 3

1回答

当keyError试图删除熊猫专栏时。

python、pandas、numpy

我想从数据中删除一些行。我用的是以下代码- import pandas as pd import numpy as np vle = pd.read_csv('/home/user/Documents/MOOC dataset original/vle.csv') df = pd.DataFrame(vle) df.dropna(subset = ['week_from'],axis=1,inplace = True) df.dropna(subset = ['week_to'],axis=1

浏览 0提问于2018-07-08得票数 0

回答已采纳

2回答

Pandas系列:提取括号之间的文本，包括它们

python、series、text-extraction

当我从pandas系列中提取文本时，如何包含括号？ my_series.str.extract('$(.*)$')

浏览 61提问于2020-12-18得票数 0

回答已采纳

1回答

从导入的excel文件中筛选字典条目

python、excel、pandas

我正在尝试删除作为nan导入的字典条目(因为它们在excel文件中是空的)。 import pandas as pd import pprint from math import isnan df = pd.read_excel (r'C:\Users\User1\Desktop\Data.xlsx') d = df.to_dict() clean = {k: d[k] for k in d if not isnan(k)} pprint.pprint(clean) 然而，这给了我错误。 TypeError:必须是实数，而不是str 如果我使用下面的命令筛选出nan

浏览 3提问于2019-11-25得票数 0

1回答

为什么df.where()的输出与df.loc[]不同？

python、pandas、where-clause

我想在桌子上找到不少于580的口袋妖怪 import numpy as np #<1> import pandas as pd #<2> Pokemon = pd.read_csv('data/Pokemon.csv') #<3> Pokemon.where(Pokemon['Total']>=580.).dropna().shape #<4> Pokemon.loc[Pokemon['Total']>=580].shape #<5> 第4项产出(78、13)，第5项产出(

浏览 0提问于2020-07-01得票数 0

回答已采纳

2回答

Pandas DataFrame Python组

python、pandas、dataframe

我是Pandas的新手，我想知道在下面的例子中我做错了什么。我找到了一个示例，它解释了如何在应用组之后获得数据帧，而不是一个系列。 df1 = pd.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Baires", "Carac

浏览 6提问于2015-07-10得票数 2

回答已采纳

1回答

以字符串形式读取包含数字值和缺失数据的pandas列

python、pandas

我的数据框中有一个Id列，如下所示： A= pandas.DataFrame(12673，44,847) 此数据有一些缺失值。如果I Keep_default_NA = True，则由NaN填充缺少的值，并将数据读取为浮点型，因此这些值将更改为 12673.0 , 44.0, 847.0 这并不是我们想要的(我想去掉nA值并将其转换为str/obj，因为id可以是任何长度)。如果I keep_default_NA = False，那么其他列(如布尔值)都变成对象，我必须比较字符串值以找出true/false值。

浏览 0提问于2018-08-24得票数 0