Pandas None值与空数据帧_Pandas数据帧比较值==无/无/空_Pandas数据帧空值的类型问题 - 腾讯云开发者社区

python、pandas、dataframe

我正在使用Pandas来探索一些数据集。我有这个数据框架：我想排除任何具有城市值的行。所以我试过了： new_df = all_df[(all_df["City"] == "None") ] new_df 但是我得到了一个空的数据帧：只要我使用None以外的任何值，它就能正常工作。你知道怎么过滤这个数据帧吗？

浏览 1提问于2017-07-15得票数 73

回答已采纳

4回答

如何传递空的pandas查询

python、pandas

为了改进模型，我将几个.query()传递给一个pandas数据帧。在for循环中，我也希望有一个空查询，但在文档中找不到任何东西。它应该返回完整的数据帧。我试过了： temp_df.query(None) temp_df.query() 但这是行不通的。其他想法？谢谢

浏览 25提问于2019-05-01得票数 4

回答已采纳

2回答

我有一组包含json文件的urls和一个空的pandas dataframe，其中的列表示jsnon文件的属性。并不是所有的json文件都具有pandas dataframe中的所有属性。我需要做的是从json文件中创建字典，然后将每个字典作为新行附加到pandas dataframe，如果json文件没有与dataframe中的列匹配的属性，则必须将其填充为空。我设法创建了如下字典： import urllib2 import json url = "https://cws01.worldstores.co.uk/api/product.php?product_sku=ULS

浏览 2提问于2015-07-29得票数 11

回答已采纳

1回答

检查是否在同一位置的第二个dataframe (即使作为子串)字符串中存在一个dataframe字符串

python、pandas

我尝试在两个不同的数据帧中计数，第一个数据帧中有多少个字符串包含在第二个数据帧中。示例： import numpy as np import pandas as pd df_1 = pd.DataFrame([["hello, world", "hello, world"]] * 3, columns=['A', 'B']) df_2 = pd.DataFrame([["hello", "hello"]] * 3, columns=['A', 'B']) 如果我选

浏览 14提问于2020-12-17得票数 1

回答已采纳

1回答

如何用Pandas计算两个数据帧之间的百分比差？

python、pandas、dataframe、percentage、calculation

我正在使用pandas，并执行一些计算和转换，最后得到两个数据帧，它们看起来或多或少如下所示： ID 'abc' 'def' Total 4 5 Slow 0 0 Normal 1 2 Fast 3 3 ID 'abc' 'def' Total 3 4 Slow 0 0 Normal 0 1 Fast 3

浏览 0提问于2019-03-21得票数 2

回答已采纳

2回答

Python -比较整个数据框会得到与单个元素不同的结果

python、pandas、dataframe

我正在比较两个数据帧的列，我得到的结果与单独比较元素的结果不同。这适用于比较"None“。 import pandas as pd df1 = ["a", None, None, "b"] df1 = pd.DataFrame(df1) df2 = ["a", None, "c", "d"] df2 = pd.DataFrame(df2) print(df1[0] != df2[0]) #[1] is True, why ?? print(df1[0][1] != df2[0][1]) #[1] her

浏览 22提问于2021-01-15得票数 0

回答已采纳

1回答

Python3 -返回包含行级错误的丢失数据的CSV

python-3.x、pandas、csv

Python新手。我正在导入一个CSV，如果有任何数据丢失，我需要返回一个带有附加列的CSV，以指示哪些行缺少数据。我的同事建议我将CSV导入到一个数据帧中，然后创建一个带有"Comments“列的新数据帧，在其中填充对目标行的注释，并将其附加到原始数据帧中。我陷入了使用与"dfinput“匹配的正确行数填充新的dataframe "dferr”的步骤。我搜索过"pandas csv return error column where data is missing"，但没有找到任何与创建标记坏行的新CSV相关的内容。我甚至不知道提出的方法是不是最好

浏览 14提问于2019-05-28得票数 0

回答已采纳

2回答

用各列中最常见的非空项替换所有数据帧列中的空值和空值

python、pandas

我是Python的新手--我试图用该列中最常见的项替换Pandas数据帧中的一个列中的空值和空白值。但是我需要能够对所有列和数据帧的所有行都这样做。我编写了以下代码--但执行起来需要很长时间。你能帮我优化一下吗？谢谢Saptarshi for column in df: #Get the value and frequency from the column tempDict = df[column].value_counts().to_dict() #pop the entries for 'NULL' and '?' tempDict.p

浏览 0提问于2017-10-18得票数 0

回答已采纳

2回答

Pandas dataframe:带有inplace=True的set_index会返回一个NoneType，为什么？

python-3.x、pandas

如果我用"inplace=True“(跟在后面)重置我的Pandas数据帧的索引，它会返回一个类”NoneType“。如果我用"inplace=False“重置索引，它会返回包含新索引的数据帧。为什么？ print(type(testDataframe)) print(testDataframe.head()) 返回： <class 'pandas.core.frame.DataFrame'> ALandbouwBosbouwEnVisserij AantalInkomensontvangers AantalInwoners \ 0

浏览 2提问于2017-03-17得票数 13

回答已采纳

3回答

从CSV中抓取空行

python、pandas、csv、scrapy

在pandas的帮助下，我写了一个抓取表格并返回csv的抓取脚本。但是，最终的csv总是有几个空行，我必须手动删除它们。 import scrapy import pandas as pd class XGSpider(scrapy.Spider): name = 'expectedGoals' start_urls = [ 'https://fbref.com/en/comps/9/schedule/Premier-League-Scores-and-Fixtures', ] def parse(sel

浏览 44提问于2020-08-13得票数 0

回答已采纳

4回答

Pyspark:有没有等同于pandas info()的方法？

python、pandas、apache-spark、pyspark

在PySpark中是否有与pandas info()方法等效的方法？我正在尝试获取有关PySpark中数据帧的基本统计信息，例如:列数和行数、空值数、数据帧大小 pandas中的Info()方法提供了所有这些统计信息。

浏览 4提问于2017-06-08得票数 6

1回答

过滤python中不遵循regex模式的字符串

python、regex、pandas

我想从不遵循特定模式的pandas数据帧中过滤字符串。但是我只能得到一个空的Dataframe 我的代码 l = ['Dubai', 'St. Petersburg', 'Aachen', '21323', '123134', 'Klaus@facebook.com'] l = pd.DataFrame(l) pattern = re.compile("([A-Z])\w+|(\w[A-Z\u00E4-\u02AF])\w+", re.UNICODE) df = l.filter

浏览 10提问于2020-08-13得票数 0

1回答

如何在Python语言中比较熊猫DataFrame和None？

python、pandas、python-2.x、nonetype

如何将熊猫DataFrame与None进行比较？我有一个构造函数，它接受parameter_file或pandas_df中的一个，但不能同时接受这两个参数。 def __init__(self,copasi_file,row_to_insert=0,parameter_file=None,pandas_df=None): self.copasi_file=copasi_file self.parameter_file=parameter_file self.pandas_df=pandas_df 但是，当我稍后尝试将pandas_df与None进行比较时(即

浏览 0提问于2016-03-25得票数 29

回答已采纳

3回答

将Pandas中的变体类型插入Snowflake

python、pandas、snowflake-cloud-data-platform

我正在尝试将来自Pandas dataframe的数据插入到Snowflake中的一个表中，但我在找出如何正确执行此操作时遇到了麻烦。首先，我在Snowflake中创建了一个表，其中包含一些VARIANT类型的列。例如： CREATE OR REPLACE TABLE mydatabase.myschema.results( DATE date, PRODUCT string, PRODUCT_DETAILS variant, ANALYSIS_META variant, PRICE float )

浏览 0提问于2020-11-06得票数 4

3回答

如果csv为空，如何不执行read_csv

python、pandas

使用Python 2.7和Pandas 我必须解析我的目录并绘制一组CSV。如果CSV为空，脚本将中断并生成错误消息： pandas.io.common.EmptyDataError: No columns to parse from file 如果我将我的文件路径存储在 file_paths=[] 如何读取每个CSV并仅绘制非空的CSV？如果我有一个定义为df=[]的空数据帧，我会尝试以下代码 for i in range(0,len(file_paths)): if pd.read_csv(file_paths[i] == ""): print "

浏览 1提问于2017-02-10得票数 19

回答已采纳

1回答

如何在pandas dataframe中创建布尔型空列？

python、pandas、boolean

我想向给定的pandas数据帧添加一个空的布尔列。现在我已经这样做了(df是我的数据帧)： <code>A0</code> 然后，我的专栏如下所示： <code>A1</code> 这并不表示某些值可能丢失，并且该列实际上是空的。在pandas数据帧中获取boolean类型的空列是不可能的吗？

浏览 9提问于2019-03-28得票数 4

1回答

Pandas None值与空数据帧

pandas、dataframe、nonetype

对于pandas dataframe中的无数据，我有两个结果不同的查询。第一个查询： with self.connection as conn: query = f"""SELECT current_client_name, client_phone_number, profile, effective_date, effective_time, client_details.telegram_id, telegram_reference

浏览 11提问于2021-03-31得票数 0

回答已采纳

2回答

如何在一列由numpy数组组成的列上使用条件来索引数据帧？

python、pandas

我目前有一个pandas dataframe，它有一列数值是numpy数组。我正在尝试获取数据帧的行，其中列的值是一个空的numpy数组，但我不能使用pandas方法进行索引。下面是一个数据帧示例。 data = {'Name': ['A', 'B', 'C', 'D'], 'stats': [np.array([1,1,1]), np.array([]), np.array([2,2,2]), np.array([])]} df = pd.DataFrame(data) 我尝试只获取‘KeyEr

浏览 18提问于2021-08-24得票数 0

回答已采纳

1回答

如何处理None类型，同时将Pandas中的列拆分为两列

python、pandas、split

如何处理None类型的，同时将Pandas中的列拆分为两列我在数据帧中有一个名为“技术”的列。 Sample values = 'CALL VIA WEBSERVICES', 'EXPLOITATION VIA CAT TECHNIQUES', None, None None =空值我必须用‘VIA’将列‘技巧’分为'TECH_PREFIX‘和'TECH_SUFFIX’ 如果技术是空的，我希望对两个派生列都有空值。我使用了下面的代码，但是获取AttributeError：'NoneType‘对象时没有属性’拆分‘ df[['

浏览 1提问于2022-09-30得票数 0

2回答

在pandas中如何根据字符串列中的NaN进行过滤？

python、pandas

我使用的是pandas 0.18。我已经使用pd.read_csv()从CSV加载了一个数据帧，看起来CSV中的空单元已经加载为数据帧中的NaN。现在，我想找出特定列中具有空值的行数，但我正在努力。这是我的数据框架： ods id provider 0 A86016 NaN emis 1 L81042 463061 NaN 2 C84013 NaN tpp 3 G82228 462941 emis 4 C81083 NaN tpp 这是我从df.de

浏览 3提问于2016-05-11得票数 9

回答已采纳

1回答

为什么pandas.where()返回'None‘

python-3.x、pandas

我试图使用pandas.where()从数据帧中的列中删除负值。删除负值的最明显方法是在列上运行pandas.abs()。所以： import pandas as pd frame = pd.DataFrame([-1,-1,-3,-4,-5],columns=["amount"]) frame.amount = frame.amount.abs() 但是我想使用pandas.where()来尝试同样的方法。因此，我尝试了以下几点： frame.amount = frame["amount"].where(frame["amount"] &

浏览 0提问于2019-05-27得票数 2

回答已采纳

1回答

第一个的Pandas groupby不会跳过None值

pandas

我有一个包含None值的数据帧当我尝试使用first执行groupby时，它不会跳过这些值，并且无法在分组前将它们转换为空值 import numpy as np import pandas as pd df = pd.DataFrame(np.array([(1, 29),(1, 50),(2, None),(2, 12),(3,None)]),columns=['day', 'amount']) df.groupby('day')['amount'].first(dropna=True) 我得到错误_cython_agg_

浏览 183提问于2021-07-21得票数 0

1回答

如何在dask中执行group-by聚集后保留分区

python、pandas、dataframe、distributed、dask

在我的应用程序中，我使用groupby对dask数据帧执行聚合，并按某个id排序。但是，我希望聚合保持分区划分，因为我打算执行与其他相同分区的数据帧的连接。 import pandas as pd import numpy as np import dask.dataframe as dd df =pd.DataFrame(np.arange(16), columns=['my_data']) df.index.name = 'my_id' ddf = dd.from_pandas(df, npartitions=4) ddf.npartitions #

浏览 0提问于2018-02-17得票数 4

6回答

如果pandas DataFrame中的另一列不为null，则用另一列替换该列

python、pandas、dataframe

我正在使用Pandas处理数据帧，其中如果另一个列的值不为空，则必须替换列。我的数据帧是这样的： v_4 v5 s_5 vt_5 ex_5 pfv pfv_cat 0-50 StoreSale Clothes 8-Apr above 100 FatimaStore Shoes 0-50 StoreSale Clothes 8-Apr 0-50 DiscountWorld Clothes 51-100 Cl

浏览 101提问于2019-10-09得票数 9

1回答

一个3.6 gb的csv怎么能占据我所有64 gb的内存

python、pandas

我正在将csv加载到pandas数据帧中。csv是3.6 gb，我有64 gb的ram。当加载一个3.6 gb的文件时，内存怎么会超过64 gb？有没有更好的方法加载整个数据帧而不占用太多内存，或者可能是我的计算机出了什么问题。下面是我用来加载csv的代码 df = pd.read_csv('../input/ML_DATA.csv') 如果感兴趣，我也可以提供csv文件。以下是数据外观的示例 df = pd.read_csv('../input/ML_DATA.csv', nrows=10) df.shape -> (10, 4247) 这是一个

浏览 15提问于2021-09-06得票数 2

回答已采纳

1回答

“合并”具有不同列的数据框

python、pandas、dataframe、join、merge

我需要合并/连接两个数据帧，这两个数据帧有一些共同的列名，但也有不同的列名。例如： df1 = {A: hello, B: bye, C:good morning, F: nice} df2 = {A: hola, D: buenos dias, C: adiós, G: bad} 因此，我想要的结果数据帧如下： A |B |C |D |F |G ---------------------------------------------------- hello |bye |good morning |None

浏览 1提问于2019-03-15得票数 0

1回答

从现有数据帧的某些列创建新的pandas数据帧

python、pandas、dataframe

我已经阅读了将csv文件加载到pandas数据帧中，并希望对该数据帧进行一些简单的操作。我不知道如何根据从原始数据框中选择的列来创建新的数据框。我的尝试是： names = ['A','B','C','D'] dataset = pandas.read_csv('file.csv', names=names) new_dataset = dataset['A','D'] 我想用原始数据帧中的列A和D创建一个新的数据帧。

浏览 1提问于2017-07-11得票数 24

回答已采纳

2回答

如何在pandas中查找完整的空行

python-3.x、pandas

我正在处理一个数据集，其中我需要从数据集中查找完整的空列。示例： A B C D nan nan nan nan 1 ss nan 3.0 2 bb w2 4.0 nan nan nan nan 目前，我正在使用 import pandas as pd nan_col=[] for col in df.columns: if df.loc[df[col].isnull()].empty !=True: nan_col.append(col) 但这是在指定的列中捕获空值，但我需要捕获空行。 expected Answer: row [0,3]

浏览 84提问于2021-01-04得票数 2

1回答

考拉中的样本数据集

python、pandas、apache-spark、pyspark、spark-koalas

我有以下使用熊猫数据帧的代码。但是，当我将Pandas dataframe转换为Koalas并运行下面的代码时，我得到了错误"Function sample当前不支持指定要返回的项目的确切数量。请使用frac“ df.loc[df.sample(int(len(df) * .05)).index, 'distance'] = None 我试着使用下面的代码，它给了我随机的记录。但是，它如何获取数据帧中的所有记录，并将5%的记录的距离替换为空值 df.sample(frac=0.05，random_state=1)

浏览 20提问于2021-05-09得票数 0

1回答

Pandas数据帧到名称空间为None的嵌套字典

python、pandas、pyomo

我有一个像这样的pd数据帧，需要转换为无命名空间的字典和嵌套的数据帧？ pandas dataframe data = {None: { 'Periods': {None: 8759}, 'Years': {None: 20}, 'Scenarios': {None: 1}, 'Scenario_Weight': {1: 1}, }}

浏览 9提问于2020-09-13得票数 3

1回答

熊猫DataFrame -用旧日期替换Datetime列的空值

python、pandas

问题：如何将Pandas DataFrame中的datetime列的NULL值替换为类似于1900-01-01 00:00:00.000的内容我使用Pandas数据帧将大型数据文件导入到SQL Server 2019表中。下面的代码正确地将数值列的空值替换为0，将对象(字符串)列的空值替换为空字符串。但是它不会将datetime列的空值更改为1900-01-01 00:00:00.000。 import sqlalchemy as sq import datetime import pandas as pd import numpy as np ............ .........

浏览 5提问于2022-04-15得票数 0

1回答

如何在初始为零行的空pandas数据帧的行中赋值？

python-3.x、pandas

实际上，我正在尝试将付款收据列的记录转换为pandas数据帧。我逐行读取记录，确定哪些数据应该在哪一列中。所以我像这样创建了空的数据帧： df=pd.DataFrame df['QTY']=None df['Unit Price']=None 并尝试像这样填充那个空的df :在本例中，记录是"1X527,000“ i=0 buff=[] for line in df1.iterrows(): if 'X' in line: try: buff=[float(a.replace(',

浏览 35提问于2021-01-16得票数 0

回答已采纳

1回答

从pandas dataframe中删除空行

python、pandas、dataframe

我正在使用，并通过pandas数据帧读取它。我只需要使用paperAbsrtract列，它有一些缺失的数据。 filename = "sample-S2-records" df = pd.read_json(filename, lines=True) abstract = df['paperAbstract'] 因为abstract数据帧中有一些丢失的数据，所以我想删除那些空的行。因此，遵循，我将在下面这样做 abstract.dropna(how='all') 但这并不会删除这些空行。它们仍然在abstract数据帧中。我遗漏了什么？

浏览 0提问于2018-10-05得票数 3

2回答

在Pandas dataframe中将NaN更改为None

pandas

我尝试将pandas dataframe中的Nan替换为None。它使用df.where(df.notnull(),None)是可行的。下面是这个方法的线程。Use None instead of np.nan for null values in pandas DataFrame 当我尝试在另一个数据帧上使用相同的方法时，它失败了。新的数据帧如下A NaN B C D E，数据帧的打印输出如下： Unnamed: 1 Unnamed: 2 Unnamed: 3 Unnamed: 4 Unnamed: 5 Unnamed: 6 0 A NaN

浏览 221提问于2021-03-23得票数 2

1回答

从稀疏数据集中删除列和行

python、pandas

我有一个包含许多空值的稀疏Pandas数据帧，我希望对其进行过滤，以便在最终数据集中只保留具有超过10个浮点型条目的行和列。我尝试使用现有的代码片段，但似乎不起作用： df.drop([col for col, val = df.count(axis=1, numeric_only='float') if val < 10], axis=1, inplace=True) 谁能告诉我在我的数据帧中删除稀疏列的最好方法是什么？

浏览 16提问于2020-06-29得票数 3

1回答

用现有数据帧填充Pandas Dataframe，但保留形状

python、pandas、dataframe

我使用以下命令创建了一个Pandas数据帧： df = pd.DataFrame(index=np.arange(140), columns=np.arange(20)) 这给了我一个140行20列的空数据帧。我有另一个有120列和20行的数据帧，我称之为df2。我想添加这些行来填充df，但仍然保留140x20的形状。当我使用：newdf = df.append(df2)时，我得到了一个有280行和20列的数据帧。

浏览 18提问于2021-01-21得票数 0

回答已采纳

1回答

Pandas DataFrame中的反转行值

python、pandas、dataframe

我正在处理一个pandas数据帧，我希望在每一行中找到最远的非空值，然后颠倒这些值的顺序，并输出一个行值颠倒的数据帧，而不会在第一列中留下空值。本质上颠倒了列的顺序并将非空值向左移位。在： 1 2 3 4 5 1 a b c d e 2 a b c 3 a b c d 4 a b c 输出： 1 2 3 4 5 1 e d c b a 2 c b a 3 d c b a 4 c b a

浏览 43提问于2019-08-24得票数 2

1回答

通过同时使用iloc和布尔掩码来设置dataframe (在dataframe中的多个不同索引(行)值处的掩码)

python、pandas、dataframe、pandas-groupby、array-broadcasting

我想根据Nan值在不同的pandas数据帧中的位置，将pandas数据帧中的值更改为Nan。我想在数组中的多个位置执行此操作。因此，如果它位于索引(行)值相同的数组的开头，它就会起作用。如果我想在箭头中设置它的偏移量为20行，然后是40行，我该怎么做呢？ import pandas as pd import numpy as np df = pd.DataFrame({'A': list(range(0,100)), 'B': list(range(0,100))}) df2_null = df2.isnull() df[df2_null] = np.NaN

浏览 5提问于2018-08-21得票数 1

回答已采纳

2回答

SODA API过滤

python-3.x、socrata、soda

我试图通过他们的苏打API过滤通过纽约政府开放的数据库。我正在按照文档中的说明进行过滤，但是它返回了一个空的数据帧。 # noinspection PyUnresolvedReferences import numpy as np # noinspection PyUnresolvedReferences import pandas as pd # noinspection PyUnresolvedReferences from sodapy import Socrata clientNYgov = Socrata('data.ny.gov', None) 这就是我试图只在

浏览 4提问于2019-02-20得票数 2

1回答

在应用df.iloc()之后转换为'nan‘的数据格式值

python、pandas、dataframe

nan值在运行完之后，我遇到了一个问题: pd.DataFrame()，整个数据帧变成'nan‘(空的)。我不能再扭转这种局面了。我还分配了数据帧列的名称，但是它们的值也消失了： import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.read_csv('PuntaCapi.csv', header=None, sep='\n') df = df[0].str.split(',', ex

浏览 9提问于2020-04-04得票数 1

2回答

在Python pandas中使用`read_excel`读取空单元格

python、excel、pandas、dataframe

我正在使用Python pandas to read_excel。这就是我正在阅读的专栏。我的问题是read_excel没有将空单元格计算为单元格。当我使用df2=df1.iloc[0:30]时，我希望它包含那些空单元格，这样最后两个数据项就不会包含在我的数据框中(这是因为这些单元格在整个月中每天都被填充，所以这些空单元格将一直存在到这个月的最后一天)。如何确保pandas read_excel在其数据帧中包含这些空单元格？

浏览 1提问于2017-11-30得票数 1

2回答

从dict构造数据帧并重新标记列？

python-3.x、pandas、dataframe

我试图从字典+重新标记列来构造一个数据帧，但是我得到了一个空的数据帧。请告诉我哪里做错了： import pandas as pd pd.DataFrame({'Name' : ['Ankit', 'Aishwarya', 'Shaurya', 'Shivangi'], 'Age' : [23, 21, 22, 21], 'University' : ['BHU', 'JNU', 'DU

浏览 21提问于2021-08-18得票数 0

回答已采纳

1回答

按字母顺序将数据帧列表按这些数据帧的名称排序。

python、pandas、list

我有一长串名为Pandas的数据帧。我的目标是按照数据帧的名称按字母顺序排列这个列表。这是一个MWE： import pandas as pd df_1 = pd.DataFrame(None) df_1.name = 'a' df_2 = pd.DataFrame(None) df_2.name = 'b' df_3 = pd.DataFrame(None) df_3.name = 'c' df_list = [df_2, df_1, df_3] 现在，我的目标是对df_list进行排序，以便我得到一个新的列表[df_1, df_2,

浏览 0提问于2020-03-20得票数 1

回答已采纳

1回答

Panda追加并合并重新排序数据帧吗？

python、pandas、sorting、dataframe

我使用python pandas包创建了一个空数据帧(df1)，其中只包含以下列: var1、var2、var3 我还有另一个数据帧(df2)，它看起来像这样:列: var 2，var1，var3值: 1，2，3 当我向df1追加df2时，数据帧中列的顺序发生了变化。我尝试使用sort_values和sort重新排序数据帧和旧的列列表，但不起作用。有人知道我怎么解决这个问题吗？我使用的是python版本2.7

浏览 5提问于2018-01-18得票数 0

回答已采纳

2回答

将python dataframe传递给对象并更改dataframe

python、pandas、dataframe

我是python的新手，我正在尝试将参数(dataframe)传递给函数，并通过读取excel文件来更改参数(dataframe)的值。(假设我已经导入了所有必要的文件) 我注意到python在这里没有通过引用传递参数，并且我最终没有初始化/更改数据帧。我读到python是通过对象引用传递的，而不是通过值或引用。但是，我不需要更改相同的数据帧。输出为: class 'pandas.core.frame.DataFrame'> from pandas import DataFrame as df class Data: x = df @staticmeth

浏览 3提问于2015-12-08得票数 1

2回答

将日期列与NAT(null)从pandas保存到parquet

python-3.x、pandas、parquet、amazon-athena、pyarrow

我需要将可为空的整型日期值('YYYYMMDD')读取到pandas，然后将此pandas数据帧保存为Date32Day格式，以便Athena Glue Crawler分类器将该列识别为日期。下面的代码不允许我将列保存到pandas中的parquet： import pandas as pd dates = [None, "20200710", "20200711", "20200712"] data_df = pd.DataFrame(dates, columns=['date']) data_df['

浏览 32提问于2020-07-14得票数 3

0回答

Pandas合并/更新数据帧

python、pandas

我有两个pandas数据帧，例如： un do 76 0 1 32 2 3 12 0 2 56 0 1 78 2 3 6 4 4 和 un do 76 0 5 32 2 3 12 1 2 56 0 1 78 2 3 6 4 4 34 3 3 78 h 3 23 2 -34 因此，它们表示以前的数据和实际数据。我需要连接所有不同的行。我正要自杀，但是我不能用pandas的方式加入他们。我想得到这样的数据帧： un do chan 76 0 5 changed 7

浏览 4提问于2018-07-13得票数 0

回答已采纳

1回答

如何在不转换为潘达的情况下使用极地？

python、plotly-python、python-polars

我想用极地代替潘达，但我无法找到如何在没有转换成潘达的情况下使用极地。我想知道是否有办法把Pandas完全排除在这个过程之外。考虑以下测试数据： import polars as pl import numpy as np import plotly.express as px df = pl.DataFrame( { "nrs": [1, 2, 3, None, 5], "names": ["foo", "ham", "spam", "egg", Non

浏览 11提问于2022-04-04得票数 2

回答已采纳

2回答

为什么pd.concat会将结果类型从int更改为object？

python、pandas、dataframe、types、concat

我正在使用Pandas解析几个csv文件，并将它们连接成一个大数据帧。然后，我想groupby并计算mean()。下面是一个示例数据帧： df1.head() Time Node Packets 0 1 0 0 2 1 1 0 4 1 2 0 6 1 3 0 8 1 4 0 df1.info(verbose=True) <class 'pandas.core.frame.DataFrame'> Int64I

浏览 0提问于2018-12-25得票数 4

1回答

如何重新建立索引以合并两个数据帧？

python、pandas

我正在尝试合并两个都有'product_desc‘列的数据帧。我使用的是Pandas 0.13和Python 2.7。 small_df = pd.merge(small_df, linregress_df, on = 'product_desc', how = 'left') 但是，我得到以下错误： pandas.core.index.InvalidIndexError: Reindexing only valid with uniquely valued Index objects 我将两个数据帧导出到平面文件中，其中的索引或其他列都没有重复值。我需

浏览 8提问于2014-06-09得票数 2