pandas nat_Pandas dataframe将NaN和NaT_Pandas用NaT替换0值 - 腾讯云开发者社区

、、

由于pandas 0.23.4完全不推荐pandas._libs.tslib.NaTType，所以我必须使用pandas.NaT，如0.23.2 changelog中所示， The type import pandas.tslib.NaTType is deprecated and can be replaced by using type(pandas.NaT) 但当我尝试下面的代码时， from pandas import NaT val_type = type(val) if issubclass(val_type, NaT): return 'NaT' 我有个错

浏览 1提问于2018-11-20得票数 3

回答已采纳

1回答

如何在Python中创建“NaT”？

、

我需要用Python创建一个"NaT“( float('NaN')的模拟，但随时间而来)。这可以在Python或使用datetime库中本地完成吗？多么? 我知道numpy和pandas可以这样做(或者类似的事情)，但是我觉得如果我需要为此导入一个库，那么应该是datetime，而不是numpy或pandas。

浏览 11提问于2022-01-27得票数 6

1回答

为什么熊猫NaT支持date()方法，而不支持time()方法？

、

我似乎无法理解下面的行为，为什么一种方法会崩溃，而另一种则不会？ In [1]: import pandas as pd In [2]: pd.NaT Out[2]: NaT In [3]: pd.NaT.date() Out[3]: Na

浏览 5提问于2020-02-14得票数 1

回答已采纳

1回答

如何在Pandas DataFrame中合并/覆盖2列

、、

我的数据框中有两列。我想合并/覆盖这些列。两列： Column1 Column2 0 NaT NaT 1 2019-07-17 11:33:22 NaT 2 NaT NaT 3 NaT 2018-05-24 10:00:48 期望的结果： NewColumn 0 NaT 1 2019-07-17 11:33:22 2 NaT 3 2018-05-24 10:00:48 NaT类型： type(df['Column1'][0]) 输出： pandas._libs.tslibs.nattype.NaTType 日期类型： type(df['

浏览 2提问于2019-08-03得票数 0

2回答

如何使Pandas将包含NaT的列从timedelta转换为datetime？

、、、

我有一个熊猫数据栏，它的类型是timedelta64[ns]，我想把它转换为ot datetime64[ns]。 pd.to_datetime()函数就是这样做的，它过去一直在工作，但现在看来已经失败了。我认为这可能与API的怪癖有关，而这种怪癖已经在我的雷达范围内消失了。目前，它在以下方面失败： Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python3.7/site-packages/pandas/core/

浏览 0提问于2020-05-19得票数 1

回答已采纳

2回答

熊猫DataFrame错误“元组指数超出范围”

、、、

我有一个问题，用当前版本的熊猫，向后填写一个粗大的日期向量。相同的代码适用于早期版本。以下是我的问题所在：旧版本(0.7.3)起作用 C:\WINDOWS\system32>pip show pandas Name: pandas Version: 0.7.3 Summary: Powerful data structures for data analysis and statistics Home-page: http://pandas.pydata.org Author: The PyData Development Team Author-email: pydata@googl

浏览 0提问于2017-04-02得票数 2

回答已采纳

2回答

在pandas数据帧中，NaT值不会被NaT替换

、

我正在尝试用NaNs替换Pandas数据帧中的NaT值，如下所示 df = df.replace([pd._libs.tslibs.nattype.NaTType], np.nan) 但之后我又检查了一下 print(df["col"]) print(type(df["col"][0])) print(isinstance(df["col"][0], pd._libs.tslibs.nattype.NaTType)) 并获取 0 NaT 1 NaT 2 NaT 3 Na

浏览 168提问于2019-09-13得票数 0

2回答

当您需要根据另一列更新列时，可以选择在Pandas中循环

、、、、

我有一个带有文本日期的Pandas dataframe，希望转换为datetime。问题是，我的一些文本日期是糟糕的数据，因此无法转换。在日期无法转换的情况下，我希望将Error列更新为True值，并将Date列设置为None，以便以后可以将其添加到格式化为datetime的数据库列中。这是一个简化的例子。我的dataframe可能有100万行和多个日期列，这需要完成，所以我需要一种更快的方法。我知道典型的惯例是避免使用Pandas循环，但我无法找到绕过它的方法。 import pandas as pd import numpy as np import datetime data = 1

浏览 0提问于2016-08-24得票数 3

回答已采纳

2回答

我需要在date列上使用max()方法，但我没有得到它。因为列将以字符串的形式出现。有人能帮我吗？

、、、、

我用熊猫来读Dataframe()。在转换到datetime64之后，我需要在datetime列上使用max()方法。但问题是我无法改变：(. 当我去阅读我的Excel时，它以2020-03-10T00:00:00.000Z的方式呈现日期。我需要转换为datetime64类型，但它正在以字符串的形式读取。下面的例子如下： df['Date'].dtype 输出: dtype('O') df['Date'] = pd.to_datetime(df['Date'] ) 输出：错误： ------------------------

浏览 16提问于2022-07-22得票数 0

回答已采纳

1回答

熊猫不能正确处理时间戳栏吗？

、、

默认情况下，当两个dataframes被连接(使用concat)时，concat将创建一个新的dataframe，并将两者的列合并在一起，在结果中设置nan中任何缺失列的值。例如..。 import pandas as pd a = pd.DataFrame({'A':range(5), 'B':range(5)}) b = pd.DataFrame({'A':range(5)}) pd.concat([a , b], sort=False) A B 0 0 0.0 1 1 1.0 ... 3 3 NaN 4

浏览 0提问于2018-12-06得票数 5

回答已采纳

1回答

在熊猫中替换错误输入的日期

、

我有一个CSV数据集，然后导入到Pandas中。只是有几个日期输入错误，例如17/12/0089 (注:这是dd/mm/yyyy)，有时是12/11/1898，这是不对的，因为这个日期是很久以前的。我需要比较日期，所以我用： df_to_add['DOB'] = pd.to_datetime(df_to_add['DOB'], dayfirst=True) 但是，当遇到这些不正确的日期时，我得到消息pandas.tslib.OutOfBoundsDatetime:超出范围纳秒时间戳: 964-11-16 00:00:00 如何将所有错误输入的日期替换为

浏览 2提问于2016-12-12得票数 2

回答已采纳

1回答

熊猫源代码导入多个模块

、、、、

我看了熊猫的源代码，我发现下面的声明有点奇怪： from pandas._libs import NaT, groupby as libgroupby, iNaT, lib, reduction 它似乎将Nat和groupby作为多个模块(libgroupby、iNaT、lib、还原)导入，这两个库是两个库。我去了pandas._libs库，但没有找到任何名字为NaT的模型。确实有一个groupby.pyx，我假设它是groupby库？导入库的数量是否比导入的模块少？这是如何工作的呢？根据我过去的理解，我们可以做import a as b，但是不能做import a as b, c

浏览 0提问于2019-02-05得票数 1

回答已采纳

2回答

按日期从csv列中打印最早和最新的csv日期。

、、、、

更新的问题我试图使用Python (最好是Pandas )在csv的两个日期列中对日期进行排序。对于第一个，我想得到最古老的约会。对于第二个，我想得到最近的一个。我的静态列表代码工作得很好： timestamps = ['08/04/2017', '08/09/2017', '08/03/2017'] sortedDates = timestamps.sort(key=lambda x: time.mktime(time.strptime(x,"%m/%d/%Y"))) 01)首先加载数据 for row in csv.rea

浏览 4提问于2017-10-19得票数 1

回答已采纳

1回答

从Datetime操作创建TimeDeltas错误

、、、、

我看过其他几个相关的问题-- 、和，但没有一个问题与我完全相同。我使用的是Pandas版本0.16.2。我在一个datetime64ns类型的Pandas中有几列 In [6]: date_list = ["SubmittedDate","PolicyStartDate", "PaidUpDate", "MaturityDate", "DraftDate", "CurrentValuationDate", "DOB", "InForceDate"] In [11]

浏览 4提问于2015-08-21得票数 4

回答已采纳

2回答

将两只熊猫的数据与日期变量合并

、、

我想根据普通的pandas dataframes变量合并两个date。下面是我的代码 import pandas as pd data = pd.DataFrame({'date' : pd.to_datetime(['2010-12-31', '2012-12-31']), 'val' : [1,2]}) datarange = pd.DataFrame(pd.period_range('2009-12-31', '2012-12-31', freq='A'), columns =

浏览 2提问于2022-05-20得票数 1

回答已采纳

1回答

如何获取熊猫np.datetime64中包含无效DataFrame日期的所有行

、、、

我有一个熊猫DataFrame，它有一个列"date_col“的日期字符串。我希望对列中的日期字符串将抛出一个DataFrame (如果由numpy.datetime64解析)的所有行进行numpy.datetime64筛选。我要找的东西是： bad_rows = df[numpy.datetime64(df["date_col"]) is False] 除了检查False之外，我还想检查是否引发了ValueError。有什么方法可以在熊猫DataFrame中进行这种过滤吗？我试着做以下几件事： df = pd.DataFrame({"date_col"

浏览 0提问于2015-12-10得票数 2

1回答

创建一个包含numpy nans和熊猫NaTs的系列默认都是熊猫NaTs；这是有意的吗？

、、

熊猫版本1.0.3 例如..。 import pandas as pd import numpy as np pd.DataFrame([pd.Series(dict(a=pd.NaT, b=np.nan))]) 某种令人毛骨悚然的类型推断给出了a和b作为NaT。 a b 0 NaT NaT 当然，然后将后续系列中的实际浮点数添加到'b‘中，就会使它具有dtype对象，而不是您可能假设的d类型浮点数。在我看来，这种行为就像个窃听器，但是吗？

浏览 0提问于2020-06-24得票数 0

回答已采纳

1回答

不能`。tz_localize()`到欧洲时区

、

我正在创建一个date_range dates = pd.date_range(start="2022-01-01", end='2022-06-25', freq="30min") 我想按照这个的说明设置一个时区 dates.tz_localize('Europe/Warsaw') --------------------------------------------------------------------------- NonExistentTimeError Traceba

浏览 5提问于2022-06-25得票数 0

2回答

在Pandas数据帧中用NaT替换date

、

我得到了一个数据帧，其中有一个datetime64类型的列。在此列中，有几行日期为1999-09-09 23:59:59，而它们实际上应该表示为missing dates NaT。有人决定用这个特定的日期来表示丢失的数据。现在，我希望将这些日期替换为NaT (Pandas缺少的日期类型)。另外，如果我使用NaTs在此列上执行操作，例如 df['date'] - df['column with missing date'] Pandas会忽略丢失的日期并维护这些行的NaT吗?还是会抛出一个错误，比如Java语言中的空指针异常。

浏览 8提问于2014-07-17得票数 10

回答已采纳

1回答

对包含datetime列的Pandas DataFrame进行筛选会引发错误

我正在设置一个包含两个日期时间列的DataFrame，如下所示： range1 = Series(date_range('1/1/2011', periods=50, freq='D')) range2 = Series(date_range('2/5/2011', periods=50, freq='D')) df1 = DataFrame({'a': rng1, 'b': rng2}, dtype='datetime64[D]') 奇怪的是，询问df1的数据类型会给出以下结

浏览 1提问于2013-04-10得票数 3

回答已采纳

1回答

pandas.NaT的字符串表示有时是"nan“而不是"NaT”。

、

当我将pandas.NaT转换为字符串时，结果有时是"nan"而不是"NaT"。我很抱歉，但我无法在一个MWE与示例数据再现这一点。也许这取决于DataFrame的大小？我正在使用pandas==1.3.0。我创建了一个包含日期时间对象的列的字符串表示形式，其中一些对象是NaT，如下所示： df['X'] = df.ZEIT_VON.apply(str) 让我们看看结果 >>> df_roh.loc[60:63, ['ZEIT_VON', 'X']] ZEIT_VON X 60

浏览 4提问于2022-02-16得票数 0

回答已采纳

1回答

如何将datetime的列格式化为相同的格式

、、

我有一个日期格式为%Y-%m-%d %H:%M:%S或%Y-%m-%d的数据帧 ... 87986 1979-06-18 00:00:00 87987 1979-06-18 00:00:00 87988 1987-03-18 87989 1983-11-01 ... 我想以相同的方式对它们进行格式化。我试过了： df['birthdate']=pd.to_datetime(df['birthdate'].astype(str), format='%Y-%m-%d') 但我还是回来了： -

浏览 19提问于2020-02-13得票数 1

回答已采纳

1回答

带有日期和NaT的熊猫系列累积函数

、

这可能是一个已知的限制，但当Pandas系列包含NaT的时候，我很难计算出该系列的累积最小值。有什么方法可以让这个系列工作吗？下面是简单的例子： import pandas as pd s = pd.Series(pd.date_range('2008-09-15', periods=10, freq='m')) s.loc[10] = pd.NaT s.cummin() ValueError: Could not convert object to NumPy datetime

浏览 1提问于2014-12-02得票数 1

回答已采纳

3回答

让Pandas NaT像NaN一样传播

、、、

在面对NaT时，我正在尝试取两个包含datetime64数据的Pandas Series对象的最小值和最大值。如果数据类型是float64，那么np.minimum和np.maximum的工作方式就是我想要的。也就是说，一旦比较中的任何元素为NaN，该比较的结果就是NaN。例如： >>> s1 0 0.0 1 1.8 2 3.6 3 5.4 dtype: float64 >>> s2 0 10.0 1 17.0 2 NaN 3 14.0 dtype: float64 >>> np.maxim

浏览 0提问于2018-11-03得票数 4

1回答

熊猫转换为日期时间，日期解析器错误

、、

我正在尝试将两列组合在一起:一列包含日期，另一列与时间合并为一个日期时间列。 df: date time ---- ----------- ------ 0 08 Sep 2021 00:00 1 08 Sep 2021 00:00 2 08 Sep 2021 00:00 3 08 Sep 2021 00:05 4 08 Sep 2021 00:30 我的做法是： df['datetime'] = df['date'] + ' ' + df['time&#

浏览 4提问于2021-09-09得票数 0

回答已采纳

1回答

Excel不同格式的日期如何在Pandas数据中排序

、、

我有一组数据，希望使用Pandas进行分析，但问题是数据集中的数据格式不一致。甚至我也按格式单元格更改了日期，但仍然将一些日期存储为文本。我在Python中得到的东西是：

浏览 0提问于2021-08-14得票数 2

回答已采纳

1回答

取无遗漏日期的最大值

、、、、

我有一个带有nan和date值的Pandas DataFrame (浮点和日期时间的混合)： import datetime import numpy as np import pandas as pd df = pd.DataFrame({"A": [np.nan, datetime.date(2016, 1, 2), np.nan], "B": [datetime.date(2016, 1, 1),

浏览 2提问于2016-11-16得票数 1

回答已采纳

1回答

熊猫用NaT取代NaN

、

我有一个包含一些NaTs的系列，需要用NaTs替换它们。我该怎么做呢？下面是一个简单的例子，我已经尝试过了： >>> s = pd.Series([np.NaN, np.NaN]) >>> s.fillna(pd.NaT) 0 NaN 1 NaN dtype: float64 >>> s.replace(np.NaN, pd.NaT) 0 NaN 1 NaN dtype: float64 >>> s.where(pd.notnull(s), pd.NaT) 0 NaN 1 NaN dtype:

浏览 0提问于2016-05-11得票数 9

1回答

Pandas聚合:如何从一个列生成多个新列，反之亦然

、、、、

我正在对以下Pandas数据帧进行预处理。 ? 对于相同的assetid，我希望找到第一个和最后一个AccountingDate，并基于下面的isSold逻辑创建另一个列AccountingDate。 if AccountingDate of all deals for same assetid is Null: isSold = False else: isSold = True 同时，我想找出每个assetid的第一个和最后一个AccountingDate的Amount。一般来说，Pandas中的groupby聚合是这样的： df.groupby('as

浏览 11提问于2019-02-17得票数 1

1回答

熊猫to_datetime无法将字符串解析为日期和返回字符串

、、、

我有一个Series s 10241715000 201709060 11202017 112017 111617 102417 110217 1122018 我尝试使用以下代码将s转换为datetime； pd.to_datetime(s.str[:7], format='%-m%d%Y', errors='coerce') 但是它返回了s，因为它没有进行任何转换，我期待类似的事情， NaT NaT 2017-01-20 NaT NaT NaT NaT 2018-01-12 format是根据strft

浏览 0提问于2018-10-31得票数 1

回答已采纳

1回答

pd.read_csv在设置parse_date =[‘列名’时未正确解析日期/月字段]

、、、、

我在尝试通过parse_dates of pandas.read_csv()解析少数几个日期时，遇到了这个错误。在下面的代码片段中，我试图解析格式为dd/mm/yy的日期，这将导致不正确的转换。在某些情况下，日期字段被视为月份，反之亦然。为了保持简单，在某些情况下，dd/mm/yy被转换为yyyy-dd-mm而不是yyyy-mm-dd。案例1： 04/10/96 is parsed as 1996-04-10, which is wrong. 案例2： 15/07/97 is parsed as 1997-07-15, which is correct. 案例3： 10/12/

浏览 1提问于2016-05-03得票数 6

回答已采纳

1回答

尝试仅使用[HH:DD]转换Pandas列，但返回[YYYY-DD-MM HH:MM:SS]

、、、

我有一个pandas列，时间格式为HH:DD，如下所示。我想把字体改成一个时间，用谷歌搜索一下，看看周围；我应该使用to_timedate。 0 NaN 1 06:56 2 NaN 3 NaN 4 NaN Name: Time, dtype: object 我拼凑了这段代码来做这件事： df['Time'] = pd.to_datetime(df['Time'], format= '%H:%M', errors='coerce') 但现在我得到的结果是： 0

浏览 10提问于2019-07-08得票数 3

回答已采纳

2回答

在多个条件下合并来自多个数据帧的数据

、、、、

我希望合并多个数据格式，但只有在键匹配和日期范围在df1中的“df1”日期范围的90天之内的情况下。我希望保留df1中的所有行，并且只合并来自df2、df3等的额外行，只要它们与键匹配并在日期范围内。注意:首先合并dfs，然后考虑日期范围条件对我不起作用。我首先使用了这种方法，但是合并成功的条件很多，但是由于日期范围超出了限制，所以脚本删除了行。我需要以某种方式保留df1中的所有行。 -这个问题是相似的，但它似乎合并，然后应用这些条件。我认为更好的方法是应用条件，然后在满足条件的情况下合并。不过，我愿意听取你的建议。 DataFrames： a = {'Key': [100

浏览 12提问于2017-12-16得票数 2

回答已采纳

1回答

用NaT从数据帧中提取Pandas多索引

、、、、

我正在使用pandas来解析Excel电子表格。该电子表格有几个工作表，每个工作表如下所示。请注意，每列具有对应于不同日期的值，并且具有不同的长度：无论出于什么原因，当pandas解析Excel电子表格时，第一个工作表将解析日期的第一列作为索引(即使index_col参数已指定为None)。这仍然是可管理的。但是，在其他工作表中，它将索引解析为多索引：我想要做的是最终重建数据帧，以便它们都共享一个公共的日期索引，并且对于任何没有值的日期都用NaN填充。但是，我似乎无法从多索引中提取日期来开始这个过程。我尝试在0级和1级的数据帧上执行reset_index()，但它抱

浏览 2提问于2016-02-25得票数 1

1回答

带有自动数据解析的dicts中的DataFrame

、、、

我正在创建一个Pandas DataFrame从序列的dicts。这些数据集很大，而且有点异构。有些字段是日期。我想自动检测和解析日期字段。这可以通过 df0 = pd.Dataframe.from_dict(dicts) df0.to_csv('tmp.csv', index=False) df = pd.read_csv('tmp.csv', parse_dates=True) 我想找一种更直接的方法来做这件事。

浏览 0提问于2019-05-10得票数 2

回答已采纳

1回答

用pandas.to_datetime转换None值是不可预测的

、、

为什么pandas要以不同的方式将None值转换为to_datetime (不可预测的)和to_numeric (可预测的)？ import pandas as pd VALUE = None print(pd.to_datetime(VALUE)) print(pd.to_numeric(VALUE)) print(pd.__version__) 返回 None nan 0.23.4 为什么不pd.to_datetime(None) is pd.NaT？

浏览 2提问于2018-10-09得票数 3

回答已采纳

3回答

熊猫单元测试:如何断言NaT和NaN值相等？

、、、、

在NumPy和Pandas，nan != nan和NaT != NaT。因此，当在单元测试期间比较结果时，我如何断言返回的值是这些值之一？一个简单的assertEqual自然会失败，即使我使用pandas.util.testing。

浏览 3提问于2015-09-11得票数 5

回答已采纳

3回答

Numpy:检查值是否为NaT

、

nat = np.datetime64('NaT') nat == nat >> FutureWarning: In the future, 'NAT == x' and 'x == NAT' will always be False. np.isnan(nat) >> TypeError: ufunc 'isnan' not supported for the input types, and the inputs could not be safely coerced to any supported

浏览 316提问于2016-07-22得票数 61

回答已采纳

2回答

单行中的两个时间戳字符串以转换datetime

、、、

csv包含一些列值低于时间戳字符串类型，如何将其转换为pandas中最近日期的日期时间... 2019-09-27 09:15:422019-09-28 14:55:182019-09-26 04:54:12 case[date]=case[date].apply(lambda x: pd.to_datetime(x,errors = 'coerce',infer_datetime_format=True)) 但执行时出现以下错误 ('offset must be a timedelta strictly between -timedelta(hours=24)

浏览 53提问于2019-09-30得票数 1

回答已采纳

4回答

用空值处理在pandas.read_csv中解析日期？

、、

考虑以下构成的CSV： from io import StringIO data = """value,date 7,null 7,10/18/2008 621,(null)""" fake_file = StringIO(data) 我想使用pandas.read_csv读取这个文件，用na_values参数处理空值，用parse_dates和date_parser处理日期。 import pandas as pd date_parser = lambda c: pd.datetime.strptime(c, '%m/%d/%Y&

浏览 3提问于2017-10-03得票数 8

回答已采纳

1回答

熊猫日期计算

、、

我刚刚开始学习python，并试图让它为我的工作做一些有用的事情。我的目标是从excel文件中读取具有以下格式数据的表，并对其进行计算:这是员工工作天数的服务记录： Day from Day to 01/09/12 31/08/13 04/07/15 10/11/15 11/11/17 在最后一行中，未指定日期，并将将其视为当前日期。我写了以下文章： import pandas db=pandas.read_excel('earnedleaves.xls') from datetime import datetime def Calc_Days_W

浏览 0提问于2018-04-08得票数 1

回答已采纳

1回答

将Pandas系列对象的所有格式不一致的字符串元素强制转换为datetime.time类型

、、、

我有一个Pandas对象(df.Lateness)，其中每个元素都是字符串，但格式不一致： 0 00:01:48 1 00:07:38 2 00:04:44 3 00:12:18 4 0 5 0 6 00:01:36 7 0 8 0 9 0 我希望将这些转换为datetime.time类型，其中0's以%H:%M:%S格式表示00:00:00，但当我执行以下代码时： pd.to_datetime(df.Lateness, format = '%H:%

浏览 0提问于2018-08-31得票数 2

回答已采纳

1回答

如何有条件地计算Python pandas数据帧中的日期间隔？

、、

我有一个Python Pandas dataframe，它由timedelta64类型的dueDate字段组成。我在dataframe中还有一个列，表示任务是否完成。 from datetime import date df = pd.DataFrame(data = [pd.date_range('1/1/2017', periods = 6), [True if i%2 == 0 else False for i in range(6)]]).T df.columns = ['dueDate', 'completed'] 如果任务未完

浏览 4提问于2017-01-07得票数 0

回答已采纳

1回答

在读取excel文件时，有没有办法在pandas中标记错误的行？

、

pandas.read_csv有(warn, error)错误的行方法。我看不到给pandas.read_excel的。有理由吗？例如，如果我想读取一个excel文件，其中的一列应该是一个datetime，而pandas.read_execl函数在一行或几行中遇到了int或str。我需要自己处理这件事吗？

浏览 10提问于2020-09-14得票数 1

回答已采纳

2回答

通过检查多列上的条件来创建新变量

、

我刚开始学习Python，刚刚开始学习pandas。我希望通过检查多列上的条件来创建一个新变量。 import pandas as pd import datetime import numpy as np 假设我有以下数据 d = {'CUSTNO':[123, 124, 125, 126], 'STATUS':['ACTIVE', 'NO', 'CANCEL', 'ACTIVE'], 'CANCEL':[np.nan, '2019-08-09', np.nan,

浏览 0提问于2019-09-06得票数 1

回答已采纳

2回答

熊猫选择发生日期时间错误的行

、、

我需要在dataframe ()中对执行验证，检查date是否有效。如果date无效(例如，pd.to_datetime不能解析- 0107-01-06 )，我需要用Yes填充Fail列。我对包含日期的列进行了子集，并能够识别包含无效日期的列并将它们添加到dict中，但还没有弄清楚如何返回特定的行。我对其他方法是开放的，但我需要使用pandas，并以一个Fail列结束，以指示该行，我计划在该行上筛选最终数据(一个dataframe包含日期错误的行，另一个不包含错误)。有关完整代码，请参阅pastebin链接 # insert empty Fail column to identify d

浏览 0提问于2019-08-07得票数 3

回答已采纳

1回答

TypeError:无法识别的值类型：

、

我目前正在尝试将Pandas列转换为datetime列，以便找出三组日期列之间的差异(1.酒店搜索日期，2.入住日期，3.离开日期) 以下是它的外观示例： >>> print(df2) date Arrive Depart 20180516 20180516 20180518 6172018 6242018 20180515 20180519 20180517 20180515 6052018 6062018 20180517 8132018 8162018 201805

浏览 0提问于2018-05-28得票数 14

回答已采纳

1回答

从熊猫框架的系列数据中找出数值和日期。

、、

我正在用蟒蛇熊猫写一个脚本，在那里我必须找到第一个落点的值和日期，然后在那里达到最大值，然后下降值和日期。再一次，它是下跌点值和日期。在下面给出的图表中，我标记了红色的圆圈，我想从那里得到日期和值。我有一个脚本，但我需要提到日期获得的价值，但我想提取日期和价值，任何帮助将不胜感激。代码： import pandas as pd df = pd.read_csv(r"D:\Data\2015_20.csv", parse_dates=["Date"]) df = df[["Date", "Mean"]] df = df.set_

浏览 5提问于2021-02-26得票数 2

回答已采纳

1回答

延迟日期时间索引列的Pythonic方法

、、

我有各种类型的DateTime指数的数据(可以是每周、每月、年度数据)。我想要生成其他列的滞后值的列。我从电子表格中导入这些数据，而不是在python中生成datetime索引。我很难找到这种“琵琶”的方法。我想，如果我使用Pandas的日期时间功能，在出现奇怪或异常数据的情况下，延迟可能会更健壮。我做了一个看上去可行的玩具例子，但在我的现实世界中却失败了。正确工作的玩具示例(创建一个具有前一个月“foo”值的新列) rng = pd.date_range('2012-01-01', '2013-1-01', freq="M") toy2

浏览 1提问于2016-05-29得票数 5

2回答

将日期列与NAT(null)从pandas保存到parquet

、、、、

我需要将可为空的整型日期值('YYYYMMDD')读取到pandas，然后将此pandas数据帧保存为Date32Day格式，以便Athena Glue Crawler分类器将该列识别为日期。下面的代码不允许我将列保存到pandas中的parquet： import pandas as pd dates = [None, "20200710", "20200711", "20200712"] data_df = pd.DataFrame(dates, columns=['date']) data_df['

浏览 32提问于2020-07-14得票数 3