如何在python中使用Pandas dataframe按特定日期和时间进行过滤_使用python对.txt文件中的行进行按日期和按时间排序_在使用Python/Pandas的csv中按小时分组，其中包含开始时间和结束时间日期时间列 - 腾讯云开发者社区

python、pandas、dask

我有一个用dd.read_csv("./*/file.csv")创建的dataframe，其中* glob是每个日期的一个文件夹。例如，在级联的数据帧中，我想过滤掉时间子集，比如我将如何使用pd.between_time("09:30", "16:00")。因为Dask对索引的内部表示没有Pandas的DateTimeIndex那样好的特性，所以我已经成功地过滤了我通常在Pandas中的表现。除非求助于一个简单的映射函数/循环，否则我无法让它在Dask中工作。由于分区是按日期划分的，也许可以通过转换为Pandas dataframe然后返回到

浏览 6提问于2020-06-18得票数 3

1回答

当列介于两个值之间时，汇总Pandas数据

python、pandas

在python中，我有一个Pandas dataframe (df)，可以在下面进行复制。 import pandas as pd data = [['2021-09-12', 'item1', 'IL', 5], ['2021-09-12', 'item2', 'CA', 7], ['2021-08-13', 'item2', 'CA', 8], ['2021-06-12', 'item3', 'NY'

浏览 1提问于2021-09-21得票数 1

回答已采纳

2回答

如何在一列由numpy数组组成的列上使用条件来索引数据帧？

python、pandas

我目前有一个pandas dataframe，它有一列数值是numpy数组。我正在尝试获取数据帧的行，其中列的值是一个空的numpy数组，但我不能使用pandas方法进行索引。下面是一个数据帧示例。 data = {'Name': ['A', 'B', 'C', 'D'], 'stats': [np.array([1,1,1]), np.array([]), np.array([2,2,2]), np.array([])]} df = pd.DataFrame(data) 我尝试只获取‘KeyEr

浏览 18提问于2021-08-24得票数 0

回答已采纳

1回答

如何在熊猫中设置本地化的日期时间列

python、pandas、datetime、timezone、truncate

我想在熊猫python中截断/轮转一个本地化的datetime列。例如，如果我有2017-10-15 15:03:25+02:00，我想得到2017-10-15 15:00:00+02:00。请注意，我希望保留时区信息。我试过的第一件事是： DF['dtColumn'].dt.floor('H') 这很明显地缩短了时区信息和保存时区信息，这个问题出现在dst日到来的时候，例如在2017-10-29。考虑到以下代码： dt1 = datetime.datetime(2017,10,29,0,1) dt2 = datetime.datetime(2017,10,29

浏览 0提问于2018-03-06得票数 2

2回答

Python:如何在熊猫0.9.0上开发类似的between_time方法？

python、pandas、python-2.5

我坚持熊猫0.9.0，因为我是在python2.5下工作，因此我没有可用的方法。我有一个DataFrame的日期，并希望过滤所有的日期是在特定的时间，例如在08:00和09:00之间的所有日期在DataFrame df中。 import pandas as pd import numpy as np import datetime dates = pd.date_range(start="08/01/2009",end="08/01/2012",freq="10min") df = pd.DataFrame(np.random.rand(le

浏览 1提问于2016-10-19得票数 1

回答已采纳

2回答

从具有日期范围的DataFrame创建Pandas每日聚合时间序列

python、pandas、datetime、filter、aggregate

我有一个订阅的Pandas DataFrame，每个订阅都有一个开始日期时间(时间戳)和一个可选的结束日期时间(如果它们被取消了)。为简单起见，我基于开始和结束日期时间(时间戳)为日期(例如"20170901")创建了字符串列。它看起来是这样的： df = pd.DataFrame([('20170511', None), ('20170514', '20170613'), ('20170901', None), ...], columns=["sd", "ed"]) 最终结果应该

浏览 0提问于2017-09-15得票数 2

3回答

如何只加载AzureML表格数据集的一部分(链接到Azure Blob存储)

python、azure-machine-learning-service

我在我的DataSet工作区中定义了一个AzureML，它链接到一个1.6Gb的文件。此文件包含大约10000台设备的时间序列信息。因此，我还可以创建10000个较小的文件(因为我使用ADF传输管道)。我现在的问题是:是否可以在我的python笔记本或脚本中加载AzureML DataSet的一部分，而不是加载整个文件？我现在已经加载了完整文件的唯一代码： dataset = Dataset.get_by_name(workspace, name='devicetelemetry') df = dataset.to_pandas_dataframe() 我发现的关于Azur

浏览 5提问于2020-04-01得票数 1

回答已采纳

6回答

如何在非唯一列中按日期对pandas DataFrame条目进行分组

python、pandas

Pandas DataFrame包含名为"date"的列，该列包含非唯一的datetime值。我可以使用以下命令对此帧中的线条进行分组： data.groupby(data['date']) 但是，这将按datetime值拆分数据。我想按“日期”列中存储的年份对这些数据进行分组。展示了如何在将时间戳用作索引的情况下按年分组，但在我的例子中并非如此。如何实现此分组？

浏览 1提问于2012-07-09得票数 94

回答已采纳

2回答

如何利用dask高效并行化时间序列预测？

python、parallel-processing、time-series、forecasting、dask

我正在尝试使用dask并行处理python中的时间序列预测。数据的格式是，每个时间序列都是一列，它们有一个月日期的共同索引。我有一个自定义预测函数，它返回带有拟合值和预测值的时间序列对象。我想要将这个函数应用于dataframe的所有列(所有时间序列)，并返回一个新的dataframe，并将所有这些序列上传到DB。我通过运行以下代码使代码工作： data = pandas_df.copy() ddata = dd.from_pandas(data, npartitions=1) res = ddata.map_partitions(lambda df: df.apply(forecast_fu

浏览 0提问于2018-03-21得票数 5

回答已采纳

2回答

Pandas破坏datetime对象

python、pandas、datetime、pytz

我正尝试在pandas DataFrame中创建时区感知的日期列。当我运行下面的代码时，得到的pandas列的日期时间与我输入的日期时间不同。我在这里做错了什么？我使用的是python 3.6.2和pandas 0.20.3 from datetime import datetime import pandas as pd import pytz date_string = "12/14/2016 12:00" timezone = pytz.timezone("US/Pacific") input_datetime = datetime.strptime

浏览 2提问于2017-12-15得票数 2

2回答

在Python中将时间戳数据转换为日期时间

python、pandas、csv

我有一个包含时间戳的列的DataFrame，我想在Python语言中将该列转换为日期时间，并保存包含日期和时间的列的文件。代码如下： import pandas as pd df = pd.DataFrame({ "time": [1465585763000, 1465586363000, 1465586963000, 1465587563000, 1465588163000]}) df

浏览 30提问于2020-05-29得票数 1

回答已采纳

3回答

将python pandas DataFrame转换为R dataframe以便与rpy2一起使用时出现问题

python、r、dataframe、pandas、rpy2

我在使用rpy2将Python语言中的pandas DataFrame转换为R对象时遇到了问题。新的pandas版本0.8.0 (几周前发布)具有将pandas DataFrames转换为R DataFrames的功能。问题出在转换我的pandas DataFrame的第一列时，它由python datetime对象组成(按时间序列连续)。转换为R dataframe将返回日期和时间的向量，而不是我认为称为"POSIXct“对象的R StrVector类型对象的向量。我知道将返回类型的字符串转换为POSIXct的命令，使用命令"as.POSIXct('yyyy-mm

浏览 6提问于2012-07-17得票数 7

回答已采纳

1回答

Python按类别分组，然后按类别绘制

python、pandas、matplotlib、group-by、counting

很简单的熊猫问题，我是个初学者。我有一个dataframe 'df‘(例如)： import pandas as pd df = pd.DataFrame({'time': ['2019-04-23 10:21:00', '2019-04-23 11:14:00', '2019-04-24 11:30'], 'category': ['A', 'B', 'A'], 'tex

浏览 1提问于2020-04-26得票数 0

回答已采纳

1回答

excel数据的Python日期时间转换

python、pandas、datetime、timedelta

你好，我正在尝试从我的excel数据中提取日期和时间列。我用浮点值作为DataFrame列，在使用pandas.to_datetime之后，我从excel获得了与实际日期不同的日期。例如，在excel的起始日期是01.01.1901 : 00:00:00，但是在python中，我得到的是1971-01-03 00:00:00.000000。我该如何解决这个问题？我需要一个最后的输出，以总秒与DataFrame。第一个单元以100秒开始，下一个单元以秒为时间步长(任何单元的时差为15分钟)。谢谢。

浏览 9提问于2022-10-26得票数 0

回答已采纳

1回答

使用日期序列进行DataFrame索引

python、date、pandas

我是Python和Pandas的新手，在使用日期序列进行索引时遇到了一些问题。我正在尝试将数据从SQLite数据库中提取到DataFrame中，该数据库由'mm/dd/yyyy‘格式的日期和股票价格组成。然后，我使用set_index创建了一个新的DataFrame，以便按日期为价格编制索引。如何使用数据集中的日期将新索引设置为日期序列？这是否需要datetime转换，或者DataFrame是否具有从对象转换为dateseries的能力？下面是我使用的代码： import sqlite3 as db import pandas as p dbcon = db.connect(...

浏览 1提问于2012-10-24得票数 3

1回答

如何在忽略NA值的情况下找到元素之间的差异

python、pandas

我正在尝试找出pandas dataframe列中的日期时间之间的差异，但是该列中的许多条目都是NA值。示例数据集： Dates = pd.Series([np.nan, np.nan, np.nan, '2019-12-11', np.nan, '2019-12-14', np.nan, np.nan, '2019-12-20', '2019-12-23']) 我的目标是找出每个列出的日期之间的时间间隔，忽略日期之间有多少空值，即'2019-12-20‘和'2019-12-14’之间经过了多少天，同时忽略其间的

浏览 17提问于2021-08-23得票数 0

回答已采纳

2回答

熊猫`.to_pydatetime()‘不在DataFrame里工作

python-3.x、pandas、python-datetime

我有像'03-21-2019'这样的字符串，我想将其转换为本地Python对象:即datetime.datetime类型的字符串。通过pandas转换非常容易。 import pandas as pd import datetime as dt date_str = '03-21-2019' pd_Timestamp = pd.to_datetime(date_str) py_datetime_object = pd_Timestamp.to_pydatetime() print(type(py_datetime_object)) 有结果 <class

浏览 10提问于2019-10-28得票数 6

2回答

Julia pandas语法select values from conditional

pandas、syntax、julia

在Python的pandas中，如果我有一个具有n列的DataFrame，并且我想将满足某些条件的行保留在特定的列中，我只需输入：df[df.column1 > 0]，我找不到在Julia pandas中执行此操作的正确语法。

浏览 2提问于2017-11-29得票数 0

1回答

分析Pandas中日期范围的字符串

python、datetime、pandas、date-range

我在一列中有一个日期范围值为'2014-10-16 - 2014-10-23‘的字符串的pandas数据格式，我希望保留这一列，但在开始和结束的年份、月份和日期添加新的列(例如，StartYear、EndDay等)。是否有一种使用Python的简洁方法，理想地利用pandas时间序列特性并在dataframe中工作？

浏览 3提问于2014-03-16得票数 2

回答已采纳

1回答

在python pandas中为一些带有日期范围的行建立索引

python、pandas、datetime、indexing

我有一个按日期(年和时间到秒)进行索引的dataframe，我希望获得与我计算的特定时间段相对应的行。但是，在使用datetime类型或str类型进行索引时，我无法摆脱keyerror。代码如下所示： def get_series(self, id_dataset, time=None): if time == None: time = dt.datetime.now() time = time.replace(second=0, microsecond=0) dataframe_global = pandas.read_csv('../rsc

浏览 4提问于2018-09-12得票数 0

1回答

过滤月份周的日期范围

python-2.7、pandas

我有一个通过pandas.DataFrame.from_csv读取的csv文件。我想要过滤那些包含某个月份的第三个星期五或日期索引中或其中一列中的任何月份的行。我尝试了一下dateutil和pandas.datetools.WeekOfMonth(week=2,weekday=4)，但还是想不通。

浏览 1提问于2014-02-06得票数 0

2回答

按日期分组Pandas DataFrame

datetime、python-2.7、group-by、pandas

我有一个Pandas DataFrame，其中包含一个date列。该列的元素类型为pandas.tslib.Timestamp。我想按日期对数据进行分组，但不包括更细粒度的时间戳信息(即。按日期分组，其中所有Feb 23, 2011都分组)。我知道如何用SQL来表达这一点，但是对于Pandas来说，这是非常新的。做了非常类似的事情，但是我不理解代码，它使用datetime对象。在中，我甚至不知道如何从Pandas时间戳对象中检索日期。我可以转换为datetime对象，但这似乎非常迂回。根据请求，df.head()的输出 date show network time

浏览 6提问于2013-11-21得票数 10

回答已采纳

1回答

KeyError：[ Float64Index ]中没有列，不确定如何继续

python、pandas、dataframe、key、keyerror

我试图从满足两个条件的Dataframe中返回所有行。第一个条件工作得很好。第二个条件(我尝试使用rows ( 10 )根据前10个分数返回行)给出了以下错误： File "/Users/[extracted]/Desktop/imdbnew.py", line 21, in <module> comedy_high = IMDB[IMDB['Score'].nlargest(10)] File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/s

浏览 54提问于2020-05-08得票数 2

回答已采纳

1回答

将带日期的Pandas DataFrame转换为Spark Dataframe时出错

python、python-3.x、pandas、date、apache-spark

编辑:该问题似乎存在于Windows中标准日期时间库将日期时间转换为时间戳的过程中请看下面的最小示例： import datetime #this works datetime.datetime(1973,1,23,0).timestamp() #this produces OSError: [Errno 22] Invalid argument datetime.datetime(1953,1,23,0).timestamp() 问题当我将Pandas Dataframe和datetime64ns日期转换为Apache Spark dataframe时，我得到了一堆关于Excepti

浏览 9提问于2020-02-22得票数 1

1回答

Bigquery Python API -编写dataframe order by column

python、google-cloud-platform、google-bigquery、google-api-python-client

我正在尝试使用Python API向Bigquery编写一个pandas.Dataframe，按列对记录进行排序： from google.cloud import bigquery client = bigquery.Client(project=project_id) df = pd.DataFrame(...) df.sort_values('date', inplace=True) job_config = bigquery.LoadJobConfig( schema=[ bigquery.SchemaField("date

浏览 17提问于2021-06-30得票数 0

1回答

如何在date python中转换YYMMDDHH时间戳

python、python-3.x、pandas

我有以下时间戳 import pandas as pd import pandas as pd df = pd.DataFrame({'ts':[14102100, 14102101, 14102102]}) 它们的格式是YYMMDDHH。如何将它们转换为可读的日期？我试过pd.to_datetime(df.ts, format="YYMMDDHH")，但它不起作用

浏览 23提问于2019-10-24得票数 2

回答已采纳

2回答

将日期(开始和停止)转换为时间间隔，以便我可以使用Python进行比较

python、date、csv、pandas、time-series

你好，我正在处理一个包含所有总统的出生日期和死亡日期的.csv文件。我试图解决的问题是，哪一年是大多数总统在世的年份。我假设，为了做到这一点，我必须将总统的出生和死亡日期转换为时间序列，而当前在世的总统将不得不将其死亡日期更改为当前时间。有人知道我可以使用Python和包-- Pandas和NumPy --来做这件事吗？以下是我到目前为止拥有的代码：日期的格式也是这样的:1732年2月22日如果总统还没有去世，那么他的死亡日期是空的 #!/usr/bin/python #simple problem: find the year that the most presidents #were

浏览 1提问于2016-04-19得票数 0

2回答

如何按日期过滤蟒蛇大熊猫数据栏

python、pandas、dataframe、date

我在过滤熊猫的数据时遇到了问题--我想过滤“日期”列中的所有日期，只返回上个月的日期，但是python混淆了日期和月份，并返回错误的答案。你能告诉我如何修复谢谢吗？ import pandas as pd import numpy as np import datetime as dt df = pd.DataFrame(pd.read_csv("Dates.csv")) tday = dt.date.today() tdelta = dt.timedelta(days=-30) dt = tday + tdelta dt = np.datetime64(dt) print(d

浏览 2提问于2020-08-28得票数 0

回答已采纳

2回答

如何在Pandas的时间序列中检测空白和连续周期

python、pandas

我有一只按日期编制索引的熊猫。我想按时期选择所有连续的空白，并逐期选择所有连续的日期。我该怎么做？没有列但有日期索引的Dataframe的示例： In [29]: import pandas as pd In [30]: dates = pd.to_datetime(['2016-09-19 10:23:03', '2016-08-03 10:53:39','2016-09-05 11:11:30', '2016-09-05 11:10:46','2016-09-05 10:53:39']) In [31]:

浏览 0提问于2016-10-18得票数 13

2回答

CSV滤波与升序

python、python-3.x、csv

新的Python，所以我需要一些帮助。我有一个CSV文件，其中有id、created_at日期、名/姓列。 id created_at first_name last_name 1 1309380645 Cecelia Holt 2 1237178109 Emma Allison 3 1303585711 Desiree King 4 1231175716 Sam Davidson 我想过滤两个日期之间的行，比如03-22-2016和04-15-2016(日期并不重要)，然后按升序(按created_at)排列这些行。我知道

浏览 3提问于2017-02-07得票数 0

回答已采纳

1回答

如何在Algolia中按持续时间进行搜索

javascript、ruby-on-rails、search、algolia

假设我正在构建一个酒店预订平台，并且每个房间记录都有可用日历。常见的搜索条件是按持续时间搜索。其中用户输入开始日期和结束日期，数据库获取该持续时间内未占用的房间。我实现了一种非常天真的方法，将被占用的日子存储为一个数组。 attribute :occupied_at_i do array = [] if !occupied_at.empty? occupied_at.each do |date| array << Time.parse(date).to_i end end array end

浏览 0提问于2015-09-21得票数 9

3回答

如何使用python按日期拆分列

python-3.x、pandas、time-series

df.head(7) df Month,ward1,ward2,...ward30 Apr-19, 20, 30, 45 May-19, 18, 25, 42 Jun-19, 25, 19, 35 Jul-19, 28, 22, 38 Aug-19, 24, 15, 40 Sep-19, 21, 14, 39 Oct-19, 15, 18, 41 至： Month, ward1 Apr-19, 20 May-19, 18 Jun-19, 25 Jul-19, 28 Aug-19, 24 S

浏览 26提问于2020-11-12得票数 0

回答已采纳

1回答

从dataframe更新postgresql中表空的最快方法

python、postgresql、pandas、dataframe、merge

我有一个pandas dataframe和匹配的postgresql表，其中两个表中的每个单元格要么为null，要么为时间戳。对于表中单元格值等于null的每个单元格，并且相应的dataframe单元格值是时间戳，我希望更新表格单元格值。做这件事最快的方法是什么？目前，我正在将整个表拉入一个dataframe中，比较python中的两个dataframe (单元格)，将这些值输入到第三个dataframe(称为DFC)，然后销毁旧表并从DFC构建一个新表。这似乎是低效的。示例： **Data Frame** **Postgres Table** A B

浏览 0提问于2018-04-12得票数 0

1回答

在Python中绘制直方图的时间序列

python、matplotlib、pandas、histogram

我正在尝试用Python绘制直方图的时间序列。。所以，基本上，我需要同样的东西，但我在R中真的很糟糕。在我的数据集中，通常每天有48个值。其中- 9999表示缺少的数据。对数据样本执行操作。我从读取数据和构造pandas DataFrame开始。 import pandas as pd df = pd.read_csv('sample.csv', parse_dates=True, index_col=0, na_values='-9999') print df <class 'pandas.core.frame.DataFrame'

浏览 0提问于2013-06-12得票数 7

回答已采纳

1回答

ArcPy & Python -获取最新的两个日期，按值分组

pandas、date、arcpy

过去一周我一直在寻找答案，但只看到了部分答案。作为python的新手，我真的需要一些帮助。我在一个表号和日期中有两个字段。日期格式为日期和时间，因此: 07/09/2018 3:30:30 PMnumber字段只是一个整数，但每行可以有相同的数字。我已经尝试了几个选项来获取最新日期，我可以使用Pandas获得以下内容： myarray = arcpy.da.FeatureClassToNumPyArray (fc, ['number', 'date']) mydf = pd.DataFrame(myarray) date_index = mydf.groupb

浏览 40提问于2018-07-12得票数 -1

回答已采纳

1回答

Loc Pandas DataFrames on Date Range

python、pandas、dataframe、machine-learning、dataset

我有一个带有“DateTime”列的Pandas DataFrame。我需要过滤掉DataFrame中具有此日期的所有行，并在目标日期上添加-7和+7天。它应该是这样的：test = dataset.loc[-7:"4/17/2017":+7].hp1.values 实现这一目标的最佳方法是什么？

浏览 0提问于2019-12-21得票数 1

1回答

在for循环中处理数据类型

python、python-3.x、datetime、pandas

我使用for循环读取pandas dataframe中的列，并使用嵌套的if语句查找日期时间范围内的最小值和最大值。我可以确定所需的datetime列，但找不到将column变量传递给dataframe.series.min()和max语句的正确方法。 import pandas as pd data = pd.somedata() for column in data.columns: if data[column].dtype == 'datetime64[ns]': data.column.min() data.colum

浏览 5提问于2017-01-19得票数 2

回答已采纳

6回答

按日期条件切割的python熊猫数据

python、dataframe、pandas

我能够使用python对象读取和切片熊猫数据，但是我被迫只使用索引中的现有日期。例如，这起作用是： >>> data <class 'pandas.core.frame.DataFrame'> DatetimeIndex: 252 entries, 2010-12-31 00:00:00 to 2010-04-01 00:00:00 Data columns: Adj Close 252 non-null values dtypes: float64(1) >>> st = datetime.datetime(2010,

浏览 7提问于2013-04-23得票数 58

回答已采纳

2回答

过滤掉一些不包含python中特定大小写的列的组

python、pandas、pandas-groupby、filtering

我是python的新手，我有一个问题是如何过滤掉一些不包含任何女性案例的组(按“日期”分组)。假设我有一个如下的数据帧： import pandas as pd import numpy as np exam_data = { 'date': ['2000-1', '2000-1', '2000-1', '2000-2', '2000-2', '2000-3', '2000-4', '2000-4', '2000-5

浏览 25提问于2021-11-02得票数 1

回答已采纳

2回答

当列标题是日期-时间值时，如何对Pandas数据帧逐列标题值进行切片？

python、pandas

我有一个excel文件，其中列名包含日期-时间值. 如您所见，标题值采用日期-时间格式。我已经将它加载到Pandas dataframe中，并且头值确实被保存为日期时间值。现在，如果我需要从Pandas查询，“选择所有大于5月15日的列”，我如何做到这一点？我知道，通过查询df[df.columns[3:]]，我可以实现这一点。但是，我真的想根据列标题的值而不是根据列的位置进行切片。请帮帮忙。编辑：基于下面的答案，我找到了一种查询列值的方法。把它加在这里，供将来参考。 from datetime import datetime df[[col for col in df.

浏览 7提问于2015-12-23得票数 2

回答已采纳

2回答

如何在熊猫中计数？

python、python-2.7、pandas、dataframe

经过几天的研究，我被困住了。我是Python/Pandas的新手。尝试将数据分析从多个excel表转换为python解决方案。我在计算新员工在特殊技能方面的学习曲线。为此，我有以下数据集： COMM_ID -每个通信的唯一数字标识符技能-交流的范畴-文本登录-为个人-文本登录提供-是一份调查，1还是0？答复-对调查是否有答复，1或0 NOs -反应为阴性，为1或0 在下面，我构建了按SKill、Login和COMM_ID排序的数据，COMM_ID将其按时间顺序排列。然后我以技巧和登录为基础。我将如何获取数据并将数据切割成两个数据流？一个用于响应，另一

浏览 3提问于2014-12-24得票数 0

回答已采纳

1回答

如何使用json文件中的“时间戳”将DataFrame设置为从第X天到第Y天，而不是从第X年到第Y年？

python、json、pandas

我想对不同的json文件做一些文本分析。这些文件的名称类似于"2017.json“或"2018.json”。它们包含许多文本，每个文本都有一个时间戳。(如"timestamp"："2019-01-31T19:15:00"，) 熊猫的基本结构是所谓的DataFrame。我首先创建了一个DataFrame，然后将各个年份(这里只有一年)的数据附加到它上面。这确保了所有数据都在相同的结构中可用。现在我只能创建包含单个年份的DataFrame。是否可以使用文件中的时间戳来创建DataFrame，例如从第x天到第y天？ import pandas as

浏览 6提问于2019-07-22得票数 0

回答已采纳

1回答

组织从Excel读取到Pandas DataFrame的数据

python、excel、pandas

我使用这个脚本的目标是:1.从excel文件中读取时间序列数据(>100,000k行)以及标题(标签，单位)2.将excel数字日期转换为pandas dataFrame的最佳datetime对象3.能够使用时间戳引用行，使用序列标签引用列到目前为止，我使用xlrd将excel数据读取到一个列表中。制作了pandas系列，每个列表都以时间列表为索引。将序列和序列头部组合在一起，生成python字典。把字典传给了熊猫DataFrame。尽管我做了很多努力，但df.index似乎被设置为列标题，我不确定何时将日期转换为datetime对象。我3天前才开始使用python，所以任何建议都是

浏览 1提问于2013-07-18得票数 8

回答已采纳

3回答

使用Python识别并按更新时间加载目录中的最后csv文件

python、csv、sorting

我正在使用python加载一个csv文件进行处理。该目录包含许多文件，并不断更新。当我运行脚本时，我希望它只选择目录中最近更新的csv文件进行处理。我的代码似乎可以做到这一点，但它并不可靠。通常，它接受最后一个csv文件，正如预期的那样，但有时它接受一个较旧的文件，并跳过最近的文件。我认为它可能是排序α-数字，而不是通过创建/更新的时间。有人能建议修改代码，使其工作更可靠吗？当前代码： # Import python modules import pandas as pd import os #Identify last csv file in directory last_csv

浏览 9提问于2019-11-15得票数 2

回答已采纳

1回答

如何在火花数据过滤条件下工作？

apache-spark、apache-spark-sql、spark-dataframe

我在hbase中有一个有10亿条记录的表，我想根据特定的条件(按日期)过滤记录。例如： Dataframe.filter(col(date) === todayDate) 在将表中的所有记录加载到内存或我将得到过滤记录之后，将应用筛选器？

浏览 1提问于2017-01-16得票数 0

回答已采纳

3回答

如何可视化来自Pandas Dataframe的时间数据？

python、pandas、data-visualization

偶尔，我有时间数据，我只想想象事件发生的频率。因此，我基本上有一个日期时间列表，我想显示一个情节 X轴是小时(0 - 24，因此24桶) Y轴是事件的数量。基本上，这是一个直方图，按小时分组。我已经有了一个解决方案，但是如何确保所有24个回收箱都存在？(而且看起来也可能更好) 极小例子 #!/usr/bin/env python """Create and visualize date with timestamps.""" # core modules from datetime import datetime imp

浏览 9提问于2017-10-05得票数 1

回答已采纳

1回答

如何在Apache IoTDB中使用python的pandas.dataframe函数？

python、pandas、apache-iotdb、iotdb

因为我处理大量的时间序列数据，所以我想将我们的数据库切换到Apache IoTDB。我最初的代码涉及Python，我使用Python中的pandas.dataframe函数来进行一些数据分析。我想知道Apache IoTDB是否可以执行pandas.dataframe？以及如何启用此功能？

浏览 3提问于2022-06-28得票数 -1

1回答

在Python中，如何在设置的时间戳之前和之后一小时筛选行？

python、dataframe、filter、timestamp、offset

我正在尝试过滤一个DataFrame，使其只在指定时间/日期之前1小时和之后1小时显示值，但我在为此找到正确的函数时遇到了麻烦。我用Python和Pandas一起工作。我看到的关于按日期屏蔽的帖子大多涵盖了在指定的开始日期和结束日期之间屏蔽行的情况，但我在寻找如何基于单个日期屏蔽行的帮助时遇到了麻烦。我有一个DataFrame格式的时间序列数据，它跨越了大约一年，所以有成千上万的行。此数据的时间间隔为1分钟，因此每行对应一个行ID、一个时间戳和一个值。 DataFrame示例： ID timestamp value 0 2011-01-15 03:25:00

浏览 18提问于2021-04-28得票数 0

3回答

要使用pandas.DataFrame.ewm，是否必须按时间顺序对日期进行排序？

python、pandas、dataframe、datetimeindex

我需要计算来自csv文件的一组数据的EMA，其中日期在descending order中。当我应用pandas.DataFrame.ewm时，我得到了最新值(按日期)等于该值的均衡器。这是因为ewm在DataFrame中从上到下开始观察。到目前为止，我还没有找到使ewm反转的选项。所以我想，我将不得不逆转我所有的数据集。也许有人知道如何让ewm从底部开始呢？还是建议始终使用按时间顺序排序的datetimeindex？从最古老的值到底部的最新值？

浏览 3提问于2020-12-18得票数 0

回答已采纳

1回答