将每日数据转换为月度数据时，Pandas重新采样会创建索引中没有的新日期 - 腾讯云开发者社区

python、pandas、datetime

我使用不同的数据集(面板数据)，并且需要以编程方式检测我是否有每日、每月、季度或仅每年可用的数据。所有数据集都有一个日期列，格式为日期时间(例如，年度数据只有年终日期31-12-2017，31-12-2018等；每日数据可能看起来像02-02-2018，03-05-2018，09-11-2018等，具有不同的间隔)。对于年度数据，我预计日期间隔为1年，对于季度数据为3个月，对于月度数据为1个月，而每日数据应在一个月内至少有2个日期。有没有办法用Pandas来检测我在数据集中有哪些日期间隔？

浏览 1提问于2019-11-17得票数 1

1回答

Python，将dataframe中的每日数据汇总为月度和季度

python、pandas

我已经将我的数据加载到Pandas dataframe中。示例： Date Price 2012/12/02 141.25 2012/12/05 132.64 2012/12/06 132.11 2012/12/21 141.64 2012/12/25 143.19 2012/12/31 139.66 2013/01/05 145.11 2013/01/06 145.99 2013/01/07 145.97 2013/01/11 145.

浏览 3提问于2016-11-12得票数 6

回答已采纳

2回答

我正在尝试按日期对数据集进行索引，我做错了什么？

python

我的DataFrame中有以下数据：enter image description here 我一直收到这个错误： Key error 'Date' 当我键入此命令时： df1['Date'] 我插入了我的数据集，但是Python不让我只看到日期。我想将每日数据转换为季度数据。

浏览 31提问于2020-11-25得票数 0

1回答

使用Pandas重采样时丢失数据

python、pandas、numpy、datetime

如果我做错了什么，我很抱歉，但我已经尝试了很长时间才能做到这一点。我有一个巨大的数据集，其中包含大约3000只股票的所有历史价格(每日收盘价)，相当于超过1500万行。问题是，我似乎无法在不丢失大量数据的情况下对数据进行重采样。我的目标是只保留所有股票的月度成交量，同时保持数据的形状，包括股票代码、日期和关闭列。 wiki_prices_df = pd.read_csv('/gitHub/finance/PRICES_03_11_18.csv',usecols=['ticker','date','close'],parse_dat

浏览 3提问于2018-03-12得票数 1

5回答

你如何从雅虎财务中提取每周历史数据？

python、pandas、time-series、yahoo-finance

import datetime import pandas.io.data sp = pd.io.data.get_data_yahoo('^IXIC',start = datetime.datetime(1972, 1, 3), end = datetime.datetime(2010, 1, 3)) 我使用了上面的例子，但是当我想要提取每周时，这只是将每天的数据拉进数据中。get_data_yahoo似乎没有一个参数，可以像雅虎本身提供的选项那样，从每日、每周或每月进行选择。您所知道的任何其他软件包或想法都可能有助于

浏览 3提问于2013-12-14得票数 7

回答已采纳

2回答

Python pandas重采样原始数据中不存在的添加日期

python、pandas

我正在使用pandas将存储在data_m中的日内数据转换为日常数据。由于某些原因，resample添加了日内数据中没有的天数的行。例如，1/8/2000不在当天的数据中，但是每日数据包含该日期的一行，值为NaN。DatetimeIndex具有比实际数据更多的条目。我做错什么了吗？ data_m.resample('D', how = mean).head() Out[13]: x 2000-01-04 8803.879581 2000-01-05 8765.036649 2000-01-06 8893.156250 2000-01-07 8780.03

浏览 3提问于2012-12-21得票数 6

回答已采纳

1回答

有效的数据结构，以保持字典一样的观察关键时间在潘达斯？

python、pandas、dictionary、data-structures、time-series

我有一个与日期时间相关的观察列表，可以用dict或对象来表示，如下所示： Datetime | Data -------------------------------------------------------- 2018-01-20 20:00 | {'word1': 3, 'word2': 5, 'wordX': 1} 2018-01-20 20:01 | {'word1': 2, 'word2': 2, 'wordX': 5} 2018-01-20 20:05 | {&#

浏览 0提问于2018-01-22得票数 1

回答已采纳

1回答

R:将动物园的长时间序列拆分成日历

r、zoo

我有一个几年长的动物园对象。这是每日报价的时间序列(第一列:日期，第二列:报价) 我希望将这个长时间序列分成日历年的子集，最终目标是在单个图表中绘制这些数据，图表的横轴是一年的长度。 (我不想将我的源每日数据转换为月度数据或任何其他时间步长...)。谢谢。

浏览 0提问于2012-03-19得票数 2

1回答

将月末或周末系列转换为每日系列

python、pandas

让我们说，我有这样的熊猫系列： monthly = 2017-05-31 403.43 2017-06-30 292.92 2017-07-31 184.62 其中索引的类型为“datetime64ns”。我希望将其转换为一个每日系列，其中每天的值与月份的值完全相同，即， daily_imputed = 2017-05-01 403.43 2017-05-02 403.43 2017-05-03 403.43 2017-05-04 403.43 .... 2017-07-29 184.62 2017-07-30 184.62 2017-07-31

浏览 1提问于2017-10-11得票数 2

回答已采纳

1回答

为Pandas中的datetime列赋值/将datetime列重命名为date列

python-3.x、pandas

我在Pandas中创建了以下数据帧'user_char‘： ## Create a new workbook User Char with empty datetime columns to import data from the ledger user_char = all_users[['createdAt', 'uuid','gasType','role']] ## filter on consumers in the user_char table user_char = user_char[user_char

浏览 14提问于2018-02-28得票数 0

回答已采纳

3回答

使用每月第一个交易日将每日熊猫库存数据转换为月度数据

python、r、pandas

我在pandas数据框中有一组计算的OHLCVA每日证券数据，如下所示： >>> type(data_dy) <class 'pandas.core.frame.DataFrame'> >>> data_dy Open High Low Close Volume Adj Close Date 2012-12-28 140.64 141.42 139.8

浏览 1提问于2015-01-24得票数 4

回答已采纳

1回答

在Pandas DataFrame中填充FRED数据中的漏洞

python、pandas、dataframe

我的名字是Nick，我是编程新手。我最近完成了Codeacademy的使用Python分析金融数据的课程。我已经开始做我自己的一些项目，但我遇到了一个障碍。我正在使用pandas-datareader从美联储API (FRED)导入股指每日收盘价数据： import numpy as np import pandas as pd import pandas_datareader.data as web import matplotlib.pyplot as plt from datetime import datetime start = datetime(2020, 1, 1) sp

浏览 18提问于2020-04-21得票数 0

回答已采纳

2回答

如何改进Oracle Exadata中的插入和更新？

database、sql-update、sql-insert、exadata

与select查询相比，Insert和update查询花费的时间更长。以下是该表的一些统计数据- 表正在存储月度数据。对于当月，它是MTD。当前月份的数据每天都在被删除和加载。每日插入行数-250万，每日删除时间-不到一分钟，表有13个月的数据，插入250万行花费的时间-2小时20分钟，选择记录一个月的时间-不到一分钟用于插入数据的工具是Informatica Power center。Informatica正在使用查询下推到数据库的方法。请建议我如何减少在数据库级别的表中插入数据的时间。

浏览 27提问于2019-03-01得票数 0

1回答

Python pandas重采样方法使dataframe行加倍

python-3.x、pandas、csv、datetime、dataframe

我已经将csv文件读入到数据帧中，如下所示： Datetime Value 0 2017-01-04 00:00:00 0.00 1 2017-01-04 00:15:00 2.00 2 2017-01-04 00:30:00 2.00 3 2017-01-04 00:45:00 1.00 4 2017-01-04 01:00:00 3.00 ... 15542 2017-09-09 23:45:00 8.00 [155

浏览 16提问于2018-01-27得票数 2

1回答

VBA Excel:输入框日期已指定，但正在生成所有日期的数据

vba、date、excel、inputbox

我有一个VBA宏，它运行一组冗长的button_click代码，根据输入框中输入的日期创建和/或更新每日报告、仅包含每日总计的月度报告工作表，以及包含原始数据的两个工作表之间不匹配的UID的不匹配报告工作表。对于大多数日期，这是正常工作的。但是，当以数字格式输入日期" 7/11/2014“时，它将提取从2014年7/11到两个工作表中可用日期结束的所有日期。但是，如果我输入的日期是“2014年7月11日”，脚本就会正常运行。为什么7/11/2014 (7/11或7/11/14)会从7/11/14开始拉入数据，而不仅仅是与7/11/14相关的数据？我的代码非常长，我不确定这是Excel

浏览 8提问于2014-08-14得票数 0

1回答

Python -计算扩展收益的标准差

python、pandas、dataframe、time-series、pandas-groupby

我目前使用的是一个超大型数据文件(CRSP每日股票文件)，它包括超过16000家公司的每日回报，总共有850万行数据。在Python中运行for循环大约需要2周时间。目标是计算每个公司的收益波动(标准差)。对于每个月底，我需要从年初到那个月的回报的标准差。我试图在一个图表(8月数据的标准差的green=example)中可视化我的意思：我的输入DataFrame显示在下一张图片中。"PERMNO“是确定的标识符，" date”是每日返回的日期，"RETX“是每日返回的日期。输出数据帧应仅以月频率表示。因此，每个公司在一年内有12个标准差。我每年都

浏览 9提问于2022-03-04得票数 0

2回答

重新采样到DatetimeIndex会引发错误

python、time-series、pandas

我创建了一个DatetimeIndex，并希望使用该索引对数据进行重新采样。当我这样做的时候，我得到了一个异常： Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/local/lib/python2.7/dist-packages/pandas-0.8.1-py2.7-linux-i686.egg/pandas/core/generic.py", line 188, in resample limit=limit, b

浏览 0提问于2012-10-25得票数 0

1回答

使用自定义月末频率重新采样

python、pandas、dataframe、time-series、frequency

我正在寻找一个等同于W-MON (每周，周一结束)的月度数据规范。具体地说，我有一个包含每日数据的pandas数据框架，我只想每月观察一次，从最近的日期开始，每月返回。所以如果今天是2016年6月17日，我的日期索引应该是2016年6月17日，2016年5月5日，2016年4月17日……等。现在我只能找到month-start和month-end作为df.asfreq()的规范。谢谢。

浏览 2提问于2016-06-17得票数 0

1回答

向pandas DataFrame添加新列时的NaN值

python、pandas、dataframe、nan

我正在尝试在一个pandas DataFrame中生成一个新列，该列与另一个pandas DataFrame中的值相等。当我尝试创建新列时，我只得到新列值的NaNs。首先，我使用API调用来获取一些数据，'mydata‘DataFrame是按日期索引的一列数据。 mydata = Quandl.get(["YAHOO/INDEX_MXX.4"], trim_start="2001-04-01", trim_end="2014-03-31", collapse

浏览 1提问于2014-10-07得票数 26

回答已采纳

2回答

每月归还熊猫的最后日期和价值

python、python-3.x、pandas

我有一个每日数据熊猫df。我想返回每个月的最后一个值。我认为简单的解决方案是.resample("M").apply(lambda ser: ser.iloc[-1,])，但是，似乎resample实际上计算的是月结束日期，而不是返回那个月出现的实际日期。这是故意的行为吗？MWE： import pandas as pd import numpy as np df = pd.Series(np.arange(100), index=pd.date_range(start="2000-01-02", periods=100)).to_frame() df.sort

浏览 1提问于2018-07-31得票数 3

回答已采纳

1回答

如何在重采样后在列之外创建新的数据帧？

python、dataframe

我已经阅读了一个每日股票数据csv文件。并将每列重新采样为每周数据。现在，我尝试创建一个新的DataFrame来包含那些新的重新采样的列。在打印时，我只获取列名如果有人能指出我代码中的错误，请

浏览 3提问于2018-12-14得票数 0

回答已采纳

3回答

熊猫:重新采样后计算独特的价值

python、pandas

我刚刚开始使用Pandas，并且正在尝试合并:按日期分组数据，并计算每个组中的唯一值。以下是我的数据： User, Type Datetime 2014-04-15 11:00:00, A, New 2014-04-15 12:00:00, B, Returning 2014-04-15 13:00:00, C, New 2014-04-20 14:00:00, D, New 2014-04-20 15:00:00, B, Returning 2014-04-20 16:00:00, B, Returning 2014-04-20 17:00:00, D,

浏览 0提问于2014-04-22得票数 7

回答已采纳

1回答

datetime groupby/跨不同年份重新采样月份和日期(删除年份)

python、date、pandas、datetime

我研究了Pandas中的重采样/Timegrouper功能。然而，我正在尝试弄清楚如何在这个特定的案例中使用它。我想对一项金融资产进行季节性分析--比方说标准普尔500指数。我想知道多年来资产在任意两个自定义日期之间的平均表现。例如:如果我有一个10年的标准普尔500指数每日变化的历史，我选择了3月13日和3月23日之间的日期范围，那么我想知道我的范围内的每个日期在过去10年中的平均变化-即过去10年中每年3/13的平均变化，然后是3/14，3/15，直到3/23。这意味着我需要按月和日分组，并计算不同年份的平均值。我可能可以通过为年、月和日创建3个不同的列，然后按其中的两个列进行分组来做

浏览 24提问于2017-02-04得票数 1

1回答

如何从包含某些单词的CSV文件中导入数据？

python、pandas

我有一个CSV文件，其中包含不同期限的不同政府债券收益率的每日数据。标题的格式为按国家/地区，然后是债券的到期日，例如UK 10Y。我想要做的就是导入一个政府债券在一个日期内所有期限的所有收益率，例如，导入特定日期的所有英国政府债券收益率。第一个日期是2021年7月1日。我知道我可以使用Pandas，但我看到的所有代码都需要在导入时使用usecols函数。我只想创建一个函数，只导入我想要的数据，而不使用usecols。 Snapshot of data, UK data is further right, but format is the same

浏览 26提问于2021-01-19得票数 0

1回答

Python pandas重采样每周不起作用

python、pandas

尝试为股票数据定义月度和周度范围。下面的代码只适用于高价，适用于月度，但不适用于周度。当我尝试在df中为周刊创建一个新的专栏时，我得到了所有的NaN。而且，如果我使用变量而不是新列，我会得到正确的结果。 test = df['High'].resample('w',how='max') print test ... 2015-03-01 212.24 2015-03-08 212.06 2015-03-15 208.79 2015-03-22 211.27 2015-03-29 211.11 2015-04-05

浏览 2提问于2015-04-04得票数 1

2回答

将xml提要写入数据库时，如何安全地删除旧记录并用新记录更新？

php、mysql、xml

我正在将XML提要中的信息写入数据库，以便在我们的网站上使用。我们发现xml提要可能不一致，因此将信息写入数据库对我们来说是一个很好的解决方案。理想情况下，我希望每天创建一次解析xml的文件，然后将其写入数据库。我应该使用什么方法来消除前一天的数据，因为一旦我们创建文件并使用新的每日记录更新，我就不再需要它了。不好： ->文件->删除旧记录cron写入新记录如果xml不是很正确或者脚本有问题怎么办？然后我们丢掉了数据，目前无法获得任何新的数据。如果XML信息不好，至少我可以在前端写一些php，以便仍然显示较旧的数据，但修改了日期或其他什么。哪种类型的检查和失败保险最适合我

浏览 1提问于2013-07-19得票数 0

1回答

对熊猫数据帧进行不同频率采样

python、pandas

我有一个以ID和时间戳为关键字的多索引序列/数据帧。此数据结构包含各种ID的每日数据。我可以使用resample函数来查看此数据结构的月末快照吗？ ID ts value 1 2001-01-30 1 2001-01-31 2 2001-02-01 3 2 2001-01-30 3 2001-01-31 2 2001-02-01 4 我想要这个输出 ID ts value 1 2001-01-31 2 2 2001-01-31 2 我可以使用重采样函数调用来帮助我吗？我知道我可以创建月末日

浏览 5提问于2013-10-07得票数 1

1回答

如何在熊猫的数据中插入多行复杂数据？

python、pandas、machine-learning

我对数据工程非常陌生，我想看看我是否能为一些曲目绘制每日流，以便找到一个通用模型来模仿多年来歌曲的流模式。我得到了以下形式的输入数据： { "date": "2021-06-13", "streams_total": 1600432, }, { "date": "2021-06-14", "streams_total": 1600432, } .. 这不是歌曲发布后的每日数据，而是取决于它是多么的新歌。有些歌我怀念1-2年的数据。我的第一个任务是试着用熊猫把它读到

浏览 2提问于2022-09-07得票数 -1

回答已采纳

1回答

在DolphinDB中使用周频率进行类似熊猫的重采样

pandas、group-by、resampling、dolphindb

pandas支持多种频率的重采样。要在DolphinDB中实现类似pandas的重采样，我可以使用group-by子句，其中group-by列是对时间列的函数调用。例如，要使用月份频率进行重采样，我可以编写如下SQL： select count(*) from t group by month(myDate) 当涉及到周频率时，事情就有点不同了，因为DolphinDB没有像week这样的函数。此外，我希望在一周中的特定日期重新采样，例如，星期二。

浏览 1提问于2019-10-31得票数 0

3回答

将时间序列聚合为年度数据

r、time-series、finance、zoo

假设我们有股票价格的每日时间序列(假设是FTSE指数)。我们想要计算每日，每月和每年的回报。为了计算月度和年度收益，我们必须将时间序列数据聚合为月和年。在"zoo“包中，我们有聚合函数，它可以帮助我们将数据聚合到每月的频率。下面是使用as.yearmon类的代码行： # Computing simple returns FTSERet = diff(FTSE)/lag(FTSE,k=-1) # Monthly simple returns MonRet <- aggregate(FTSERet+1, as.yearmon, prod)-1 # Quarterly simpl

浏览 1提问于2012-12-21得票数 5

回答已采纳

2回答

将PANDAS数据帧从每月转换为每日

python、pandas

我有一个包含317个股票报价器(317个报价器x 12个月= 3,804行DF)的2014年月度数据的数据框架。我想将其转换为每日数据帧(317个滴答器x 365天= 115,705行)。因此，我认为我需要对月度值进行上采样或重新索引，同时将月度值分散到该月的每一天，但我无法使其正常工作。数据帧当前的格式如下： >>> df month ticker b c 2014-1 AAU 10 .04 #different values every month for each ticker 2014-2 AAU 20 .

浏览 4提问于2015-04-14得票数 11

回答已采纳

1回答

在不同字段中使用datetime创建数据帧

python、pandas

我希望有一个ohlc表，以便稍后分析蜡烛图案，使用当前代码，如您在下面看到的，我能够看到我的ohlc表，但“蜡烛”与数据序列不匹配。 # my testing code import pandas as pd df = pd.read_csv('tmp/NEG_20180829.txt', header=None, delimiter="\;", skiprows=1, names=["Session Date", "Symbol", "Deal Number", "Deal Pric

浏览 12提问于2018-09-02得票数 1

回答已采纳

2回答

用NaNs替换我所有的数据，为什么要重新索引数据？

python-3.x、pandas、numpy

因此，我研究了来自Pandas的一些命令是如何工作的，我遇到了这个问题；当我使用reindex命令时，我的数据被NaN值所替代。下面是我的代码： >>>import pandas as pd >>>import numpy as np >>>frame1=pd.DataFrame(np.arange(365)) 然后，我给它一个日期索引： >>>frame1.index=pd.date_range(pd.datetime(2017, 4, 6), pd.datetime(2018, 4, 5)) 然后我重新编制索引：

浏览 1提问于2017-04-06得票数 4

1回答

如何从pandas dataframe中按月汇总支出值？

python、pandas、dataframe、group-by、pandas-groupby

如何从该数据框中按月和按日期聚合值： payout_date payout_value 2017-01-14 1 2017-01-14 30 2017-01-16 216 2017-02-17 23 2017-02-17 2 2017-03-19 745 2017-03-19 32 2017-03-20 11 2017-03-20 222 2017-03-21 4 对于我使用的每日聚合值 df.groupby('date').agg(['sum']) payout_value sum date 2017-01-14 31 2017

浏览 98提问于2018-05-30得票数 0

回答已采纳

1回答

熊猫将每小时的时间序列重新采样为每小时的比例时间序列

pandas、time-series、resampling

我正在处理每小时的时间序列(日期，时间(hr)，P)，并试图计算每个小时的每日总‘金额’的比例。我知道我可以使用Pandas‘resample('D'，how=' sum ')来计算P (DailyP)的每日总和，但在相同的步骤中，我想使用每日P来计算每个小时的每日P的比例(因此，P/DailyP)，从而得到每小时的时间序列(即，与原始频率相同的频率)。我不确定这是否可以被称为熊猫术语中的“重采样”。这可能从我的术语使用中很明显，但我在Python或编程方面是一个绝对的新手。如果有人能提出一个这样做的方法，我将非常感激。谢谢!

浏览 0提问于2013-05-05得票数 4

回答已采纳

2回答

使用pandas将每月数据重新采样为年度数据，但从某个月份开始

python、pandas、dataframe

如何将月度数据重采样为年度数据，但从10月1日开始。我尝试了以下方法，据我所知，使用base works在一天中的某一小时开始，但似乎在一年中的某个月都不起作用。 df = (df.resample(rule='Y', base=10).sum().reset_index())

浏览 25提问于2021-04-30得票数 2

6回答

在数据仓库场景中，使用(NOLOCK)是否有任何缺点

sql-server、sql-server-2005、data-warehouse、nolock

我有一个Kimball风格的数据仓库(星型模型中的事实和维度-没有晚到的事实行或列，维度中没有列更改，除了过期作为类型2缓慢更改维度的一部分)，具有繁重的日常处理以插入和更新行(在新日期)以及月度和每日报告流程。事实数据表按日期进行分区，以方便旧数据的回滚。我理解WITH(NOLOCK)可能会导致未提交的数据被读取，但是，我也不希望创建任何会导致ETL进程失败或阻塞的锁。在所有情况下，当我们从DW读取时，我们从不会更改的日期的事实表中读取(事实表按日期分区)，以及维度表将不具有它们所链接的事实的属性更改。那么--有没有什么缺点呢？--可能是在执行计划上，或者是在相同表上并行运行的SELE

浏览 0提问于2009-06-18得票数 8

回答已采纳

2回答

Python初学者:提升ValueError(‘必须具有相等的len键和值')

python、pandas、csv、dataframe、dictionary

我想在现有的数据框中填入另一列。该列将包含字典的值。这些值是令牌列表。到目前为止，它还不起作用，有没有办法将它们添加到数据帧中？ df = pd.read_csv(sys.argv[1], na_values=['no info', '.'], encoding='Cp1252', delimiter=';') s = pd.DataFrame(dict1).T.reset_index() print(s) #result ''' index 0 1 2 0

浏览 40提问于2019-07-16得票数 1

1回答

使用pandas读取每日时间序列，并重新采样到每月

python、pandas

我对Python非常陌生。我通常使用scikits.timeseries来处理时间序列数据。现在，我想使用诸如read_csv之类的Panda来完成与下面显示的代码相同的操作。我使用read_csv手册读取了该文件，但我不知道如何将每日时间序列转换为每月时间序列。输入是从2002-01-01到2011-12-31的一列每日数据，因此长度为3652。输出将是从2002-01到2011-12的一列月度数据，因此长度为120。 import numpy as np import pandas as pd import scikits.timeseries as ts stgSim = ts.tim

浏览 0提问于2018-08-16得票数 0

回答已采纳

1回答

自动记录新行中某列的每日值。

google-sheets、google-apps-script、formulas、tracking、time-tracker

我目前在google工作表中有一个项目跟踪器，它记录项目名称、状态字符列和三个进度列，如下所示： 📷 我想记录与项目相关的每个进度的每日日志，以便有一个表自动记录下列标题:日期、项目1进度1、项目1进度2、项目1进度3、项目2进度1、项目2进度2等等。我已经能够使用以下脚本将一列每日数据复制到另一列，但不知道如何将其转到另一列： function recordHistory() {var ss = SpreadsheetApp.getActiveSpreadsheet(); var sheet = ss.getSheetByName("Sheet1"); var

浏览 0提问于2023-01-24得票数 1

回答已采纳

1回答

如何使用列表中的列名创建SQLite3表？

python、sqlite

我将患者的每日血压数据存储在一个SQLite3表中。每个患者对应一行，每个日期对应一列。如何使用Python Pandas系列中的日期作为列名来初始化该表？可能是这样的： DATE_LIST = pandas.date_range(start_date, end_date) cursor.execute('''CREATE TABLE bloodpressure DATE_LIST REAL''') 上面的代码将创建一个表，其中只有一个名为DATE_LIST的列，这不是我想要的。我想使用DATE_LIST中的日期作为列名。

浏览 0提问于2016-08-04得票数 0

1回答

如何在BOOTSTRAP之后查看重采样数据

matlab、statistics、statistics-bootstrap

我试图使用Matlab中的'bootstrap‘重新采样(替换)我的数据库，如下所示： D = load('Data.txt'); lead = D(:,1); depth = D(:,2); X = D(:,3); Y = D(:,4); %Bootstraping to resample 100 times [resampling100,bootsam] = bootstrp(100,'corr',lead,depth); %plottig the bootstraping result as histogram hist(resampling1

浏览 2提问于2013-01-15得票数 1

回答已采纳

1回答

熊猫:使用群表或枢轴表时按顺序排列日期

python、python-2.7、pandas、dataframe、pivot-table

我有一只熊猫DataFrame (名为"df1")，它的结构如下(尽管我有很多个月的每日数据)： date WeightedReturn 0 15/07/2015 0.005128 1 15/07/2015 0.002844 2 15/07/2015 0.003055 3 15/07/2015 -0.001481 4 15/07/2015 -0.000741 5 15/07/2015 -0.000741 6 16/07/2015

浏览 2提问于2015-10-11得票数 1

回答已采纳

1回答

从每月更新日表中的一条记录

mysql、sql、vertica

我有两个文件，一个是每日文件，第二个是月度文件。现在，每天都会将每日文件加载到一个表中。我们在下个月的第一周收到月度文件(例如，在月度文件中，我们有1月1日到1月31日的数据，我们将在2月的第1周收到该文件)。加载每日文件数据后，我们将更新每月文件，现在我应该添加一列作为状态。 “当订单以每日或每月的形式发送时，将状态设置为”已预订“。如果订单不是按月输入的，而是按天输入的，您应将状态更新为已取消。谁来为此编写SQL？？任何建议。假设实际上我们有一个表 +----------+--------------------+-----------+ |order_id | booking_d

浏览 0提问于2017-03-15得票数 0

2回答

对时间序列数据进行重采样

python、pandas

我有一些随机的每小时时间序列数据(让我们编造一些)，我如何为每日最大值重新采样，以及为记录的每日最大值所在的小时创建单独的df列？ import pandas as pd import numpy as np from numpy.random import randint import os np.random.seed(10) # added for reproductibility

浏览 25提问于2020-03-03得票数 3

回答已采纳

2回答

去掉pandas时间序列中的重复项

python

我有一个csv文件，其中包含一个时间序列，其结构为：col1: date col2: value。csv文件的日期是从1月1日到4月30日。然后我有了第二个csv文件，不同之处在于日期是2月1日到5月31日。第二列中从2月1日到4月30日的值在第一个和第二个文件中相同。第三个csv文件(3月1日到6月30日)、第四个文件也存在同样的问题:相同的覆盖结构。我希望读取这些csv文件，但仅保留从1月1日到12月31日的唯一日期，并且值不重复。有没有一种快速处理Pandas数据帧的方法？

浏览 26提问于2020-06-30得票数 0

1回答

Pandas Dataframe功能

dataframe

我想使用excel电子表格作为源数据来创建数据帧。我需要将数据系列从用于存储excel电子表格中的数据的格式转换为dataframe变量最终产品。我想知道用户是否有使用各种python方法来完成以下操作的经验： -data系列转换:我有一个系列，它每月包含一个数据值，但希望使用索引(或包含日期值的列)将值表扩展为每天包含一个值。因此，如果table1具有基于月份的索引，而table2具有每日索引，如何将table1值转换为基于table2的索引。 -dataframe雕刻:我正在处理的数据在长度上并不相似，一些数据集比其他数据集更长。在多列数据帧的上下文中，通过哪些方法可以找到列中最短的序

浏览 12提问于2019-02-19得票数 0

1回答

Pandas中的日期时间数据应该在索引中吗？

python、pandas、datetime、time-series

我的意思是，Pandas的设计方式，所有的Pandas时间序列函数都是建立在这个假设之上的吗？几周前，我正在试验，它似乎希望日期时间在索引中。给出这样的数据： df = pd.DataFrame({'date' : ['23/10/2017', '24/10/2017', '25/10/2017','26/10/2017','27/10/2017'], 'dax-close' : [13003.14, 13013.19, 12953.41,13133.28,13217.54]})

浏览 3提问于2017-10-30得票数 1

回答已采纳

1回答

Excel将日期范围总计拆分为日合计

excel、datetime、excel-formula、split、dataset

我正在为一个公式而苦苦挣扎，我用sum尝试了索引匹配公式，但它根本不起作用。我有一个具有名称的数据集，该数据集的开始日期和结束日期之间的总时间为小数。我想将此数据拆分为每个名称的每日总计，但它不能超过每日24小时标记。日期24小时从07:00到07:00，因此对于a，它应该计算从2021/01/01 07:00到2021/01/02 07:00的第一天，任何超出该范围的时间都不应添加到总和中。我已经创建了一个示例如下： ? 任何帮助都将不胜感激。

浏览 13提问于2021-01-05得票数 0

回答已采纳

3回答

有没有办法组织一个两列的csv数据文件，使它在经过一定的时间间隔(即365天)后换到一个新行？

python、pandas、csv

我拥有的csv文件是收集到两个大列中的数据:一个是我需要的每日数据，另一个是与当天相关的变量。我想在一年的每日数据之后中断，并在pandas表中显示这些数据，其中第一年的开始到结束是水平显示的，变量应该正好在下面。因此，为了清楚起见，年份应该有自己的列，然后水平显示每日数据，并在正确年份的相应日期下显示可变数据。现在，我所有的数据都被组合在一起，所以所有时间的数据都在一个长列中，我不能真正地构建我的代码来使用它。我以前查过这个，但没有找到任何能真正描述我的情况的东西。我在想也许拼接函数可能会有帮助，但我对此还不够了解，我也希望它是动态的。它需要能够修改为其他csv文件，以便它们从一年的第一年

浏览 0提问于2019-04-09得票数 1