在python中归档丢失的时间序列

在Python中归档丢失的时间序列可以通过使用pandas库来实现。pandas是一个强大的数据分析和处理工具，提供了丰富的功能和方法来处理时间序列数据。

首先，我们需要导入pandas库：

import pandas as pd

然后，我们可以使用pandas的DataFrame对象来表示时间序列数据。DataFrame是一个二维表格，可以存储不同类型的数据，并且具有标签和索引。

假设我们有一个包含时间序列数据的CSV文件，可以使用pandas的read_csv函数将其读取为DataFrame对象：

df = pd.read_csv('data.csv')

接下来，我们可以使用pandas的方法来处理时间序列数据。例如，我们可以使用set_index方法将某一列设置为索引列，表示时间：

df = df.set_index('timestamp')

然后，我们可以使用resample方法对时间序列数据进行重采样，以填补丢失的数据。重采样可以根据指定的时间间隔对数据进行聚合、插值或填充缺失值。

df = df.resample('1H').mean()

上述代码将时间序列数据按小时进行重采样，并计算每个小时的平均值。可以根据实际需求选择不同的重采样频率。

另外，如果时间序列数据中存在缺失值，我们可以使用fillna方法来填充缺失值。例如，可以使用前向填充或后向填充的方式：

df = df.fillna(method='ffill')  # 前向填充
df = df.fillna(method='bfill')  # 后向填充

最后，我们可以将处理后的时间序列数据保存为新的CSV文件：

df.to_csv('processed_data.csv')

以上是在Python中归档丢失的时间序列的基本步骤。根据具体的需求和数据特点，还可以使用其他pandas的方法和函数进行更复杂的处理和分析。

腾讯云提供了一系列与数据处理和分析相关的产品和服务，例如云数据库TDSQL、云数据仓库CDW、云数据湖CDL等。您可以通过访问腾讯云官网了解更多关于这些产品的详细信息和使用指南。

参考链接：

pandas官方文档：https://pandas.pydata.org/docs/
腾讯云数据库TDSQL产品介绍：https://cloud.tencent.com/product/tdsql
腾讯云数据仓库CDW产品介绍：https://cloud.tencent.com/product/cdw
腾讯云数据湖CDL产品介绍：https://cloud.tencent.com/product/cdl

页面内容是否对你有帮助？

有帮助

没帮助

Oracle的sp_BlitzBackups替代方案

、

在Server世界中，有一个名为sp_BlitzBackups的存储过程来自"第一应答器套件“，它帮助数据库管理员计算恢复时间目标和数据库备份历史记录中的恢复点对象(总之)。我想知道是否最终会存在相同类型的存储过程，如果不存在，我可以依赖的基本表是什么？

浏览 0提问于2022-02-25得票数 2

1回答

将boost序列化文本存档转换为结构化格式

、、

给定的 boost序列化文本存档用于序列化的boost版本和c++工具集但缺乏基于数据结构的文本存档。是否有一种方法可以恢复任何更易读的结构化表示(例如XML或JSON)？

浏览 3提问于2016-12-29得票数 1

2回答

第一个问题在这里被问到。我试过使用Boost，但就是想不出它在我这里的结构中是如何工作的。此外，即使在将.lib添加到其他库之后，它仍然会出现丢失错误。就像它在运行了几次之后，再次弹出一样。第一次是通过创建一个新项目来修复的，但我没有时间继续这样做。无论如何，我已经将我的代码从Visual Studio移到了QT Creator。现在我正在读一些关于XML或JSon的东西，并在想我是否应该尝试实现它？事情是这样的，我有一整天的时间来解决我明天要完成的期末项目的序列化问题。一旦我得到了这个，我需要做一个GUI，我希望它会更容易。提前谢谢。下面是我使用Boost的最佳尝试 Hotel.h c

浏览 1提问于2017-05-17得票数 0

1回答

在“时间序列日期”中查找支出

、、、、

我有以下日期、时间戳和值的数据框架。 date Value 2022-07-19 44.43000000 2022-07-20 43.43000000 2022-07-21 42.43000000 2022-07-22 41.43000000 2022-07-25 41.43000000 ... ... 2022-09-02 86.40000000 2022-09-06 85.13000000 2022-09-07 86.86000000 2022-09-08 88.44000000 2022-09-09 89.44000000 在py

浏览 4提问于2022-09-11得票数 2

1回答

为什么我的拉链缺少CRC值？

、

我的脚本正在用CRC文件压缩一些文件，但是归档文件似乎缺少CRC值。这一切为什么要发生？这是我的代码： import os.path import zipfile from glob import glob from sys import exit def dozip(): file_list = glob("C:/python27/scripts/*.py") zf = zipfile.ZipFile("myzip.zip", 'w') for f in [f.replace("/", os.

浏览 0提问于2018-05-08得票数 0

回答已采纳

3回答

Python打印计算比执行计算花费更多的时间。

、、、

我用python写了一个脚本，这让我很惊讶。基本上，它需要5个20位数，乘以它们，然后将它们提升到3000的幂。timeit模块用于查找计算所需的时间。嗯，当我运行这个脚本时，它说计算它需要3*10^-7秒。然后生成一个文件output.txt，但是脚本直到15秒后才会结束。 import timeit outputFile = open("output.txt", "w") start = timeit.default_timer() x = (87459837581209463928*23745987364728194857*2738564759384756

浏览 1提问于2014-03-30得票数 7

回答已采纳

1回答

Python库趋势时间序列多变量

、

我们的csv包含36列每30分钟收集一次日期时间栏来自服务器的不同数据点的3个变量(计数、延迟、时间)x10特性(用户io、serverio、并发..etc )：示例用户io计数、用户io延迟、userio总计时间。其他5个则比较静态:服务器名、ip地址..。我们知道当其中一个特性(userio，serverio)出现峰值时，服务器中就会出现问题。也有一些时候，它可以是一个功能的组合。在过去一年的数据中，我们可以看到在任何1项特性中是否存在延迟:异常值有可能成为更大的异常值(这意味着我们看到异常值在30分钟内不断增加，最大的异常值与发布时间相匹配)，从而导致服务器上的问题。经过大量

浏览 0提问于2022-12-17得票数 1

2回答

log4j滚动文件附加器-多线程问题？

、、

Log4J滚动文件附加器是否有任何已知的错误。多年来，我一直在愉快地使用log4j，但并没有意识到这一点。我的一位同事建议存在一些已知的问题(我在这里找到了一个Bugzilla条目)，在繁重的负载下，滚动文件附加器(我们使用基于时间的附加器)在午夜滚动发生时可能无法正确执行。 Bugzilla entry - 感谢其他人如何克服这一点的意见和建议。谢谢你，芒露

浏览 2提问于2010-02-26得票数 1

1回答

iphone中的动态UI

我有一个计划，在iphone中创建动态用户界面使用网络服务的..that是用户界面将建立根据一个网络服务的xml内容。我想知道你对此有什么建议...我在哪里可以找到构建这样一个应用程序的资源……有没有可用的教程...？

浏览 0提问于2010-06-17得票数 0

1回答

应该是什么类型/值的主键应该是无限制的

、、、

我正在制作一个消息系统，其中通过身份验证和未经身份验证的用户都应该能够使用。消息的每个索引都应该是唯一的。我正在考虑使用bigint，但它有大约18446744073709551615 (未签名)的限制，如果我想保留所有消息的记录，这对我来说并不理想。此外，我正在考虑一个时间戳，但有一个以上的用户将在同一时间发布消息的可能性。因此，创建的时间戳会与其他时间戳冲突。你们知道这里应该做些什么吗？提前谢谢你。:D

浏览 5提问于2012-05-24得票数 0

回答已采纳

2回答

如何序列化一个保持指向C++中其他对象的指针的对象？

、、、

我正在寻找一种在C++中序列化大型复杂对象的方法。我一直在考虑使用boost序列化api，但我不确定是否可以序列化以这种方式实现的对象。在我的程序中，我有以下对象： typedef map<float, float> SignalData; typedef pair<float,float> TimeValuePair; class SignalDatabaseNG : public SignalDatabase { (...) private: vector<SingleSignal *> all_signals; (..

浏览 0提问于2013-09-20得票数 2

1回答

Oracle goldengate服务未启动:无法检索缺少的Oracle重做日志的名称

、、

我试图启动GG服务，当尝试‘启动my_service’然后启动，但它没有启动，状态总是改变开始停止。我需要开始金牌服务..。我不知道它的服务发生了什么，该做什么来解决这个问题。帮我，伙计们我的服务名称是: MY_SERVICE 以下是日志： 2020-02-17 14:52:37 INFO OGG-00987 Oracle GoldenGate Command Interpreter for Oracle: GGSCI command (oracle): start MY_SERVICE. 2020-02-17 14:52:37 INFO OGG-00963 Orac

浏览 0提问于2020-02-17得票数 1

4回答

寻找一套很好的时间序列异常检测软件包

、、、、

是否有一个全面的开放源码包(最好在python或R中)可以用于时间序列中的异常检测？在scikit中有一个支持向量机软件包--学习，但它不是针对时间序列数据的。我正在寻找更复杂的包，例如，使用贝叶斯网络进行异常检测。

浏览 0提问于2018-05-24得票数 24

回答已采纳

1回答

将我的Mac应用分发给朋友

、、、

你好，我已经为mac (可可)在Xcode中做了一个应用程序。我想通过ichat或邮件把它分发给我的朋友。但当我复制并发送它时，它不能运行。我也把权限改成了777，但还是不能运行。我认为有一些权限问题。我进入我的应用程序x.app，在Mac_OS文件夹下更改了x的权限。有什么需要帮忙的吗，Abhi

浏览 1提问于2011-02-04得票数 3

回答已采纳

1回答

为同一个表空间ID找到多个文件

、

经过管理，mysql服务器的硬盘利用率达到了100%.在恐慌中，我关闭了大部分服务--包括mysqld，我想这是造成这个问题的原因。随后，我删除了文件以腾出空间。在可用1GB以上的情况下，我试图启动mysqld，但它无法启动。日志中指出的错误如下： [ERROR] [MY-012209] [InnoDB] Multiple files found for the same tablespace ID: [ERROR] [MY-012202] [InnoDB] Tablespace ID: 23 = ['archive/transaction_archive_1.ibd', &#

浏览 0提问于2019-02-20得票数 3

1回答

PostgreSQL主机的硬重启能改变PostgreSQL序列吗？

、

我把这个箱子放在我的办公桌上。客户已经重新启动(至少2次)运行PostgreSQL的机器。在此之后，一个列上的序列的下一个级别发生了变化。重新启动之前的最后一个值是582。重新启动后，它应该返回583，但返回615。我已经检查了所有可能的日志，从linux日志到PostgreSQL日志，直到我们的应用程序日志，没有看到任何调用nextval的东西。所以我尝试了这个疯狂的想法，并把数字转换成了一些..。 583 in bits: 0010 0100 0111 615 in bits: 0010 0110 0111 只有一点不同。那么，是否有可能是因为硬重启而造成一点混乱？在这段时间里，

浏览 1提问于2016-11-24得票数 3

1回答

图标显示在模拟器中，而不是在iPad上进行模拟时出现

我在Resources文件夹中有一张名为Icon.png的72X72PNG图片。当我在Iphone模拟器上运行这个应用程序时，它显示得很好，但当我在iPad上运行它时，效果就不好了。图标在-info.plist中指定。我试过Run and Clean，Run and Clean ALL。我得到以下错误： Icon specified in the Info.plist not found under the top level app wrapper: Icon.png (-19007) iPad: Info.plist: Unable to verify icon dimensions, n

浏览 3提问于2010-09-10得票数 0

1回答

为什么要在审计表中存储整个记录？

、、、

我曾在几家公司工作过，在每一家公司中，审计表都存储了每个变更的完整记录快照。据我所知，在任何给定的时间点，只存储更改的列以重新创建记录就足够了。它将明显减少存储空间。此外，我认为这将提高性能，因为我们需要写入的数据量要小得多。因为我已经在不同的数据库和框架中看到了它，所以我不会在这里放任何特定的标签。我很乐意理解这种方法背后的原因。

浏览 22提问于2020-02-14得票数 0

回答已采纳

2回答

在使用GNU make并行构建归档文件时，如何避免并发问题？

我正在使用GNU make来构建一组静态库，使用隐式make规则来实现这一点。这些规则运行ar(1)命令来更新库/存档。分析表明，如果我在构建过程中使用-j选项来运行并行作业，构建时间将会缩短。不幸的是，GNU make手册中有一节，它几乎说make没有为运行ar(1)提供并发保护，因此它可以(并且确实)破坏归档。该手册进一步调侃说，这可能会在未来得到解决。一种解决方案是使用，它基本上在运行命令之前进行信号量锁定，从而序列化构建归档的ar(1)命令。这个特殊的解决方案对我不好，因为我是在Windows上使用基于mingw的交叉编译工具构建的。这个问题有没有更简单或更好的解决方案？

浏览 0提问于2012-01-12得票数 11

1回答

Xcode归档文件在导入到新计算机后被识别为macOS应用程序而不是iOS

、

我最近将user Library/developer/xcode文件夹移到了我的新机器上，试图保持相同的设置。在我的新机器上打开管理器时，我注意到应用程序都在macOS下，而它们应该在iOS应用程序端。它们也没有正确的应用程序图标。较旧的计算机仍具有适当的组织和图标。你知道我会错过什么吗？谢谢你的帮助!

浏览 18提问于2020-10-14得票数 0

2回答

Timeseries (InfluxDB)：如何处理丢失的数据？

、

问题描述我们正在执行许多timeseries查询，这些查询有时会导致问题，通常通过API (Python)执行，有时由于数据丢失而导致完全失败。由于这种情况，我们不知道在哪里教育自己，并得到这个具体问题的答案，如何处理我们的timeseries (进水数据库)数据库中丢失的数据。示例在一个例子中描述一个问题。我们有一些时间序列数据，比如说我们测量房间的温度，现在我们有很多房间，有时传感器会死掉或停止工作一到两周，然后我们替换它们等等，在那个时间框架内，数据丢失了。现在我们尝试执行某些计算，它们失败了，假设我们想要计算每天的平均温度，现在这将失败，因为有些日子我们没有传感器的测量输入

浏览 0提问于2023-02-06得票数 2

回答已采纳

1回答

是否可以配置NLog在日志达到一定限制后对其进行修剪？

、

是否可以将NLog配置为在日志文件达到特定文件大小后自动修剪/修剪？

浏览 0提问于2013-10-09得票数 15

回答已采纳

1回答

如何设计tensorflow的ctc丢失层标签

、

我刚开始使用tensorflow(r1.0)中的ctc丢失层，与“标签”输入有点混淆。在tensorflow的API文档中，它说标签:A int32 SparseTensor.labels.indicesi，：== b，t表示labels.valuesi存储(批处理b，时间t)的id。labels.valuesi必须接受[0，num_labels]中的值 b，t和valuesi -我的意思是在批中序列"b“的"t”处有"valuesi“的标签吗？它说值必须在[0，num_labels]中，但是对于稀疏张量，除了某些指定的位置外，几乎所有的地方都是0

浏览 2提问于2017-02-27得票数 3

回答已采纳

2回答

将numpy数组转换为.npy格式是数据序列化的一个例子吗？

、、

我理解数据的序列化意味着将数据结构或对象状态转换为可以存储在文件或缓冲区中的形式，可以传输，并且可以稍后重新构造()。根据这个定义，将numpy数组转换为.npy格式应该是numpy数组数据对象的序列化。然而，当我在互联网上查找时，我在任何地方都找不到这个断言。大多数相关链接都提到了pickle格式如何在python中实现数据的序列化。我的问题是-将numpy数组转换为.npz格式是python数据对象序列化的一个例子。若否，原因为何？

浏览 1提问于2020-03-29得票数 0

3回答

时间序列日志/统计.可伸缩的解决方案

、、、、

通常会查询数据库或日志文件以获取正常运行时间信息或每个给定时间间隔的请求数。随着您收集越来越多的数据，SQL查询或日志爬行变得越来越慢(想象一下1000万个表行/日志行)。典型问题：在过去的x个月里我们处理了多少项任务？在过去的X期内，我们提供的服务有哪些？最后一小时内的平均请求数量是否高于最后一天的平均数量？我想使用一些键值存储:许多不同自动过期的桶，这样我们就可以查看例如10分钟/1小时/1天的桶和那里的所有物品，并自豪地说：“在最后10分钟内，我们处理了10^6个请求”。我确信MongoDB或Redis会在存储桶中提供过期时间--我只是有点担心实现是否简

浏览 9提问于2013-05-23得票数 0

2回答

什么是boost序列化地图加载时间？

、、、

如果在boost中映射是二进制序列化的，那么加载nlogn的时间是n还是n？如果map是一次只写一个元素，那么加载n个项目似乎需要nlogn，因为我们要插入n个项目，而每个项目都需要logn时间。但是我想知道映射是否可以以一种与内存布局和编组指针相匹配的格式编写。所以加载它，我认为需要n个时间。本质上，内存布局正在被加载。有没有人有这方面的经验？

浏览 13提问于2018-01-07得票数 1

2回答

PowerShell:使用压缩存档和开始-作业不能工作

、、

我试图使用PowerShell压缩H:\驱动器上的一堆视频文件。但是，由于驱动器相当大，连续运行此操作将需要很长时间。下面是我正在使用的代码的一个简短片段。一些部分已被扣留。 $shows = Get-ChildItem H:\ foreach($show in $shows){ Start-Job -ArgumentList $show -ScriptBlock { param($show) $destPath = "$($show.DirectoryName)\$($show.BaseName).zip" Compre

浏览 6提问于2020-03-22得票数 2

回答已采纳

1回答

具有火花的非均匀时间序列的正则化

、

我们计划将传感器时间序列数据存储在cassandra中，并使用spark/spark-ts应用机器学习算法。与文档中不同的是，我们的时间序列数据是不规则的-- --因为传感器发送基于数据事件的数据。但大多数算法和模型都需要有规律的时间序列。 spark-ts是否提供了将不规则时间序列转换为规则时间序列的函数(使用插值或时间加权平均值等)？如果没有，建议采取什么办法来解决这个问题？

浏览 1提问于2016-05-31得票数 4

1回答

rpm中的python get文件

、、

在python中，我想获取文件位于rpm包中，我可以打开这个包，获取文件并将其保存在python变量中吗？(不解压/tmp中的所有包)

浏览 17提问于2017-07-11得票数 0

1回答

ImportError:没有名为“googlevoice”的模块

、

这里是python noob。几周前就开始学习python了，目前需要一些帮助。我为windows 7提供了3.3.4python，我尝试运行以下命令： import urllib.request from googlevoice import Voice from googlevoice.util import input import time File "<pyshell#0>", line 1, in <module> from googlevoice import Voice ImportError: No

浏览 0提问于2014-03-17得票数 0

2回答

boost和stl中的iostream比较

、、、

就像我提到的， stlp_std::ostream //stl lib call for io stream boost::archive::text_oarchive //boost call for io serialization using archive 有人能告诉我通过归档序列化的用途是什么吗？两个call refer功能是否相同？

浏览 1提问于2015-02-13得票数 1

2回答

在取消引用的基类指针上增强序列化

、、、

我对boost序列化有一点小问题。有许多示例说明了如何简单地使用BOOST_CLASS_EXPORT和BOOST_CLASS_EXPORT_IMPLEMENT通过基类指针来序列化派生类指针。这工作得很好，没有任何问题。但是，我不想序列化指针，因为另一端的反序列化应该再次位于指针上，然后boost会创建序列化对象的新实例。我可以序列化一个解除引用的指针，然后在现有的对象实例上再次反序列化，没有问题，并且不会创建新的实例。但是，当解除引用的指针在基类上时，在通过指针进行序列化时，派生类不会像预期的那样序列化。工作示例： Class A; Class B : public A; A* bas

浏览 7提问于2013-07-15得票数 2

1回答

当用户仍在使用系统时，当我们调用pg_dump时会发生什么？

我们有一个以PostgreSQL为数据库的web应用程序，并将芹菜背景任务用于一些比较复杂的任务。在这个复杂的任务开始时，我们使用pg_dump对数据库进行备份。我想知道这个sql转储的状态，如果用户还在使用系统的话。会不会引起任何不一致？另外，我想知道在这种情况下，pg_dump是否是进行备份的最佳选择。当然，随着数据库的增长，备份需要花费大量的时间，从而减缓了整个过程。谢谢。

浏览 0提问于2014-04-22得票数 1

回答已采纳

1回答

ModuleNotFoundError:没有名为“tensorflow.contrib.tensorboard”的模块

、、、、

我通过pacman在我的arch linux计算机上安装了tensorflow。我试图运行官方的来解决mnist问题，但是我得到了这个错误： Traceback (most recent call last): File "mnist_example.py", line 27, in <module> from tensorflow.examples.tutorials.mnist import input_data File "/usr/lib/python3.6/site-packages/tensorflow/examples/tuto

浏览 11提问于2017-09-05得票数 1

1回答

PCA缺失数据填充的重要部分

、、

我正在对不同的时间序列进行PCA，然后使用K均值聚类来尝试并将共同的因素组合在一起。我面临的问题是，一些因素进出时间序列。例如，我可能总共有12年的数据点，有些因素可能在整个12年中存在，但有些因素可能会出现或下降(前两年是活跃的，三年是不活跃的，其余的是活跃的)。我可以使用迭代PCA来填补数据中的一些通常的空白，但是我不知道应该使用什么来处理大块(数年)的数据缺口。例如，如果一个因素只存在于最后三年，我是否应该将其纳入分析？

浏览 0提问于2018-05-17得票数 3

1回答

ARCHIVELOG的后果

、、

负责我们服务器备份的人在整个备份场景中让我们的数据库(一个大型数据库)离线超过6小时。我与他们交谈，询问我们是否可以将其分解为更小、更频繁的备份任务，例如，在不同的时间备份每个架构，甚至是表的集合。他们的回答是，如果我们决定将ARCHIVELOG转换为ARCHIVELOG，这在某种程度上是可能的，这将对性能产生影响。我对这一点非常不熟悉，就像对备份的方式一样。如果要以更有效的方式备份我的模式，或者至少不是停机时间密集的方式，你们会推荐哪些其他选项？谢谢! f.

浏览 3提问于2011-01-19得票数 3

回答已采纳

1回答

Boost序列化文本归档是跨语言的吗？

、、、

嘿...我试着更好地解释我的问题...在通过TCP连接发送数据之前，我正在使用boost序列化文本存档...现在我需要将接收到的数据传递给Java，我知道序列化的流是由数据组成的，还是由application...so + boost序列化(标记、代码等)组成的。在这种情况下，我将数据传输到java应用程序的唯一机会是在传输之前对其进行过滤?谢谢……

浏览 0提问于2011-06-08得票数 0

回答已采纳

1回答

tarfile.extractall()中的Unicode问题(Python2.7)

、、、、

我在Windows上使用python2.7.6，我使用tarfile模块提取一个文件( gzip文件)。mode选项tarfile.open()设置为"r:gz"。在打开调用之后，如果我要通过tarfile.list()打印归档的内容，我会在列表中看到以下目录： ./Θ¥ÖµÇüσêåµ₧É Part 1.v1/ 但是，在调用tarfile.extractall()之后，我没有在提取的文件列表中看到上面的目录，而是看到以下内容： é™æ€åˆ†æž Part 1.v1/ 如果我要通过7zip解压缩存档，我会看到一个目录，其名称与上面的第一项相同。因此，很明显，extractal

浏览 2提问于2016-06-21得票数 1

回答已采纳

1回答

如何还原oracle数据备份

、、

最近，我的电脑硬盘出了问题。我的甲骨文10克xe是安装和运行在这个高清。但是，在HD停止运行之前，我在文件夹“oradata”中执行了DBF文件的副本。这些文件是: CONTROL.DBF、SYSAUX.DBF、SYSTEM.DBF、TEMP.DBF、UNDOTBS1.DBF、USERS.DBF 我想知道是否可以从这些文件中恢复我的数据。或者，如果可能，可以将此文件中的数据导入Oracle 10g的新安装。我有所有的用户和密码。有人能帮我吗？提前谢谢你。诚挚的问候。

浏览 2提问于2013-09-09得票数 0

回答已采纳

2回答

处理对同一时间戳具有多个观测值的时间序列数据

、

Python 3中有一个时间序列数据，如下所示： Date `Weekly_Sales` 2010-05-02 3400 2010-05-02 5600 2010-05-02` 4590 2010-05-02 5800 2010-05-12 2380 2010-05-12 6700 2010-05-12 3700 时间序列是不连续的，因为同一日期有多个观测结果。我试图用ARIMA预测py

浏览 0提问于2019-02-09得票数 3

2回答

多重时间序列的ARIMA/Holt温特斯

、、、

有没有一种方法可以在python中运行ARIMA/Holt-温特斯模型，同时处理多个项目(时间序列)？我可以使用Python中的StatsModels包运行一个ARIMA/Holt-温特斯模型，但不能运行多个时间序列。若要澄清我所说的多时间序列的含义，请参阅我的数据集。

浏览 1提问于2018-11-14得票数 3

1回答

如何处理缺少时间步骤的数据以创建时间序列模型？

、、、、

数据有一个以Time_id为索引的系列。索引不是日期时间索引，因此可以修复丢失的时间间隔。我的问题是：我能和ARIMA一起预测这个系列吗？如果是，我如何处理丢失的Time_ids？如下图所示，我想填补Time_id中的空白。因此，我需要添加更多的行，其中包含Time_id 8,9，值为0。这是一个巨大的数据，许多可能缺失的时间间隔。如果有人能帮我解决这个问题，那就太好了。示例图像在下面的链接中。

浏览 1提问于2022-03-06得票数 0

1回答

填充大量的时间序列数据

、、、、

在时间序列数据中填充缺失值的最佳方法是什么。在不同的工作时间里，数据变化很大。数据大量丢失。我已经尝试了回溯，前向填充和平均技术来填充数据。我也尝试了插值(线性，最近和多项式)与熊猫包。但是所取得的结果并不是很有用。第一张图显示了4月6日至9日前后丢失的数据。第二个图是在填充缺失值后用线性插值法绘制的。填写这种数据的最佳方法是什么？我担心线性插值最终会污染数据。我读过一些关于卡尔曼滤波的文章。不知道该怎么用。

浏览 0提问于2019-08-08得票数 0

回答已采纳

1回答

R中PMG分析中的不平衡面板错误

、、

我正在尝试在R中运行Fama Macbeth分析，其中我使用了'pmg‘函数和以下代码： Fpmg1 <- pmg(ret ~ HML_OBS + SMB + Mktrf + HML, Analysis4_Weighted, index = c("permno")) summary(Fpmg1) 我目前有1,354,623个条目和11个列。我得到了下面的输出，其中我的系数的估计值是NA。 Mean Groups model Call: pmg(formula = ret ~ HML_OBS + SMB + Mktrf + HML, data = Analysis

浏览 3提问于2021-03-10得票数 0

2回答

如何在Objective C MultipeerConnectivity框架中传输NSObject数据

、、

我是Objective C的新手，正在开发一个基于MultipeerConnectivity网络项目框架的iOS移动应用程序。这个框架为我提供了在设备之间发送消息和接收消息的方法。这里我想通过这个函数发送一个自己定义的MyMessage NSObject，如下所示来传输不同类型的数据。但是，我想包含一个NSMutableArray，它在单个message对象中包含多个信息对象。 @interface MyMessage : NSObject { NSMutableArray playersInfo; } @end 我知道在Objective C中我们不能像这样静态分配接口类型。相反，

浏览 0提问于2014-04-11得票数 0

1回答

$zip->addFile在我的服务器上不创建文件夹，而只创建文件路径

、、、

通常，在localhost和其他服务器上，用于创建和填充zip存档的以下脚本都能正常工作： $zip = new ZipArchive(); $zip->open($filename, ZipArchive::CREATE); foreach( $pathToAssets as $nPath ) { $files = new RecursiveIteratorIterator( new RecursiveDirectoryIterator( $nPath ), RecursiveIteratorIterator::LEAVES_ONLY );

浏览 6提问于2016-02-08得票数 0

1回答

有没有办法使用原始字节的向量作为boost序列化的归档文件？

、、

我已经编写了一些通过串行链路接收消息的代码，目前，消息数据以std::vector结束。我想用它做的是使用boost::serialization (可能)机制将消息拆分到类成员中。我一直在寻找如何做到这一点，我已经找到了一些似乎是拼图的碎片，但我有点卡住了。到目前为止，有各种各样的例子帮助我，有些跑起来了，但不起作用，所以我希望能得到一些帮助(部分原因是我已经经历了太多的事情，我的大脑感觉有点炸了)。其要点是我在DataIn.hpp中有一个类，例如： #include <cstdint> #include <iostream> #include <boost

浏览 0提问于2019-08-03得票数 1

1回答

在训练RNN时，时间步长必须有相同的时间距离吗？

、、、

我有一个带有LSTM单元的递归神经网络，我想用6个时间步骤进行训练。每个时间步骤都是数据集的记录，表示每10秒获取的超过5分钟的数据的时间聚合。不幸的是，数据集有时态中断，因此有时数据集中的两个连续记录可以暂时间隔10分钟到几周。我想知道，我给予网络的每一批的时间步骤是否都必须用相同的时间间隔，即在我的情况下，它们都必须在5分钟之内，或者它们都是后续的，因此我也可以给网络，例如，在距离对方5分钟的情况下，有4条记录的批，然后2条，例如两天后。更新:数据来自一个电子系统，因此时间中断是由于设备被关闭。很少只有几分钟才关机，而大多数情况下，它会持续更长的时间，比如几个小时，有时甚至几天。除其他元

浏览 0提问于2019-09-05得票数 4

回答已采纳

1回答

哪个存档的mpi与boost？

、、

我打算使用Boost::MPI在主进程和工作进程之间发送和接收一些数据--主要是大数组的数字。现在，我正在导入text_iarchive.hpp和text_oarchive.hpp作为归档实现。这些是这个应用程序中最好的吗？如果数据是BOOST_IS_MPI_DATATYPE，我使用的是哪一个，这有关系吗？谢谢

浏览 3提问于2017-04-27得票数 0

回答已采纳

3回答