在R中，如何从较大的数据集创建单独的时间序列(以循环低谷并运行Mann-Kendall测试)？_在时间序列上创建循环，以基于R中的公式生成新的数据集 - 腾讯云开发者社区

php、google-cloud-platform

我正在GCP上开发我的数据存储，但我有两个问题，我是一个初学者，我不知道他们的API。我的环境是PHP，我写了这个指令： $datastore = new DatastoreClient(['keyFilePath' => 'myKey']); 我如何知道连接已准备就绪？我在找一个例子： if( $datastore->status_code === 200) 例如，200个代码已经准备好了。这个问题会影响第二个问题。当我试图从数据存储中获取一些信息时，如果我使用var_dump($datastore)，谷歌的响应是非常巨大的，我迷路了，我的数据在哪

浏览 56提问于2018-05-29得票数 0

1回答

关于列车测试时间序列分割的问题

python

在Time Series tasks中，我遇到了一个关于将数据拆分成训练和测试集的问题。我知道数据不能被混洗，因为保持数据的时间性很重要，所以我们不能创建能够展望未来的场景。然而，当我打乱数据(用于实验)时，我得到了一个离谱的高R平方分数。是的，R平方是用测试集评估的。有人能简单地解释一下为什么会这样吗？为什么在时间序列中混洗训练和测试数据会产生高R平方分数？我的猜测是，这与时间序列的趋势有关，但我不确定。我只是好奇地问一下，谢谢！

浏览 0提问于2020-05-31得票数 0

1回答

如何避免在PHPUnit上使用进程隔离的闭包序列化？

php、phpunit、integration-testing、nextcloud

我正在尝试为nextcloud的一个扩展(app)写一个集成测试。Nextcloud本身是基于Symfony的。长话短说，到目前为止，我以一个测试类结束，它抛出了以下错误消息： PHPUnit 8.5.15 by Sebastian Bergmann and contributors. IE 2 / 2 (100%) Time: 642 ms, Memory: 24.00 MB There was 1 error: 1) tests\Integration\

浏览 5提问于2021-07-14得票数 1

1回答

时间序列预测

time-series、feature-selection

我正试着预测另一个意甲的时间。我的方法是基于一个移动的窗户。我从以下特性预测serie的输出值:源serie的前一个值和6个过去值。增加前一次意甲联赛的价值会有用吗？我觉得我没有用曲线中包含的所有信息来预测期货价值。但是，我不知道如何使用所有以前的数据来预测一个值(首先，特性的数量将增长到低谷时间.)。 6个月时间窗法的警告是什么？有关于时间序列特征选择的不同方法的论文吗？

浏览 0提问于2014-12-28得票数 5

回答已采纳

1回答

从服务块中的队列大小创建数据集

simulation、anylogic、event-simulation

我是任何逻辑模拟的新手。在我的项目中，我希望在每个时间步骤从服务块中取出队列大小，并创建一个数据集。类似地，我还希望在每次复制之后从相同的队列大小中取出平均队列大小，并创建相应的数据集。有人能帮我做这件事吗？

浏览 2提问于2022-05-03得票数 0

1回答

时间序列静态性检验

r、time-series

我需要检查长度为7320的时间序列的二阶平稳性(我有1800个这样的时间序列)。这些时间序列是记录在一座山上1800个地点上的位移。我尝试在R：stationarity()中使用Priestley。对于1800年中的1个时间序列，我得到了以下值： p-value for T : 2.109424e-15 p-value for I+R : 9.447661e-06 p-value for T+I+R : 1.4099e-10 你能告诉我怎么解释吗？我所知道的是，如果T的p值是0，时间序列平稳的零假设就会被拒绝。另外，在1800年的第二次时间序列中，我得到了这些值； p-value for

浏览 0提问于2018-01-29得票数 1

回答已采纳

1回答

在培训最终模型时，我应该使用验证数据和val_loss吗？

machine-learning、neural-network、keras、machine-learning-model、cross-validation

我正在训练一种利用early_stopping来防止过度拟合的角膜模型。这要求我预留一个验证数据集。我的任务要求我将我的训练和验证按时间分开，这样我的验证集中的所有样本都会在我的训练集的时间点之后发生。我面临的挑战是，我验证中的示例(从定义上说，是时间上的最新示例)对于我的预测任务非常重要，我想用它们来训练最终的模型。从我所看到的来看，在传统的训练/测试阶段决定了模型配置之后，一般建议在所有可用的数据上训练一个最终的模型(将发布到生产中)(参见这里)。但是，如果我使用所有的数据来训练最终的模型，我就不能再利用early_stopping了，因为我将没有任何验证集(它将用于培训)。我可以

浏览 0提问于2022-09-03得票数 3

回答已采纳

2回答

如何将代码(在本例中为类)发送到服务器/程序并接收输出

c#、interprocess

情况是这样的：我有一个庞大的数据集，需要快速访问。这是一个金融数据集，所以基本上它的设置方式是，在每个时间点，你都有数千只股票的数据。现在，将这些数据加载到程序中需要一段时间(20-40秒)，我希望避免每次修改代码时都要这样做。基本上，我有一个想法，我想知道它是否有意义/是否是最优的。我在考虑建立某种类型的服务器，它加载了所有数据和所有对象定义，然后从第二个程序/客户端，我想向服务器发送一个预定义类型的类(一个策略类)，让服务器运行代码，然后让服务器将测试结果发回给我。在这种情况下，我正在创建交易策略，所以我有一个定义“策略”需要的抽象类。我有一个市场模拟器，它在每次日期改变时调用派生的

浏览 2提问于2011-02-17得票数 5

回答已采纳

1回答

如何在R中使用RandomForestSRC软件包寻找生存分析的准确性

r、random-forest、survival-analysis

我正在使用R中的randomForestSRC包来创建生存森林。我有训练和测试数据集。通过使用训练数据集，生长树(随机森林)，并使用测试集，进行预测。现在我想要得到预测生存输出的精度，我可以从预测output.But中获得错误率参数，不知道这是不是模型的精度，或者我们必须计算它的精度。当我搜索相同的内容时，我可以看到正态随机森林的准确性可以使用混淆矩阵来计算。但不确定如何计算生存输出的准确性。请让我知道，如何计算RandomForest生存模型的准确性。

浏览 8提问于2016-11-14得票数 2

2回答

能否将.NET 4.5.2程序集编程为用于Server 2008 R2的CLR2.0版本

sql-server、sql-server-2008-r2、sqlclr、asp.net-4.5

我正在用MicrosoftWebFramework4.5.2编写一个程序集，该程序集定义了在数据库连接(数据库中的.NET以及.NET端的DataTable )中使用的类型。服务器正在运行server 2008 R2。 Server版本为v2.0.50727，windows服务器上的.NET版本( R2也是2008版本)为4.5.2。由于.NET版本，Server实例将只支持CLR 3.5及更低版本。如果不立即升级到server 2012，我就不能改变这一点，因为这是一个生产服务器，但我已经围绕ASP.Net 4.5.2构建了一个应用程序，我不相信我现在可以将其更改为使用3.5。我对这些类

浏览 0提问于2018-04-09得票数 2

回答已采纳

1回答

大型数据集的验证测试

automated-testing、data-quality、validation、data-validation

我经常不得不在相当大的数据集上编写和执行验证测试。数据以不同的数量(一个文件和多个文件)和格式(有时类似于表) (csv，dbf，.)有时它像树一样(JSON，XML，.)。我必须执行的测试要么是根据列表或有效值范围简单地检查每个值(例如，temperature > -20 AND temperature < 50，或者有时检查多个记录之间的相互依赖关系(例如，属于同一类型的七个记录必须具有连续的时间戳)。我喜欢编写和执行这样的测试的语言是Python，但是我愿意学习一些新的东西，如果这会有帮助的话。如果可能的话，我想使用一个已建立的测试运行程序，如UnitTest、nose、

浏览 0提问于2016-09-02得票数 2

1回答

R在生产中-在批处理组中处理SQL数据库，直到数据库耗尽？

sql、r、production、dbplyr

背景我有一个问题，批处理，一个R脚本(大约。( 1000行)，它需要调用SQL后端来获取数据。数据是通过odbc从SQL中提取到R中的，而且我确实有编写后端的权限。我已经尽可能多地存储在后端，以减少本地内存的使用。然而，一个问题是由一些记忆密集的过程引起的，比如大量的相关性，以及时间序列结构的估算。当脚本应用于整个数据集时，这占用了大量的本地内存，这通常不会仅为了提取数据而贴现数据库的大小。脚本和数据结构我的脚本被设计成20个“项目组”的批次，每个组最多有100个项目，用于获取组中每个项目的时间序列数据。此数据存储为相对于“item组”的嵌套数据(请参见下面的图像)，并在整个脚本中使用

浏览 1提问于2022-03-18得票数 0

回答已采纳

2回答

如何在不同线程中获取UI元素？

c#、multithreading、windows-runtime、task

在我的应用程序中，我将数据保存到我的数据库(SQLite)。我不想阻止我的UI，所以我将数据保存在不同的任务中 await Task.Run(() => this.SaveTracks(books, filesCollection)); 我从我的包含数据的字典中获取TextBox TextBox tmpTextBox = parseData["title_" + i] as TextBox; 当它不在不同的任务中时，它工作得很好，但是当我用Task.Run设置的时候，我得到了异常，我不能使用它，因为我在不同的线程中调用元素。如何不在不同任务中阻塞U

浏览 2提问于2012-11-13得票数 0

回答已采纳

1回答

neo4j REST API慢速

neo4j、cypher

我使用带有Node.js和的Neo4j 2.0.0M4社区版，通过传递Cypher查询通过REST API访问Neo4j DB服务器。我观察到Neo4j从neo4j的webadmin返回的数据，甚至从REST APi返回的数据都非常慢。例如，返回900条记录的查询需要1.2秒，然后后续运行大约需要200毫秒。类似地，如果记录的数量增加到27000条，则在webadmin浏览器中的查询需要21秒。我想知道是什么原因导致REST API如此缓慢，以及如何提高性能？a)它正在使用CYPHER？jSON解析或者b) HTTP开销本身与在mysql中返回27000条记录的类似查询一样需要11ms 任

浏览 0提问于2013-09-24得票数 1

1回答

select_features方法背后的算法

python、time-series、feature-extraction、feature-selection

我最近开始使用tsfresh库从时间序列数据中提取特性。我可以在几行代码中获得一系列特性，这是非常酷的，但我对select_features方法背后的逻辑有疑问。我查看了官方文档并搜索了它，但找不到用于此的算法。我想知道它是如何工作的，这样我就可以在tsfresh中的数据处理之后决定在特性选择阶段做什么。

浏览 4提问于2019-10-01得票数 1

回答已采纳

2回答

JMeter:将请求主体保存到文件中

jmeter、http-post、export-to-csv

我已经看到了的回应，但没有解决问题。我想将一个动态请求体保存到csv，例如{"transfer":${id}，“a”：${ want }}。我希望实际的请求数据{“传输”：1234，“金额”：5678}保存到csv文件中。我有多线程并行运行至少50个用户，所以我不希望文件再次创建，并保存所有发送的请求数据。我需要的原因是，当我为几个用户运行时，应用程序响应不同，我们希望比较不同运行的数据(请求数据、响应头、响应体)。最好的。

浏览 21提问于2022-11-16得票数 0

1回答

数据存储中服务器上文件中的作业参数

database、oracle、parameters、datastage

你好，数据开发人员，我是非常新的工具。我正在尝试开发一个与Oracle stage并行的工作。我需要在运行时填充数据库参数。我看到为我们的项目设计的作业从位于ETL服务器上的文件中获取这些参数(DB名称、userID、密码、模式)。我无法找到作业如何命中该文件并获取值。我希望我已经清楚地提出了这个问题。你能一步一步地指导我如何从文件中获取参数吗？

浏览 5提问于2016-03-02得票数 1

2回答

随机森林用于时间序列数据集

time-series、modeling、random-forest

对于时间序列数据集，我想做一些分析并创建预测模型。通常，我们会将数据(通过整组数据的随机抽样)分割成训练集和测试集，并使用带有randomForest函数的训练集。并保留测试部分，以检查模型的行为。然而，有人告诉我，时间序列数据不可能通过随机抽样来分割数据。如果有人能解释如何将数据分割成时间序列数据的培训和测试，我将不胜感激。或者如果有任何替代做时间序列随机森林。问候

浏览 3提问于2015-09-09得票数 3

回答已采纳

1回答

如何创建callScript的手动VP？

rft

我有一个脚本，可以调用其他测试数据库的脚本。当脚本运行时，它会在控制台中显示查询结果。我如何创建一个手动VP来在日志中显示callScript的结果？

浏览 0提问于2012-11-22得票数 2

1回答

在kubernetes吊舱内循环运行命令n次

bash、docker、sed、kubernetes、kubernetes-pod

基本上，如果这是正确的方法，我需要澄清:我能够在k8s容器中运行sed命令。现在，同样的sed，我想循环10次，但不确定这是否有效，虽然我没有从kubernetes吊舱或日志中得到错误。请确认我的循环是否好。 'sed -i "s/$training:$.*/\1 12/" ghav/default_sql.spec.txt && lant estimate -e dlav/lat/experiment_specs/default_sql.spec.txt -r /out' 我想在同一个容器中执行这个工作命令10次。下面是对

浏览 0提问于2018-12-23得票数 1

1回答

用Keras对多时间序列输出进行多步预测

keras、time-series、lstm

我有一个数据集，如下所示： 📷 每一列都是不同的数字特征。每一行代表一个时间戳。我想要创建一个LSTM模型，它可以对所有特性的未来时间步骤进行预测。例如，我想使用第一个2000示例来训练我的模型，并使用下一个1000来测试它。问题是我不知道如何进行。因为我们在这个数据集中没有y的值，所以我考虑通过将时间t+1移到t有一个新的列y来创建它们。等等，所有的时间-步骤和所有的特点。之后的问题是，我不知道如何使用Keras为我的LSTM提供数据，以便使用这样的数据集进行几步预测。

浏览 0提问于2018-03-08得票数 0

1回答

如何训练LSTM用于多个时间序列数据--包括单变量和多变量情景？

tensorflow、time-series、lstm

我有数百个设备的数据(对不起，我没有详细说明设备和设备记录的数据)。对于每个设备，每小时记录数据。记录的数据为25个维度。我几乎没有什么预测任务时间序列预测我用的是LSTM。因为我有数百个设备，而且每个设备都是一个时间序列(多变量数据)，所以我所有的数据都是多变量数据的多个时间序列。为了处理多个时间序列，我的第一种方法是一个接一个地连接数据，并将它们作为一个时间序列(既可以是单变量，也可以是多元)，并应用LSTM并训练我的LSTM模型。但是通过上述方法(通过连接时间序列数据)，实际上我正在失去数据的时间属性，所以我需要一个更好的方法。请提出一些想法，或博客文章。请不要混

浏览 0提问于2019-05-11得票数 1

1回答

如何针对可以并行运行的JPA编写junit测试？

java、jpa、junit、jpa-2.0、parallel-processing

要编写所有访问数据库的单元测试(通过JPA+Hibernate)，以便它们可以并行运行，我需要知道什么？我们开始使用mavens并行单元测试特性，体验测试失败，当它们在一个线程中运行时不会发生这种情况。我将给出一个简短的例子，说明我们现在是如何编写测试的。我们在EntityManager中设置@Before和其他类，开始事务，最后插入类中所有测试所需的测试数据(测试特定数据是在测试中创建的)。@After测试正在运行，我们通过调用Transaction.rollback();和null来回滚所有成员变量。我们对内存中的hsqldb运行所有单元测试。 public class TestLogE

浏览 5提问于2011-08-09得票数 3

1回答

MATLAB -更快的文件写入速度

performance、file、matlab

我正在执行下面的代码，根据其中一行(指定为q行)中所有字符的值过滤从一个文件中取出的每组四行，并将过滤后的行写到一个新文件中。 fin = fopen(fname_in,'r') ; fout = fopen(fname_out,'w') ; y = 0 ; w = 0 ; fprintf(1,'Filtering') ; while ~feof (fin) w=w+1 ; if ~mod(w,50000) fprintf(1,'.'); end t = fgets(fi

浏览 2提问于2013-01-25得票数 0

1回答

时间序列多个事件预测

python、pandas、deep-learning、time-series、forecasting

我是时间序列的新手，我有一个问题，我有一个3列的数据集，时间，类别，频率这一类别。时间是从2016年到2017年底。我需要预测2018年每个类别的频率:数据集：我需要使用神经预言家来预测这些数据的频率，我只知道如何预测ds，y。所以请建议如何使用神经预言家来完成这项任务谢谢

浏览 8提问于2021-09-18得票数 0

1回答

Java EE/SQL:主键类型之间是否存在显著的性能滞后？

sql、jql

目前，我正在学习Java技术的一些基础知识。我遇到了一个特定的项目，并对底层数据库结构进行了更深入的研究。在服务器端，我研究了一个Java函数，它创建一个长度为32个字符的主键(基于连接时间、随机散列和附加的加密随机数)。我感兴趣的是对使用这样的主键造成的性能损失的估计。如果没有安全原因，创建这样的唯一ID不是更好吗?让底层数据库从0开始创建新的递增主数不是更好吗？当使用数字而不是字符串时，SQL/JQL搜索不是更快吗？

浏览 2提问于2013-05-29得票数 0

4回答

为基准测试目的模拟大型视图的查询

sql-server-2005、ado.net、benchmarking

我们的Windows应用程序通过ADO.NET和SOAP服务从Server视图中提取记录，并将它们显示在数据网格中。我们有几个有25,000行的案例，运行相对平稳，但是一个潜在的客户需要在一个列表中拥有这么多的数据。为了弄清楚我们现在的规模有多大，以及我们如何(以及有多远)可以实际地改进，我想实现一个模拟:让SQL Server发送虚构的随机数据，而不是显示实际数据。客户端和传输端将基本相同；视图(至少是底层表)的工作方式会有所不同。用户指定虚构行的数量(例如，100,000行)。目前，我只想知道客户端检索和处理数据需要多长时间，并且已经准备好显示数据。我想弄清楚的是:如何让Server

浏览 3提问于2008-08-31得票数 0

1回答

CC.Net构建服务器--如何查找根本没有完成的NUnit测试？

nunit、cruisecontrol.net

我有一个大约1500个测试的测试套件，它们通常在“合理的时间”内运行和完成。但是，最近我更改了部分代码以使用线程--现在我的构建会因为超时而失败。我想象一个线程拒绝死亡，构建等待，直到达到最大构建时间。我的问题是如何检测哪个测试导致了问题？我是否可以激活一些日志记录，以显示测试已开始/完成？当然，我可以通过在每个单独的测试方法中插入代码来完成-或者只是在fixture中插入代码，但这是我宁愿避免的大量工作。

浏览 1提问于2011-12-13得票数 2

回答已采纳

1回答

如何在循环中重复调用R并检索结果，以便在SAS中进行进一步处理

r、sas、sas-macro、do-loops、sas-iml

我简化了代码，以说明这个问题： proc iml; var=40; call ExportMatrixToR(var, "var" ); submit / R; sample<-sample(1:var, 50, replace=TRUE) endsubmit; call ImportDataSetFromR( "WORK.rdata", "sample" ); proc means data=rdata; output out=a; run; 如何更好地控制var，例如，如果我想尝试var=(20,40,80,100,120...)的不

浏览 5提问于2018-09-14得票数 1

回答已采纳

2回答

为大型集成测试集有效地设置测试数据:每个测试是否？

integration-testing、test-data

有了大量的集成测试，数据设置在运行时方面就成了一个障碍。你有什么经验来处理类似的情况？场景:涉及合同的200个API集成测试，其中的数据先决条件包括一个公司和一个人的存在，每个人都处于一个特定的(非默认)状态。案例1:每个测试都设置自己的数据 Pro:测试数据是在测试中管理的，没有对其他数据的干扰。 Con:为每个测试创建新的公司/人员大大降低了整个运行时案例2:数据设置主要是在测试项目级别的上完成的 Con:测试数据被管理在项目中的所有测试中，这使得管理和防止交叉影响变得更加困难。支持:创建可重用的公司/人员数据设置要小得多，导致更快的运行时(尝试和测试.) 案例3:数据设置使用

浏览 0提问于2019-09-02得票数 1

2回答

ML模型部署体系结构？

machine-learning、machine-learning-model、databases、data-product

我来自一个软件开发背景，我们拥有相同数据库的独立服务器(dev、test、prod)。之所以如此，是因为我们开发了针对dev DB的应用程序，针对Test运行了测试，而prod就是prod。这样我们就可以创建一个清晰的分离，并且不会降低我们构建应用程序的难度。你们用同样的方式训练你们的模特吗？有三个相同数据库的环境，当您的模型从开发到测试到测试，它是针对相应的环境进行的吗？示例：数据科学家围绕着3种不同的标志进行分类。使用dev env的数据库创建3种模型(A、B、C)。数据科学家对3种模型进行评估，并在测试/验证后选择模型A。数据科学家将代码部署到测试/分阶段env (相同的超参数

浏览 0提问于2019-05-14得票数 1

1回答

持久化实例化XmlSerializer

c#、.net、xml-serialization、persistence

我有一个相当大的应用程序，它将大约100个不同的类序列化为XML。由于在运行时创建XML序列化程序需要一些时间，因此我在加载应用程序时对最重要的类执行此操作。其他的，当需要的时候。为了提高性能，我正在考虑以某种方式持久化创建的序列化程序。当我在谷歌上搜索这个问题时，我发现了一种使用微软工具"sgen.exe“的方法。它允许您创建一个程序集，据我所知，该程序集包含指定程序集中类型的所有序列化程序。在尝试为我的程序集执行此操作时，我认识到所有程序集(以及它使用的所有程序集)都需要签名。在我继续创建大量签名文件并开始为所有项目创建签名文件之前，我只想确保没有遗漏任何东西。所以最后是我

浏览 0提问于2012-06-13得票数 0

回答已采纳

1回答

将完整结果集传递给数据流任务SSIS

sql、ssis、oledb、execute、flow

执行Sql任务中的Proc返回开始和结束日期，我将这些值存储为对象变量上的完整结果集。现在，我需要将结果集(开始日期和结束日期)传递给数据流任务。在数据流中，我将根据开始和结束日期从oledb源中提取数据，并将结果保存到文本文件中所以我的问题是如何将开始日期和结束日期传递给数据流任务，在执行sql任务中返回的开始和结束日期，我需要在数据流任务中作为参数传递(select ...创建日期介于起始日期和结束日期之间的起始表)

浏览 0提问于2013-12-30得票数 2

回答已采纳

4回答

这个R循环的更有效的版本

r、procedural-programming、declarative-programming

我已经习惯了Python和JS，对R也很陌生，但我喜欢它来进行数据分析。我希望在我的数据框架中创建一个新的字段，该字段基于一些if/ new逻辑，并试图以标准/过程的方式进行： for (i in 1:nrow(df)) { if (is.na(df$First_Payment_date[i]) == TRUE) { df$User_status[i] = "User never paid" } else if (df$Payment_Date[i] >= df$First_Payment_date[i]) { df$User_status[i]

浏览 2提问于2014-04-12得票数 0

回答已采纳

1回答

双向LSTM (BLSTM)的培训、测试和验证集

python、neural-network、time-series、keras、recurrent-neural-network

当涉及到正常的ANNs或任何标准的机器学习技术时，我理解培训、测试和验证集应该是什么(无论是概念上还是经验法则)。然而，对于双向LSTM (BLSTM)网，如何分割数据却让我感到困惑。我正在努力改进对个人主题数据的预测，这些数据包括被监测的健康值。在最简单的情况下，对于每个主题，有一个长时间序列的值(>20k值)，并且该时间序列中的连续部分由一组类别标记，这取决于主题当前的健康状况。对于BLSTM来说，网络被训练成所有同时向前和向后的数据。那么问题是，一个主题的时间序列是如何分裂的呢？我不能只拿最后的2000个值(例如)，因为它们可能都属于一个类别。我不能把时间序列随机分割

浏览 3提问于2016-01-24得票数 1

回答已采纳

1回答

基于mxnet卷积神经网络的时间序列分析

r、time-series、mxnet

我正在尝试使用mxnet包中提供的卷积神经网络函数来分析R中的时间序列。请让我知道1) num.filter在mx.symbol.Convolution中的值应该是什么? 2)在代码中需要做哪些更改，以便它适合一维CNN(时间序列)？参考：

浏览 1提问于2016-11-22得票数 0

1回答

在运行脚本之前等待加载google sheets数据

google-apps-script

我有多个用户谁提交每日进度信息通过谷歌表单在不同的工作地点。所有数据都被转储到单个工作表->中，称为主表我已经创建了单独的工作表，这些工作表使用query函数过滤与每个站点->相关的数据，称之为单站点工作表每个月，我都有一个谷歌应用程序脚本，为每个站点的回复创建一个按月的pdf摘要。这已经很好地工作了一段时间，但是最近，脚本运行并创建了一个没有任何数据的pdf。当我尝试解决这个问题时，我想我看到了问题所在。现在主工作表已经收集了超过1000行数据，每个站点工作表的查询功能需要几秒钟才能加载。在加载期间，脚本在单个站点中运行时没有任何数据。有没有办法确保在应用程序脚本在该

浏览 12提问于2019-06-12得票数 0

1回答

通过调用LoadTest.Abort()中止测试后，负载测试结果显示“正在进行”

c#、visual-studio、load-testing

我使用Visual Studio2010和SQL数据库进行负载测试。我在插件中编写了代码，以便在测试运行一段时间后调用LoadTest.TestFinished事件中的LoadTest.Abort(异常)。中止后，测试将停止，并在测试结果窗口中显示“已中止”。但奇怪的是，负载测试没有正确中止，因为通过查看数据库，它的状态仍然是“正在进行中”，并且没有"EndTime“。知道为什么吗？

浏览 1提问于2013-05-31得票数 0

1回答

差异中的变量

r、var

有人能帮我吗?如果我有一个由4个时间序列组成的多变量时间序列，其中一个是非文具的，需要差分才能使其成为文具，而其他的已经是文具了。我应该使用哪种类型的VAR模型？水平上的VAR还是差异中的VAR？如果我对整个多变量时间序列进行一次差分，并拟合某个VAR(p)，并找到一些预测，那么如何恢复到原始水平的预测，而不是差分序列的预测。另外，我如何检查协整？我在R工作，在R上的任何帮助都是值得的。谢谢

浏览 2提问于2014-01-28得票数 0

2回答

SQLite还是纯文本文件？

python、sql、database、r、file-format

我处理很多在Python、R和Matlab之间交换的文本/数据。我的选择是纯文本文件，但偶尔也会使用SQLite来存储数据和访问每个程序(虽然还不是Matlab )。我在SQL中不像在R中使用GROUPBY、AVG等操作那么多，所以我不一定需要数据库操作。对于这类需要在程序之间交换数据以利用每种语言的可用库的应用程序，有没有一个好的经验法则来决定使用哪种数据交换格式/方法(即使是XML、NetCDF或HDF5)？我知道在Python -> R之间有rpy或rpy2，但我想知道在更一般的意义上这个问题-我使用许多都没有rpy2的计算机，也使用其他一些在不同时间需要访问数据的科学分析软

浏览 0提问于2010-03-06得票数 8

回答已采纳

1回答

如何修复“无法加载动态生成的序列化程序集”错误

sql-server、web-services、sql-server-2008-r2、sqlclr

“无法加载动态生成的序列化程序集。”在SQL server 2008 R2中执行调用web服务的clr函数时出错。我在Visual Studio 2017中有一个数据库项目，其中包含一个调用web服务的clr函数。项目属性包括以下内容：项目设置目标平台= SQL Server 2008 SQLCLR目标框架= .Net框架3.5 SQLCLR生成序列化程序集= On 序列化程序集是在发布数据库时由部署后脚本在数据库中创建的。当我将数据库发布到Windows10 PC上的SQL Server2008R2实例时，执行clr函数会导致"Cannot load dynamically

浏览 39提问于2019-01-31得票数 1

1回答

如何在Python中将蒙特卡罗交叉验证应用于多元线性回归？

python-3.x、linear-regression、cross-validation、montecarlo

所有人。因此，我是Python的新手，我正在尝试根据10个不同的数值输入来预测一个数值变量。特别是，我正在尝试应用多元线性回归，但希望在训练-测试-验证阶段添加蒙特卡洛交叉验证。所以，我写了一段代码，看起来像这样： #I have imported libraries #imported the dataset #then created X and Y df. #then split the data into training and testing, with validation parameters as follows: from sklearn.model_selectio

浏览 0提问于2019-04-17得票数 0

1回答

扩展tf.io.gfile.GFile的吞吐量超过100/s

python-3.x、tensorflow、tensorflow-datasets

为了使GPU在培训期间得到充分利用，我需要能够向GPU提供大约250 MB/s的原始数据(数据是不可压缩的)。我正在通过一个快速网络访问数据，这个网络可以提供超过2GB/秒的数据，没有问题。Python的GIL使得很难将这些速度输入到运行Tensorflow的相同进程中，而不会对训练循环产生负面影响。Python3.8的共享内存可能会减轻这种情况，但Tensorflow还不支持这一点。因此，我使用tf.io.gfile.GFile通过网络读取数据(数据存储在高带宽S3兼容的接口上)。GFile的价值在于它不使用GIL，因此很好地处理了训练循环。为了实现高吞吐量，需要对网络IO进行重要的并行化

浏览 13提问于2020-01-10得票数 6

回答已采纳

1回答

使用Liquibase在每个测试类之前重新创建数据库

java、spring-boot、testing、integration-testing、liquibase

在集成测试期间，我在JUnit5和中使用Spring。在启动期间，我使用Liquibase创建我的数据库。我正在使用我的数据库的一个实例，我不想重新启动整个容器。但是，我希望在每个测试类之前删除所有数据库对象，并通过Liquibase changelog重新创建数据库。我发现了一些可能性，但使用起来很痛苦。我可以手动编写脚本，这是我不喜欢的，因为我每次都要更新它们。我知道，我可以重新启动数据库容器，但是它会使测试时间太长。还有@DirtiesContext花费了太多的时间。有没有办法告诉Liquibase放弃一切，然后重新运行变更量？(或者这个用例没有解决方案，因

浏览 3提问于2022-03-21得票数 0

2回答

变化检测

python、statistics、anomaly-detection

我有个关于变化检测的问题。应用领域是机器人/规划。 Background/setting: 在环境中(x, y, theta)的特定位置有一个传感器检测距离障碍物的距离(超声波/声纳传感器)。它按一定的时间间隔返回一些读数。假设读数是R，在一段时间内它记录了R+或R- (+/-是指由于传感器不准确而产生的变化)。案例1:我在传感器和障碍物之间引入了一个附加的物体( D，D < R)，以便在下一个实例中检测到并返回D。案例2:我移除原来的障碍，现在下一个障碍是D' (D' > R)，在下一个实例中返回D'。问题是否有一种方法可以准确地(或高概率地)说

浏览 0提问于2016-04-20得票数 5

回答已采纳

1回答

在时间序列上进行列车/试验分离的正确方法

python、deep-learning、time-series、lstm

我想用LSTM创建一个模型来预测用户下一个购买价值。为此，我使用了用户的购买历史记录。我已经创建了模型，它运行良好，但老实说，我不知道我做火车/测试拆分是否正确的方式。为此，我使用了(单变量)用户的购买历史记录(X-购买历史值，y-目标购买值)作为第一步，我创建了一个创建新数据的滑动窗口过程。(如图中所示)在原始数据集中，我有1000个用户有2820个时间戳和1个功能(购买值)，而滑动窗口过程中我得到了1000*2320个用户，有500个时间戳和1个功能。 X.shape -> OriginalDataShape (1000,2820，1) X.shape -> Modified

浏览 0提问于2020-07-13得票数 3

3回答

Airflow:将大型数据集从数据库传输到远程机器

postgresql、airflow

我有以下设置:远程机器'D‘包含Postgres DB。远程机器'C‘包含一个数据处理平台。Airflow正在本地计算机“L”上运行。预计来自数据库的简单select查询将产生大小约为1 GB的数据集。我想用在DB上运行查询并将结果传输到'C‘的任务之一创建一个airflow DAG。但GenericTransfer运营商的官方文档中写道： “这意味着要在内存中可以容纳的小型数据集上使用。” 如何可靠地将一个巨大的数据集从'D‘转移到'C'？

浏览 3提问于2016-11-22得票数 2

1回答

使用位于不同代码基中的盐类进行单元测试加密/解密

java、unit-testing、encryption、jce

首先，我要提到我见过和。我想通过验证一个库的许可证来保护它。许可证包含诸如最大用户和过期时间等信息。我遇到的问题是：加密器和解密器位于两个不同的代码基中。解密器与库一起打包，但加密器不是，所以很难将它们放在同一个测试套件中！在加密器中使用随机盐，所以即使在相同的输入下，每次加密器也会产生不同的输出，同样，我也不能对结果进行断言。为了达到目的，解密器(使它更难注入另一个类)是最后一个类，它的所有方法都是私有的，除了几个包可访问的入口点。我不想测试JCE，但是我想测试我的代码：从加密的许可证中提取盐，破解加密的许可证，将输出反序列化为包含许可证数据

浏览 8提问于2017-09-13得票数 0

1回答

如何编写集成测试？

c#、entity-framework、asp.net-web-api、continuous-integration、integration-testing

我的团队使用实体框架6 ORM开发了一个Web 2应用程序。我们的应用程序是一封电子邮件，它的主要目的和行动是从一个客户端发送一封信给另一个客户。由于这是应用程序的主要目的，我们都希望有一个集成测试，以确保信件发送正确。这是因为我们不想意外地插入会破坏它的代码。当寄出一封信时，我们要测试的主要行为是- 通过HTTP 方法接收信件，并在服务器上进行验证该信件被保存到数据库中。这封信是连载的。序列化后的信件通过外部模块发送到指定的目的地。这封信在接收方被反序列化。该信件被添加到接收客户的数据库中。我问这个问题是因为我对如何处理这个问题一无所知，但我

浏览 2提问于2016-03-27得票数 1

2回答

找槽长度

matlab

我在MATLAB中有很多这样的图，我有相应的数据(每个图25000点)。我想找出数据为0的最长时间的长度(在上面的图中突出显示的部分)。问题是，在其他较短的时间内，数据为0，并且在周期内(在1.4×10^4处可以看到)在x轴上有微小的峰值。我正在寻找一种方法，以编程方式找到这在MATLAB中。这段时间的长度以及数据中的其他低谷都有很大的差异，但一般来说，我要找的是最长的。

浏览 1提问于2018-01-17得票数 2

回答已采纳