在单个查询中聚合时间范围和聚合所有时间_在PromQL/MetricsQL中按时间和聚合分组_在特征和时间上聚合数据 - 腾讯云开发者社区

、、

什么是用于快速聚合数据的首选数据存储？我有定期从其他系统提取的数据，数据存储应该支持以下查询：用户在一个时间范围内完成的事务数。用户在一个时间范围内完成的成功事务的总数是多少。查询应该支持大量数据的组by、计数、sum等sql结构。现在，我在Redis中使用自定义数据模型，数据在内存中获取，然后在其上运行聚合。这个模型的问题是，它与我的枢轴(列)和任何附加的枢轴紧密相连，如果加进去会导致我的数据爆炸，导致我的红宝石框上的大量内存消耗。我已经研究过elasticsearch，但是带有聚合的elasticsearch查询所用的时间超过200 of。还有其他的选择吗，

浏览 0提问于2016-02-11得票数 0

1回答

DynamoDB避免扫描时间序列数据集

、

我对在两个时间点之间使用唯一可识别资源的用户交互进行计数感兴趣。我的用例是：检索单个resourceId的总计数(在时间x和时间y之间) 生成按计数(时间x和时间y之间)排序的顶级resourceId的列表。理想情况下，我希望使用DynamoDB来实现这一点。在dynamo中对时间序列数据进行排序看起来有它的挑战，我在尝试对数据建模时遇到了一些反最佳实践。迄今为止的数据模型下采样表可能如下所示，其中count是resourceId在timebin范围内的交互次数。 | resourceId | timebin | count | |-------------

浏览 3提问于2016-01-14得票数 0

3回答

用子句计算组中每组的AVG值

、、、

我正在处理Server 2005中的一个查询，该查询查看一个记录电话的表，按一天中的小时对它们进行分组，并计算一天中每小时的平均等待时间。我有一个疑问，我认为有效，但我有困难说服自己，这是正确的。 SELECT DATEPART(HOUR, CallTime) AS Hour, (AVG(calls.WaitDuration) / 60) AS WaitingTimesInMinutes FROM ( SELECT CallTime, WaitDuration FROM Calls WHERE DATEADD(day,

浏览 0提问于2015-10-06得票数 1

回答已采纳

1回答

SOLR One集合(核心) VS。许多

、、

我有来自MySQL数据库的多个实体，这些实体将在SOLR中进行索引。为了获得最佳的性能结果(查询时间)，最好的方法是什么？在实体类型的字段中使用单个SOLR集合(核心) 或拥有每个实体类型的集合(核心) 谢谢

浏览 1提问于2013-03-13得票数 4

回答已采纳

1回答

动态SQL透视查询中的Group by和aggregate函数

、、、

我已经制定了以下动态SQL查询，将未知数量的行值(Maschine名称为nvarchar)转换为列。旋转列的行值应该是特定机器的停机时间和维护时间(两者都是整数)的总和。 DECLARE @columns NVARCHAR(MAX), @sql NVARCHAR(MAX); SET @columns = N''; SELECT @columns += N', p.' + QUOTENAME(Maschines) FROM (SELECT Maschines FROM Rawdata AS p GROUP BY MASCHINE) AS x; SET @s

浏览 2提问于2013-10-23得票数 0

1回答

组内减速器的蜂巢数和计数(不同)

、、、、

我被告知，计数(不同)可能会导致数据倾斜，因为只使用一个减速器。我用一个包含50亿个数据的表进行了测试，有两个查询，查询A： select count(distinct columnA) from tableA 查询B： select count(columnA) from (select columnA from tableA group by columnA) a 实际上，查询A大约需要1000-1500秒，而查询B则需要500-900秒.结果似乎是预料之中的。但是，我意识到这两种查询都使用370 mappers和1 reducers，而且它们几乎都有same cumulative

浏览 4提问于2020-05-13得票数 1

回答已采纳

1回答

在Ontology数据属性中连接不同的信息

、、、

每次访问文件时，我都需要用位置(lat，long)和时间信息对其进行注释；跟踪访问文件的时间和地点。我的应用程序是基于本体的，所以我需要在本体中定义新的属性。我目前使用的是一个数据属性： fileAccessedLocation 域:文件范围:字符串与日期和时间连接在一起的lat的逗号分隔表示形式。例如52.500556，13.398889_atTime_2014-07-14T08:09:00 在使用此属性的应用程序中，我能够实现所需的功能。但就本体而言，我不确定连接的时间和位置是否正确。如果连接方法是错误的，那么我将如何将时间和位置与单个文件访问联系起来？

浏览 2提问于2016-02-28得票数 0

回答已采纳

1回答

从多个条件计算命中次数

我将游泳比赛的结果存储在elasticsearch中，以便能够以不同的方式分析和显示数据。每个结果都以单独的文档形式存储，时间在millis中。如下所示： { "swimmer": "xyz123", "stroke": "butterfly", "distance": 25, "time": 20250 } 然而，对于年轻的游泳运动员来说，当他们在五种不同的项目类型(不同的笔划)中达到特定的时间时，就会获得奖励。我希望能够找到所有在所有五项项目中的时间都低于指定时间的游泳运动员(不

浏览 0提问于2019-05-07得票数 1

回答已采纳

1回答

没有Opscenter的Cassandra时间序列汇总

、、、、

我正在尝试弄清楚聚合和汇总Cassandra时间序列数据的最佳实践是什么。我偶然看到这个，上面提到Opscenter可以用于汇总，但我认为这对我不起作用，因为我没有使用企业版的Cassandra。我想将时间序列数据聚合到几个存储桶中(1分钟、30分钟、1小时、4小时、12小时、1天、3天等)。我想使用这些数据来生成各种时间分辨率的图表，类似于。实现这一点的推荐方法是什么？我是新来卡桑德拉的。

浏览 7提问于2017-06-11得票数 0

1回答

Apache流中特定分区的聚合

假设我有一个名为SensorData的卡夫卡主题，S1和S2向其中两个传感器发送数据(时间戳和值)到两个不同的分区，例如S1、->、P1和S2 -> P2。现在，我需要分别聚合这两个传感器的值，比方说，在1小时的时间窗口中计算平均传感器值，并将其写入一个新的主题SensorData1Hour中。在这种情况下如何使用KStreamBuilder#stream方法选择特定的主题分区？是否可以在来自同一主题的两个(多个)不同分区上应用一些聚合功能？

浏览 5提问于2016-08-17得票数 2

回答已采纳

1回答

MySQL表缓存

、、

我对此还是个新手，所以我需要深入了解缓存是如何工作的。我正在做一些分析工作，所以我只对一些日期-时间之间的数据感兴趣。我必须在不同的列上执行count()、max()、avg() (对于相同的数据范围，总共有20多个查询)。我希望优化我的查询，以便缓存'SELECT * FROM table WHERE date BETWEEN startdate AND enddate'表，并对该数据执行后续查询。我是否可以做一些事情并保存处理过程，否则它将自动发生？

浏览 0提问于2012-09-04得票数 0

1回答

仅在无界范围内支持前面的范围。

我想尝试在时间窗口sql代码中进行avg()聚合 select user_id,timestamp avg(y) over(range between '5 second' preceding and '5 second' following), from A 但是系统报告错误 RANGE PRECEDING is only supported with UNBOUNDED 有什么方法可以为avg()窗口函数实现10秒窗口吗？窗口函数框架的范围与当前行时间戳之前的n秒钟和当前行时间戳之后的m秒相同。

浏览 0提问于2014-11-06得票数 3

回答已采纳

1回答

如何优化Firestore缓存和查询建模

、、

我正在制作一个Moneymanagement-应用程序，其中用户可以创建每天的转移。我目前正在列出主屏幕上的所有数据。目前，这并不重要，因为没有太多的数据，但想象一下，一个用户使用该应用程序几年，并跟踪他的所有支出。我的第一个想法是为用户缓存所有可用的数据，但这会导致太多不必要的读取，因为用户很可能不需要5年前的数据。因此，我认为解决方案应该是为该屏幕实现分页。但是：用户可以通过选择类别和时间段在另一个屏幕上获得有关其消费历史的统计数据。目前，每当这些参数发生变化时，我都会对它们运行一个查询，但这显然也会导致大量不必要的读取。所以问题是，如果用户选择获取5年前的统计数据，这些数据将

浏览 5提问于2020-03-13得票数 0

回答已采纳

1回答

SQL:使用窗口函数每天应用聚合结果

、、、、

考虑一个时间序列表，该表包含三个字段( time类型为时间戳)、balance (类型为数值)和is_spent_column (类型为文本)。下面的查询为给定间隔的最后一天生成有效结果。 SELECT MAX(DATE_TRUNC('DAY', (time))) as last_day, SUM(balance) FILTER ( WHERE is_spent_column is NULL ) AS value_at_last_day FROM tbl 2010-07-12 18681.800775017498741407984000 但是，我需要一个

浏览 2提问于2022-05-08得票数 1

回答已采纳

1回答

使用大型sql视图时的限制

、、

我正在寻找方法来扩大我正在做的一个小项目。目前，我有一套关于SSRS的报告，使用一个sql视图注销了许多存储过程。目前，这个视图是从3个数据库获取的数据中填充的。目前，这种方法运行良好，视图包含大约50,000行数据。为了扩大我的测试项目，视图可能最终包含150万到200万行，并被许多用户通过SSRS查询。有人能给我指点一下我应该在哪里指导我的时间来学习如何更有效地/更先进地完成这项任务吗？我理解这是一个很大的问题，所以即使是一些“阅读这个”类型的答案也会有很大的帮助。非常感谢你抽出时间阅读这篇文章。克里斯

浏览 1提问于2014-07-09得票数 1

回答已采纳

1回答

按时钟范围查询芒果文档-正向和反向

、、、

业务案例:我不想检索那些不想在一天中的一段时间内被检索的用户，例如下班时间。上的模式。 { 'name': String, 'from': Number, // 800 (8:00 AM) 'to': Number, // 1700 (5:00 PM) ... } 我使用聚合来获取用户，同时在其他操作中展开子文档数组。基本搜索条件在$match操作符中，如下所示。 User.aggregate([ { // some aggregation stuff }, { $match: { $an

浏览 0提问于2015-02-11得票数 0

2回答

对cassandra表执行范围查询

、、

我试图用以下模式存储数据： CREATE TABLE temp_humidity_data ( asset_id text, date text, event_time timestamp, temprature int, humidity int, PRIMARY KEY((asset_id, date),event_time) ) 我遵循了datastax的文章“开始

浏览 4提问于2014-07-23得票数 3

回答已采纳

2回答

为什么Cassandra不支持内部聚合？

、、

在许多书籍和文章中考虑到这句话：在柱状结构中，寻求聚合特定列值的查询是经过优化的，因为要聚合的所有值都存在于相同的磁盘块中。而卡桑德拉是列族NoSQL数据库。如果这句话是真的，为什么Cassandra不支持内部聚合功能？还是我误解了这个句子或概念？

浏览 2提问于2018-10-09得票数 2

回答已采纳

1回答

在时序表中按哪些列进行分区？

我想收集时间序列数据并将其存储在snappydata存储中。我将收集数百万行数据，并希望跨时间片/范围进行查询。下面是我想要执行的示例查询： select avg(value) from example_timeseries_table where time >= :startDate and time < :endDate; 因此，我认为我希望对时间列进行逐列分区，而不是传统的主键列。在我熟悉的其他技术中，如Cassandra DB，使用分区键中的时间列将直接指向分区，并允许在单个节点中提取时间片的数据，而不是跨多个分布式节点。为了提高性能，我假设我需要在此表中按列“ti

浏览 1提问于2016-08-25得票数 1

1回答

如果我们只需要第一列的id，那么当我们在select中有两个cols，其中一个有min/max聚合函数时，是否需要使用组？

、

假设我有一个OrderDetails表，如下所示(单击右边的OrderDetails表) 我想选择数量最大的productID 我问了这个答案，因此，这个答案是有意义的，如果我正在求和/平均某一项，然后将另一列(不进行聚合)按子句分组。例如 select depName, avg(salary) from department 在这里，您是平均的，没有组，所以查询是不明确的，avg什么depName？但是下面的查询是我所说的，如果我有这样的情况(OrderDetails表并选择最大数量的ID )，我可以使用下面的查询吗？ select ProductID, max(Quantity)

浏览 1提问于2019-08-30得票数 1

回答已采纳

3回答

嵌套内部hits的Elasticsearch聚合

、、

我在Elasticsearch中得到了大量的数据。我的加法有一个名为"records“的嵌套字段，它包含一个包含多个字段的对象列表。我希望能够从记录列表中查询特定对象，因此我在查询中使用了inner_hits字段，但这没有帮助，因为聚合使用0大小，因此不会返回结果。我没有成功地使聚合只对inner_hits起作用，因为无论查询如何，聚合都会返回记录中所有对象的结果。这是我使用的查询：(每个文档都有first_timestamp和last_timestamp字段，记录列表中的每个对象都有一个时间戳字段) curl -XPOST 'localhost:9200/_msearc

浏览 6提问于2017-09-04得票数 11

回答已采纳

1回答

MongoDB聚合性能

、

我们有一个问题，就是聚合查询要运行很长时间(几分钟)。集合：我们收集了2.5亿个文档，每个文档大约有20个字段，集合的总大小为110 20。我们在"our_id“和dtKey字段上有索引。硬件：内存： 24 4GB (6 *4GB DIMMS 1333 Mhz) 磁盘： Lvm 11TB由4个3TB磁盘组成： 600 maximum /s最大瞬时数据传输。 7200 RPM主轴平均延迟= 4.16ms RAID 0 CPU： 2* E5-2420 0@ 1.90GHz共12芯，有24个线程。戴尔R420. 问题:我们正在尝试对以下内容进行聚

浏览 0提问于2014-12-18得票数 25

1回答

Timetree:使用节点进行排序

、

在我的Neo4J中实现了时间树之后，我思考如何使用时间树的节点对查询结果进行排序，因为每个节点都是独立的，对于查询来说是不够的。在SQL中，我可能会使用CONCAT来生成一个排序条件，但在Cypher中，我可以使用一个提示。让我们假设 MATCH (e:Event) --> (h:Hour)--(d:Day)--(m:Month) -- (y:Year) RETURN e.name ORDER BY // here I would like to have an DESC or ASC order of the

浏览 3提问于2015-10-04得票数 0

回答已采纳

2回答

使用zrange按时间段查询Redis timeseries

、

我搜过书，读了不少书，却找不到答案。我相信在这里我可能对缓存实现有错误的想法。我有一组历史的和当前的金融股票数据，我想将这些数据缓存起来，以便快速访问API，这些数据遵循以下格式： id: uuid timestamp: unix_timestamp data: {...} 目的是允许由高速缓存服务的用户请求数据，但是我希望用户能够提供一个时间范围，例如1483142400 - 1493510400，以及一个秒形式的句点(例如300、900、1800、3600、86400)。我现在在如何处理这个问题上进退两难，我最初的想法是使用zadd将所有时间戳存储在一个按股票排序的集合中，然后使用zr

浏览 14提问于2017-07-28得票数 1

回答已采纳

1回答

ElasticSearch -在日期范围之间搜索以比较它们

、

我是ElasticSearch的新手(使用7.6版)，并试图找出如何在两个时间段之间进行搜索。我正在尝试的一个查询是查询2019年的第12周和2020年的第12周。目的是比较结果。在阅读文档和寻找样本时，我已经接近了我要找的东西。简单的方法是用两个不同的日期触发两个查询。但我想限制查询的数量。我基于读取文档编写的最新查询是使用聚合，但我不确定这是正确的方法： GET sample-data_*/_search/ { "query": { "bool": { "must": [ { "range&#

浏览 1提问于2020-03-27得票数 2

回答已采纳

1回答

Autofac:注入整体AggregateService而不是具体服务的性能

、、、

假设我有一个控制器接受在Autofac中的容器中注册的AggregatedService DI： public interface IMyAggregateService { IFirstService FirstService { get; } ISecondService SecondService { get; } IThirdService ThirdService { get; } IFourthService FourthService { get; } } public class SomeController { private readonly IMyA

浏览 3提问于2021-03-18得票数 0

回答已采纳

1回答

忽略范围查询的弹性搜索聚合

假设我有一个索引，它索引了许多产品。价格从1美元到100美元不等。我想发送一个请求，以检索价格在1美元到50美元之间的产品，以及所有产品中的最高价格(100美元)。因此，我发送了一个同时包含范围和聚合查询的请求： { "query": { "range" : { "price" : { "from" : 1, "to" : 50 } } }, "aggs" :{ "ma

浏览 10提问于2019-08-02得票数 0

回答已采纳

2回答

事件源体系结构中不同时间点的多状态持久化和查询

、、

我正试图理解如何在事件源场景中处理这个问题。我有一个域对象，这是事件的来源。我想对对象执行不同类型的聚合和查询，但是我希望能够在对象的“生命周期”中，在不同的时间点上查询它。也许有一个例子可以说明:我有一个代表合同的对象。我有多个阶段的合同:它的最新版本，预先签署的版本，我们的客户收到的第一个版本，等等。用户希望能够在不同的时间点(查找查询和聚合查询)查询这个“契约”对象。数据在多个位置被持久化和查询(在事件源读取预测中是常见的)。我想知道以一种允许我查询它们的方式存储这样一个对象的多个“状态”的标准方法是什么？我最好的选择是用另一个读投影来“复制”数据吗？对数据存储的更新也不太可能，因

浏览 5提问于2021-12-11得票数 0

2回答

根据日期时间间隔匹配记录

、、、

在SQL Server2008中，我有一个保存事件和事件的日期时间的表。在另一个表中，我有一个可能的时间间隔列表，如下所示。有没有人可以举例说明，只有当事件日期时间落在间隔表的间隔内时，我才能从事件表中进行选择？ FromDate ToDate ----------------------------------------------- 2012-11-29 06:00:00.000 2012-11-29 07:00:00.000 2012-11-29 07:00:00.000 2012-11-29 08:00:00.000 201

浏览 0提问于2012-12-04得票数 0

回答已采纳

1回答

Elasticsearch聚合过滤结果不能正常工作

、、

两个样本文件员额/受害/测试/1 { "categories": [ { "type": "book", "words": [ {"word":"storm","count":277}, {"word":"pooh","count":229} ] }

浏览 2提问于2015-05-08得票数 1

1回答

获取带有Azure TimeSeries Insight的时间序列的最后值

、

如何在时间序列中查询上一个(最近的)事件及其时间戳？所描述的方法对我不起作用，因为我不能保证最近的事件是在一个固定的时间窗口内。就我的情况而言，这个事件可能是几个小时或几天前收到的。最后一个()函数返回最后一个事件，Get Series应该根据文档保留实际的事件时间戳，但是我对从这个API得到的结果感到有点困惑。我得到多个结果(有时甚至没有按时间戳排序)，并且必须自己找出最新的值。我还注意到，查询结果实际上并不反映最新摄入的值。只有当我多次摄入该值时，最新摄入的值才会包含在结果集中。有没有更多的直接或可靠的方式来获得时间序列的最后值与Azure时间序列的洞察力？

浏览 4提问于2021-03-22得票数 1

回答已采纳

1回答

按滑动时间段进行的数据聚合

、、、、

由于@Gordon Linoff和@shawnt00 00的评论，编辑和修正了查询和问题最近，我继承了一个SQL查询，该查询从日志数据库中计算某些时间窗口中30天内的事件数。它使用一个CTE (通用表表达式)生成从'2019-01-01‘到现在的30天范围。然后统计每隔30/60/90天的病例数。我不确定这是最好的方法。我所知道的是，它需要很长的时间来运行，而且我不完全理解它是如何工作的。因此，我试图以一种有效的方式重建它(也许它现在是最有效的方法，我不知道)。我有几个问题：我注意到的一件事是，这个查询不是使用DATEDIFF，而是简单地从comparisons?Is减去几天的时

浏览 2提问于2020-09-29得票数 0

回答已采纳

1回答

所有页面的ElasticSearch聚合

、、

我使用size和from关键字对ElasticSearch结果进行分页，每次页面更改都需要执行另一个搜索查询。我想用aggregations特性计算方面，但是聚合只基于受size和from关键字约束的结果计算，例如，当我请求列表中的记录20-30时，在这10条返回的记录上只计算。当然，我希望在所有匹配的记录上计算全局方面，这些记录在我切换页面时不会改变。除了执行一个额外的全局搜索( size和from不受约束)之外，还有什么想法可以做吗？

浏览 3提问于2015-07-15得票数 0

回答已采纳

1回答

随时间变化的范围支持--桶形分析

、、、

阅读，并尝试尝试它。下面是我的模式。模式： { "s" : "CB", "c" : "REQ_RCV", "e" : "sms_click", "st" : "i", "b" : "2", "a" : "1", "u" : "b1_h1_d1_m1_user_2", "c#" :

浏览 2提问于2017-01-22得票数 3

1回答

与计算成员一起使用作用域

、、

我的计较成员有问题。每当该成员参与计算或查询时，都需要大量时间执行。我想缩短执行时间。我必须从成员中删除IIF条件，并开始使用范围。 CREATE Member CurrentCube.[Measures].[AvgAmount] as IIF(ISLeaf([Customer].[ParentCustomer].currentmember), [Measures].[Value], (SUM([CCube^Customer].[ParentCustomer].CURRENTMEMBER.CHILDREN) / COUNT([Customer].[ParentCu

浏览 5提问于2013-09-12得票数 1

1回答

Lucen/Elasticsearch:对一个具有多个值的字段的查询

、、

以下是我想做的事。我在Elasticsearch中有一个带有几个文档的索引。在每个文档中，我都有两个字段: deviceField (设备名称)和pressionField (周期性的压力值)。我想在索引中查询每个设备的平均压力。你知道在一个查询中怎么做吗？实际上，我不想为了每个deviceName的查询而执行某种“for”循环。由于我有数以百万计的设备，这将花费太多的时间。谢谢你的关注和帮助。 S

浏览 2提问于2016-05-29得票数 0

回答已采纳

1回答

MongoDB查询响应太慢

、

我正在从事一个Golang项目(db MongoDB)。我已经执行了下面的查询，但是加载数据需要花费太多的时间。在这个过程中，我从两个具有多个阶段的集合中获取数据。 db.getCollection('Collection1').aggregate([ { "$lookup": { "localField": "uid", "from": "collection2", "foreignField": "_id",

浏览 3提问于2020-08-27得票数 0

2回答

具有大小和日期范围限制的C#弹性聚合查询

、

我有以下查询，哪个查询按主键主机I分组，然后按提供的时间间隔分组。我希望将聚合和命中限制在两个datetime对象提供的时间范围内。设置大小限制了点击次数，但我不知道如何对聚合进行相同的操作，以及如何为两者设置全局日期范围？ SearchResponse<LogLine> response = await _elasticsearchClient.SearchAsync<LogLine>(r => { r.QueryLuceneSyntax(request); r.Aggregations(arr => { arr.T

浏览 14提问于2022-08-23得票数 1

回答已采纳

1回答

选择“今天”的范围查询

、

我正在使用watcher来选择今天的记录。时间戳的格式为yyyy-MM-dd HH:mm:ss。now/d将时间舍入到一天的开始。但是下面的from/to值似乎不起作用。下面的查询出了什么问题？ "filter": { "range": { "ingestion_timestamp": { "from": "now/d", "to": "now"

浏览 0提问于2018-03-19得票数 0

1回答

DynamoDB如何查询重叠时间范围

考虑由一个主键和两个描述开始日期和结束日期的属性组成的DynamoDB表。如何在不扫描整个表的情况下查询某个时间范围是否与表中的时间范围重叠？例:发电机表有两条记录 PK Start End A 2019-01-01 2019-10-01 B 2019-06-01 2019-08-01 查询中记录的时间范围为2018-02-01至2019-03-01。

浏览 5提问于2020-01-02得票数 4

回答已采纳

1回答

带顺序和限制的Firestore复合查询

、、、

我想在我的firestore数据库中查询一个集合我想查询以获取当前用户提要的所有帖子。我现在这样做 let ref = Firestore.firestore().collection("feedItems") .whereField("uid", isEqualTo: uid) .whereField("wasViewed", isEqualTo: false) .whereField("isResharedPost", isEqualTo: false)

浏览 1提问于2019-09-16得票数 0

1回答

PostgreSQL中的时间是什么意思？

我发现在PostgreSQL中有两种类型的时间： \ time :返回查询执行时间和从服务器到客户端传输数据所需的时间。解释分析:返回查询执行时间他们是对的吗？如何查看查询计划时间？在什么范围内，查询执行时间是可接受的？小姐级？谢谢。

浏览 0提问于2014-03-14得票数 4

回答已采纳

4回答

Windows环境下存储简单数据的高读取性能数据库解决方案

、、、、

我认为我有一个简单的问题，但最近几天我一直在努力解决这个问题。长话短说，下面是对它的描述：我每天有大约100万条新记录，每条记录由record_name (字符串，约20个字符)、date、value组成，记录存储时间约为两年(数据库中有约7亿条记录)；大多数record_names每天都在重复；我需要在给定日期之间找到最大价值收益的能力，同时保持通过通配符record_name过滤结果的能力；运行此操作的软件需要在Windows上运行。最重要的是每个查询的执行时间。到目前为止，我已经尝试了MySQL数据库和卡桑德拉。虽然MySQL在Linux上有相当好

浏览 11提问于2011-02-25得票数 0

回答已采纳

2回答

如何避免在KQL查询中有太多的数据点(10000)？

、、、、

在工作簿中，我显示了一个比较节气门和非节流阀请求的时间图。查询使用了一个汇总操作符，当它正常工作时，它经常会遇到“太多的数据点(10000)”错误。我试图使用极限运算符，但它没有起作用(我认为这是因为汇总操作符正在执行两个操作，其中一个操作的数据点超过了)。此外，我在工作簿中包含了一个Timerange选择器，以限制时间跨度，但是即使在繁忙的一天中，一个小窗口也会导致错误出现。我也在考虑用另一种方式限制记录，但我不知道怎么做。图表必须显示RPS，因此不能将其更改为RPM。 Requests | project TimeGenerated, ResultType | sum

浏览 11提问于2022-06-04得票数 2

1回答

Cassandra:这是适合数据模型的模式吗？

、

在基于传感器的应用程序中，每小时监视多达30万个对象，每个指标都有成功和失败计数器。我的方案： CREATE TABLE measurements( objId int, hour timestamp, metric text, succ int, fail int, PRIMARY KEY (objId, hour, metric)); 数据保留期在1年内，这样表将有300k行，每行有24*360*30*2列(单元)。通常的查询是获取在指定时间间隔(可能是天、周、月)和指定对象(从1到数百)内聚合的计数器值。对于列切片，时间切片是完全可以的，而检索多个对象则有点

浏览 0提问于2014-06-20得票数 0

1回答

臭名昭著的实体框架-聚合根问题

、、

我在谷歌( StackOverflow )和谷歌( Google )等网站上跌跌撞撞，但无法理解如何实现它的概念。这里我有一个非常简单的模型：Item和ItemActivity。很明显，Item是聚合根，ItemActivity是一个实体。因此，根据DDD原则，我只应该实现ItemRepository。除了自己的-lets say CRUD操作之外，ItemRepository还应该管理其子实体的、ItemActivity的、CRUD操作。下面是一些实现问题：应该在域或存储库中实现子实体操作吗？加载与项相关的所有子实体或导航到它们，对于实体框架来说是可以的。用.include

浏览 1提问于2013-10-31得票数 3

回答已采纳

1回答

使用Aerospike Nodejs客户端进行分页

、、、

我用nodejs和Aerospike设置了服务器。我想实现分页列出的所有数据在集合上的航空公司数据库。Aerospike似乎不支持像limit、orderBy或skip这样的sql查询参数。使用LList部分解决了这个问题，因为默认情况下数据是按键排序的。另外，也许通过使用Aerospike Lua List，我们可以部分地实现一个使用list.take(number of elements from start)的UDF。然而，由于假设随着时间的推移集合变得非常大，OrderBy和跳过变得非常重要，并且不能通过UDF过滤有效地实现。对于如何处理这个问题，有什么建议吗？

浏览 0提问于2016-01-11得票数 2

1回答

如何改进cubejs的预发酵过程？(即使使用partitionGranularity，也要花很长时间才能构建preaggs )

、、、、

我们在预聚合创建性能方面遇到了问题。目前，我们为每个客户端的数据设置了特定的过滤器，并且通过扩展一个基本多维数据集(称为Metrics)并定义一个表示这些过滤器的段，为每个客户端生成不同的多维数据集。总之，我们有一个Metrics基多维数据集，并为客户端A, B, C生成动态多维数据集MetricsA, MetricsB, MetricsC。这些多维数据集中的每一个都有一个我们称为z的段，它包含针对每个客户端的特定的SQL查询。构建该段的数据是使用asyncModule从API中检索的，然后通过使用客户端的filter覆盖z段，扩展Metrics多维数据集以生成所有客户端特定的多维数据集。通

浏览 3提问于2020-02-12得票数 1

1回答

按时间自动聚合和分区SQL表

、、、

我有下面的SQL表，用于网络中由时间戳(流中的节点)定义的流。每一个流量都有一个体积。 | ID | timestamp | source | handover | nexthop | destination | volume | |----|-----------|--------|----------|---------|-------------|--------| | 01 | 123456788 | src001 | hnd 001 | nxt 002 | dst 001 | 1.23 | | 02 | 123456789 | src002 | hnd 001 | n

浏览 5提问于2016-07-19得票数 1

回答已采纳

1回答

是否有可能在PromQL中的聚合上执行range函数？

、、

通常，在PromQL中具有range函数和聚合的构造方式如下： sum by(label) (increase(metric{label="label"}[1h])) sum是聚合器，increase是范围函数。但是，我只想查询的度量标准在不同的时间以不同的标签值返回1。基本上是一个不断增加的计数器。Grafana中没有应用任何函数的(堆栈)图如下所示：因此，在这个度量上应用范围函数是无用的，因为它永远不会改变(仍然是1)。我想先sum by(label)，然后，然后对结果执行increase。它看起来像这样的东西： increase((sum by(label) (me

浏览 13提问于2022-11-29得票数 0

回答已采纳