腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
当
每行
的
时间
窗口
不
同时
,
如何
编写
单个
查询
来
运行
一些
回溯
聚合
?
、
、
我正在
编写
一些
SQL
查询
,以便根据历史服务数据为客户流失预测创建一个数据集。其中
一些
服务可以追溯到几年前。他们中
的
一小部分人在过去
的
某个时候被搅动了,而另
一些
人最终得到了更新。其中
一些
属性基于每个服务处于活动状态时处于活动状态
的
服务
的
聚合
。例如,我想要找出
当
单个
帐户处于活动状态时,同一帐户下有多少个服务处于活动状态。我目前正在使用Python wrapper<em
浏览 33
提问于2021-08-17
得票数 0
回答已采纳
1
回答
火花数据管线初始负荷对生产数据库
的
影响
、
、
我想
编写
一个Spark管道来对我
的
生产DB数据执行
聚合
,然后将数据写回DB。我
编写
管道
的
目的是执行
聚合
,而不是在
运行
时影响生产DB,这意味着我
不
希望用户在进行
聚合
时遇到滞后,也
不
希望DB有严重
的
IOPS。例如,作为SQL
运行
的
等效
聚合
查询
将花费很长
时间
,也会耗尽RDS IOPS,这会导致用户无法获取数据--试图
浏览 5
提问于2022-09-12
得票数 0
2
回答
Kafka流
聚合
:
如何
忽略
窗口
的
中间
聚合
结果
、
我们使用带有
时间
窗口
的
kafka-stream
聚合
来
计算事件
的
结束和。我们已经实现了我们
的
需求,但是我们有一个中间
聚合
结果
的
问题。
聚合
计算输入
的
记录值之和(按键分组),并返回KTable<String, Integer>。 而
不
缓存:对键A发出一系列输出记录,表示结果
聚合
表中
的
更改。我们
的
问题是,我们有其他
的
浏览 0
提问于2018-07-12
得票数 1
2
回答
Spark使用spark
窗口
函数获取每个
窗口
的
行计数
、
我想使用星火SQL
窗口
函数来进行
一些
聚合
和
窗口
化。 我想
运行
这个
查询
,给出每个类别的最大2收入,
同时
也给出每个类别的产品计数。在我
运行
这个
查询
之后 product, revenue SELECT category, revenuePARTITION BY cate
浏览 0
提问于2020-05-19
得票数 2
回答已采纳
1
回答
常规MongoDB性能故障排除
、
、
、
TL;DR:长
时间
运行
的
查询
会杀死其他用户
的
整个应用程序。规避这种情况
的
策略是什么? 您好,我在AWST2上
运行
MongoDB。小实例(2 2GB,1核)适用于流量较小
的
Meteor应用程序。它工作得很好,除非人们想要
运行
一个执行大约30个
聚合
以显示各种KPI
的
报告。
当
一个用户
运行
报告(大约需要一分钟才能完成)时,应用程序
的
性能非常糟糕(几乎为零
浏览 17
提问于2018-01-07
得票数 2
1
回答
基于两个子文档
的
Mondo-DB分组
、
、
我试图
编写
一个
聚合
查询
,以过滤两个子文档并对它们进行分组,但我似乎无法弄清楚
如何
使用
单个
查询
来
实现它,它是否可行。我尝试过
一些
聚合
和mapReduce
查询
,但无法使它们工作。"id" : 'A', }]] 基本上,我想分组读取和保存
的
子文档分别跨用户
浏览 1
提问于2015-03-03
得票数 0
回答已采纳
1
回答
基于
时间
戳值
的
数据串连
、
我有一个带有文本消息和
每行
时间
戳值
的
Dataframe。我可以通过遍历整个Dataframe,添加
时间
戳差异,并在实现
时间
窗口
时插入新
的
Dataframe
来
实现这一点。它可以工作,但很难看,我正在寻找
一些
关于
如何
在Scala中以更实用、更优雅
的
方式完成这一任务
的
建议。我查看了
窗口
函数,但是由于我没有进行
聚合
,所以在创建WindowSpec之后,我
浏览 0
提问于2019-08-04
得票数 2
回答已采纳
1
回答
使用可配置变量
的
SQL
查询
设计
、
、
我有一个web应用程序,它有大量
的
表和变量,用户可以在
运行
时选择(或
不
选择)。如下所示:Table ATable CResult Display = A.field1, A.Field3, B.field19 可以在
单个
结果集中返回
的
15+表中最多有100+个总字段。我们有一个
查询
,当前
的
工作方式是创建一个临时表
来<
浏览 1
提问于2014-11-25
得票数 0
1
回答
Map-降低MongoDb 2.2、2.4和2.6中
的
性能
、
基本上,它说尽量避免Mongo
的
MR
查询
,因为它是单线程
的
,根本不应该是实时
的
。两年过去了,我想知道从那以后发生了什么变化。现在我们有了MongoDb 2.2。我听说MRs现在是多线程
的
。请分享你
的
想法在MR使用
的
实时请求,如获取数据
的
web应用程序频繁
的
http请求。它能有效地使用索引吗?
浏览 1
提问于2012-10-02
得票数 29
回答已采纳
1
回答
每个键
的
动态
窗口
聚合
、
我有一个特定
的
用例,在这个用例中,我正在使用来自
单个
主题
的
数据。该主题接收包含特定类型
的
消息。
当
第一
浏览 2
提问于2020-05-19
得票数 1
回答已采纳
1
回答
文字将列转置为单列行
我已经针对这个表
编写
了一个
查询
,该
查询
查找
不
匹配
的
行,该
查询
每行
返回三个键值。每列都是一个键值,表示参与
不
匹配
的
服务器。
当
第三列与第一列不
同时
,它是
不
匹配
的
,我想详细查看所有这些行。为了进行检查,我希望使用
查询
的
结果
来
获得代码所表示
的
每条完整记录
的
详细信息,该
查询</
浏览 0
提问于2016-02-04
得票数 0
1
回答
Toad变量
、
、
我最近开始在蟾蜍DB2中工作,我正在尝试设计
一些
模板,在这些模板中,我使用了一个特定
的
术语来处理多个
查询
。困难在于,我很少将所有
查询
作为一个批处理
来
运行
。我
运行
一个
查询
来
研究
如何
最好地
编写
代码
来
进行BA修改;研究结果,并记下需要更改
的
术语和唯一标识记录
的
术语。所以我临时
运行
它们,我不想将它们作为一个批处理或
单个
浏览 0
提问于2017-07-21
得票数 0
1
回答
使用“转换”检查特定日期,如果不存在日期,则会导致转换失败。
、
在Server中,我正在
编写
一个
查询
,以计算某些用户事件之间
的
一些
时间
,为此,我需要为某个事件
运行
一个设置日期
的
聚合
查询
。一个事件可以在多天内
运行
,对于我用来验证我
的
查询
的
数据,有2月27日,2月28日
的
数据,但是该事件从2月25日到3月1日。我只使用一个子集
的
数据
来
验证
查询
,将会有更多<em
浏览 0
提问于2018-03-22
得票数 0
回答已采纳
1
回答
BigQuery范围装饰器复制问题
我们面临
的
问题,与BigQuery
的
范围装饰在流表。范围修饰器
查询
提供重复数据。我
的
BQ表是通过流插入定期从客户事件中获取数据。另一个任务是使用范围修饰器定期从表中获取
时间
约束数据,并将其发送到数据流作业。喜欢SELECT * FROM [project_id:alpha.user_action@1450287482158] 当我
运行
这个
查询
时,得到了91条记录。15分钟后,基于最后一次间隔
的</e
浏览 8
提问于2015-12-17
得票数 1
回答已采纳
1
回答
时间
窗口
聚集中
的
Kafka KStreams问题
、
、
、
、
对于KStreams
聚合
和
窗口
,我有一个问题。我想把一个记录
聚合
到一个记录列表中,只要它在一个
时间
窗口
内,它就具有相同
的
键。我之所以选择SessionWindows,是因为我必须使用会话中
的
移动
窗口
:假设记录A在10 :00到达;那么在10秒
窗口
时间
内(直到10:00:10)内到达
的
所有其他记录都将落入同一会话,
同时
要记住,这导致我们有一个移动
窗口
+10从最后收到
浏览 0
提问于2019-05-29
得票数 3
1
回答
Apache依赖于EventTime事件
的
时间
戳分配。
我是apache
的
新手,并试图了解EventTime和
窗口
的
概念是
如何
由flink处理
的
。下面是我
的
设想:,然后我使用下面的代码
来
打开上面的
窗口
并尝试获取
聚合
: .window(TumblingEventTime
浏览 1
提问于2021-12-16
得票数 0
1
回答
如何
处理resolvejs中
聚合
根之间
的
关系
、
、
、
我很难弄清楚
如何
处理resolvejs中
聚合
根之间
的
关系
的
一些
基本问题。基本
的
问题是我
如何
处理关系
的
完整性?要做到这一点,似乎你需要
同时
了解这两方面的知识,但这在
编写
端似乎是不允许
的
。设置如下:我正在尝试构建一个用户管理工具,并且我有两个
聚合
根,User和Organisation。我需要允许两者相互独立地存在,并定义它们之间
的
access关系(即用户可以访问任何数
浏览 21
提问于2021-06-26
得票数 2
4
回答
同步来自多个数据源
的
数据
、
、
、
、
我们
的
团队正在尝试构建一个预测维护系统,其任务是查看一组事件,并预测这些事件是否描述了一组已知
的
异常。根据特征集
的
不同,推理引擎将订阅多个Kafka主题和来自这些主题
的
流数据,以持续输出推理。 为了将一组事件分类为异常,必须在同一
时间
窗口
中发生事件。例如,有三个数据源将各自
的
事件推入Kafka主题,但由于某种原因,数据不同步。因此,其中
浏览 0
提问于2019-05-27
得票数 8
回答已采纳
1
回答
关于mongodb切分
的
建议
、
我读过mongodb切分指南,但我不确定哪种类型
的
切分键适合我
的
应用程序。欢迎任何建议。但我在海量数据上广泛使用了
聚合
框架。所有的
聚合
都有一个时限-即大多是最近
的
一
浏览 4
提问于2014-02-25
得票数 1
1
回答
Kafka流:处理来自不同分区
的
消息时
的
事件
时间
偏差。
、
让我们考虑一个主题,其中包含多个分区和按事件
时间
顺序
编写
的
消息,而没有任何特定
的
分区方案。Kafka Streams应用程序对这些消息进行
一些
转换,然后按某个键分组,然后使用给定
的
宽限期通过事件时
窗口
聚合
消息。这意味着,在groupBy洗牌之后,
当
消息来自不同
的
任务时,在内部主题
的
同一分区中
的
消息之间
的
事件
时间
排序将不会被保留。过一段
时间
浏览 3
提问于2020-11-16
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券