腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3451)
视频
沙龙
1
回答
如何
自动
执行
德鲁伊
批量
摄取
作业
?
我正在EMR集群上设置Druid,并使用批处理
摄取
成功地从gcs存储桶中
摄取
了拼图文件。 现在,我想
自动
化这个
摄取
过程,以便每天为具有相同配置的不同文件(在相同的s3存储桶中)运行。这个是可能的吗?
浏览 16
提问于2021-10-21
得票数 0
2
回答
如何
将Spark批处理
作业
结果写入Apache?
、
、
我知道
德鲁伊
有本地批处理入口,,如index_parallel。Druid运行Map-在同一个集群中减少
作业
。但我只想用Druid作为数据存储。
德鲁伊
有Tranquility的实时
摄取
。我可以使用宁静发送批处理数据,但这并不有效。
如何
有效地将批处理结果发送到
德鲁伊
?
浏览 4
提问于2019-11-11
得票数 0
2
回答
有没有办法通过http将历史数据推送到druid中?
有没有办法通过http推送把历史数据发送到
德鲁伊
?
浏览 1
提问于2018-03-15
得票数 1
4
回答
如何
将数据实时输入到Druid?
我想用一些api把数据发送给
德鲁伊
。我该怎么做呢?我可以用它来替代google analytics吗?
浏览 2
提问于2015-07-26
得票数 3
1
回答
深度存储不可达时
德鲁伊
的行为
、
上下文: 每5分钟定期查询一次数据。
浏览 4
提问于2021-10-07
得票数 1
回答已采纳
1
回答
非时间序列数据的Druid
、
、
、
、
这意味着,当她恢复她的互联网时,发送给
德鲁伊
(例如通过宁静服务器)的数据将被
德鲁伊
拒绝(因为
德鲁伊
实时不接受过去的数据)。问题:那我会有重复的事件吗? 或者..。
浏览 6
提问于2016-10-12
得票数 3
回答已采纳
1
回答
Oozie仅在指定的时间范围内运行
作业
、
、
我需要从RDBMS系统中sqoop 600TB的数据,并且我必须在从午夜12点到早上7点的特定时间范围内完成这项工作由于无法在一天内
摄取
全部数据,因此需要
批量
执行
。oozie有没有可能在早上7点之前终止
作业
,并在第二天重新启动失败的
作业
。
浏览 0
提问于2015-07-08
得票数 1
2
回答
如何
配置druid批次索引
作业
动态EMR集群用于批次摄入?
、
我试着用气流来
自动
完成
德鲁伊
的批次摄入。我的数据管道按需创建EMR集群,并在
德鲁伊
索引完成后关闭它。但是对于
德鲁伊
,我们需要在
德鲁伊
服务器文件夹中配置Hadoop。这阻碍了我的动态电子病历集群。我们是否可以在
作业
配置中覆盖Hadoop连接细节,或者是否有一种方法可以支持多个索引
作业
使用不同的EMR集群?
浏览 7
提问于2022-01-15
得票数 1
回答已采纳
2
回答
实时的蜂窝数据转换?
、
、
、
、
我有以下数据管道: A进程将消息写入 Spark结构化流应用程序正在侦听新的消息,并将它们写入HDFS ,批处理Hive
作业
每小时运行一次,并通过某些中介复杂插入语句读取来自HDFS的最新消息,填充一些表
浏览 1
提问于2020-02-13
得票数 1
回答已采纳
1
回答
一次运行一条Apache Camel路线
我的产品有一个使用Java编写的
摄取
服务,它运行Apache路由。有多个
摄取
服务实例运行在不同的VM上。
摄取
服务使用server 2016数据库服务器。在
执行
每个路由时,它在数据库中创建一个
作业
,然后每个
作业
步骤管理
作业
状态,直到达到完成状态为止。 要求确保骆驼路线一条接一条地
执行
,没有路线并行运行(即同时)。
如何
才能做到这一点?一种选择是使用自主开发的解决方案,其中每条路径都查看是否存在运行状态中的
作业
,只有在没有
浏览 4
提问于2022-04-20
得票数 0
1
回答
MarkLogic -高效批处理的设计建议
、
、
MarkLogic版本9.0-6.1 我们已经实现了两种
批量
摄取
模式。我们的MLCP
作业
在默认线程数为4的情况下运行得很好,最多有3个MLCP
作业
并行运行,确保在任何时间点至少有60个内核可用于实时(或接近实时)处理。但是,我不确定Informatica/NiFi批处理
作业
如何
使用内核。像MLCP一样,有没有办法限制Informatica/NiFi
作业
使用的内核,以确保有足够的内核/线程可用于实时处理?有没有一种方法可以控制/限制
浏览 21
提问于2019-10-24
得票数 0
回答已采纳
1
回答
如何
使用宁静核心API将数据发送给
德鲁伊
?
我已经安装了
德鲁伊
,并且能够在:上运行教程。我还能够
执行
本机json查询并获得结果,如:,
德鲁伊
设置运行良好。我在:上试用了示例程序wikipedia-index.json "type&
浏览 1
提问于2018-10-31
得票数 0
1
回答
C# Azure持久函数[聚合器]
、
、
、
、
是否可能有一个持久的函数,允许我在每个设备ID上运行一个线程,然后聚合和操作数据, 到目前为止,我能在网上找到的所有东西都是基于实体触发的,但是,我不明白
如何
才能真正触发它。
浏览 6
提问于2022-05-13
得票数 0
1
回答
elasticsearch 2.4中跨节点的大容量摄入分布
、
、
我目前正在运行一个10节点的ElasticSearch2.4集群,并使用Apache通过PutElasticsearch处理器大量
摄取
数据。当涉及到将负载分配给所有节点时,我很好奇Elasticsearch
如何
处理
摄取
(
批量
摄取
)。如果我只在我的Elasticsearch集群中的主节点上
执行
一个大容量的
摄取
命令,那么这个主节点会知道
如何
将摄入的负载分配给集群中的所有其他节点,比如一个循环类型的策略吗?
浏览 3
提问于2017-11-21
得票数 0
回答已采纳
1
回答
如何
执行
从蜂箱压缩兽人到
德鲁伊
的数据
摄取
、
我正在尝试从hdfs中的hive压缩表数据中
摄取
数据到
德鲁伊
。任何关于这方面的指示都会很有帮助。
浏览 10
提问于2017-05-27
得票数 1
1
回答
如何
更改Laravel的
作业
批处理表名和连接
、
、
、
、
Laravel 8引入了Job Batching,它允许
批量
执行
作业
,并在
批量
完成时
执行
操作。但是,Laravel文档中没有关于
作业
批处理表和数据库连接配置的部分。
如何
为job_batching表指定不同的数据库,是否可以重命名job_batching表名称?
浏览 27
提问于2021-01-26
得票数 1
回答已采纳
1
回答
MongoDB中的原子概率计数和集员
、
、
、
是否支持使用这样的数据结构,并在服务器端通过用户定义的函数或类似函数
自动
对其
执行
操作?或者有什么方法可以让我添加这样的功能扩展?(我可以通过另一个系统
摄取
数据并
批量
更新,以减少争用,但如果所有这些都可以在数据库服务器中处理,则会简单得多。)
浏览 0
提问于2015-04-29
得票数 0
3
回答
德鲁伊
能取代hadoop吗?
、
与
德鲁伊
相比,hadoop有什么优势?我读过
德鲁伊
和hadoop一起使用。那么,是否可以避免使用Hadoop呢?
浏览 3
提问于2014-06-09
得票数 10
回答已采纳
1
回答
MarkLogic -接收和协调性能调优
、
、
、
我有一个500MB的聚合XML文件,mlcp
摄取
需要30秒(大约80,000个文档),协调大约需要6分钟(在加载到最终DB之前将每个XML文档转换为JSON )。1)有没有一种方法可以启动mlcp加载并并行协调多个文件(在同一个
作业
中)?2)在harmonize
作业
中,我尝试使用-PbatchSize和-PthreadCount参数,但它们对
批量
大小和6个线程计数没有任何影响。
如何
通过增加这两个值来提高性能?
浏览 17
提问于2019-02-21
得票数 1
回答已采纳
0
回答
临时TableSpace使用率
、
我们的系统中有一个正在
批量
处理数据的
作业
,因此一些用户抱怨应用程序在
作业
运行时速度很慢,从AWR报告中我们观察到,即使在启用
自动
扩展的情况下,临时表空间也会等待32 so,有没有办法检查
作业
执行
时的临时表空间使用情况
浏览 7
提问于2017-12-04
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【运维自动化-作业平台】如何创建执行方案和作业模板
自动化运维-服务器批量执行……
CAD如何自动批量编号
腾讯问卷回收作业图片按学生姓名批量自动重命名
AutoRunner脚本参数化实现用例的自动化批量执行
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券