在使用自定义IScheduler时，如何将指标从远程Storm worker发送到Graphite服务器？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Storm 理解内部消息缓冲机制

Storm工作进程中的内部消息当我说内部消息时，我的意思是在 Storm 工作进程内发生的消息，这只局限在同一个 Storm 节点内发生的通信。...也就是说，当一个工作进程中的 Task 想要将数据发送到 Storm 集群另一台机器的 Task 时，需要使用 ZeroMQ/Netty 进行传输。...使用 topology.transfer.buffer.size 配置的输出队列的每个元素实际上都是一个元组列表。不同的 Executor 发送线程批量的将输出的元组从输出队列发送到传输队列中。...除此之外，你还可以生成自己的应用程序指标，并使用 Graphite 等工具进行跟踪。...有关详细信息，请参阅我的文章将Storm指标发送到Graphite以及通过RPM和Supervisord安装和运行Graphite。

8072 0

监控即服务:用于微服务架构的模块化系统

它还支持python插件和shell脚本，因此您可以开发自定义解决方案：CollectD将从本地或远程主机收集数据（让我们假设有一个Curl）并将其发送到Graphite。...它是一个路由器，它收集我们从聚合器发送的所有指标并将它们路由到节点。路由时，它会检查指标的有效性。首先，它们必须与上面显示的前缀布局匹配，其次，它们必须对Graphite有效。否则，它们会被丢弃。...它还支持自定义脚本的执行。当它被触发并订阅自定义脚本或二进制文件时，它会启动二进制文件并将JSON发送到二进制文件的stdin。你的程序必须解析它。这取决于您如何处理JSON。...聚合器(brubeck) 指标数量： ~ 300000/sec 将指标发送到Graphite的时间间隔：30秒 服务器资源使用率：~6％ CPU（这里我们指的是功能齐全的服务器）; ~ 1Gb RAM;...我们设置了Redis服务器，使用连接到Postgres的Collectd-plugins并从那里获取数据，将指标发送到Graphite。但我们用哈希替换度量的名称。

1.5K3 0

您找到你想要的搜索结果了吗？

是的

没有找到

如何在CentOS 7上使用Skyline检测异常

可以在MessagePack官方网站上找到更多信息和API示例。本教程将向您展示如何从Graphite发送数据并收集到Skyline。...从Graphite获取数据 Graphite由几个组件组成，其中一个组件是碳中继服务。碳中继将传入的指标转发到另一个Graphite实例以实现冗余。...WORKER_PROCESSES - 此选项指定将从Horizon队列中使用的工作进程数。默认值是2。 PICKLE_PORT - 此选项指定侦听Graphite的pickle的TCP端口。...所有检测到的异常指标都显示为网页底部的列表。将鼠标悬停在其中一个指标的名称上时，在上方的图表中可以看到最后一小时和当天的相应时间序列。...他们在计算中使用Python库SciPy和NumPy。您可以自定义任何使用的算法。您还可以修改，删除或添加新的。

2.9K5 0

Storm极简教程

在Storm中编程时，就是在操作和转换由元组组成的流。通常，元组包含整数，字节，字符串，浮点数，布尔值和字节数组等类型。要想在元组中使用自定义类型，就需要实现自己的序列化方式。...小心使用这种分组方式。在拓扑中，如果希望某类元祖发送到所有的下游消费者，就可以使用这种All grouping的流分组策略。 Global grouping: 整个流会分配给Bolt的一个任务。...worker会订阅到transfer-queue来消费消息，同时也会发布消息到transfer-queue，比如需要进行远程发布时（某个bolt在另一个进程或者节点上）。...transfer-thread会订阅到transfer-queue消费消息，并负责将消息通过socket发送到远程节点的端口上。...随着Twitter内部Storm用户的增多，他们又发现，用户需要用指标监控他们的拓扑。为此，他们开发了Storm的监控指标API，使用户可以收集任意完全自定义的指标，然后把它们发送给任意监控系统。

1.9K5 0

Alluxio监控系统

指标提供了对集群中正在发生的事情的洞察力。它们是用于监视和调试的宝贵资源。 Alluxio 有一个基于 Coda Hale 指标库的可配置指标系统。在度量系统中，源生成度量，汇使用这些度量。...GraphiteSink：将指标发送到 Graphite 服务器。 MetricsServlet：在 Web UI 中添加一个 servlet，以将指标数据作为 JSON 数据提供。.../' static_configs: - targets: [ ':' ] 在指定要轮询的指标时要小心。...Web UI Master Web UI Metrics 除了通过 metrics servlet 或自定义指标配置显示的原始指标外，用户还可以在 Alluxio leading master (http...使用自定义名称将 Prometheus 数据源添加到 Grafana，例如 prometheus-alluxio。有关导入仪表板的帮助，请参阅教程。

3.9K2 0

干货 | 携程实时大数据平台实践分享

架构图的话就比较简单，就是从一些业务的服务器上去收集这个日志，或者是一些业务数据，然后实时地写入Kafka里面，Storm作业从Kafka读取数据，进行计算，把计算结果吐到各个业务线依赖的外部存储中。...，它会把所有的metrics信息实时地写到携程自己研发的看板系统Dashboard和Graphite中，在Graphite中的信息会被用作告警。...• STORM-643：当failed list不为空时，并且一些offset已经超出了Range范围，KafkaUtils会不断重复地去取相关的message；另外就是在用户使用过程中的一些问题，...比如说如果可能，我们一般会推荐用户使用localOrShuffleGrouping，在使用它时，上下游的Bolt数要匹配，否则会出现下游的大多数Bolt没有收到数据的情况，另外就是用户要保证Bolt中的成员变量都要是可序列化的...的功能实现了数据写入Dashboard和Graphite的功能这两点，此外我们结合了两者的API提供了一个统一的接口，能兼容两个环境，方便用户记录自定义的metrics。

2.3K6 0

指标存储: 我们如何从Graphite + Whisper迁移到Graphite + ClickHouse

Graphite + Whisper的问题 1、磁盘子系统高负载在迁移时，我们每分钟收到大约150万个指标。在该指标流程中，我们的服务器的磁盘利用率约为30％。...这就是我们想要实现的目标：将磁盘子系统利用率从30％降低到5％，将使用的空间量从1 TB减少到100 GB，能够在服务器上每分钟接收1亿个指标，开箱即用的数据复制和弹性，使该项目易于管理并在合理的时间内完成转换...•我们编写了一个小的python脚本，使用whisper-dump库，从我们的存储库中读取所有.wsp文件，并将数据发送到24个线程中的上述carbon-clickhouse。...占用的空间量从1 TB减少到300 GB， •我们每台服务器每分钟可以获得1.25亿个指标（迁移时的峰值）， •所有指标都切换到30秒的存储间隔， •实现数据复制和弹性， •无需停机即可完成过渡， •整个项目在大约...在kubernetes中动态创建的容器发送大量具有短期和随机生命周期的度量。这些指标的数据点很少，并且没有观察到存储空间的问题。但是在构建查询时，ClickHouse会从“指标”表中选择大量这些指标。

1.5K2 1

大数据基础系列之spark的监控体系介绍

当使用文件系统提供程序类（请参见下面的spark.history.provider）时，基本日志记录目录必须在spark.history.fs.logDirectory配置选项中提供，并且应包含每个表示应用程序事件日志的子目录...如果应用程序不在缓存中，则如果应用程序从UI访问，则必须从磁盘加载该应用程序。...这对这种情况，一个自定义namespace必须被指定，可以使用 spark.metrics.namespace设置为${spark.app.name}。...3),worker：Standalone模式下的worker进程。 4),executor：spark的Executor。 5),driver：spark的diver进程。...5),GraphiteSink：将指标追加到Graphite节点。 6),Slf4jSink：将度量标准作为日志条目发送到slf4j。

2.4K5 0

Storm介绍及原理

Storm的部署和运维都很便捷，而且更为重要的是可以使用任意编程语言来开发应用。...集群中的topology在如下的四个级别中存在并发： 1．Nodes 服务器：配置在Storm集群中的一个服务器，会执行Topology的一部分运算，一个Storm集群中包含一个或者多个Node...大多数情况下，除非明确指定，Storm的默认并发设置值是1。即，一台服务器(node)，为topology分配一个worker，每个executer执行一个task。 ...这种方式会导致所有tuple都发送到一个JVM实例上，可能会引起Strom集群中某个JVM或者服务器出现性能瓶颈或崩溃。 5．None Grouping 不分组。 ...集群中的概念 1、概述 Storm集群遵循主/从结构。

4.9K8 0

Storm进程通信机制分析

本文主要分析storm的worker进程间消息传递机制，消息的接收和处理的大概流程见下图在Storm中，worker进程内部的thread通信与worker进程间的通信有一些差别，worker间的通信经常需要通过网络跨节点进行...，Storm使用ZeroMQ或Netty(0.9以后默认使用)作为进程间通信的消息框架。...worker进程内部通信或在同一个节点的不同worker的thread通信使用LMAX Disruptor来完成。...对应接收线程，每个worker存在一个独立的发送线程，它负责从worker的transfer-queue中读取消息，并通过网络发送给其他worker，transfer-queue的大小由参数topology.transfer.buffer.size...每个executor有单独的线程分别来处理spout/bolt的业务逻辑和从outgoing-queue消费数据并发送到transfer-queue中。

3292 0

storm 分布式实时计算系统介绍

使用Storm时你需要关注以下几点：如果使用的是自己的消息队列，需要加入消息队列做数据的来源和产出的代码需要考虑如何做故障处理：如何记录消息队列处理的进度，应对Storm重启，挂掉的场景需要考虑如何做消息的回退...在Storm中编程时，就是在操作和转换由元组组成的流。通常，元组包含整数，字节，字符串，浮点数，布尔值和字节数组等类型。要想在元组中使用自定义类型，就需要实现自己的序列化方式。...小心使用这种分组方式。在拓扑中，如果希望某类元祖发送到所有的下游消费者，就可以使用这种All grouping的流分组策略。 Global grouping: 整个流会分配给Bolt的一个任务。...标记是在emit函数里完成，完成一个元组后需要使用ack函数来告诉Storm。这些都在一文中会有更详细的介绍。拓扑以一个或多个Worker进程的方式运行。...在Storm中，Netty比ZeroMQ而且提供了worker间通信时的验证机制，所以在就改用了。 Storm系统的实现语言。

1.7K3 0

spring boot 配置属性大全(3)

server.jetty.acceptors -1 要使用的接收器线程数。当值为-1（默认值）时，接受者的数量是从操作环境派生的。...server.jetty.selectors -1 要使用的选择器线程数。当值是-1（默认值）时，选择器的数量是从操作环境派生的。...management.metrics.export.graphite.host localhost Graphite服务器的主机，用于接收导出的指标。...management.metrics.export.graphite.port 2004 Graphite服务器的端口，用于接收导出的指标。...轮询量规时，将重新计算其值，并且如果该值已更改（或publishUnchangedMeters为true），则将其发送到StatsD服务器。

4.6K4 3

Storm——分布式实时流式计算框架

Worker – 进程一个Topology拓扑会包含一个或多个Worker（每个Worker进程只能从属于一个特定的Topology）这些Worker进程会并行跑在集群中不同的服务器上，即一个...重启(极小概率出现, 因为自身基于Netty和队列机制) 非Nimbus服务器故障时，该节点上所有Task任务都会超时，Nimbus会将这些Task任务重新分配到其他服务器上运行 2、进程挂掉 Worker...实现该函数的拓扑使用一个DRPCSpout 从 DRPC 服务器中接收一个函数调用流。 DRPC 服务器会为每个函数调用都标记了一个唯一的 id。...Transaction id从1开始，每个tuple会按照顺序+1。在处理tuple时，将处理成功的tuple结果以及transaction id同时写入数据库中进行存储。...例如，在计算全局计数时，计算分为两个部分：计算批次的部分计数使用部分计数更新数据库中的全局计数＃2的计算需要在批之间进行严格排序，但是没有理由您不应该通过为多个批并行计算＃1 来流水线化批的计算。

4.9K2 0

storm如何分配任务和负载均衡？

在supervisor周期性地进行同步时，会根据新的任务分配来启动新的worker或者关闭旧的worker，以响应任务分配和负载均衡。...worker通过定期的更新connections信息，来获知其应该通讯的其它worker。 worker启动时，会根据其分配到的任务启动一个或多个executor线程。...5、如果配置了NIMBUS-SLOTS-PER-TOPOLOGY，在提交topology到nimbus时，会验证topology所需的worker总数，如果超过了这个值，说明不能够满足需求，则抛出异常。...在收到任务时，如果相关的topology代码不在本地，supervisor会从nimbus下载代码并写入本地文件。...也完整地回答了这个问题：在Topology中我们可以指定spout、bolt的并行度，在提交Topology时Storm如何将spout、bolt自动发布到每个服务器并且控制服务的CPU、磁盘等资源的

1.6K6 0

大数据技术原理与应用之【流计算】习题

20.试列举几个Storm框架的应用领域 Storm框架可以方便地与数据库系统进行整合，从而开发出强大的实时计算系统 Storm可用于许多领域中，如实时分析、在线机器学习、持续计算、远程RPC、数据提取加载转换等...当Spout或者Bolt发送元组时，它会把元组发送到每个订阅了该Stream的Bolt上进行处理 5.Topology：Storm将Spouts和Bolts组成的网络抽象成Topology，它可以被提交到...当Spout或者Bolt发送元组时，它会把元组发送到每个订阅了该Stream的Bolt上进行处理 22.一个Topolog由哪些组件组成？...Storm集群采用“Master—Worker”的节点方式： Master节点运行名为“Nimbus”的后台程序（类似Hadoop中的“JobTracker”），负责在集群范围内分发代码、为Worker...Worker进程 28.试述Zookeeper在Storm框架中的作用 Storm使用Zookeeper来作为分布式协调组件，负责Nimbus和多个Supervisor之间的所有协调工作。

9393 0

Apache Storm内部原理分析

Supervisor Storm集群的从节点，负责管理运行在Supervisor节点上的每一个Worker进程的启动和终止。...进程对应的JVM实例中，则Tuple只发送给这些Task 另外，Storm还提供了用户自定义Streaming Grouping接口，如果上述Streaming Grouping都无法满足实际业务需求，...另外，Acker也是一个Bolt组件，只不过我们实现处理自己业务逻辑时，不需要关心Acker Bolt的实现，在提交实现的Topology到Storm集群后，会在初始化Topology时系统自动为我们的...进程内部可能存在一个Transfer Thread，用来将需要在Worker之间传输的Tuple发送到下游的Worker内上面，很多地方我使用了“可能”，实际上大部分情况下是这样的，注意了解即可。...Tuple在Task之间路由过程下面，我们关心每一个Tuple是如何在各个Bolt的各个Task之间传输，如何将一个Tuple路由（Routing）到下游Bolt的多个Task呢？

1.2K10 0

日处理20亿数据，实时用户行为服务系统架构实践

在处理流，行为日志会从客户端（App/Online/H5）上传到服务端的Collector Service。Collector Service将消息发送到分布式队列。...图4 双队列设计生产者将行为纪录写入Queue1（主要保持数据新鲜），Worker从Queue1消费新鲜数据。如果发生上述异常数据，则Worker将异常数据写入Queue2（主要保持异常数据）。...图5 补偿重试策略另外，数据发生积压的情况下，可以调整Worker的消费游标，从最新的数据重新开始消费，保证最新数据得到处理。...图7 正常数据流程在系统正常状态下，Storm会从Kafka中读取数据，分别写入到Redis和MySQL中。服务从Redis拉取（取不到时从DB补偿），输出给客户端。...因为携程的MySQL数据库现在普遍采用的是一主一备的方式，在扩容时可以直接把备机拉平成第二台（组）主机。假设原来分了2个库，d0和d1，都放在服务器s0上，s0同时有备机s1。

4132 0

干货 | 携程实时用户行为系统实践

在处理流，行为日志会从客户端（App/Online/H5）上传到服务端的Collector Service。Collector Service将消息发送到分布式队列。...图4：双队列设计生产者将行为纪录写入Queue1（主要保持数据新鲜），Worker从Queue1消费新鲜数据。如果发生上述异常数据，则Worker将异常数据写入Queue2（主要保持异常数据）。...图5：补偿重试策略另外，数据发生积压的情况下，可以调整Worker的消费游标，从最新的数据重新开始消费，保证最新数据得到处理。...图7：正常数据流程在系统正常状态下，storm会从kafka中读取数据，分别写入到redis和mysql中。服务从redis拉取（取不到时从db补偿），输出给客户端。...因为携程的mysql数据库现在普遍采用的是一主一备的方式，在扩容时可以直接把备机拉平成第二台（组）主机。假设原来分了2个库，d0和d1，都放在服务器s0上，s0同时有备机s1。

1.5K6 0

日处理20亿数据，实时用户行为服务系统架构实践

在处理流，行为日志会从客户端（App/Online/H5）上传到服务端的Collector Service。Collector Service将消息发送到分布式队列。...图4 双队列设计生产者将行为纪录写入Queue1（主要保持数据新鲜），Worker从Queue1消费新鲜数据。如果发生上述异常数据，则Worker将异常数据写入Queue2（主要保持异常数据）。...图5 补偿重试策略另外，数据发生积压的情况下，可以调整Worker的消费游标，从最新的数据重新开始消费，保证最新数据得到处理。...图7 正常数据流程在系统正常状态下，Storm会从Kafka中读取数据，分别写入到Redis和MySQL中。服务从Redis拉取（取不到时从DB补偿），输出给客户端。...因为携程的MySQL数据库现在普遍采用的是一主一备的方式，在扩容时可以直接把备机拉平成第二台（组）主机。假设原来分了2个库，d0和d1，都放在服务器s0上，s0同时有备机s1。

1.3K10 0

日处理20亿数据，实时用户行为服务系统架构实践

在处理流，行为日志会从客户端（App/Online/H5）上传到服务端的Collector Service。Collector Service将消息发送到分布式队列。...图4：双队列设计生产者将行为纪录写入Queue1（主要保持数据新鲜），Worker从Queue1消费新鲜数据。...图5：补偿重试策略另外，数据发生积压的情况下，可以调整Worker的消费游标，从最新的数据重新开始消费，保证最新数据得到处理。...图7：正常数据流程在系统正常状态下，storm会从kafka中读取数据，分别写入到redis和mysql中。服务从redis拉取（取不到时从db补偿），输出给客户端。...因为携程的mysql数据库现在普遍采用的是一主一备的方式，在扩容时可以直接把备机拉平成第二台（组）主机。假设原来分了2个库，d0和d1，都放在服务器s0上，s0同时有备机s1。

8312 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭