前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据NiFi(十六):处理器Connection连接

大数据NiFi(十六):处理器Connection连接

原创
作者头像
Lansonli
发布2023-02-10 06:07:28
1.5K1
发布2023-02-10 06:07:28
举报
文章被收录于专栏:Lansonli技术博客

处理器Connection连接

一、查看队列中的FlowFile

单独启动“GenerateFlowFile”处理器后,可以观察到对应的Connection连接队列中有数据,在Connection连接上右键“List Queue”可以查看队列中的FlowFile信息:

二、查看FlowFile自定义属性值

队列中的FlowFile属性中还可以查看自定义的属性信息,例如:在“GenerateFlowFile”处理器中设置自定义属性“mykey”,对应的value值设置为“myvalue”:

单独启动“GenerateFlowFile”生产部分数据,查看队列中的FlowFile属性如下:

三、​​​​​​​Connection 配置

针对Connectiond连接,可以通过“Configure”配置更多信息:

弹出页面点击“SETTINGS”:

“FlowFile expiration”数据过期:

设置FlowFile expiration 时间可以删除队列中无法及时处理的数据,默认设置为0,数据永远不会过期,当设置了一个过期时间,在Connect连接上可以看到一个小时钟图标。

“Back Press”背压:

NiFi提供了两种背压配置机制,背压机制允许在队列中存在多少数据,当达到这个数据后,源头处理器就不再调度产生数据,防止数据溢出。"Back pressure object threshold"指定队列中的数据达到多少条数触发背压机制。"Back pressure data size threshold"指定队列中数据达到多大时触发背压机制。设置背压机制后,在Connection连接上会显示进度条。

“load balance strategies”负载均衡:

负载均衡策略可选项如下:

  • Do not load balance:不在集群中均衡数据,默认值。
  • Partition by attribute:根据用户指定的属性值决定数据发往哪个节点,相同属性值的数据会发往同一个节点。如果数据发往的节点断开连接,数据不会发送到其他节点,当节点再次连接到集群时,会自动发送。
  • Round robin:轮询方式分发数据,当一个节点断开时,会自动轮询发送到其他节点。
  • Single node:所有数据发送到单节点,不可配置哪个节点。当节点与集群断开后,数据不会发送到其他节点,直到该节点再次可用。

设置好负载均衡后可以看到图标:

“Load Balance Compression”负载均衡数据压缩:

当配置好负载均衡策略后,可以设置节点间数据传递是否压缩,可选项如下:

  • Do not compress:不压缩。
  • Compress attributes only:只压缩属性。
  • Compress attributes and content: 压缩属性和内容。

"Select Prioritization"优先级:

可以指定如何对队列中的数据进行优先级排序以便处理优先级高的数据。可以从"Available prioritizers" 拖动到"Selected prioritizers"标签下使用优先级。可以选择多个优先级,数据会依次按照选择的优先级排序,优先级可选如下:

  • FirstInFirstOutPrioritizer:给定两个FlowFiles,首先处理首先到达连接的FlowFiles。
  • NewestFlowFileFirstPrioritizer:给定两个FlowFiles,将首先处理数据流中最新的FlowFiles。
  • OldestFlowFileFirstPrioritizer:给定两个FlowFiles,将首先处理数据流中最旧的FlowFiles。这是在没有选择优先级的情况下使用的默认方案。
  • PriorityAttributePrioritizer:给定两个FlowFiles,将提取名为priority的属性。将首先处理具有最低优先级值的那个。建议设置数值,如果是字符串会按照ascii码排序。

四、​​​​​​​​​​​​​​查看Connections信息

在主菜单“Summary”中的“Connection”中可以查看连接的信息:

五、​​​​​​​​​​​​​​设置弯曲连接

可以双击Connection连接线来增加弯曲点,对弯曲点再次双击将删除当前弯曲点。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • ​处理器Connection连接
    • 一、查看队列中的FlowFile
      • 二、查看FlowFile自定义属性值
        • 三、​​​​​​​Connection 配置
          • 四、​​​​​​​​​​​​​​查看Connections信息
            • 五、​​​​​​​​​​​​​​设置弯曲连接
            相关产品与服务
            负载均衡
            负载均衡(Cloud Load Balancer,CLB)提供安全快捷的流量分发服务,访问流量经由 CLB 可以自动分配到云中的多台后端服务器上,扩展系统的服务能力并消除单点故障。负载均衡支持亿级连接和千万级并发,可轻松应对大流量访问,满足业务需求。
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档