首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

日志系统Kafka运维的经验

背景介绍: 从事日志系统的开发运维1年多了,Kafka集群一直是系统中最重要的集群之一。及时有效地处理Kafka问题,是保障系统运行稳定的重要工作。...故障描述:硬盘分区/data9 只读, 出错信息:Read-only file system 系统日志数量巨大,持续的数据写入操作,导致磁盘很容易故障,出现故障时,需要尽快停止服务,减少对集群的影响。...partition消费僵死 曾经出现过某topic的单个partition数据无法消费的情况,其它partition可以消费,消费集群整体无异常,未找到具体原因,重启消费者后,问题消失,为了避免及时发现问题,系统增加了对所有...(二)Kafka监控 image.png 在运维kafka系统的过程中,我们根据业务的特点,为了能及时发现上述问题,对所有的集群进行了如下方面的监控: 1,生产者offset变化监控(partition...) 根据系统特点,数据是每时每刻都在产生的,可以对指定的Topic的每个partition,检测数据写入后的offset变化情况,如果未变化,则表示数据写入可能出现了异常,然后检查是集群问题或者是生产者

3.9K11

zookeeper 运维经验

去哪儿网也在很多场景依赖Zookeeper,所以我们也一直在摸索怎么更好的运维稳定的Zookeeper集群。在过去的几年我们也踩过一些坑,也因为Zookeeper导致了故障。...现在将我们运维Zookeeper集群的一些经验分享,也欢迎大家提供更好的建议。 那么在打算运维一套Zookeeper集群之前,我们先了解一些Zookeeper的基本原理。...网络流量以及client ip 这个会记录到监控系统里,这样很快能发现『害群之马』 10. 一些使用建议 a. 不要强依赖Zookeeper,也就是Zookeeper出现问题业务已然可以正常运行。...不建议做通用配置的第二个理由是,通用配置要提供给特别多特别多系统使用,而且一些公共配置甚至所有系统都会使用,一旦这样的配置发生变更,Zookeeper会广播给所有的watcher,然后所有Client都来拉取...而自己实现通用配置系统的时候,一般会对这种配置采取排队或分批通知的方式。 11.

43110
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Linux 系统运维工具 OpenLMI

    OpenLMI(全称 Open Linux Management Infrastructure)顾名思义就是开放式的 Linux 管理基础架构。...OpenLMI 是开源项目,旨在提高使用 WBEM 标准的 Linux 系统管理。OpenLMI 项目为管理 Linux 系统提供常用的基础设施。它还可让用户配置、管理并监控硬件、操作系统及系统服务。...OpenLMI 就是开放式的 Linux 管理基础架构。OpenLMI 是开源项目使用 WBEM 标准的 Linux 系统管理。...oenlmi 项目为管理 Linux 系统提供常用的基础设施。它还可让用户配置、管理并监控硬件、操作系统及系统服务。OpenLMI 旨在简化任务配置及产品服务器管理。...查看运程主机服务运行情况,使用如下命令: lmi> service show httpd.service Name=httpd Caption=The Apache HTTP Server Enabled

    9.7K40

    运维经验|Linux虚拟机如何挂载磁盘

    专注于研究Java,就职于科技型公司后端工程师 近期荣誉:华为云云享专家、阿里云专家博主、腾讯云优秀创作者 三连支持:欢迎 ❤️关注、点赞、收藏三连,支持一下博主~ 引言 今天早上在做业务系统日常巡检...环境准备 实验机器环境(虚拟机):Linux ky10.x86_64 、Linux CentOS 7.6_x86_64 其中本次实践演示为CentOS 7.6虚拟机。...5、 格式化写入文件系统 使用 mkfs.ext4 /dev/sdb1 命令来格式化磁盘并写入到文件系统中。 注意:这里可以用ext3,也可以用ext4。可以到/dev目录下查看有哪些格式。...个人觉得Linux中的工具不像windows,可以使用图形化界面程序处理,但是命令也可以完美的解决问题,尤其是在线上环境中历练我们的命令功底,而且看了很多国产操作系统在被应用到线上环境后,这是其他操作系统所不具备的优势...总的体验下来,国产操作系统非常好用,功能也很强大,值得入手体验一番!

    21010

    运维经验|Linux虚拟机如何挂载磁盘

    引言 今天早上在做业务系统日常巡检,发现日志盘没有办法写入进去了,第一个想到的就是磁盘被撑爆了。很好奇就去看了下,果不其然,满满当当的日志文件。...环境准备 实验机器环境(虚拟机):Linux ky10.x86_64 、Linux CentOS 7.6_x86_64 其中本次实践演示为CentOS 7.6虚拟机。...所以,我们需要额外的命令工具来做支撑,实验之前,先检查下机器已经挂载的磁盘,可使用lsblk命令来查询,如果不了解这个命令,可以参考博主以前的博文:Linux工具|运维工具lsblk使用小妙招 注意:Linux...5、 格式化写入文件系统 使用mkfs.ext4 /dev/sdb1 命令来格式化磁盘并写入到文件系统中。 注意:这里可以用ext3,也可以用ext4。可以到/dev目录下查看有哪些格式。...个人觉得Linux中的工具不像windows,可以使用图形化界面程序处理,但是命令也可以完美的解决问题,尤其是在线上环境中历练我们的命令功底,而且看了很多国产操作系统在被应用到线上环境后,这是其他操作系统所不具备的优势

    9821210

    系统运维|用 Netdata 监控 Linux

    如果你想深入了解图形化数据,你只需要下滑滚动条,或者点击在右边菜单的项目。通过每个图表的右下方的按钮,Netdata还能让你控制图表的显示,重置,缩放。...Netdata图表控制 Netdata并不会占用多少系统资源,它占用的内存不会超过40MB。因为这个软件是作者用C语言写的。...当然,你的系统需要安装git。Git在Fedora系统是默认安装的。如果没有安装,你可以用下面的命令在命令行里安装git。...$sudodnfinstallgit安装好git后,你要把仓库“clone”到你的系统里。运行下面的命令。...如果你以后不想使用Netdata,运行这个脚本可以从你的系统里面卸载掉Netdata。 你可以通过systemctl查看它的运行状态。

    7.1K30

    Zookeeper运维实践经验

    为了防止ZooKeeper因为排队的请求而耗尽内存,ZooKeeper将会对客户端进行限流,即限制系统中未处理的请求数量不超过globalOutstandingLimit设置的值。...AdminServer默认开启,但是可以被关闭通过下面的方法:设置java系统属性zookeeper.admin.enableServer为false....:不要超过1GB体积 建议:不要把ZK当做文件存储系统来使用 zk_open_file_descriptor_count/zk_max_file_descriptor_count 说明:当上述两个值相等时...在弹出的界面选择“远程进程”,输入“服务器IP:9991”(zookeeper服务器的IP和端口) 实践经验 分Group 要确保Zookeeper整个集群可靠运行,就是要确保投票集群可靠。...内存 因为Zookeeper将所有数据都放在内存里,所以对JVM以及机器的内存也要预先计划,如果出现Swap那将严重的影响Zookeeper集群的性能,在启动的时候可以修改java系统参数进行控制。

    1.4K30

    linux运维

    浅析操作系统的进程、线程区别 为了实现多任务系统,现代操作系统提出了进程的概念,在linux系统初期,进程作为 CPU 调度的基本单位,后来由于操作系统普遍引入了线程的概念,线程成为了CPU调度的基本单位...Linux服务器被黑遭敲诈,如何在3小时内紧急逆袭 作者介绍:陈浩,北信源研发工程师,五年Linux运维工作经验,热衷运维技术研究、实践和团队分享。...看完就会用的 GIT 操作图解分析 无论你是前端还是后台,无论是运维还是移动端研发,GIT 是逃避不了的东西,当然你说你要用 SVN,那不在这次的讨论范围之内。...HTTP原理和SSL原理 HTTP协议相关知识也属于前端必备基础知识,是很多公司面试时必问的知识点 一步一步打造 MySQL 高可用平台 作者一步一步打造 MySQL 高可用平台的经验分享...Linux常用命令使用 系统基础相关 使用root用户的环境变量切换到root用户 su - 显示当前工作路径 pwd 显示当前系统默认语言及键盘布局 localectl 显示系统中能支持的所有语言

    14.1K30

    Linux系统运维之修炼秘法

    而接下来要给大家介绍的就是一门发展延伸了很多年且越来越火的技能,那就是我们今天的猪脚——Linux运维。而想要拿到铁饭碗乃至高薪。那唯有将Linux运维这部功法修炼到至高境界。才有拿到高薪的机会。...而本期讨论的就是如何修炼Linux运维。 首先先给大家看一下Linux运维工程师必备技能: 1. Linux系统基础 2. 网络服务 3. Shell脚本语言 4. 数据库 5. 防火墙 6....基本上运维是系统对外提供服务的最后的把关者。因此,一个系统对用户来说是不是稳定跟运维有很大的关系。...7、要有精益求精的精神 应该说运维的工作的弹性还是很大的。即可以非常粗造的运维一个系统,也可以持续改进、优化系统,使系统越来越高效的运行。...去一些招聘网站,搜集一下运维工程师的职位要求,将这些职位要求进行汇总后,得出一条学习路线。学习最忌心焦气燥,调整一下心态,多和同道交流,争取早日成为一名Linux运维工程师!

    3K00

    Linux系统运维之修炼秘法

    而接下来要给大家介绍的就是一门发展延伸了很多年且越来越火的技能,那就是我们今天的猪脚——Linux运维。而想要拿到铁饭碗乃至高薪。那唯有将Linux运维这部功法修炼到至高境界。才有拿到高薪的机会。...而本期讨论的就是如何修炼Linux运维。...首先先给大家看一下Linux运维工程师必备技能: Linux系统基础 网络服务 Shell脚本语言 数据库 防火墙 监控工具 集群于热备 数据备份 文本处理 正则表达式 然后在这里给大家罗列出几条Linux...基本上运维是系统对外提供服务的最后的把关者。因此,一个系统对用户来说是不是稳定跟运维有很大的关系。...7、要有精益求精的精神 应该说运维的工作的弹性还是很大的。即可以非常粗造的运维一个系统,也可以持续改进、优化系统,使系统越来越高效的运行。

    2.6K00

    线上Linux服务器运维安全策略经验分享

    因此做为运维人员,就必须了解一些安全运维准则,同时,要保护自己所负责的业务,首先要站在攻击者的角度思考问题,修补任何潜在的威胁和漏洞。...设置一个相对复杂的密码,对系统安全能起到一定的防护作用,但是也面临一些其他问题,例如密码暴力破解、密码泄露、密码丢失等,同时过于复杂的密码对运维工作也会造成一定的负担。...文件系统安全 1、锁定系统重要文件 系统运维人员有时候可能会遇到通过root用户都不能修改或者删除某个文件的情况,产生这种情况的大部分原因可能是这个文件被锁定了。...2、文件权限检查和修改 不正确的权限设置直接威胁着系统的安全,因此运维人员应该能及时发现这些不正确的权限设置,并立刻修正,防患于未然。下面列举几种查找系统不安全权限的方法。...作为一个安全运维人员,要把握的原则是:尽量做好系统安全防护,修复所有已知的危险行为,同时,在系统遭受攻击后能够迅速有效地处理攻击行为,最大限度地降低攻击对系统产生的影响。

    2.4K21

    Linux系统运维问题解决(一)

    验证是否删除干净 whereis python whereis yum Step4.重新安装python和yum #在以下链接的镜像站中找到你系统对应版本的python rpm包,选择系统对应的位数..., (2) 当安装依赖包错误的时候进行一起安装即可(不知道谁与谁有依赖关系,就都一起安装就好了,亲测有效)) Q:Centos6.x安装/升级到python2.7 A:因为在linux机器上用yum安装的默认是...configure --enable-optimizations make && make altinstall #安装是否成功 /usr/local/bin/python2.7 -V #建立软连接,使系统默认...答:有先决条件,就是在进程中被打开,在内存中被分配资源; 恢复原理: 在Linux系统中,每个运行中的程序都有一个宿主进程彼此隔离,以/proc/进程号来体现(Linux本质上就是一个文件系统) 比如:...ls -l /proc/13067 查看进程PID为13067的进程信息;当程序运行时操作系统会专门开辟一块内存区域,提供给当前进程使用,对于依赖的文件,操作系统会发放一个文件描述符,以便读写文件; 当我们执行

    3K10

    运维审计系统

    4、集中身份认证 内网运维综合审计管理系统为用户提供统一的认证接口,支持多种认证方式。...6、集中访问控制 内网运维综合审计管理系统能够提供细粒度的访问控制,最大限度保护用户资源的安全。...8、工单审批 内网运维综合审计管理系统支持工单审批模式,第三方运维人员或普通运维用户访问特定的服务器设备必须经过管理员的临时审批授权才能进行运维操作,更好的提高运维流程简单并记录相应操作。...9、计划任务 内网运维综合审计管理系统支持建立计划任务,对被管资源进行口令修改(手动指定/随机生成)、账号同步、脚本执行等任务配置,方便运维人员对资源的维护,减少重复工作,提高运维效率。...Ø  资源类型:支持资源类型丰富,工作站及服务器资源(Windows、Linux、Unix等)、部分数据库资源(oracle、MySQL、SQL Server、DB2、Sybase等)、网络资源及B/S

    4.4K11

    转行做Linux运维工程师,简历的项目经验应该怎么写比较好?

    转行做linux运维工程师,首先要了解linux运维要做多少事情,需要什么基础,然后根据自己的情况进行有的放矢的追踪学习。...先了解下做linux运维工程师需要做的事情 1.熟悉linux命令基本操作,玩不转基本操作别的都是空中楼阁 2.熟悉tomcat,nginx,memcache等等应用服务器的配置和管理 3.熟悉集群的,...拥有一个资深的运维工程师是一个最幸运的事情,运维对经验的要求还是相当高的,有很多运维是技术研发人员直接转岗去的,这样在发现复杂的难以解决问题上就会快很多。 ?...对于楼主提到的简历的项目经验,其实这些都是实践类的东西,尽量的把自己工作经历中和运维相关的经验写上去,如果真的不具备这方面的经验,可以多学习一些运维的知识搞在简历上,不要为了获得面试的机会去造假,技术类的工种简历造假的后果基本上都是一竿子拍死...平时没事的时候安装一个纯的linux系统把常见一些软件自己亲自安装一下,并且把过程整理成文档,多总结归纳时间长了积累的经验够了慢慢也就有了感觉,安装部分相对比较简单,主要是监控部分以及出现系统故障如何快速的排除方面问题

    4.5K40
    领券