首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

linux

理解 shell 先来说下shell是什么,shell是Linux/Unix的一个外壳,Linux/Unix通过shell与内核交互,shell接收用户或程序的命令进而转化成内核明白的命令,内核完成任务后再返回有用的信息给用户或者程序...Linux服务器被黑遭敲诈,如何在3小时内紧急逆袭 作者介绍:陈浩,北信源研发工程师,五年Linux工作经验,热衷技术研究、实践和团队分享。...看完就会用的 GIT 操作图解分析 无论你是前端还是后台,无论是还是移动端研发,GIT 是逃避不了的东西,当然你说你要用 SVN,那不在这次的讨论范围之内。...本文主要讲述如何在 Linux 下连接 V** 服务。....… 10 个非常有趣的 Linux 命令 Linux 当中有很多比较有趣的命令,可以动手看看,很简单的。

14K30

【扯淡篇】故障的觉醒力?

,我们是认真的,故障,我们更是认真的。故障,真的是最好的老师,因此我才想写这篇文章! 最近互联网也是非常有意思,接二连三的发生故障,让我们一起先回顾一下。...如果广义的去看这个,我还会把它归结成问题。不过对于以上的故障,从的角度来说,我依然会说官方结论不够专业,希望内部不是这样的哈。...不断的审视我们的能力和IT的能力,说“故障最好的老师”的原因也在于此,它能够不断驱使我们走向更高的成熟度。...是复盘的首要负责人,复盘是为了找到根因(Root Cause),根因和故障现象不同,举个例子,故障现象是交换机故障,根因是因为技术架构没有对交换机故障做到容错,根因是对这种故障缺乏有效的临时应对机制...你们真的重视故障了么?你们真的重视了么?故障不能带来人的春天,从根本上去意识到的重要性,那才是人真正的春天。

65711
您找到你想要的搜索结果了吗?
是的
没有找到

掌握必备技能--问题故障定位

同样对于内存有些概念需要清楚: 主存 虚拟内存 常驻内存 地址空间 OOM 页缓存 缺页 换页 交换空间 交换 用户分配器libc、glibc、libmalloc和mtmalloc LINUX内核级SLUB...要监测 IO 性能,有必要了解一下基本原理和 Linux 是如何处理硬盘和内存之间的 IO 的。...网络 7.1 说明 网络的监测是所有 Linux 子系统里面最复杂的,有太多的因素在里面,比如:延迟、阻塞、冲突、丢包等,更糟的是与 Linux 主机相连的路由器、交换机、无线信号都会影响到整体网络并且很难判断是因为...Linux 网络子系统的问题还是别的设备的问题,增加了监测和判断的复杂度。...目前供职于滴滴基础平台部-技术专家岗位,主要负责分布式Ceph系统。个人主要关注的技术领域:高性能Nginx开发、分布式缓存、分布式存储。 来源:简书,转载请联系作者获得授权

1.2K20

管理之线上故障处理原则

应急目标 在生成环境发生故障时快速恢复服务,避免或减少故障带来的损失,避免或减少故障对客户的影响 应急原则 应第一时间恢复系统,而不是彻底解决呢问题,快速止损 明显资金损失时,要第时间升级,快速止损 指标要围绕目标...对数据库的负载、慢查询、连接数等监控 对缓存的连接数、占用内存、吞吐量、响应时间等监控 消息队列的响应时间、吞吐量、负载、堆积情况等监控 定位问题 分析定位过程中先考虑系统最近发生的变化,需要考虑如下几方面 故障系统最近是否上过线...做了哪些事情,及时发生故障,也不会产生影响? 改进措施 根据回顾问题提出的改进措施,以正式的项目管理方式进行统一管理,采用 SMART 原则来跟进 参考 分布式服务架构原理、设计与实战

2.1K30

故障自愈——游戏的终极福音

报名请点击【阅读原文】 Chapter 1 【故障自愈的思路及解决方案】 故障自愈对意味着什么 在游戏领域,各种专业化解决方案越来越成熟和丰富,各类自动化工具不断涌现,包含发布变更、容量伸缩等多种场景的游戏云服务也在逐步优化和推广中...从团队核心价值来看,个人认为,相比起对各种操作的需求,业务侧更需要提供的是全面而高水平的业务质量保障服务,包括对业务架构及部署的优化服务,包括专业而精细化的游戏健康度管理,以及快速的故障处理服务等...故障自愈服务尚未出现时,故障自动恢复方面的处理一般是这样的:在运营服务器上部署监控脚本和异常处理脚本。当监控脚本发现业务任何异常时,调用处理脚本进行自动恢复。...可以很轻松的接入到自愈中。 故障自愈能够帮助业务第一时间查明问题原因、并马上恢复故障,后续还能帮助输出阶段性待优化问题形成闭环管理。...同时,监控和自动处理完全做到了本地,告警分析收敛等功能实现起来更复杂,需要投入的成本也会高很多。 使用自愈服务,可以非常轻松的实现这种故障的自动恢复。

2.4K80

Linux常见故障排查和处理的33个技巧汇总

作为linux,多多少少会碰见这样那样的问题或故障,从中总结经验,查找问题,汇总并分析故障的原因,这是一个Linux工程师良好的习惯。...下面汇总了我做项目过程可能出现的故障及解决方法,看看是否与你有共鸣,并对你有帮助?...看这错,我就问他是不是在windows下编写的脚本,然后在上传到linux服务器的……果然。...序号 故障点 分析与解决 1 Linux系统安装初始状态时,找不到硬盘,并无法进入下一步安装 进入COMS设置,找到硬盘设置的相关选项,并设置为兼容模式 2 Linux系统安装时,在硬盘分区完成后,无法继续安装...云计算及高薪实战班》2018年03月26日即将开课中,120天冲击Linux年薪30万,改变速约~~~~ *声明:推送内容与图片均来源于网络,部分内容会有所改动,版权归原作者所有,如来源信息有误或侵犯权益

3.3K71

远离故障的十条原则

线上更新要有回滚,在同样的环境测试过再上线 是一门经验的学科,是一门试错的学科。永远要做最坏的打算。不要寄希望于每次都有逆天的好运气。...设备故障本来就是小概率事件。故障后,备份在失效。可以收拾东西,准备找下家了。 在说一次,不要寄希望于可有可无的运气。重要的事情说三遍。...这些帐户包括linux用户还包括数据库帐户 你的sudo权限是否开放给了某些用户,这些用户是否安全 用户密码是否经常修改,是否加密不让具体人员直接看到,密码强度是否足够,密码重试次数达到一定次数是否黑名单...你的生产环境和线下环境是否隔离,数据库是否和外网隔离 是否一些工作明明可在开发库和测试库做,却被放到生产环境上去了 是否有专门人员负责线上应用发布,从而避免开发人员接触生产环境 交接和休假最容易出故障

47020

规范:线上故障处理的流程模板

流程机制故障发现后,On-Call 的 SRE 或 故障指挥官 有权召集相应的业务开发或其它必要资源,快速组织 事故处理小组。...如果问题和恢复过程非常明确,故障指挥官 仍然是 SRE 或 ,就不做转移,由他来指挥每个人要做的具体事情,以优先恢复业务优先。...详细流程图```sequenceOnCall->故障:发现故障OnCall->OnCall: 初步分析故障原因OnCall->事故处理小组: 召集业务开发或其它必要资源事故处理小组->事故处理小组...: 事故反馈(10-15分钟一次)事故处理小组->事故处理: 事故排查OnCall-->高管: 问题疑难,影响范围很大,事故升级高管-->事故处理小组: 全权管理,进行下一步协商处理事故处理->事故处理...->事后总结: 组织故障复盘会议Note right of 事后总结: 总结原因,解决问题事后总结->事故处理小组: 输出会议总结,故障报告```COPY事故业务现象由谁在什么时间点报什么问题,尽量详细

2.7K20

网络配置——Linux基础

今天把Linux的网络配置总结了一下,尽管并不难可是是个比較重要的基础。然后我也不知到自己以后是否会做,可是我知道自己比較喜欢刨根问底。还有就是我很珍惜我以前掌握过的这些的技能。...今天突然间问自己,Linux网络配置的那个文件路径是什么。突然间小心脏又绷紧了,我发现记忆已经開始模糊了。尽管陆续有把之前的笔记整理上来,可是每次都有种写遗书的淡淡地忧伤在里面。...yes:支持IPv6 no:不支持IPv6 IPV6ADDR:IPv6地址/前缀长度 二、献给那些windows人员...在我实习的时候,我看到有非常多运window的员工适应不了windowsLinux的转变。...405d-b567-6cb32642acfa” 最后重新启动一下网络,查看一下效果: 多网卡绑定单个ip 使用情景: 这个通常是提高网络的高可用性,当一块网卡出现故障的时候使用第二快网卡

9.3K20

Linux常用知识(3)

.51cto.com/829079/745164 http://blog.sina.com.cn/s/blog_79bc8e830101m84w.html http://www.ttlsa.com/linux...linux下创建镜像文件 如果没有mkisofs命令,需要安装yum install -y mkisofs [root@localhost ~]# mkdir test [root@localhost ...root@localhost ~]# mkdir /jingxiang [root@localhost ~]# mount -o loop test.iso /jingxiang  //挂载镜像文件 linux...常见系统服务介绍:http://www.tiejiang.org/996.html irabalance服务主要是可以合理调配使用各个CPU核心,把压力分配到各个CPU核心上面,提升***能,降低能耗...Linux下,普通用户如何临时获取root权限,来满足工作需要。 在实际工作中,公司不会将root用户直接给员工使用,而是通过员工自己的账号临时获得系统的root权限。

26.9K34

IT 中的事件、故障排查处理思路

针对这个故障,业务希望能否更快的解决故障的恢复,经理希望制定优化呼叫中心故障处理流程,做了以下几件事: 1、优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键盘“ 2、提前发现故障,加强监控...1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于人员需要对应用系统的整体功能有一定的熟悉程度。...确认了故障现象后,才能指导人员初判断故障影响。 2)应急恢复 最基本的指标就是系统可用性,应急恢复的时效性是系统可用性的关键指标。...我认为要解决这个难点,需要先让人员经常使用这个手册。如果一个手册没有场景可以用,那就需要管理者为人员创造机会去使用这个手册,比如应急演练。...有些人员认为应用人员没有能力去把应用系统本身的内容了解得很透彻,所以应用人员在故障处理过程中的地位很尴尬,人员掌握操作权,但却不知道应该操作什么。

3K30
领券