首页
学习
活动
专区
工具
TVP
发布

Linux: Nginx proxy_pass域名解析引发的故障

故障描述 在有次更新代码时,发现前端能够打开,但是所有接口请求全是502(Bad GateWay) ?...故障排查 查看前端容器compose_ui_1的日志,刷了一大波502(Bad GateWay) ? UI没问题的话,第一反映就是 compose_api_1 跪了,所以直接去容器看看日志 ?...搞不明白为什么会转发到 172.17.0.5 难道是系统的域名解析错误了? ? 尼玛这真是太神奇了。 男人的直觉告诉我 nginx 有猫腻! 重启下容器的 nginx,然而容器也被重启了。。。...故障定位 只是为什么 nginx 会有这样的错误呢?不太应该呀。。 感觉应该是 nginx 内部域名解析缓存问题。 然后查了下资料,呵呵,还真有。...proxy_pass 如果后面跟真实域名,是真的直接复用还是有时间缓存? 本来想用 gdb 调试下这个问题,然而花了一天时间,毛都没有。

3.8K20
您找到你想要的搜索结果了吗?
是的
没有找到

故障分析 | cassandra 集群数据故障转移

---一、前情提要:我们知道 cassandra 具有分区容错性和强一致性,但是当数据所在主机发生故障时,该主机对应的数据副本该何去何从呢?是否跟宿主机一样变得不可用呢?...测试并查看集群中出现故障节点后的数据分布情况:94机器关闭服务:systemctl stop cassandra[cassandra@data01 ~]$ nodetool statusDatacenter...,因此可以看到,在 dc1 数据中心中,数据随机仍只分布在其中三个节点上,而 dc2 数据中心的数据将分布在了仅有的三个节点上,发生了数据转移;如果此时 dc2 数据中心还有节点继续故障,那么故障节点上的数据不可能再移动到其他节点上了...,dc1 是不变的,owns 还是300% ,但是 dc2 的 owns都是100% ,没办法故障转移了,只能存在自身的数据了;此时重启所有主机,所有主机 Cassandra 服务都会开启,包括之前故障模拟的节点也会自启...,那么此时就会达到了另一种效果:故障模拟节点后的状态,再添加到了集群中,那么此时数据又会进行了自动的分发。

1.2K20

事中故障处理(4)故障定位

故障恢复指恢复业务连续性的应急操作,很多故障是在不断尝试验证解决恢复的动作,所以故障恢复环节与故障定位环节有一定的交叠,或在这两个环节之间不断试错的循环,即故障恢复操作可能和故障诊断是同时,也可能是诊断之后或诊断之前...1.已知预案下的恢复三把斧 在故障管理过程中,通常大部分故障有一些明确的故障恢复预案,比如基础设施、服务器、网络设备、网络线路,以及应用系统层中关于服务可用性等故障因素,以及基于历史故障经验积累的方案。...以一个复杂故障应急场景中,很多时候故障处置的决策人员通常一方面协调人员现场分析问题,另一方面指挥启动已知预案的应急。...、数据完整性的故障恢复,这些故障恢复通常需要现场临时决断恢复。...结束 注:“3.4 事中处置”另外3个环节内容链接: 1.故障发现、故障响应 2.故障定位

1.3K30

nginx 域名绑定 域名, nginx 域名绑定 端口

一、nginx 域名绑定 域名 nginx绑定多个域名可又把多个域名规则写一个配置文件里,也可又分别建立多个域名配置文件,我一般为了管理方便,每个域名建一个文件,有些同类域名也可又写在一个总的配置文件里...一、每个域名一个文件的写法        首先打开nginx域名配置文件存放目录:/usr/local/nginx/conf/servers ,如要绑定域名www.itblood.com 则在此目录建一个文件...:www.itblood.com.conf然后在此文件中写规则,如: server{ listen 80; server_name www.itblood.com; #绑定域名...nginx服务器重起命令:/etc/init.d/nginx restart 二、一个文件多个域名的写法 一个文件添加多个域名的规则也是一样,只要把上面单个域名重复写下来就ok了,如: server{...301跳转 如果不带www的域名要加301跳转,那也是和绑定域名一样,先绑定不带www的域名,只是不用写网站目录,而是进行301跳转,如: server { listen 80; server_name

68.3K73

故障改进

当你解决故障的时候,一定要防止对方对问题提前下结论,如果对方局部的证明是能证明结论是正确的,那从全局来看呢?不要在二手信息上深入讨论,不要用二手信息作为重要依据。...那从整体来看,需要怎么故障改进? 第一,优化故障获知和故障定位的时间。 从故障发生到我们知道的时间是否可以优化得更短? 定位故障的时间是否可以更短? 有哪些地方可以做到自动化?...第二,优化故障的处理方式。 故障处理时的判断和章法是否科学,是否正确? 故障处理时的信息是否全透明? 故障处理时人员是否安排得当? 第三,优化开发过程中的问题。...做个简短的总结:循序渐进的让故障定位时间变短,持续改善,不要出现好像又是人品的问题,莫名的日了狗,不存在的,归根结底是自己的基础理论修养不够。关于严谨程度,是工程师很重要的品质。

58020

3.4 事中故障处理(3)故障定位

故障定位指诊断故障直接原因或根因,故障定位有助于故障恢复动作更加有效。故障定位通常是整个故障过程中耗时最长的环节,定位的目标围绕在快速恢复的基础上,而非寻找问题根因,后者由问题管理负责。...通常大部分可用性故障,要借助运维专家经验的假设判断或已知预案的执行得到解决,但仍有部分故障,尤其是性能、应用逻辑、数据故障需要多方协同与工具支持。...判断应用逻辑层面的异常,比如功能、菜单级别的故障,如何更加主动、从容的找到逻辑上的故障点,并作出应急。...应用逻辑故障的问题定位与“故障传染”场景类似,如何在大量病态的功能中找到根因功能,并对功能进行降级等恢复是难点。...如果运维知识图谱准确性有保证,可以预见还能够支持数据源/指标/文本异常检测、基于人工故障库/数据挖掘的故障诊断、故障预测、故障自愈、 成本优化、资源优化、容量规划、性能优化等场景。

1.4K20

故障治理:如何进行故障复盘

图片故障复盘的重要性无需多说,每一次故障都是宝贵的学习机会,本人接手故障复盘工作已经半年有余,从一开始的手足无措,慢慢变得游刃有余。...三、故障复盘运作机制3.1 故障复盘前准备3.1.1 提交故障报告故障直接原因方(非最终认定的故障责任方)在故障发生后3个工作日内提交故障报告。如故障原因涉及多个部门,需跨部门共同协助撰写故障报告。...复盘会议后,结合故障处理报告形成故障复盘报告定稿,发给所有故障干系人及相关领导。3.1.3 确定故障干系人复盘owner确定故障直接原因方、关联(受影响)方等与故障有关的干系人。...3.2 故障复盘关键流程步骤(包括但不限于)3.2.1 故障背景概述故障的背景要解释清楚本次故障的基本情况,即发生了什么故障,影响了什么业务(产品)等。...四、故障改进及闭环故障复盘后由复盘owner(或其他)将故障信息(也就是故障报告里的内容)录入故障管理系统,系统将向故障改进措施负责人派单,整改负责人整改完成后在系统回单并提交整改完成的证明材料,由复盘

29620

故障分析 | MySQL 无监听端口故障排查

擅长数据库故障处理。对数据库技术和 python 有着浓厚的兴趣。 本文来源:原创投稿 *爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。...---- 前言 最近解决了一个比较基础的问题故障,由于排查过程挺有意思,于是就以此为素材写出了本篇文章。 故障现场 防火墙什么的均正常但是无法被远程访问到。简单的使用客户端登录了一下。...ERROR 2003 (HY000): Can't connect to MySQL server on '127.0.0.1' (111) 根据以往经验大脑中浮现了几个常见的排查此类故障手法 1....解决方案 因为配置 skip-grants-tables 引起无法远程连接 mysql 服务端的故障,解决方法也是非常的简单注释重启。...本文关键字:#故障排查# ---- 文章推荐: ‍‍技术分享 | 国产麒麟 arm 上编译安装 xtrabackup8 技术分享 | MySQL 会受到“Unix千年虫“的影响吗‍ 技术分享 | MHA-MasterFailover

2.1K30

故障分析 | MySQL 无监听端口故障排查

擅长数据库故障处理。对数据库技术和 python 有着浓厚的兴趣。本文来源:原创投稿*爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。...---前言最近解决了一个比较基础的问题故障,由于排查过程挺有意思,于是就以此为素材写出了本篇文章。故障现场防火墙什么的均正常但是无法被远程访问到。简单的使用客户端登录了一下。...ERROR 2003 (HY000): Can't connect to MySQL server on '127.0.0.1' (111)根据以往经验大脑中浮现了几个常见的排查此类故障手法1.排查进程存在...解决方案因为配置 skip-grants-tables 引起无法远程连接 mysql 服务端的故障,解决方法也是非常的简单注释重启。

79420
领券