首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

将生产环境SUSE Linux Enterprise 11 SP2 升级至 SP4

SUSE Linux Enterprise 11 SP4两台为SP2,部署的应用相同,sp2两台偶尔会出现服务卡死现象,经代码排查、weblogic升级、系统资源使用分析等都没解决问题,现决定对操作升级...more .bash_profile cd /var/spool/cron/tabs more monitor more root more callcent 主要有文件系统、用户、组、网络、应用用户、应用进程...3.登陆console控制台 http://172.xx.x.xx:8001/console 截图 该步骤是确认哪些进程处于RUNNING哪些属于SHUTDOWN 4.登陆nginx服务器 172.xx.x...9.拉起nmon 10.清除报错日志 检查是否告警日志产生,如有则清除以免触发告警事件。...系统升级步骤: 以下操作都在虚拟机上完成: 1.确认版本 2.升级步骤 生产环境按F12进入光驱启动(IBM X3650 M4) 选择update 3.验证版本 至此完成系统升级

87010

问题排查:nginx能跑,但是只能跑一点点,不能跑多了

在文章,最终查到是nginx的全连接队列满了(每个监听端口个队列,完成三次握手的请求会进入这个监听端口的全连接队列,队列大小是只有128,比较小),我当时的解决方式,是把队列大小调大到了512,然后重启...然后是磁盘,df一执行,结果直接卡死了,也不知道咋回事,之前就是感觉这机器问题,之前lsof命令也是执行卡死。 当时都怀疑是不是磁盘问题,还是机器哪里问题,要不要换台机器部署算了。...解决 所以,我猜测,df、lsof等各种要遍历文件夹的命令都卡死了,那估计nginx去读取那个目录下的文件,也卡死了,worker如果卡死,那么nginx负责accept的进程,应该就会停止去accept...我们先去找服务器管理的同事,结果跟我们说,这个nfs服务器已经被回收了,果然,主打一个混乱。...行吧,反正是测试环境,既然nfs服务器没了,我们也没打算再搭一个,后边问到相关业务同事,已经没在用这台机器了,那就不用顾忌他们了,那这个挂载就得想办法去掉,不然各种命令都卡死,实在不爽。

30370
您找到你想要的搜索结果了吗?
是的
没有找到

生产环境Suse11sp2升级至sp4全记录(坑)

suse11sp4两台为sp2,部署的应用相同,sp2两台偶尔会出现服务卡死现象,经代码排查、weblogic升级、系统资源使用分析等都没解决问题,现决定对操作升级。...more .bash_profile cd /var/spool/cron/tabs more monitor more root more callcent 主要有文件系统、用户、组、网络、应用用户、应用进程...3.登陆console控制台 http://172.xx.x.xx:8001/console 截图 该步骤是确认哪些进程处于RUNNING哪些属于SHUTDOWN 4.登陆nginx服务器 172.xx.x...9.拉起nmon 10.清除报错日志 检查是否告警日志产生,如有则清除以免触发告警事件。...系统升级步骤: 以下操作都在虚拟机上完成: 1.确认版本 [p86ux1iawm.png] 2.升级步骤 生产环境按F12进入光驱启动(IBM X3650 M4) [674xccgdgs.png] [3w4ii82ec6

93330

【浏览器渲染原理】

很多应用程序都是多进程的结构,这样是为了避免某一个进程卡死,影响整个应用程序,因为进程之间相互独立,一个进程卡死不会影响用户使用另一个进程。...但这一个进程也有多个线程: 页面线程:负责页面渲染和展示 JS线程:执行js代码 还有其他各种线程 但是单进程结构几个问题: ① 不稳定:其中一个线程卡死,会导致整个进程出问题。...② 不安全:浏览器之间是可以共享数据的,那么js线程就可以访问浏览器的所有数据 ③ 不流畅:一个进程需要负责太多事情,导致运行效率不佳 4....,因为这和用户启动浏览器时选择的进程模型有关,一共有4种进程模型: 默认进程:为每一个标签页创建一个进程 同一站点使用同一进程, 一个tab的所有站点使用同一个进程 浏览器引擎和渲染引擎共用一个进程...网络线程从服务器获取到数据后的操作: a.

69320

PHP-FPM运行模式解析:如何选择适合的服务器模式

最近服务器遇到一些瓶颈,就是在部分人员多的时候会出现内存跑满,直接卡死的状态,在优化服务器和MySQL数据库配置文件的时候,PHP个运行模式引起我的注意,觉得不错,可以仔细的研究下,当然解决内存卡死的原因很多...,今天仅仅聊聊PHP-FPM的运行模式,不代表是因为运行模式引起的内存卡死,请勿过多解读,设置正确可以缓解服务器堵塞,PHP-FPM(FastCGI Process Manager)是一个PHP FastCGI...PHP-FPM三种运行模式:静态、动态和按需。每种模式都有其优缺点,选择哪种模式取决于您的服务器性能和应用程序需求。静态模式在此模式下,PHP-FPM在启动时创建固定数量的子进程。...在这种情况下,您可以设置较低的最小子进程数量,以确保在低负载时有足够的资源可用,同时设置较高的最大子进程数量,以确保在高负载时不会耗尽服务器资源。...我的服务器配置一般,所以设置如图,效果还不错,具体还要看程序及访问量去优化和设置,此文仅供参考,其他问题留言反馈,一起探讨探讨!

20210

Hiveserver2 性能优化与GC优化

最近发现hiveserver2(本质上是提供jdbc连接的driver进程)经常发生严重卡死故障。...通过jstat 命令,每隔10秒获取一次hiveserver2进程的GC情况,最终复现该问题。...以下是hiveserver2发生卡死,jdbc无法连接到hiveserver2的时候,统计GC的结果: 可以看到,当hiveserver2发生严重卡死时,也就是hiveserver2 进程发生严重GC...因此,将hiveserver2迁移到资源非常空闲的另外一台服务器。 4.2 采用优化GC机制和参数 之前hiveserver2进程的启动参数没有添加GC参数,也就是说采用系统默认的GC机制。...PrintGCDateStamps -XX:GCLogFileSize=512M -Xloggc:/data/log/tbds/spark/gc-sparkthrift.log-${timenow} 其中,几个参数需要根据服务器的自身资源量来决定

6K103

炫技!bug 排查大曝光,涉及Linux 内核的那种

发现问题 话说一天公司服务器报警,登录到机器后发现进程已被“卡死”,常规 GDB 调试没有反应,查找 Log 也没有线索,问题似乎已经无解。 就在这时博主的脑海里浮现出了岛国的。。...,现在还能查到进程ID,进程ID运行 top 命令看一下: ?...跟踪进程用户态运行时栈 了,可以用 pstack 命令,该命令能打印出进程运行时栈信息,虽然该命令不能追踪到内核,但是可以看到用户态最终调用了什么函数,从而推断出调用了什么系统调用,让我们来运行一下:...通过ps命令我们可以看到进程状态为D,进一步验证了进程确实被“卡死”了。 那么进程卡死在了哪里呢? 幸运的是 WCHAN 这一列可以告诉你答案。...看起来该进程正在等待一个 RPC 调用,RPC 实际上就是一个进程正在和另一个进程网络通信,尽管我们知道了进程卡死在了哪里,但是我们依然不知道为什么会被卡死在这里。 至此线索似乎中断了。。。

1.6K20

Hive调优 | HiveServer2 性能优化与GC优化

最近发现hiveserver2(本质上是提供jdbc连接的driver进程)经常发生严重卡死故障。...通过jstat 命令,每隔10秒获取一次hiveserver2进程的GC情况,最终复现该问题。...以下是hiveserver2发生卡死,jdbc无法连接到hiveserver2的时候,统计GC的结果: 可以看到,当hiveserver2发生严重卡死时,也就是hiveserver2 进程发生严重GC...因此,将hiveserver2迁移到资源非常空闲的另外一台服务器。 4.2 采用优化GC机制和参数 之前hiveserver2进程的启动参数没有添加GC参数,也就是说采用系统默认的GC机制。...PrintGCDateStamps -XX:GCLogFileSize=512M -Xloggc:/data/log/tbds/spark/gc-sparkthrift.log-${timenow} 其中,几个参数需要根据服务器的自身资源量来决定

1.7K20

关于vmware中的某个虚拟机死机且无法关机问题的快速解决办法

前情概要:公司某台服务器上采用的是vmware的方案进行部署的,在vmware中部署了多台虚拟机,某天其中一台虚拟机突然卡死(事后经检查是由于运行的python程序线程调用错误,导致CPU和内存占满,...进而导致服务器卡死)且无法关机或其他任何操作(如下图)。...因为无法重启物理机,会影响其他正在运行的系统,在进行多种尝试后,发现可以通过直接结束进程的方式关掉这台问题的虚拟机,具体操作如下~ Step1:在vmware中右键单击此台虚拟机,并选择 “打开虚拟机目录...找到vmware.log文件(如下图) Step3:双击打开vmware.log文件,并找到pid(在第一行) Step4:打开物理机的 “任务管理器”,点击 “详细信息”,找到PID为上一步中找到的进程

99310

F-Stack Q&A 第三期

A3:如果不需要使用这个网卡管理服务器,启动F-Stack的应用就可以了,然后 F-Stack的 dpdk 会启动网卡并接收处理包的;如果还需要这个网卡管理服务器,还需要在配置文件中开启kni功能,启动...A6:F-Stack使用了单进程单线程模型,只能在dpdk线程使用,如果是自己起的线程,调用这些函数会因为curthread为null而挂掉,其他线程可以处理非网络io的事。...使用F-Stack代替系统协议栈,Intel 82599/X540 10G网卡16个物理队列,启动16个进程性能达到了52万QPS,主要是多进程模式去除了系统协议栈的资源共享、pcb表锁等带来的提升。...然后就是有些动态内存分配,所以直接把 ngx_slab 给移植过来做分配器了,我现在是一对元数据表需要多个进程共享的, 如果每个进程都存一份,内存占用可能比较大。...进程读和元数据更新做到了完全无锁(读写锁也没有的),这个什么其他的解决办法吗? A12:单线程跑,开多个实例;要线性扩展,架构上就要share nothing,否则一直蛋疼。

3.9K100

linux服务器内存不够用怎么办?

服务器随着运行时间的增加,占用内存会逐渐增加。如果服务器内存小,就很容易出现内存占满,系统变慢,甚至是卡死的情况。一个办法是增加物理内存,但这涉及到费用、停机、开机箱等。这里一个处理方案,可供借鉴。...如果你分析各个进程占用内存大小,然后把它们加一起,发现并不等于总占用内存的大小。那为什么free -m指令显示剩余的内存那么小呢?内存用来做什么了呢?...缓存使用的物理内存加上进程占用物理内存,才是总的物理内存。 为了保护服务不会因为物理内存占用过高而卡死,可以定时计划crontab中每隔一小时清空操作系统的缓存数据,配置如下。

9.8K20

Node.js 案发现场揭秘 —— 文件句柄泄露导致进程假死

故障现象 Easy-Monitor[1] 开源官方讨论群一位同学 Midqiu 遇到了进程跑几个小时后就处于假死无响应的问题,而且神奇的是进程假死的同时,监控服务端的 **系统数据 **也同时断开...这样现象就很奇怪了,Node.js 的 JS 主线程卡死竟然会让插件的日志也无法正常输出。 II....初步排查问题 既然是进程假死无响应,首先猜测的就是是不是 JS 工作主线程卡死导致的,所以线下沟通 SSH 到服务器上查看假死时的 Node.js 负载: 使用 top -H -p 查看发现...这时候其实我还不死心,手动在服务器应用下执行了 xprofiler 插件的命令: ....拿到这个日志中间件的源代码,果然存在一个 Logger 类 fs.open 动作: private async ensureFile(filename: string): Promise < number

2K60

手动设置的静态DNS老是变成DHCP,如何破

如果还是不行,把代码的3改成2试试 图片.png 代码的2和3两种情况我都遇到过,由于cloudbase-init是通过调用powershell代码起作用的,我猜测这个判断逻辑2和3的差异可能自定义镜像常驻的开机计划任务开了弱干个...powershell进程放置在了后台,如果是这种情况,除过2和3,可能还会有4、5、6等情况,具体就是看开机后在后台的powershell进程数量多少 cloudbase-init配置文件位置: ‪...C:\Program Files\Cloudbase Solutions\Cloudbase-Init\conf\cloudbase-init.conf 配置文件这2行配置我在IBM服务器的初始化配置文档看到过...C:\powershell PS C:\Set-ExecutionPolicy Unrestricted https://www.ibm.com/docs/en/cloud-orchestrator/...topic=images-adding-cloudbase-init-windows https://www.ibm.com/docs/zh/cloud-orchestrator/version-missing

2.1K40

mysql 删表引出的问题

背景 将测试环境的表同步到另外一个数据库服务器中,但有些表里面数据巨大,(其实不同步该表的数据就行,当时没想太多),几千万的数据!! 步骤 1....于是 delete from table_name where 1=1; 结果傻眼了,执行了一会儿就卡死了,对卡死了! 2. 那么问题来了,是不是死锁了呢?那怎么判断死锁呢?...执行这个命令可以查看数据库当前的进程 3....可以通过kill命令来干掉一些数据库的进程 ? kill 2; 这样既可,这样只是解决了卡死的问题,执行同样的命令还是会卡死的 ; 5. 那就想想为什么会卡死呢 ?...原来个这么一个参数 一般等待超时的时候会抛出这样的异常: Lock wait timeout exceeded; try restarting transaction 是因为mysql的话,默认锁等待时间是

2.5K70

Linux 使用strace命令查找进程卡死原因

点击小卡片,回复 “合集” 获取系统性的学习笔记和测试开发技能图谱 背景 最近遇到某个线上服务进程卡死的情况,但是在本地调试的过程中又没法复现,需要在线上服务器运行一段时间后在某些条件下才会触发。...定位问题 首先我们用ps auxf命令查看我们的进程执行到了哪一步: 可以看到执行到了[sh]然后就卡死了,然后我们接着通过strace命令来查看执行这个操作死在了哪个系统回调: root@demo...socket:[675848446] lrwx------ 1 root root 64 Jul 14 05:58 5 -> socket:[675847890] 我们可以发现,5代表的是socket,说明进程是死在...socket通讯上了,那么再去排查线上服务器中有哪些服务用到了socket,最后定位到是X服务中大量不合理的使用socket连接导致的,至此问题就定位到了。

4.7K20

为什么go语言适合开发网游服务器

前段时间在golang-China读到这个贴:木人用(或打算)golang做游戏服务器端? 个人觉得golang十分适合进行网游服务器端开发,写下这篇文章总结一下。...因此,多人同时在线十分必要。 再来看网游的常见玩法,除了排行榜这类统计和数据汇总的功能外,基本没有需要大量CPU时间的应用。以前的项目,即时战斗产生的各种伤害计算对CPU的消耗也不大。...以前的项目,就经历了从MySQL转向MongoDB这种内存数据库的过程,磁盘IO不再是瓶颈。总体来说,还是用内存做一级缓冲,避免大量小数据块读写的方案。...这样既达到了通信的目的,又实现同步,用CSP模型的观点看,并发模型就是通过一组进程进程间的事件触发解决任务的。虽然说,主流的编程语言之间,只要是图灵完备的,他们就都能实现相同的功能。...个人十分推崇erlang社区的脆崩哲学,推动应用发生预期外行为时,尽早崩溃,再fork出新进程处理新的请求。对于协程机制,需要由程序员保证执行的函数不会发生死循环,导致线程卡死

2.8K60

记一次离谱的内存马 GetShell

此时我想将 webshell 代码插入到已有的 JSP 中,但是想想还是算了,如果导致已有 JSP 卡死而影响业务的话,问题就大了。...WAS 7.0 里面内置 IBM J9 jdk 1.6,这两个环境加起来和其他中间件很大区别。调试的过程比我想想的时间要长,里面坑点很多。这里不一一贴代码赘述,直接给出一些关键技术点以及坑点。...再后来经过反复重启本地服务器,我发现这个问题并不是能稳定复现,有时可以创建类实例,有时又不行,这可能就是 IBM 的 BUG,哦不,是 IBM 的禅学,告诉我们,这世界上就是充满了有趣的不确定性。...(事后推测,是否可能目标服务器 JVM 占满内存导致无法实例化类?verifyImpl 方法是否对内存的校验?)...我们来看一下 com.ibm.ws.classloader.CompoundClassLoader 这个 ClassLoader,这个类个成员变量,用于缓存加载过的类对象。

10510

如何定位 golang 进程 hang 死的 bug

ch 是否数据被填满,在另一个 goroutine 把 100 条数据塞到 ch 。...因为在 for 循环中没有函数调用的话,编译器不会插入调度代码,所以这个执行 for 循环的 goroutine 没有办法被调出,而在循环期间碰到 gc,那么就会卡在 gcwaiting 阶段,并且整个进程永远...某次更新说明中官方声称在密集循环中理论上也会让其它的 goroutine 被调度的机会,那么我们选择相信官方,试一下下面这个程序: package main import ( "fmt"...然后就剩卡死在 for 循环上了,密集的 for 循环一般会导致一个 cpu 核心被打满。...jsoniter 定位了一个类似上面这样的 bug: https://github.com/gin-gonic/gin/issues/1086 从 perf 定位到函数,再用 pid attach 到进程

1.8K30

记一次真实的网站被黑经历

error.log 查看日志容量 ll -h 查看并发连接数 netstat -nat|grep ESTABLISHED|wc -l 一顿骚操作之后,并没有什么异常,内存和CPU平稳,Nginx和PHP 进程没问题...然后分别重启了一下 PHP 和 Nginx,开始网站还可以访问,进入社区首页就被卡死。 查看错误日志,后台使劲的刷日志,随便查看了几个IP,印度的,美国的,菲律宾的等等,当然大多数还是国内的IP。...重启了服务多次,访问一下首页就被卡死,然后瞬间瘫痪,整个网站(社区+博客)都不能访问了。既然这样,还是老实上班,坐等攻击停止吧。 期间群的小伙伴们问网站怎么了,打不开了椰?...话说,现在请求没那么多了,重启了一些Nginx 和 PHP 进程,访问首页还是卡死?真是怪了个蛋。...问题解决 其实,最终问题怎么解决的,我并不清楚,说几个比较疑惑的点: ECS 服务器 CPU 和内存也在正常阈值 Nginx 和 PHP-FPM 进程都分别重启过 RDS 数据库连接数尽管有所波动,但是并没有占满未释放

1.9K20

WPS JS宏——For语句

: Dim i As Long i = 100 VBA在对象的赋值上,是一定要set关键字的,但值类型是可以省略let关键字的。...这个语句上面只循环了20次,那是因为我尝试把数字改到50的时候,WPS竟然卡死了! 循环20次的情况下,我尝试多运行了几次,竟然也卡死了!...查看进程,发现进程的等待频道字段标识的是futex_wait_queue_me,baidu了一下,发现这个是Linux内核函数,那是完全的不懂啊!...后来把这个语句单独放到一个新文件又正常了,然后回到原来的那个文件,删除了一些Sheet和单元格内容后,也正常了,再怎么测试也没复现bug!!...这里的x是arr数组中当前遍历值的一个拷贝,而JSx是arr的下标!

2.9K30
领券