首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

服务器内存故障预测居然可以这样做!

并且服务器内存的数量众多,vivo的内存数量达到40w+条,内存故障造成的最严重的后果是会直接导致系统崩溃,服务器宕机,这些对于上层业务而言都是不能接受的。...控制器检查到CE事件后,可以看作对未来UCE事件的预测。我们可以通过一些屏蔽手段或者更换内存条减少UE事件以及系统宕机的可能性。...(2)配置内存槽位与物理槽位对应关系通过sysfs文件系统我们可以看到哪个CPU的哪个内存控制下的哪个通道的哪条内存的CE计数,但是它对应的系统下的哪一个内存呢,毕竟我们服务器日常的运维,经常看到的是系统槽位名称...CE计数四、 总结与展望 EDAC可以明确的获取到服务器的每条内存上的CE计数,我们可以通过CE计数去设定阈值,分析CE计数曲线等,结合其他MCE log 、SEL等对内存进行健康状况评估,进行内存预测...EDAC在vivo服务器全量上线过程以来,累计提前发现450+ case的内存CE问题,服务器的宕机数量明显减少。

18.1K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    浪潮发布服务器操作系统KOS:可以热插拔CPU、内存

    近日,浪潮信息正式发布服务器操作系统“KOS”(InspurKOS),为数据中心的软硬件协同设计与优化,提供稳定可靠、高效协同、广泛兼容、全天候运维的基础软件平台。...关键数据冗余机制可对核心数据内存进行镜像,增强性容错能力可将引起系统宕机的UCE进行降级容错处理,大幅降低系统宕机率。 支持CPU、内存等核心部件的热替换,支持内核、应用软件的热升级。...支持基于专家规则的自动化运维和诊断,可以方便地进行故障定位、性能分析、性能优化。 可无缝接入到浪潮InService云端运维服务,实现运维远程托管。...性能方面,KOS在分布式存储、虚拟化、云、AI服务器等方面刷新了多项权威评测的记录。...263台负载虚拟机,刷新了世界记录; 借助KOS提供的场景优化能力,完成业内首个一云多芯场景下的SPEC Cloud云性能基准测评,扩展性、性能、上线效率世界第一; 支撑MLPerf AI推理性能测评刷新

    3.4K50

    一条SQL能占多大内存

    初学计算机时,我经常琢磨的一个问题是:一个进程到底能吃多大内存,能把系统内存吃完? 学了数据库后,我又开始问自己类似的问题,一条 SQL 能把数据库内存全部吃完?...虚拟机服务器总共有8G内存,从数据库导出一张2GB的表,监测服务器内存的使用量。 1- 用 SQL Server 自带的“导出”功能,将一张2GB的表,导出到一个文本文件。...为了不影响虚拟机内存的监控,这个导出的操作, 在本机(架设虚拟机的本地机器)执行。...回到主问题,一条 SQL 能占多大内存?...解决方法,是系统在预加载的时候,多建立几个链接,等到用时,把已经建立好的链接拿过来就用,这样就可省去链接的时间。 既然说到可以预先建立几个数据库链接备用,那么是不是的越多越好,比如100万个?

    2.2K20

    一条SQL到底能占多大内存

    SQL145题系列 初学计算机时,我经常琢磨的一个问题是:一个进程到底能吃多大内存,能把系统内存吃完? 学了数据库后,我又开始问自己类似的问题,一条 SQL 能把数据库内存全部吃完?...虚拟机服务器总共有8G内存,从数据库导出一张2GB的表,监测服务器内存的使用量。 1- 用 SQL Server 自带的“导出”功能,将一张2GB的表,导出到一个文本文件。...为了不影响虚拟机内存的监控,这个导出的操作, 在本机(架设虚拟机的本地机器)执行。...回到主问题,一条 SQL 能占多大内存?...解决方法,是系统在预加载的时候,多建立几个链接,等到用时,把已经建立好的链接拿过来就用,这样就可省去链接的时间。 既然说到可以预先建立几个数据库链接备用,那么是不是的越多越好,比如100万个?

    9210

    计网 - 一台内存在 8G 左右的服务器可以同时维护多少个连接?

    ---- Question 一台内存在 8G 左右的服务器可以同时维护多少个连接? 分析: 连接是内存中的状态对象,从理论上分析,连接本身不太占用内存。不同语言连接对象大小不等,但是通常很小。...clients.add(client); } Thread.sleep(10000000); } } 通过运行上面这段程序,你可以观察到以下这几个现象...连接速度不是很快,这说明 TCP 连接创建有成本(3 次握手,都是网络 IO); 用jps找到对应的进程的id,在用sudo cat /proc/{进程ID}/status | grep VmHWM可以看到实际的内存占用...按照这种增长趋势,8G 内存空间可以轻轻松松存放 100W 个连接。...所以,我们可以得出一个结论:核心的问题是,通信需要缓冲区,通信需要 I/O。这是因为通信占用资源,连接本身占用资源少。 ----

    2.9K30

    虚拟机上网的三种方式

    ,就是192.168.1.1了,这样,虚拟机可以上外网了,但是,上网我们一般是通过域名去访问外网的,所以我们还需要为虚拟机配置一个dns服务器,我们可以简单点,把dns服务器地址配置为google的dns...服务器:8.8.8.8,到此,虚拟机可以上网了。...如果你一个虚拟机,只是给自己用,不需要给局域网其他人用,那么可以选择NAT,毕竟NAT模式下的虚拟系统的TCP/IP配置信息是由VMnet8(NAT)虚拟网络的DHCP服务器提供的,只要虚拟机的网路配置是...例如你想多个虚拟机集群,作为测试使用,而宿主机可能是一个笔记本,ip不固定。...这个功能或许对普通用户来说没有多大意义,但大型服务商会常常利用这个功能。

    2K30

    云游戏服务器怎么?云游戏服务器需要显卡吗?

    随着现在游戏占用的内存越来越大,意味着游戏对于电脑配置的要求越来越高,为了能够玩到更多好玩的游戏,现在很多玩家们都会选择使用云游戏平台,而这种游戏平台同样是需要搭载服务器的,正常来说都是专门的云游戏服务器...,这种服务器可以为玩家们提供更为稳定顺畅的游戏运行效果,那么云游戏服务器怎么?...云游戏服务器需要显卡吗?下面就由小编来为大家简单介绍一下吧! 云游戏服务器怎么?...搭建云游戏服务器主要需要用户们做好两方面的准备,第一个就是服务器的租用问题,需要用户们在搭建之前根据自己的需求去租用游戏专用的服务器,能够维持众多大型游戏运行的服务器才能满足使用;第二个就是服务器的硬件支持问题...,虽然是云服务器平台,但是还是需要电脑拥有足够高的配置的,解决这两个问题大家就可以搭建云游戏服务器了。

    5.3K20

    Hyper-v 设置静态IP 搭建集群

    新建虚拟机 虚拟机交换器 Hyper-V 虚拟交换机是基于软件的第 2 层以太网网络交换机;在安装 Hyper-V 服务器时,Hyper-V 管理器中提供了该交换机。...说白了就是供虚拟机网络交互使用的 新建虚拟机 提前准备好iso镜像 选择存储位置,我习惯一个单独的目录,目录下以 虚拟机_1、虚拟机_2。。。...这样来存储,方便管理 没有额外要求就选择第一代,求兼容、稳定 分配虚拟机内存,根据本地电脑的内存空间合理分配 选择刚刚新建的虚拟交换器 选择准备好的iso镜像 控制面板\网络和 Internet...选择刚刚新建的虚拟机 导出到一个目录,然后在Hyper-v管理器中选择导入虚拟机,这样可以省去虚拟机安装引导的一些步骤 安装好之后按照修改静态ip,只需修改一行 vi /etc/sysconfig...最后在各个虚拟机上测试是否网络通常,服务器之间是否能ping通

    48930

    「实战篇」开源项目docker化运维部署-linux和docker基本命令(三)

    这些缺点就阻碍了windows进入服务器市场的主要原因。linux没有这些缺点。 ?...vmware 属于重量级虚拟机,docker是轻量级虚拟机。...docker虚拟机和云计算的关系 想把自己的项目部署到服务器上,我们在本地真实的搭建服务器成本很高的,固定的ip,服务器硬件,宽带申请等等吧反正是不划算。...经常做的事情到云空间申请个虚拟的空间,一般在云空间厂家哪里购买几核cpu,多大内存的机器付好款就归你使用。...其实这种方式用docker也是可以实现的,因为本身docker的空间就是容器,docker虚拟机在创建容器的时候,可以设置这个虚拟空间创建多大内存,cpu是什么样的配置,网络使用是什么样子的,这其实就是

    1.7K20

    Java虚拟机(二):JVM内存模型

    我该为堆内存设置多大空间呢?OutOfMemoryError的异常到底涉及到运行时数据的哪块区域?该怎么解决呢?...其实如果你经常解决服务器性能问题,那么这些问题就会变的非常常见,了解JVM内存也是为了服务器出现性能问题的时候可以快速的了解那块的内存区域出现问题,以便于快速的解决生产故障。...根据Java虚拟机规范的规定,Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样。...Java虚拟机规范对这个区域的限制非常宽松,除了和Java堆一样不需要连续的内存可以选择固定大小或者可扩展外,还可以选择不实现垃圾收集。...局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。

    37840

    jvm系列(二):JVM内存结构

    我该为堆内存设置多大空间呢?OutOfMemoryError的异常到底涉及到运行时数据的哪块区域?该怎么解决呢?...其实如果你经常解决服务器性能问题,那么这些问题就会变的非常常见,了解JVM内存也是为了服务器出现性能问题的时候可以快速的了解那块的内存区域出现问题,以便于快速的解决生产故障。...根据Java虚拟机规范的规定,Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样。...Java虚拟机规范对这个区域的限制非常宽松,除了和Java堆一样不需要连续的内存可以选择固定大小或者可扩展外,还可以选择不实现垃圾收集。...局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。

    92440

    Java中的String到底占用多大内存空间?你所了解的可能都是错误的!!

    写在前面 最近小伙伴加群时,我总是问一个问题:Java中的String类占用多大内存空间?...那如果真是这样的话,服务器内存空间还放不下一个字符串呀!作为程序员的我们,可不能闹这种笑话呀。今天,我们就一起来聊聊Java中的String到底占用多大内存空间!...Java对象的结构 首先,我们来下Java对象在虚拟机中的结构,这里,以HotSpot虚拟机为例。 ?...所以,我们可以得出一个空String对象所占用的内存空间,如下所示。...因此在代码中大量使用String对象时,应考虑内存的实际占用情况。 注:40 + 2 * n 这个公式我们可以看成是计算String对象占用多大内存空间的通用公式。

    3.2K40

    高级性能测试系列《6.问题解答、应用的发展》

    并不是占用本机的物理空间多少,就只能虚拟出和占用的物理空间一样大小的虚拟空间,理论上是虚拟出多大空间都是可以的。 实际上用vmware不可能虚拟出无限大的空间(因为是sata接口)。...虚拟出来的磁盘,也是可以存数据的。只不过这个数据是存在我当前的虚拟机上面,并没有存在真实的物理机上面,并没有消耗真实的物理机空间。 2.压力终端要压1000或2000并发,应该买多少核cpu和内存?...买多少核cpu和内存是无所谓的,但是可能需要有多台机器。 理论上你的自己的笔记本电脑4核8g是可以虚拟出大概2000左右的并发用户数的。 如果公司需要更多的并发用户数,需要采用分布式的技术。...可以借用同事的一台4核8g的电脑,组成一个分布式。这样4000的并发用户数就产生了。 至于被测的服务器的cpu和内存应该是多少?这个就不好说了。 因为要看你们公司项目的代码的情况。...3.如果在虚拟机里面安装软件,占用的也是虚拟的空间大小吗? 虚拟机里面安装软件,肯定用的虚拟机里面的资源啊。 二、应用的发展 最开始,所有的代码都在一个工程下面,生成一个项目包。

    66220

    Linux养成计划(一)

    安装后的CentOS系统就是一系列的文件,同样可以把装好后的"一系列文件"移植到别的操作系统上。别的操作系统也必须使用Vm打开,这种移植对测试服务器的压力等非常有帮助。...这里分配不是立马吃掉20G,可以根据设置,随着使用慢慢增加到20G。 ? 7. 完成 ? 8. 红色箭头位虚拟机配置 ? 9. 点击编辑虚拟机设置->内存,根据Windows的内存进行适当调高。...小编内存是8G,所以虚拟机选择了3G。 ? 10. 选择处理器->更改处理器数量和核数,母鸡的核数配置可以在任务管理器中查看 ? 11. 网络适配器:NAT模式 ?...小白的电脑可以与小黑的电脑通信,小白的电脑还可以与小黑安装的CentOS虚拟机进行通信。...打开虚拟机的过程可能出现下方的选择,一定选择Skip(Tab切换) ? 16. 选择语言:中文 ? 17. 这里需要等半分钟,等待加载完毕后:选择安装位置进行配置 ? 18.

    86720

    【java进阶JVM】JVM内存结构

    我该为堆内存设置多大空间呢?OutOfMemoryError的异常到底涉及到运行时数据的哪块区域?该怎么解决呢?...其实如果你经常解决服务器性能问题,那么这些问题就会变的非常常见,了解JVM内存也是为了服务器出现性能问题的时候可以快速的了解那块的内存区域出现问题,以便于快速的解决生产故障。...Java虚拟机规范对这个区域的限制非常宽松,除了和Java堆一样不需要连续的内存可以选择固定大小或者可扩展外,还可以选择不实现垃圾收集。...局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。...如果虚拟机进程本身耗费的内存不计算在 内,剩下的内存就由虚拟机栈和本地方法栈“瓜分”了。每个线程分配到的栈容量越大,可以 建立的线程数量自然就越少,建立线程时就越容易把剩下的内存耗尽。

    55330

    白话Elasticsearch63-生产集群部署之硬件配置、jvm以及集群规划建议

    调整io scheduler可以带来很大的性能提升,甚至可以达到数百倍。 如果我们没有办法使用SSD,只能使用机械硬盘,那么至少得尽量正确读写速度最快的磁盘,比如高性能的服务器磁盘。...但是同时我们也可以再云供应商上,比如阿里云,租用大量的小资源的虚拟机。那么对于自己购买昂贵高性能服务器自建集群,以及租用云机器来部署,该选择哪种方案呢?...你是自己购买5台,比如说,8核64G的物理机,搭建es集群 或者是,比如说,上阿里云,或者其他的云服务,购买了2核4G,16台,虚拟机,搭建es集群 你上阿里云,也可以买到大资源量的虚拟机,4/8/16...---- 容量规划 在规划你的es集群的时候,一般要规划你需要多少台服务器,每台服务器要有多少资源,能够支撑你预计的多大的数据量。...比如说,你预计一下,你的数据量有多大,需要多少台机器,每台机器要多少资源,来支撑,可以达到多大的性能 数据量 -> 性能,10亿 -> 要求1s内返回 es达到ms级的化,你必须要有足够的os cache

    1.1K20

    redis-基本介绍与linux安装

    1.最简启动 2.动态参数启动 3.配置文件启动 客户端连接 连接失败排错 redis 是什么 redis 是一个开源的内存数据库,属于 NoSQL 阵营 支持的数据类型 字符串(string) 哈希(...),数据存在内存中,c语言实现,单线程模型 功能丰富:发布订阅(消息) Lua脚本,事务(pipeline) 简单:源代码几万行,不依赖外部库 主从复制:主服务器和从服务器,主服务器可以同步到从服务器中...高可用和分布式: 2.8 版本以后使用 redis-sentinel 支持高可用 3.0 版本以后支持分布式 正因此,也有很多大公司都在使用它,如:github,twitter,stackoverflow...连接失败排错 参考博客【windows本地连不上虚拟机redis服务完美解决】,成功解决~ # 连接失败解决 # 先查看 虚拟机的 6379 端口是否打开,下面命令如果返回 no 则说明虚拟机的端口未打开...那么检查一下虚拟机的防火墙 systemctl status iptables # 发现我的虚拟机上 firewalld 防火墙开着,那么把它关掉(正式服务器上不建议这么做) systemctl status

    78920
    领券