大家好,我是飞哥!前几天看到一个有意思的问题,我前几天在朋友圈分享了,今天再在公众号里给大家发一下。
昨天分享的《难道这就是“西安一码通”再次崩溃的真实原因?》收到了很多留言,群里也是各种吐槽。怎么会通过服务端生成图片下发呢?Low的不行!
有个全球知名的互联网公司,因为某些原因,在多年前痛失中国市场,它当然心有不甘,所以现在正以另外一种形式,在全国开花——各地建立体验中心——据说是类似于阿里巴巴的平台,旨在将中国制造的产品推向国外市场,每个体验中心,看上去都很高大上,我们有幸成为该公司苏州体验中心的IT建设商
公司使用的是MySQL数据库,随着业务和用户的增加有张表的数据达到了150000000(1亿5千万)条左右,其中好几个功能都会对这张表进行增删改操作。在并发量比较大的时候,经常会出现死锁问题。 为了解决这个问题找到CTO和其他领导来请教方案。 经过分析之后,由于离业务繁忙期还有几天,并且1月是系统达到最大并发的时期,所以决定暂时先采取比较稳妥的版本号方案,即只往数据库insert和update数据,定时任务删除旧的数据(之后会采取数据分表分区的方案)版本号记录在redis里面。于是花了2天左右的时间把这些业务里面的代码重构和修改了一遍(其中涉及到使用第三方库修改的代码,修改这部分花了很多时间)。经测试人员测试没问题后,准备发到线上。
之前,听道友们讲Linux服务器被入侵、被挂马等等,当时感觉很不可思议,怎么会轻轻松松被入侵呢?安全防护得多low!(不过,这次并未打脸,被入侵的是大数据的机器,不归运维管理)
现在分时操作系统是通过循轮方式分配时间片进行进程调度的,如果进程在等待或阻塞,不会造成 CPU 资源使用。线程称为轻进程,共享进程资源,关于线程的调度,CPU 对于线程也是分时调度。而在 Java 中,线程的调用由 JVM 负责,线程的调度一般有两种模式,分时调度和抢占式调度。
最近西安一码通二次崩溃这个事情,实在是太顶了。作为程序员,出现这种问题属实不应该。
我的毕设项目是为学院编写一个在线 SQL 考试系统,目标是支撑 300 人同时进行在线 SQL 编程考试,全栈开发。身为前端,我毫不犹豫选择 Node 作为系统后台——告别庞大的 Java,全方位拥抱灵活的 JS,我对项目前景充满信心。项目进展顺利,很快业务完工,到达了最终测试环节,是系统投入真实场景的最后一关(测试不充分,上线必挨喷)。
查询日志 显示 内存满了 把mysql服务给杀了 linux 服务器如果 内存满了 会自动清理进程 防止服务器挂掉 选择的话 谁占的的内存大 就先杀谁 我的服务器里面 mysql服务占的内存是最大的 所以就把mysql就给杀了
到年底了,又到了各大高校开始动手采购GPU服务器的时候到了,最近不少学生在QQ上请我们帮忙看看配置
由于单位的安全要求,原有的一个应用由互联网区域机房搬迁至内网机房,然后业务系统走内网进行访问。新服务器是网管给重新做的,CentOS 8.1 + Oracle 19c,我把数据库、应用都迁移到新服务器上之后,发现莫名其妙的卡顿,一开始我以为是内网的问题,没有在意,但后来发现,每次都是规律性的卡顿,表现为:第一次访问或者隔几分钟第一次访问的时候,会卡顿10秒,然后就恢复正常速度,页面秒开。如果停几分钟不访问,再次打开时,还是会卡顿10多秒。
接下来,dump内存,这里注意一点,dump时切记让运维同学把dump的机器从集群中摘掉,否则dump时会造成JVM线程停顿,导致超时告警,影响业务。dump结果使用MAT(Eclipse Memory Analyzer)分析,具体截图就不展示了,从支配树上可以看出,某个缓存对象占用空间很大,个数非常多。从业务代码中查看,发现该对象是个本地缓存对象(Guava Cache),缓存3分钟,而且是个配置项,按照不同业务线、城市,总共才500个,每个配置项比较小,怎么会突然占用这么大空间呢?使用jstat命令查看系统的垃圾回收统计情况,发现YGC大概每10s一次,对于一个对象,即在年轻代中驻留约15*10=150s,再晋升到老年代,也就是在缓存有效期内,缓存对象足够晋升到老年代,缓存失效时,则会创新创建对象放入缓存。初步结论是:缓存过期时间过小导致对象晋升到老年代过快。
第一次看到这个消息的时候,我是抱有怀疑态度的。毕竟大家都知道这种大的政府项目都是要招标的,能中标到项目的公司也肯定不会差,怎么会犯这么低级的错误呢?
满200减150 / 满500减375 / 满1000减750 / 满2000减1500
SQL 语句执行慢的原因是面试中经常会被问到的,对于服务端开发来说也是必须要关注的问题。
在一次正常的活动促销之后,客服开始陆续反馈有用户反应在抢标的时候打不开网页或者APP,在打开的时候标的就已经被抢光了,刚开始没有特别的上心,觉得抢标不就是这样吗,抢小米手机的时候也不就这样吗?随着活动继续推进,有更多的用户强烈抗议,用户领了加息卷或者抵现卷之后抢不上标的,认为是平台作假故意不让使用以达到节省资源。 分析过程 其实以前也会有陆续的用户反馈不减少,给客户以小米抢手机为例子忽悠了过去,这次用户反馈太过强烈,才让我们重视了起来。我们前端一共三款产品,app、官网、H5,其中app使用量最大,官网其次
上篇写了掌握Rabbitmq几个重要概念,从一条消息说起,这篇来总结关于消息丢失让人头痛的事情。网络故障、服务器重启、硬盘损坏等都会导致消息的丢失。消息从生产到消费主要结果以下几个阶段如下图。
昨晚我发文上线了自己的网站:小林的网站上线啦!,结果发文上线不到 10 分钟, 服务器就炸了,读者疯狂跟我说网站 500 错误了。
前几天,接到研发同事反馈,内网通过 Nginx 代理下载 OSS 的大文件时,老是会断,而在服务器上下载时却很正常,非常奇怪。原本以为可能和 VPN 有关,经确认排除嫌疑。彷徨了许久,最后发现是 Nginx Buffer 的锅。下面就来聊聊这个问题是怎么发生的。
| 作者简介 | Docker容器生成僵尸进程 现象 公司开发服务器上使用Docker跑了几个容器,这些容器都是长时间运行的。偶然发现服务器上有大量僵尸进程,大约有两三千个。简单跟踪了下,发现这些僵尸进程均是在容器的进程命名空间的。 1 2ps aux | grep 'Z' | grep -v grep ll /proc/${any_zombie_pid} 在容器里运行的程序是很正常的web server,怎么会这样呢? Docker 和子进程“僵尸化”问题 初始进程的责任:“收割”“僵尸进程” Un
那是一个风和日丽的上午,我和往常一样来到公司,倒杯水等待电脑打开,之后打开日常维护的几个系统。
小编收集了过去一段时间内腾讯云云监控官网客服小助手收到的最最频繁的一些问题,整理到一块,统一为大家解答,希望对大家有帮助。 01. 什么是云监控 简单说,各云产品都会有一些指标来衡量它的运行情况,用户可以通过云监控的能力对这些指标可视化展示,实时监控,及时了解云产品监控状态。当然,云监控也不仅仅是用来帮助了解云产品,同样也可以用来监控基于云的服务,这些未来我们慢慢再说~ 更加通俗易懂的解释参考上篇科普文:云监控新手入门 02. 什么是基础监控 基础监控(Basic Cloud Monitor)是
腾讯云服务器计费标准其中一项就是宽带计费,计费模式有按带宽计费与使用流量两种,那么这两种计费模式有什么区别?在购买时应该如何选择是很多新手用户都想了解的问题,下面腾讯云优惠网来详细解读一下按带宽计费与使用流量计费。
腾讯云视频产品狂欢季来啦!包括音视频通话视频产品组合,特惠 8 折起,同时是在线教育企业的信赖之选。腾讯云本身是做游戏比较专业,基于游戏服务器多年积累下来的经验,对于视频这种长时间流媒体音视频通话的业务也是很容易上手,无论速度、稳定性等都是占据了很多优势的。下面魏艾斯博客分不同类型详细介绍一下。
某年某月某日的一个下午,接收到监控服务器的一条告警短信:尊敬的运维工程师 XX,你好:“192.168.136.200”数据库服务器 CPU 异常,CPU 使用率 98.7%,请尽快处理。看到这个消息浑身一紧,赶紧掐灭手中的烟,跑回办公室。
本文讲述了一位互联网金融公司技术团队的架构师在负责抢标活动过程中,通过优化Web服务器、数据库服务器以及应用服务器等基础设施,解决了高并发问题,并实现了抢标活动的顺利进行。通过采用分布式架构以及缓存技术,解决了数据库压力过大、请求响应慢等问题,提高了系统的稳定性。同时,采用负载均衡技术,提升了系统的处理能力,最终实现了平台的高可用性。
关于磁盘空间中索引节点爆满的问题还是挺多的,借此跟大家分享一下: 一、发现问题 在公司一台配置较低的Linux服务器(内存、硬盘比较小)的/data分区内创建文件时,系统提示磁盘空间不足,用df -h命令查看了一下磁盘使用情况,发现/data分区只使用了66%,还有12G的剩余空间,按理说不会出现这种问题。 二、分析问题: 后来用df -i查看了一下/data分区的索引节点(inode),发现已经用满(IUsed=100%),导致系统无法创建新目录和文件。 [root@bastion-IDC ~]# df
话说这个背景挺惨的,某系统使用了poi-ooxml-3.5-final做excel导出功能。起初使用该版本的poi的HSSF配合多线程生成excel,没有任何问题,后来改成了XSSF生成后上线,导出3w条数据时,cpu使用率达到了100%,内存达到了100%,打死了整个服务器!
对于线上系统调优,它本身是个技术活,不仅需要很强的技术实战能力,很强的问题定位,问题识别,问题排查能力,还需要很丰富的调优能力。
问题详情: 如何配置一台适用于深度学习的工作站? 刚买两块 Titan Z GPU 准备搞搞深度学习,结果原来的工作站功率不够,带不动,所以准备组装一台新工作站。求大神们给点意见,最好给个完整的 li
腾讯云移动直播是腾讯云很擅长的技术,有着多年云服务行业经验的腾讯云视频移动直播包括活动直播/会议直播/发布会直播等秀场直播/游戏直播/娱乐直播等,腾讯云移动直播技术经过多年的研发发展,使用起来简单易接入,下面魏艾斯博客详细介绍一下。
关于云服务器,想必不少人都有过考虑租用,因为云服务器是作为建立网站必不可少的东西,那么云服务器怎么建立网站?具体不同的云服务器收费价格又都是怎样的呢?
做Java的大都没有c++ 的那种分配内存的烦恼,因为Java 帮我们管理内存,但是这并不代表我们不需要了解Java的内存结构,因为线上经常出现内存的问题,今天聊一下内存的问题。
本文来源于王璋在知乎问题【如何配置一台适用于深度学习的工作站?】下的回答,AI科技评论获其授权转载。 问题详情 如何配置一台适用于深度学习的工作站? 刚买两块Titan Z GPU准备搞搞深度学习,结
1.CPU:4核(最低需要4核起,当然可以选择更高的)CPU的选择更看重单核性能,尽量选择主频2.5GHz以上的,如果是E5处理器,最低也得E5-2670v2,多核心性能拉满
服务器内存占用过高导致数据库服务关闭,网站无法登陆的错误详解-制作swap交换区加大内存
Jekyll可以启动一个server服务,启动参数中有--watch(监听文件变化)和--detach(后台运行)选项,看起来这两个参数一起使用就完事了.
套接字socket是大多数程序员都非常熟悉的概念,它是计算机网络编程的基础,TCP/UDP收发消息都靠它。我们熟悉的web服务器底层依赖它,我们用到的MySQL关系数据库、Redis内存数据库底层依赖它。我们用微信和别人聊天也依赖它,我们玩网络游戏时依赖它,读者们能够阅读这篇文章也是因为有它在背后默默地支持着网络通信。
花费了整整一个周末加两个晚上,终于将最新的SAP S/4HANA 2020, Fully-Activated Appliance从Amazon远程主机打包下载下来,做成VM虚拟机,对,你没看错,很多人心心念念的Fully-Activated Appliance版本,自带业务数据,简称FAA。整个过程非常的艰辛,不仅需要在Amazon上提交工单增加配额,同时还要配置各种参数,主机上打包系统花了5-6个小时,中间还断线了一次,还得从来。因为国内的网络不给力,下载速度太慢,所以采用加拿大的服务器从Amazon主机ftp到本地,然后再传到网盘上,下载过程也很辛苦,足足花了二十多个小时,生怕掉线又得重新来过。但上传网盘的时候又差点崩溃,百度网盘在加拿大海外不给力,上传只有200-300KB/S,尝试了很多的网盘,最终挑选Apple iCloud作为中间云盘,购买iCloud容量,先传上去,然后国内这边再下载下来,123G的数据库上传下载足足用了15个小时,分了33个压缩包。因为手头上没有合适的机子安装,只好借用一个朋友的日本远端主机,然后又得在那台服务器上重新下载一遍。
我们应对单台应用服务器做压力测试,你只有知道了单台能够承受多少才能知道集群能承受多少。
垃圾回收器帮助你管理应用程序内存的分配和释放,自动内存管理可避免内存泄漏,或者重复释放内存。
已经被这个问题困扰了很久了,先说下这个问题的来源及现象吧。 这个问题得从上次换服务器之后说起。这是公司的服务器,用于手机相关的服务器,为手机业务提供APP的升级、收集手机用户基本信息及为手机APP提供相应的指令。因为业务原因,手机用户的相关请求在时间上会比较集中,从数据上来说,高峰的时候并发也就几千个吧。之前的服务器配置比较差一些,4核8G的机器,访问量大的时候响应会比较慢,最慢的时候几十秒才能给返回,服务器的资源也吃满,所以就换成新服务器。新机器是Xeon E5 v4处理器,8核16线程,16G内存。 换到新机器之后,资源剩余比较多,但是却时不时的出现访问的时候秒断的情况。
设置缓存大家可能大家都是从性能角度去考虑的,但是如果你不注意或者稍微设置不当,缓存也可能对我们的网站的安全性和用户隐私造成负面影响。
领取专属 10元无门槛券
手把手带您无忧上云