云服务与SRE架构师社区

22 篇文章
13 人订阅

全部文章

王录华

利用公有云上的Kubernetes集群为单点应用提供高可用

Kubernetes作为一个容器编排系统,为我们提供了异常丰富的功能:服务发现、负载均衡、CI/CD、配置管理、故障自愈。作为曾经的高可用性(HA)集群的开发人...

6510
王录华

解决云服务中的多对多分组问题 - 二分图的社区发现算法

本文介绍一种高效的二分图社区发现算法biLouvain,以云服务中的多对多关系的分组问题为例,分析这类算法的使用方法和效果。

11920
王录华

API 网关 kong 实战

目前互联网后台架构一般是采用微服务,或者类似微服务的形式,应用的请求通常需要访问多个后台系统。如果让每一个后台系统都实现鉴权、限流、负载均衡、审计等基础功能是不...

17220
王录华

云上构建高可用实例——应用负载均衡

  作为云行业的新人,把在云上构建系统的一点一滴记录下来,有坑填坑,没坑挖坑再填平,同时也希望能给看到此文章的人提供一定的实操及经验指南。  下文中所有云中操作...

7210
王录华

在堡垒机隔离环境中使用Python的pexpect模块收集日志一例

在实际生产环境(production environment)中, 很多系统为了安全考虑只有对应一些指定的堡垒服务器(bastion server)才能登录到虚...

6710
王录华

如何利用云安全运营中心监测数据泄露

➢5月,三星手机厂商多个内部项目代码泄露,包括SmartThings敏感的源代码、证书和密钥。

9720
王录华

SRE和DevOps的关系:把SRE看作是DevOps接口的实现

译者注:近几年,包括Oracle、微软在内的全球主要的软件企业都在其云服务研发和运营部门推行DevOps或SRE。我所在的系统架构和性能服务部门也在2017年初...

8910
王录华

使用ELK+SpringBoot+bboss实现日志分析一例

上篇说到ELK日志整合系统的搭建:如何使用ELK Stack分析Oracle DB日志,这篇接着说说分析系统的设计和开发,还是举个例子吧。

9020
王录华

SpringBoot+Prometheus:微服务开发中自定义业务监控指标的几点经验

从马楠的上一篇文章中,我们已经了解到Prometheus的一大优势,是可以在应用内定义自己的指标做监控。我们在 SpringBoot 做微服务的生产环境中,使用...

28920
王录华

转: Oracle正在招Linux OS Architect,技术挑战和薪酬都相当的给力!

(信息来源:https://oracle.taleo.net, JOB ID: 16000P1S, 160017NU)

6830
王录华

浅析kube-proxy中的IPVS模式

笔者在学习kubernetes的kube-proxy的时候,kube-proxy具有三种proxy mode:

9920
王录华

Oracle Linux对LXC容器的优化以及常见问题汇总

关于作者:王录华 (luhua.wang@oracle.com), 高级经理 - 系统架构和性能服务, Oracle

11130
王录华

Prometheus 开源监控解决方案 之 基本架构及部署

Prometheus把所有的数据按时序列进行存储, 所有采集上来的数据在都被打了时间戳并按时间先后顺序进行流化,这些数据属于相同的指标名以及一组标签维度(lab...

30110
王录华

一文读懂 Spring Boot、微服务架构和大数据治理三者之间的故事

微服务的诞生并非偶然,它是在互联网高速发展,技术日新月异的变化以及传统架构无法适应快速变化等多重因素的推动下诞生的产物。互联网时代的产品通常有两类特点:需求变化...

6610
王录华

如何使用ELK Stack分析Oracle DB日志

随着业务的发展,服务越来越多,相应地,日志的种类和数量也越来越多。一般地,我们会用grep、awk,或者编写脚本进行日志分析。对于多个服务构成的系统,需要人为把...

16610
王录华

MongoDB从理论到实践

MongoDB是一个开源的分布式文档形数据库,文档是一个键值对组成的数据结构,类似JSON,字段的值可以是数组或者字典(可以理解为嵌套的文档),例如

6410
王录华

APMCon 2017 | 清华裴丹:智能运维中的科研问题

编者按:公众号上的文章,你有读过5遍的么?我就经历过。2017年3月,我的团队开始在AIOps上做一些探索,因为这条路那时没什么走过,所以特别难,周围当时也没有...

12310
王录华

王录华:关键客户访问应用时如何做到Average Page Load Time超过3分钟就触发警报(第5篇)

(1)如何你的云计算数据中心有超过两万个各式各样的企业应用,您如何找出用户体验最差的应用及页面链接?这个最差体验是由于服务器响应延迟时间导致的,还是网络延迟时间...

7520
王录华

谈云计算数据中心DevSecOps运维模式中的安全性(第4篇)

DevOps T-shirt worn at a computer conference (图片来源于Wikipedia, 由Raysonho上传)

9120
王录华

【原创干货】我是如何为公有云和XX联邦政府提供安全的Linux操作系统的解决方案的?

我大约是在2012年左右时,在网络和私有云两大领域之外,又在操作系统领域得到一个非常有挑战的新机遇:为公司超过30万台的服务器提供安全的Linux操作系统解决方...

6620

扫码关注云+社区

领取腾讯云代金券