数据库监控是运维之本

前一段时间用户的系统进行应用发布和系统运维,准备了很久,结果我们最为担心的数据库维护环节没有出现问题,却在应用发布的阶段出现麻烦,因为程序未设置正确的字符集,导致插入了乱码数据,结果又不得不重来。

在很多重要的维护操作中,往往核心环节没问题,结果在微不足道的小地方折戟沉沙。

移动的朋友总结了一句话,非常有道理:运维保障总是从最高风险点开始逐步推进,悖论是如果这样推进的执行力有保障,出的问题总是之前觉得低风险的地方。

这也给我们一个警示:数据库运维或系统运维,每一个环节都要细致入微,唯有如此才能保障长治久安。

最近某用户的ASM实例又因为ORA-04031错误出现宕机事故,影响了业务运行,我分析了一下日志,同一个的错误自去年就已经出现,两个实例分别发生了148 次和111次,最终--终于导致事故出现。、数据库运维,监控是根本,及时发现、分析和解决出现的问题,是运维保障系统稳定的关键,任何一个简单的错误都不容轻忽。

加强监控,收集和分析足够多的数据,是系统的最佳保障!

图:对客户系统错误的分析。

原文发布于微信公众号 - 数据和云(OraNews)

原文发表时间:2013-07-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏互联网数据官iCDO

Google Analytics增强版电子商务功能的分步指南

译者:陈荣芳、审校:朱玉雪 本文长度为3728字,预估阅读时间7分钟。 我们今天要向大家简单介绍下,如何使用Google Analytics增强版电子商务插件...

66040
来自专栏钱塘大数据

【干货】冲击年薪百万,11 大编程语言薪资排行榜

有这样一个问题,使用空格和使用 Tab 的程序员谁挣得更多? 你别说,还真有人做了统计: ? 图1:根据 2017 年 Developer Survey 调查 ...

522110
来自专栏软件测试经验与教训

张老师聊面试(二)

小梅,毕业一年,从实习到现在都在一家外包单位工作,做的是手机测试和定制软件的测试,由于工作单调,且没有成长空间,因此考虑换一份工作。但几次面试都不太顺利。

11210
来自专栏Android 开发者

[译] 更好的数据,更明智的决策:Google Play Console 和 Firebase 帮你分析你的用户

作者:Tom Grinsted(Google Play Console 的产品经理)和 Tamzin Taylor(Google Play 西欧区应用及游戏部主...

26820
来自专栏ThoughtWorks

2015.1 技术雷达 | 技术篇

许多项目都存在外部代码依赖,这些依赖中很大一部分是由开源项目提供的。为了确保构建过程可被重现,我们总是与固定版本的外部依赖进行集成。但这就意味着我们与这些类库的...

36270
来自专栏美团技术团队

云端的SRE发展与实践

背景 SRE(Site Reliability Engineering)是Google于2003年提出的概念,将软件研发引入运维工作。现在渐渐已经成为各大互联网...

36990
来自专栏Java架构师学习

Java开发技术大揭底——让你认知自己技术上的缺陷,成为架构师一、分布式架构体系二、微服务架构三、阅读源码、分析源码四、工具的使用五、性能优化

一、分布式架构体系 分布式怎么来的。传统的电信、银行业,当业务量大了之后,普通服务器CPU/IO/网络到了100%,请求太慢怎么办?最直接的做法,升级硬件,反正...

31790
来自专栏云计算D1net

揭穿SaaS应用程序可取代所有遗留系统这个神话

如今,软件即服务(SaaS)应用程序越来越多地应用于大企业。公司高管想要员工使用这种应用程序的两个首要原因是: * 节省成本:公司可节省IT团队扩建构建新应用程...

28770
来自专栏云计算D1net

亚马逊Web服务超级用户论战DBaaS

高级亚马逊Web服务用户更喜欢自我管理运行在亚马逊弹性计算云上的数据库,而不是数据库即服务产品,至少现在看是这样的。 上周,AWS超级用户在线活动群组...

31550
来自专栏云计算D1net

公有云存储方案:迁移哪些数据

使用对象存储和商业硬件是进入云计算服务的一种方案,但并非最佳方式。当开始支持新的、云架构下的应用(这类应用是根据RESTful应用编程接口[RESTful AP...

46450

扫码关注云+社区

领取腾讯云代金券