本文作者系肖遥(花名),现任甲骨文技术支持工程师 ,目前专注于Oracle RAC领域。个人主页:
很多年前的一套测试环境,今天发现集群无法启动。手工尝试启动crs,集群日志也无任何输出。进一步检查集群配置:
说明,ora.cluster_interconnect.haip的ENABLED属性的原始值为1:
为了及时共享行业案例,通知共性问题,达成共享和提前预防,我们整理和编辑了《云和恩墨技术通讯》,通过对过去一段时间的知识回顾,故障归纳,以期提供有价值的信息供大家参考。同时,我们也希望能够将热点事件、新的产品特性及其他有价值的信息聚集起来,为您提供具有前瞻性的支持信息,保持对于当前最新的数据库新闻和事件的了解,其中包括重要数据库产品发布、警报、更新、新版本、补丁等。
通过以上我们对集群有了一定的认识,这节我们介绍Oracle 11g 集群的启动过程
先来说一下前面发布的文章【Oracle 通过 SQL 语句查看数据库服务器 IP 地址】看着阅读量还不错,故有了这篇更文。
环境:RHEL 6.4 + GI 11.2.0.4 + Oracle 11.2.0.4 对有关HAIP相关问题的总结,包括禁用/启用HAIP,修改ASM资源的依赖关系,修改cluster_interconnects参数等。
OCR就好比Windows的一个注册表,存储了所有与集群,RAC数据库相关的配置信息。而且是公用的配置,也就是说多个节点共享相同的配置信息。因此该配置应当存储于共享磁盘。本文主要基于Oracle 10g RAC描述了集群的OCR以及OCR产生的健忘问题。
最近碰到了一个关于ASM无法启动的案例,当然这个案例比较长,准备分两篇来写。 问题的背景如下: 目前存在一套standalone的环境,采用了ASM作为存储管理,业务属于实时统计,在某一天下班的时候开发的同事突然联系我说,数据库感觉有些问题,因为部分应用开始报错了,然后他们问我在这段时间做过什么操作没有,从我的印象来看下午4点只对部分分区做了例行维护,其它什么都没调整。问题是在6点开始发现,所以应该没有什么关联。 当然口说无凭,开发的同学也反馈了报错的信息。 反馈错误信息1:Yourdatabase con
. run-level 2 May 20 11:35 2 0 S
在Oracle RAC中,Public IP、Private IP、Virtual IP、SCAN IP、GNS VIP及HAIP的作用分别是什么?
前言 在Oracle Clusterware需要从集群中逐出特定节点或一组节点的情况时,基于服务器权重的节点驱逐可充当断裂机制,通过服务器上的负载附加信息来识别要驱逐的节点或节点组。其中所有节点被驱逐的可能性是一样的。 基于权重的集群驱逐介绍 基于权重的集群驱逐(Server Weight-Based Node Eviction)是一项Oracle 12.2版本引入的一项新特性。在此之前,Oracle集群在处理脑裂问题时,通过判断子群(各自独立)的规模情况,来决定在脑裂问题发生时,终止哪个子群,判断的依据如
以oracle 11G版本为准进行解析 Data Guard Architecture Overview (Data Guard架构概述) Data Guard provides the management, monitoring, and automation software to create and maintain one or more synchronized copies of a production database to protect Oracle data from failures, disasters, human error, and data corruptions while providing high availability for mission critical applications. Data Guard is included with Oracle Database Enterprise Edition. Data Guard提供管理,监视和自动化软件,用于创建和维护生产数据库的一个或多个同步副本,以保护Oracle数据免受故障,灾难,人为错误和数据损坏,同时为关键任务应用程序提供高可用性。 Data Guard包含在Oracle数据库企业版中。 Active Data Guard Functionality Overview (Active Data Guard功能概述) Active Data Guard is an option license for Oracle Database Enterprise Edition. Active Data Guard enables advanced capabilities that that extend basic Data Guard functionality. These include:
题记:在RAC数据库的故障当中,节点重启的现象很常见,在这种问题的处理当中,有一定的规律性。为了更好的说明这个问题的处理过程,保证出现该类问题的时候,能够有序的进行处理,特编写此文档。
环境: RHEL 6.5 + Oracle GI 11.2.0.4 (2 nodes) 参考MOS文档 How to Deconfigure/Reconfigure(Rebuild OCR) or Deinstall Grid Infrastructure (文档 ID 1377349.1) 1.前期准备 2.删除GI 1.前期准备 确认各节点都是unpin的状态: <GI_HOME>/bin/olsnodes -s -t If a node is pinned, unpin it first, i.
Linux平台 Oracle 18c RAC安装指导: Part1:Linux平台 Oracle 18c RAC安装Part1:准备工作 Part2:Linux平台 Oracle 18c RAC安装Part2:GI配置 Part3:Linux平台 Oracle 18c RAC安装Part3:DB配置
题记:在RAC数据库的故障当中,节点重启的现象很常见,在这种问题的处理当中,有一定的规律性。为了更好的说明这个问题的处理过程,保证出现该类问题的时候,能够有序的进行处理,特编写此文档。 作者介绍 曾天水(水哥) , oracle认证大师,在数据库领域钻研了10多年,擅长数据库优化,系统架构方案设计,疑难杂症问题解决等,并在开源领域也有广泛的涉猎。 问题现象描述 此问题的现象比较明显,也就是数据库自动重启,或者是节点自动重启,客户端在数据库重启期间无法连接数据库,导致业务断连的现象。这种情况如果出现在业务高
目 录 1 实施需求 2 修改主机名 2.1 停止HAS服务 2.2 修改主机名 3 重新配置服务 3.1 使用root用户重新配置CSS & OHAS服务 3.2 设置cssd自动启动属性 3.3 重启OHAS 3.4 检查css & ohas状态 3.5 添加监听资源并启动 3.6 创建pfile文件 3.7 添加asm实例资源 3.8 设置asm资源自动启动属性 3.9 设置asm_diskstring属性 3.10 启动asm实例 3.11 验证asm磁盘可被识别 3.12 创建新的spfil
diagwait算是一个小知识点,但具有普遍性。因为现实中很多客户生产数据库版本低于11.2,同时diagwait没有正确设置(默认配置不合理),轻则导致一些节点驱逐的案例缺少相关日志无法准确分析原因,重则由于oporcd默认的1.5s(1000ms+500ms)过短过于敏感,比如瞬时压力过大都很容易导致节点主机重启,这显然不是我们所期望的。
原文链接 http://allthingsoracle.com/oracle-flex-cluster-leaf-node-failover/ 译者 周天鹏 Oracle 在12c中使用hub-and-spoken技术实现了Flex Cluster的功能(即RAC集群中的每个节点不再需要既运行ASM实例又运行DB实例,各节点可以扮演不同的角色)。相比12c以前的版本,该功能使集群规模的扩大和缩减变得更加靠谱。原因如下: 集群中各节点间网络的互相干扰变得更少。 关键的集群组件争用更少,如OCR, VOT
在对集群做调整前。如:增删节点等操作前,应该对OCR进行一次备份。能够使用export备份到指定文件。
新安装了Oracle 11g rac之后,不知道是什么原因导致第二个节点上的crsd无法启动?其错误消息是CRS-4535: Cannot communicate with Cluster Ready Services。其具体的错误信息还需要查看crsd.log日志才知道。
Oracle认为这是存储或者OS问题导致asm acd block的元数据不一致了,可能导致ASM元数据的主辅扩展区都发生损坏。这个损坏会导致rebalance挂起或不断尝试失败,或者阻止磁盘组被挂载。
本文实验环境: 10.2.0.5 Clusterware + RAC 11.2.0.4 GI + RAC 通过对比命令的输出,也可大致了解10g RAC 到 11g RAC 发生的变化。
从集群的启动角度来讲,Oracle 10g、11gR1版本的集群是通过/etc/inittab文件中的以下3行代码来启动的。
作者简介: 何剑敏 Oracle ACS华南区售后团队,首席技术工程师 现供职于Oracle ACS华南区售后团队,首席技术工程师。多年从事第一线的数据库运维工作,有丰富项目经验、维护经验和调优经验
使用crsctl查看集群各资源状态,在任一节点都会直接报错CRS-4535, CRS-4000;但此时数据库是可以被正常访问的。 具体故障现象如下:
Linux平台 Oracle 19c RAC安装指导: Part1:Linux平台 Oracle 19c RAC安装Part1:准备工作 Part2:Linux平台 Oracle 19c RAC安装Part2:GI配置 Part3:Linux平台 Oracle 19c RAC安装Part3:DB配置
这套rac环境是搭建在华为云ECS上的,操作系统为CentOS 7.6。根据经验,rac不能启动,主要是2个方面的原因:一个是共享存储,一个网络。共享存储常见原因是盘掉了,或盘坏了,或多路径软件出问题等等,而网络问题常见原因是私网网卡坏了,或节点之间网络不通(注意:修改ssh端口或修改oracle和grid密码不会影响rac的正常运行)。
处理过程:在失败的节点上,清理节点集群相关配置信息,然后重新跑root.sh脚本。
第一篇的内容可以参考。ASM无法启动的问题分析(一),有不少的朋友给了一些建议,我也糅合了进来。一并感谢。 当然重启服务发现CSSD服务是Online,但是ASM是无法启动。 [grid@testbiadmin]$ crs_stat -t Name Type Target State Host ------------------------------------------------------------ ora.DATA01.dg
由于维护人员修改Oracle Linux 7中的/dev/shm大小造成其大小小于Oracle实例的MEMORY_TARGET或者SGA_TARGET而导致集群不能启动(CRS-4535,CRS-4000) [grid@jtp1 ~]$ crsctl stat res -t CRS-4535: Cannot communicate with Cluster Ready Services CRS-4000: Command Status failed, or completed with errors.
操作环境:Citrix虚拟化环境中申请一个Linux6.4主机(模板) 目标:创建单机11g + ASM存储 数据库
随着云计算技术的逐日发展,现在云服务器云硬盘这些云产品也正在成为网络产品中的主流。比起普通的服务器以及硬盘,云产品拥有更高的性能以及更优惠的价值,并且功能更加的强大和丰富,但是很多人对于云硬盘以及云服务器的支持并不太了解,现在就来了解一下云硬盘备份是什么意思。
域名是建立网站的核心,也是一个网站的标志,用于标记在网络当中网站的位置。而如何的申请域名呢,需要找到域名的服务商进行注册,如果是收费的域名通常会比较短,而且字母明晰不会有太多字符,域名申请可以自行完成也可以委托网络公司代为申请。域名注册通常会有使用时间,除非是一些大型企业一样买断域名,否则就会出现域名过期。域名过期了是什么意思,就是到了合约的服务期限之后,域名注册的企业未进行续费,导致域名无法正常使用。
本文安装环境:RHEL 6.5 + Oracle 12.2.0.1 GI & RAC
网页是网络的基础,很多操作都需要通过网站来进行,但是有时候打开某个网页,却会显示域名重定向,一些没有经验的人并不知道域名重定向是什么意思。下面来为大家介绍一下域名重定向是什么意思,以及域名重定向应该怎么处理?
目前互联网行业也因为云技术的逐步成熟而出现了一次革新,出现了分布式配置中心等一系列的新概念,不少中小型企业都开始采用分布式配置中心作为公司的核心,就连一些比较大型的互联网公司也开始逐步接受分布式配置中心,那么分布式配置中心是什么意思呢?下面为大家简单介绍分布式配置中心是什么意思?
域名一词频繁在大众视野出现,一些创业公司想要拥有自己的网站,必定需要购买自己域名,而且一个好听易记的域名也深受大众喜爱,人们在登录网站时只需输入域名后便会跳出一系列想要查找的信息,那么具体来说域名是什么意思呢?作用有哪些?今天就来具体讲解,希望对大家有所帮助。
网络技术的提高也带来了新事物的产生,伴随着新的网络技术出现,出现了一大批人们没有见过的新概念,比如堡垒机,目前很多公司或者企业都会使用堡垒机进行企业管理,但同样有很多人并不知道堡垒机是什么意思,想要正确发挥堡垒机的作用,必须要知道堡垒机是什么意思,所以下面为大家简单介绍堡垒机的意思以及使用堡垒机的原因。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/113498.html原文链接:https://javaforall.cn
在我们浏览相关网页的时候,其实并不了解网页到底是如何构成的,这背后有一个非常重要的因素,那就是域名。如果想要创立属于自己的网站,那么一定避免不了要设定二级域名。很多人都不知道二级域名是什么意思以及在什么时候使用二级域名会比较合适呢?接下来就带你一起了解一下。
很多企业在制作企业主页时,往往都将这件事想得过于简单,认为只要制作出网站将其连接到互联网上就可以让其他人访问了,但其实网站建设还需要空间来存放需要域名来给访问者使用,那么空间域名费是什么意思?什么样的空间域名价格便宜呢?
做网站的人应该都知道域名的意思,域名的就好比是家门口中的那块门牌号,每家每户都有独立无二的门牌号。域名也是一个意思,都是全世界独立无二的域名,接通着ip地址,让人们通过域名的方式进行访问网站里面的内容。域名也有顶级之分,下面就给大家讲讲顶级域名是什么意思?
现在社会处于互联网飞速发展的时代,互联网技术的不断发展也让现在社会中信息传播速度越来越快,每个人随时随地都可以使用手机或者电脑访问互联网,在互联网上面会接触到各种各样的数据,无论是对于个人还是企业来说数据量都是非常庞大的,庞大的数据保存就是非常麻烦的问题,数据除了可以保存在各种存储硬件上面之外,现在还引入了数据湖的概念,那么数据湖是什么意思?数据湖有哪些价值?
领取专属 10元无门槛券
手把手带您无忧上云