我们正面临基于web的Oracle 10g表单应用程序的问题。
客户端正在随机断开连接(登录应用程序后1分钟到3小时)。
应用服务器- Windows 2003运行Oracle 10g的R2
数据库服务器- Linux服务器也运行Oracle DB
在事件发生时,我们将在Apache错误日志中获得以下日志。
Sat Aug 15 10:26:35 2015客户端ClientIP MOD_OC4J_0015: recv()返回0。没有可用的消息可供接收,而且oc4j已经优雅地(有序)关闭了连接。
2015年8月15日10:26:35客户端ClientIP MOD_OC4J_0054:未能调用网络
我们正在与庞大的hadoop集群合作。
我们有736台datanode机器,每个节点有16个核心X2线程.
在一些机器上,我们看到CPU平均负载(98.128个5分钟)。
经过深入调查,我们发现:
no HW problem
no Disk proble
no network problem
no infra problem
我们仍然没有检查的是优化linux参数和优化内核参数。
哪些参数或内核参数可以帮助机器获得良好的CPU工作在大多数CPU的低平均负载。
http://linuxrealtime.org/index.php/Improving_这个_实时_属性