我们的系统设置由两个WebLogic10.3服务器组成:一个承载表示层,另一个托管EJB。系统在中度负载下正常运行一段时间(一天到几天),之后EJB方法从呈现服务器调用到EJB服务器开始失败,出现以下错误:
java.rmi.RemoteException: java.rmi.UnmarshalException: error unmarshalling arguments; nested exception is: java.io.OptionalDataException
堆栈跟踪:
java.io.OptionalDataException
at java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1349)
at java.io.ObjectInputStream.readObject(ObjectInputStream.java:351)
at weblogic.utils.io.ChunkedObjectInputStream.readObject(ChunkedObjectInputStream.java:197)
at weblogic.rjvm.MsgAbbrevInputStream.readObject(MsgAbbrevInputStream.java:564)
at weblogic.utils.io.ChunkedObjectInputStream.readObject(ChunkedObjectInputStream.java:193)
at weblogic.jndi.internal.RootNamingNode_WLSkel.invoke(Unknown Source)
at weblogic.rmi.internal.BasicServerRef.invoke(BasicServerRef.java:589)
at weblogic.rmi.cluster.ClusterableServerRef.invoke(ClusterableServerRef.java:230)
at weblogic.rmi.internal.BasicServerRef$1.run(BasicServerRef.java:477)
at weblogic.security.acl.internal.AuthenticatedSubject.doAs(AuthenticatedSubject.java:363)
at weblogic.security.service.SecurityManager.runAs(Unknown Source)
at weblogic.rmi.internal.BasicServerRef.handleRequest(BasicServerRef.java:473)
at weblogic.rmi.internal.wls.WLSExecuteRequest.run(WLSExecuteRequest.java:118)
一旦遇到第一个OptionalDataException,所有后续调用都会失败,结果相同。一些消息来源认为,这可能与集群多播端口配置错误有关。但是,这些服务器不属于集群。
引导EJB服务器总是临时解决这个问题,但问题似乎在一段时间后再次出现。
更新:问题似乎与套接字连接数量的溢出无关(见下面的答案)。在拒绝网络类加载之后,我们非常稳定地运行了一周,之后又开始在表示服务器上接收OptionalDataExceptions (下面是堆栈跟踪)。奇怪的是,这个系统工作了一周后就开始失效了。
javax.naming.CommunicationException [Root exception is java.rmi.UnmarshalException: error unmarshalling arguments; nested exception is:
java.io.OptionalDataException]
at weblogic.jndi.internal.ExceptionTranslator.toNamingException(ExceptionTranslator.java:74)
at weblogic.jndi.internal.WLContextImpl.translateException(WLContextImpl.java:439)
at weblogic.jndi.internal.WLContextImpl.lookup(WLContextImpl.java:395)
at weblogic.jndi.internal.WLContextImpl.lookup(WLContextImpl.java:380)
at javax.naming.InitialContext.lookup(InitialContext.java:392)
...
Caused by: java.rmi.UnmarshalException: error unmarshalling arguments; nested exception is:
java.io.OptionalDataException
at weblogic.rjvm.ResponseImpl.unmarshalReturn(ResponseImpl.java:234)
at weblogic.rmi.cluster.ClusterableRemoteRef.invoke(ClusterableRemoteRef.java:348)
at weblogic.rmi.cluster.ClusterableRemoteRef.invoke(ClusterableRemoteRef.java:259)
at weblogic.jndi.internal.ServerNamingNode_1030_WLStub.lookup(Unknown Source)
at weblogic.jndi.internal.WLContextImpl.lookup(WLContextImpl.java:392)
... 38 more
Caused by: java.io.OptionalDataException
at java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1349)
at java.io.ObjectInputStream.readObject(ObjectInputStream.java:351)
at
weblogic.utils.io.ChunkedObjectInputStream.readObject(ChunkedObjectInputStream.java:197)
at weblogic.rjvm.MsgAbbrevInputStream.readObject(MsgAbbrevInputStream.java:564)
at
weblogic.utils.io.ChunkedObjectInputStream.readObject(ChunkedObjectInputStream.java:193)
at weblogic.jndi.internal.RootNamingNode_WLSkel.invoke(Unknown Source)
at weblogic.rmi.internal.BasicServerRef.invoke(BasicServerRef.java:589)
at weblogic.rmi.cluster.ClusterableServerRef.invoke(ClusterableServerRef.java:230)
at weblogic.rmi.internal.BasicServerRef$1.run(BasicServerRef.java:477)
at
weblogic.security.acl.internal.AuthenticatedSubject.doAs(AuthenticatedSubject.java:363)
at weblogic.security.service.SecurityManager.runAs(Unknown Source)
at weblogic.rmi.internal.BasicServerRef.handleRequest(BasicServerRef.java:473)
at weblogic.rmi.internal.wls.WLSExecuteRequest.run(WLSExecuteRequest.java:118)
... 2 more
我们以标准的方式获得初始上下文:
Properties p = new Properties();
p.put(Context.INITIAL_CONTEXT_FACTORY, "weblogic.jndi.WLInitialContextFactory");
p.put(Context.PROVIDER_URL, serverPath);
Context context = new InitialContext(p);
同样,对任何获得的引用的调用都会在类似的OptionalDataException中失败。单独启动表示服务器可以暂时解决此问题。
发布于 2010-08-02 07:36:00
最后,OptionalDataExceptions已经成为历史。简而言之,在我们的应用程序代码中,一个复杂的值对象(用作远程方法调用的返回值)有一个HashMap数据结构作为内部字段。将此字段的类型更改为SynchronizedMap后,OptionalDataExceptions停止发生。在遗留代码中,这个Map似乎是以非线程安全的方式处理的。
奇怪的是,这不会导致WLS 8.1出现问题,但会导致WLS 10进入一个状态,其中所有后续的远程方法调用(包括JNDI查找)都会开始失败。
发布于 2010-03-31 07:22:56
最后,我们找到了解决这个问题的方法(编辑:后来我们发现这不是问题的根源,而是一个单独的严重问题。关于最终的解决方案,请参见下面的答案)。一旦我们开始收到以下异常,我们就发现了原因:
<BEA-000403> <IOException occurred on socket: Socket[addr=/x.x.x.x,port=3266,localport=7001]
java.net.SocketException: Connection refused.
java.net.SocketException: Connection refused
at java.net.SocketInputStream.socketRead0(Native Method)
at java.net.SocketInputStream.read(SocketInputStream.java:129)
at weblogic.socket.SocketMuxer.readReadySocketOnce(SocketMuxer.java:887)
at weblogic.socket.SocketMuxer.readReadySocket(SocketMuxer.java:859)
at weblogic.socket.DevPollSocketMuxer.processSockets(DevPollSocketMuxer.java:120)
at weblogic.socket.SocketReaderRequest.run(SocketReaderRequest.java:29)
at weblogic.socket.SocketReaderRequest.execute(SocketReaderRequest.java:42)
at weblogic.kernel.ExecuteThread.execute(ExecuteThread.java:145)
at weblogic.kernel.ExecuteThread.run(ExecuteThread.java:117)
在表示服务器上,它运行在与EJB服务器不同的主机上,我们可以选择
-Dweblogic.NetworkClassLoadingEnabled=true
显然,可以从EJB服务器加载类。我们不知道的是,使用此选项会导致打开大量的网络套接字。使用netstat,我们能够发现数千个套接字处于CLOSE_WAIT或FIN_WAIT_2状态。似乎除了类之外,web中的所有元素都是从EJB服务器加载的,尽管表示服务器上的war文件包含了所有这些内容。大量的套接字并没有导致“太多的文件”错误消息,因为Weblogic在其启动脚本中删除了文件的u限度。使用测试服务器,我们发现用户对web的一次单击就在两个服务器之间打开了大约30个套接字。
我们删除了这个选项,并将war重新打包到表示服务器上,以包含所有需要的类,从而消除了网络类加载的需要。这导致两个服务器之间的套接字连接数量从数千个减少到1个。
总之,尽可能避免在Weblogic中加载网络类。
https://stackoverflow.com/questions/2454234
复制相似问题