我有一个 Thrift API,由在 Linux 上运行的 Java 应用程序提供服务。我正在使用 .NET 客户端连接到 API 并执行操作。
对该服务的前几次调用工作正常,没有错误,但随后(看似随机)调用将“挂起”。如果我强制退出客户端并尝试重新连接,服务要么再次挂起,要么我的客户端出现以下错误:
Unable to read data from the transport connection: An existing connection was forcibly closed by the remote host.
at System.Net.Sockets.NetworkStream.Read(Byte[] buffer, Int32 offset, Int32 size)
at Thrift.Transport.TStreamTransport.Read(Byte[] buf, Int32 off, Int32 len)
(etc.)
当我使用 JConsole 获取线程转储时,服务器已开启accept()
"Thread-1" prio=10 tid=0x00002aaad457a800 nid=0x79c7 runnable [0x00000000434af000]
java.lang.Thread.State: RUNNABLE
at java.net.PlainSocketImpl.socketAccept(Native Method)
at java.net.PlainSocketImpl.accept(PlainSocketImpl.java:408)
- locked <0x00000005c0fef470> (a java.net.SocksSocketImpl)
at java.net.ServerSocket.implAccept(ServerSocket.java:462)
at java.net.ServerSocket.accept(ServerSocket.java:430)
at org.apache.thrift.transport.TServerSocket.acceptImpl(TServerSocket.java:113)
at org.apache.thrift.transport.TServerSocket.acceptImpl(TServerSocket.java:35)
at org.apache.thrift.transport.TServerTransport.accept(TServerTransport.java:31)
at org.apache.thrift.server.TSimpleServer.serve(TSimpleServer.java:63)
netstat
在服务器上显示与打开的服务端口的连接TIME_WAIT
在我强制退出客户端几分钟后(正如预期的那样),它最终消失了。
设置Thrift服务的代码如下:
int port = thriftServicePort;
String host = thriftServiceHost;
InetAddress adr = InetAddress.getByName(host);
InetSocketAddress address = new InetSocketAddress(adr, port);
TServerTransport serverTransport = new TServerSocket(address);
TServer server = new TSimpleServer(new TServer.Args(serverTransport).processor((org.apache.thrift.TProcessor)processor));
server.serve();
请注意,我们正在使用TServerTransport
采用显式主机名或 IP 地址的构造函数。我怀疑我应该更改它以采用仅指定端口的构造函数(最终绑定到InetAddress.anyLocalAddress()
)。或者,我想我可以将服务配置为绑定到“通配符”地址(“0.0.0.0”)。
我应该提到的是,该服务不是托管在开放的互联网上。它托管在专用网络中,我使用 SSH 隧道来访问它。因此,服务绑定的主机名在我的本地网络中无法解析(尽管我可以通过隧道建立初始连接)。我想知道这是否类似于?
是否有对所发生情况的技术解释(如果这是一个常见问题),或者我可以采取的其他故障排除步骤?
UPDATE
今天也遇到同样的问题,但是这次jstack
显示 Thrift 服务器永远阻塞从输入流读取:
"Thread-1" prio=10 tid=0x00002aaad43fc000 nid=0x60b3 runnable [0x0000000041741000]
java.lang.Thread.State: RUNNABLE
at java.net.SocketInputStream.socketRead0(Native Method)
at java.net.SocketInputStream.read(SocketInputStream.java:129)
at org.apache.thrift.transport.TIOStreamTransport.read(TIOStreamTransport.java:127)
at org.apache.thrift.transport.TTransport.readAll(TTransport.java:84)
at org.apache.thrift.protocol.TBinaryProtocol.readAll(TBinaryProtocol.java:378)
at org.apache.thrift.protocol.TBinaryProtocol.readI32(TBinaryProtocol.java:297)
at org.apache.thrift.protocol.TBinaryProtocol.readMessageBegin(TBinaryProtocol.java:204)
at org.apache.thrift.TBaseProcessor.process(TBaseProcessor.java:22)
at org.apache.thrift.server.TSimpleServer.serve(TSimpleServer.java:70)
所以我们需要在其中设置一个“客户端超时”TServerSocket
构造函数。但是为什么这会导致应用程序在阻塞时也拒绝连接accept()
?