网络编程中send和recv常见错误梳理

网络开发时,调用send和recv进行数据收发,经常会遇到一些异常问题,导致返回值为-1,errno被置为某个特殊值。这时就需要我们根据经验,结合实际情况判断问题症结,这样才能快速定位和处理问题。下面总结了一些开发中,经常会遇到的问题。

  • Connection reset by peer
    这个错误一般是对端已经关闭连接(处于关闭连接过程中),本端依然向对端发送数据导致。

  • Broken pipe
    这个错误一般是向一个已经关闭的套接字中写数据,导致管道错误。默认操作系统会终止进程,在c程序中需要将该信号忽略。
    当向一个已经关闭的链接发送数据时,由于处于tcp的状态不同,可能会导致上面两种不同的结果。

  • errno为EAGAIN EWOULDBLOCK EINTR
    这个是程序中当send和recv返回-1时,判断errno如果为上述值,需要再次send和recv。有下面几个情况:

    1. 用于非阻塞套接字
    2. 阻塞套接字,但是设置了SO_RCVTIMEO和SO_SNDTIMEO
    3. O_NODELAY会导致write接口返回EAGAIN。如果设置了O_NODELAY而当前不可写,那么write接口会设置errno为EAGAIN,但是write接口会返回0而不是-1。
  • recv返回0
    这个是对端已经正常关闭套接字,本端获取这个返回值时,也应当正常关闭。如果对端调用close关闭套接字,本端的recv会从阻塞状态(如果处于阻塞的话)立即返回0。

  • send和recv一直阻塞
    用于非阻塞套接字,且未设置超时时间。有以下情况:

    1. 发送方阻塞:内核发送缓冲区已满,无法将数据从用户空间拷贝到内核空间,一般对端未及时读取数据导致。
    2. 接收方阻塞:发送方未发送数据导致内核接收缓冲区为空或者应用未及时取走数据。
      在阻塞状态下,如果断开网络连接,有可能一直阻塞下去。
  • 双方同时send导致死锁问题
    参考http://m.blog.csdn.net/article/details?id=64131277

另外在java中,会有一些异常,从网上摘录如下

Connection reset by peer的常见原因:
1)服务器的并发连接数超过了其承载量,服务器会将其中一些连接关闭;
如果知道实际连接服务器的并发客户数没有超过服务器的承载量,则有可能是中了病毒或者木马,引起网络流量异常。可以使用netstat -an查看网络连接情况。
2)客户关掉了浏览器,而服务器还在给客户端发送数据;
3)浏览器端按了Stop;
这两种情况一般不会影响服务器。但是如果对异常信息没有特别处理,有可能在服务器的日志文件中,重复出现该异常,造成服务器日志文件过大,影响服务器的运行。可以对引起异常的部分,使用try…catch捕获该异常,然后不输出或者只输出一句提示信息,避免使用e.printStackTrace();输出全部异常信息。
4)防火墙的问题;
如果网络连接通过防火墙,而防火墙一般都会有超时的机制,在网络连接长时间不传输数据时,会关闭这个TCP的会话,关闭后在读写,就会导致异常。 如果关闭防火墙,解决了问题,需要重新配置防火墙,或者自己编写程序实现TCP的长连接。实现TCP的长连接,需要自己定义心跳协议,每隔一段时间,发送一次心跳协议,双方维持连接。
5)JSP的buffer问题。
JSP页面缺省缓存为8k,当JSP页面数据比较大的时候,有可能JSP没有完全传递给浏览器。这时可以适当调整buffer的大小。 <%@ page buffer=”100k”%>

其它异常

第1个异常是java.Net.BindException:Address already in use: JVM_Bind。该异常发生在服务器端进行new ServerSocket(port)(port是一个0,65536的整型值)操作时。异常的原因是以为与port一样的一个端口已经被启动,并进行监听。此时用netstat –an命令,可以看到一个Listending状态的端口。只需要找一个没有被占用的端口就能解决这个问题。

第2个异常是java.net.ConnectException: Connection refused: connect。该异常发生在客户端进行 new Socket(ip, port)操作时,该异常发生的原因是或者具有ip地址的机器不能找到(也就是说从当前机器不存在到指定ip路由),或者是该ip存在,但找不到指定的端口进行监听。出现该问题,首先检查客户端的ip和port是否写错了,如果正确则从客户端ping一下服务器看是否能 ping通,如果能ping通(服务服务器端把ping禁掉则需要另外的办法),则看在服务器端的监听指定端口的程序是否启动,这个肯定能解决这个问题。

第3个异常是java.net.SocketException: Socket is closed,该异常在客户端和服务器均可能发生。异常的原因是己方主动关闭了连接后(调用了Socket的close方法)再对网络连接进行读写操作。

第4个异常是java.net.SocketException: (Connection reset或者 Connect reset by peer:Socket write error)。该异常在客户端和服务器端均有可能发生,引起该异常的原因有两个,第一个就是如果一端的Socket被关闭(或主动关闭或者因为异常退出而引起的关闭),另一端仍发送数据,发送的第一个数据包引发该异常 (Connect reset by peer)。另一个是一端退出,但退出时并未关闭该连接,另一端如果在从连接中读数据则抛出该异常(Connection reset)。简单的说就是在连接断开后的读和写操作引起的。

第5个异常是java.net.SocketException: Broken pipe。该异常在客户端和服务器均有可能发生。在第4个异常的第一种情况中(也就是抛出SocketExcepton:Connect reset by peer:Socket write error后),如果再继续写数据则抛出该异常。前两个异常的解决方法是首先确保程序退出前关闭所有的网络连接,其次是要检测对方的关闭连接操作,发现对方关闭连接后自己也要关闭该连接。

客户端错误代码10053 Software caused connection abort(软件原因导致连接中断)

坚持原创技术分享,您的支持将鼓励我继续创作!