如何解决TCP socket的阻塞问题
作者:shusy411
这篇文章主要介绍了如何解决TCP socket的阻塞问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
解决TCP socket的阻塞问题
大家知道,tcp的读和写是阻塞的,即读的时候不知道什么时候读完,写的时候不知道什么时候写完,因此线程就一直暂停在哪里,一般tcp程序用在上位机下位机之间对吧!
下位机一些设备一般会发心跳报文给我们机器,假设为10s发一次吧,当机器超过10s没接收到数据,那么我们就要考虑把socket断开,因为不断开的话设备重新连接可能又会建立新的socket,这样如果设备反复断开连接的话,将产生大量的socket,占用大量系统资源,这里我们用socket.setSoTimeout(500)方法解决read方法的阻塞问题,同时设定一个标志位
在异常处理程序当中退出socket连接
public void run(){ InputStream is = null; OutputStream os = null; int flag = 0; try { socket.setSoTimeout(500); // 0.5秒就退出read()方法的阻塞 is = socket.getInputStream(); os = socket.getOutputStream(); } catch (Exception e2) { e2.printStackTrace(); } while (true) { try { // 读取数据 int readlen = is.read(buff); if (readlen > 0) { flag = 0; } byte data[] = Arrays.copyOfRange(buff, 0, readlen); resolveData(data); } catch (IOException e) { try { flag++; if (flag == 200) { is.close(); os.close(); socket.close(); } } catch (Exception e1) { e1.printStackTrace(); } } } }
TCP连接阻塞的监控和处理
那么,什么样的TCP连接属于上述发生阻塞的异常连接呢?结合线上运维经验
我们整理出符合该类异常的特征如下
- 该连接的Recv_Q的值特别大(超过3M)
- 该连接的Recv_Q的值持续上涨,造成堆积(在一定滑动时间窗口内)
- 服务端进程已长时间不再处理该连接的请求(超过90秒)
其中Recv_Q的值可以通过netstat或ss系统工具即可进行Recv_Q队列大小的采样,从而进行阀值判断。
netstat 的结果是读取/proc/net/tcp文件而来的.
如何查看一个连接的创建时间
1.nestat -apn | grep xxx查看到对应的连接的进程pid和端口
2. 将上下游端口,转换为16进制xxxa xxxb
3.然后cat /proc/net/tcp | grep -i xxxa | grep -i xxxb找到该socket连接的inode inodex
4.ls -al /proc/pid/fd | grep inodex即可看见该socket文件的创建时间.
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。