背景
今天有同事反馈客户的环境在 TCP
建链时偶现超时导致握手失败,希望我能帮助测试定位。那我们可以使用 netperf
工具进行时延测试,如果能够触发问题,我们就可以抓包进行分析了。
分析
前面我们已经介绍过使用 netperf
进行网络性能测试,那 netperf
其实也能够进行网络时延的测试,今天我们就结合实际问题进行 TCP
协议下的网络时延测试。
通常这种情况一般发生在数据包转发点,根据网络拓扑即可知道数据包在哪些地方进行了转发。在这些地方我们都需要进行抓包。比如客户端到外部路由器,路由器到交换机,交换机到服务器,服务器到虚机。
netperf 测试网络时延
关于 netperf
的安装我们就不再赘述,有需要的同学点这里:xxx。
首先我们在客户端和服务段都安装好 netperf
,然后再服务端启动 netserver
,最后在客户端发起测试即可。
启动 netserver
命令:netserver
12865
端口监听成功,说明 netserver
启动成功。
客户端发起测试
命令:
netperf -H $(对端IP) -t omni -- -d rr -O "THROUGHPUT, THROUGHPUT_UNITS, MIN_LATENCY, MAX_LATENCY, MEAN_LATENCY"
测试结果分析
从测试结果我们可以知道,最大的时延为 697us
,并没有复现开始提到的问题,但是我们可以使用-t
参数增加测试时间观察能否复现,同时结合抓包工具进行深度分析。
其他常用测试命令
最大收发包数(速)
服务端后台启动 netserver
。然后使用 sar
命令观测虚拟网卡上的数据包情况。
netserver &
sar -n DEV
多台测试机上向被测虚机(服务端)使用 UDP
灌包。
netperf -H x.x.x.x -t UDP_STREAM -l 60 -- -m 1
最终的结果在 sar
的观测结果中获取。
多说一句
网络问题相比其他问题而言,存在定位难度大,不确定性高,运维监控难等问题,但是我们可以结合业务场景,利用相关测试工具,再根据自己的经验来一步一步分析,是问题总能搞清楚的。
评论区