thug 2019-06-20
关于 Ping
Ping 是一个网络命令,主要是用于确定本地主机是否能与另一台主机交换(发送与接收)数据。根据返回的信息,就可以推断 TCP/IP 参数是否设置得正确以及运行是否正常。正常情况下,Ping 将返回若干个参数,丢失率为 0,当网络状态不佳或网络中断的情况下,Ping 操作将无法正常返回 TTL 参数(显示请求超时或其他 bug )。
通过 Windows 平台的 ms-dos 可以简单执行 Ping 操作,然而这种操作只能简单测试网络是否正常联通,大体上排除网络访问层、网卡、MODEM 的输入输出线路、电缆和路由器等存在的故障,要想更进一步了解网站的连通速度和连线时间,获取连接错误的详细信息,还需要通过具体的监测工具。
超级Ping工具是一套实现对多个主机网络状态的实时监测、监测结果分析、断网告警、网络状态上报等功能的工具,采用 ICMP 协议即 Ping 的方式来实现对主机网络状态的监测。具有以下几个特点:1、基于 ICMP 协议实现网络监测。2、支持连续监测和间隔监测两种网络监测模式。3、提供短信、邮件等多种网络异常告警方法。4、可同时监测多台主机。
Ping 监控的使用场景
要了解 Ping 监控的使用场景,我们就不得不介绍 Ping 监控的几个指标。
可用性
可用性是在某个考察时间,系统能够正常运行的概率或时间占有率期望值。它是衡量系统在投入使用后实际使用的效能,是设备或系统的可靠性、可维护性和维护支持性的综合特性。从用户角度来说就是用户感知到的产品质量,系统是否稳定以及服务是否可用。
可用性的考量在网页监控中有重要意义,好的可用性能够确保系统正常运作,用户不必为操作问题分心,把精力集中在任务上。举个例子,对于电子商务网站来说其可用性体现在有效性( Effectiveness )、效率( Efficiency )和用户主观满意度( Satisfaction )3个方面,可用性差的网站可能会发生某个环节崩溃,比如支付环节,这将对用户体验造成毁灭性的影响。再比如对于可用性差的网站如果顾客在网上找不到所需的产品,他们就无法进行购买,网站就会损失潜在销售额。Ping 监控能够提供可用性指标的具体参数,实时监控系统可用性,并且能够从运营商、省份等不同维度来进行监控,全方位掌握网站可用性能。
可用工具:New Relic、OneAPM Cloud Test
响应时间
在操作系统中,响应时间指用户发出请求或者指令到系统做出反应(响应)的时间。对用户来说,当用户单击一个按钮,发出一条指令或在 web 页面上单击一个链接,从用户单击开始到应用系统把本次操作的结果以用户能察觉的方式展示出来,这个过程所消耗的时间就是用户对软件性能的直观印象。响应时间对用户体验会造成很直接的影响,系统响应时间过长,用户就会感到不安和沮丧,而响应时间过短有时会造成用户加快操作节奏,从而导致错误。
举个例子,某系统有一个信息查询功能,当输入某条件查询时,可能要查询几百万条数据,如果数据库要查询所有的数据来搜索我需要的信息,可能服务器要查询很久,而这个过程所消耗的时间对于系统和用户而言都会造成一定的负荷,如何合理把握响应时间的长度,也是网站建设者需要考虑的问题。
Ping 监控不仅能够监控网络连通状态,还能够直观反映系统响应时间:
可用工具:APPDynamic、OneAPM Cloud Test
丢包率
丢包率是指测试中所丢失数据包数量占所发送数据组的比率。丢包率高会对系统造成严重影响,以游戏为例,TCP 协议丢一个包就只能等待重传,严重影响网速,造成画面卡顿、跳帧,大大延长等待时间,极大影响用户体验。
网络丢包的原因主要有物理线路故障、设备故障、病毒攻击、路由信息错误等,其中线路设备故障和网络阻塞是造成丢包的主要原因,具体原因可能是软件配置不当或是硬件设备故障或是信号干扰等,必须通过具体监测工具加以分析。
Ping 监控能够提供丢包率的具体参数,并提供具体的错误信息,帮助运维人员合理开展修复,完善系统性能。
可用工具:Ruxit、OneAPM Cloud Test
Cloud Test 是基于云技术的实时监控系统,能够帮大家实时监控网站性能,监控CDN、DNS、API等第三方服务提供商的可用性,实现应用性能及时监测及时报警。想阅读更多技术文章,请访问 OneAPM 官方技术博客。
本文转自 OneAPM 官方博客