本文摘要:网络遥测(NetworkTelemetry)是一种新的较慢故障回避模型,需要检测故障并隔绝故障,按照网络状态统合数据,还包括底层和覆盖面积的网络统计数据,主动将这些网络设备状态信息启动时到监控设备上,数据具备很强的时效性。
网络遥测(NetworkTelemetry)是一种新的较慢故障回避模型,需要检测故障并隔绝故障,按照网络状态统合数据,还包括底层和覆盖面积的网络统计数据,主动将这些网络设备状态信息启动时到监控设备上,数据具备很强的时效性。只不过网络遥测并不是新鲜的概念,早就在数据中心里有所部署。网络遥测分成带上内和带外两种,带外网络遥测(Out-bandNetworkTelemetry,全称ONT)是通过监控设备分开发送到观测报文,从而搜集链路状态信息,这种类似于在网络中部署一套长PING设备,通过PING网络中有所不同设备和主机,从而辨别网络链路否可约,在网络监控中广泛应用于。
带上内网络遥测(In-bandNetworkTelemetry,全称INT)是这两年才确实落地的技术,可以说道是一种新型的遥测协议,它是由Barefoot、Arista、Dell、Intel和VMware联合明确提出的。从两种遥测技术的讲解中可以显现出,ONT通过发送到观测报文,及时发现网络故障,报文类型可以是PING、TCP,UDP等等都可以,和网络业务流量牵涉到,这种网络观测结果并不精确。
原因有三:一是观测报文并无法覆盖面积所有发送路径和表项,有的网络链路故障意味着是一条并转公开发表项出问题,而观测报文不能回头一条并转公开发表项,大概率找到没法网络故障;二是观测报文的特征和业务流量有所不同,PING、TCP,UDP等类型并无法覆盖面积所有业务流量类型,比如组播业务,各种隧道PCB业务,视频大包业务等,非常简单地周期性放一些观测报文并不是几乎找到明确业务问题;三是观测报文虽较少,但仍不会闲置少量比特率,导致网络带宽的一些浪费,观测报文的优先级和多业务类型的优先级也不尽相同,这样回头的优先队列地下通道也有所不同,从而很难找到所有优先级队列里的网络问题。不过,纵然ONT有这么多缺点,这些年在数据中心网络中还是作为一种高效的网络监控技术用于着,却是和NetFlow、sFlow、SNMP这些监控功能比起,ONT仍有很大的技术优势。NetFlow和sFlow也构建了网络流量的取样和启动时,但启动时的是原始数据取样信息,仍必须展开二次数据加工分析,而且是按照一定的取样比来收集的,无法体现整个网络链路的流量全貌。而且网络设备的CPU、内存、网络冗余信息、网络事件日志信息等也无法通过NetFlow或者sFlow动态传送出来。
SNMP可以收集到网络设备的CPU、内存、日志等信息,但又无法收集到数据流量,可以将NetFlow和SNMP同时都部署到网络中,这又不会减少网络设备CPU开销,这些技术都要靠网络设备CPU展开处置,毫无疑问减少了网络设备的开销,给网络平稳运营带给了不平稳因素。所以,ONT虽有严重不足,但总比其它现有技术很强,一定程度上构建了网络监控可视化。随着技术的变革,INT经常出现了。
INT技术是通过在数据层面搜集和报告网络状态来构建对网络状态的监控,整个过程不必须掌控层面参予,从而会减少网络设备CPU的开销。INT技术原理是这样的:当业务报文转入第一台网络设备时(INTSource),通过网络设备上设置的取样方式取样并镜像出该业务流报文,INTSource在报文中PCB一个INTheader,同时定义INT结构,在INTheader后加到INT数据,将必须搜集的网络设备信息放入INT数据中;接着业务报文将被发送至下一台路径上的网络设备(INTTransitHop),INTTransitHop根据上一台设备的INT数据内容,之后加到本机的INTMetadata信息;当业务报文经过所有INTTransitHop,被发送至最后一台网络设备(INTSink),INTSink将INTHeader拆毁,同时将路径信息发送给监控服务器,这样监控服务器就取得了网络链路状态信息,还包括:延时、冗余、丢包等链路异常情况。
同时,还能较慢寻找是哪台网络设备的哪个端口再次发生了故障。INT类似于OAM协议,根据链路设备信息,就能告诉报文是怎么走的,哪里有性能瓶颈,解决问题了网络发送路径和发送时延不可见问题。INT是通过镜像出来的报文,并不转变完整业务报文发送路径,INT是取样方式收集镜像,仅有占到很少部分的比特率。INT通过网络设备发送芯片硬件处置,并不消耗CPU资源,因此必须网络设备的发送芯片反对。
现在近期的主流芯片早已反对了INT功能,这才使得INT有了实践中部署的有可能,不过它拒绝整个网络中所有设备都要反对才讫,链路每台设备都要打标,这样INT才能监控精确,这对于已建成的数据中心部署有相当大可玩性。一个数据中心的网络设备要全部替换掉,最少要三到五年,而且目前能很好反对INT的网络设备并不多,价格仍较高,数据中心要投放更加多资金来建设INT网络。
当然仅有监控网络链路还过于,还必须监控网络设备的各种运营状态,在INT网络里,似乎没有适当再行去部署SNMP了,而是自由选择了gRPC(GoogleRemoteProcedureCalls,谷歌远程过程调用),gRPC是Google公司开源的一个高性能、横跨语言RPC框架,用于HTTP/2协议,并用于ProtoBuffer作为序列化和鼓吹序列化的工具。gRPC可以构建周期性启动时网络设备的各种运营状态给监控服务器,gRPC具备响应速度慢,实时性低,收集数据全面的优点,很好解决问题了动态数据无法有效地传授给监控服务器的问题。
当然,INT的数据也可以通过gRPC发送给监控服务器,INT+gRPC奠下了数据中心网络可视化构建的技术基础。网络遥感技术是构建数据中心网络可视化和智能运维的有效地手段,特别是在是INT技术,对现有的ONT技术展开了完全改进,舍弃现有所有的构建方式,确实地构建网络业务末端到端的流量可视化,超越“网络黑盒”束缚,为网络监控获取精准动态的数据承托。
可以意识到,在旋即的将来,INT将不会替代ONT,构建确实的网络可视化和智能运维。
本文来源:米乐|米乐·M6-www.tz2100.net