解决方案
Solution
明网网络性能与故障分析解决方案
发布时间:2016-09-08
目前,网络运维的技术手段基本上都是通过基于SNMP网管软件的手段或通过人工方式,都无法快速取证故障数据从而判断数据流转过程中出现的问题,很难在第一时间对故障做出精确分析判断,更无法提前预警。目前迫切需要的是能够长期存储原始数据并且可以从数据包级进行快速了解网络性能、追本溯源、应用服务数据包级分类、识别标记等科学分析手段。

一、网络运维整体监测思路
针对上述需求分析,融合大数据分析、应用可视化、业务多段路径等技术,弥补传统监测手段的缺失,从数据分析角度出发,抽象业务系统监控视角,将业务系统从海量数量中抽取出来。以传统信息系统平台为基础,将业务系统在基础平台中的通过情况,通过不同监测点之间各类指标进行监测,并以辅助的业务多段路径(俗称:应用拓扑)功能作为展示,可以直观的展示每一个业务系统在基础信息系统运行状态。例如:当出现业务系统缓慢,该功能可以直观的显示,慢在哪个区域、慢在那一段、慢的量是多少,如同现实生活中的交通情况,出现堵车,可以清楚看到堵在哪个路口,为什么堵,应该怎样疏通。

现对运维护总体的架构提高网络运维支撑保障提出以下思路:
“核心布控、分级保护、动静结合”的解决方案。该方案有如下特点:
针对应用复杂的情况,在核心网部署明网网络分析系统迅速区分责任所在,定位故障原因。
针对各分支机构网络的特点,部署明网网络分析系统,从而能在核心监控系统责任划分后更精确的定位故障。

二、方案效果
当各部门提出网络故障申诉时,能够迅速判断问题来自数据中心,还是来其业务部门本身;是来自传输层,还是来自服务端或者软件系统,从而马上发出通告,让具体负责子系统的负责人进行故障排查。能够日常监测网络,发现潜在的网络故障,从而把问题扼杀在“摇篮”之中。
当发现问题来自本地网络时,因为多层的交换,路由,多级的服务系统,结构复杂,要能够迅速定位故障来源。

三、部署方式
3.1监测端口预留

网络分析设备接入网络方式传统方式一般采取端口镜像方式,端口镜像方式在实际操作中通过设备命令形式操作比较方便,但镜像也有其弊端,首先他对交换或路由设备负载增加,有可能会影响正常数据。如有多台设备需要接入测试如IDS,IPS等设备都需要接入网络对设备压力也会增加,同时设备端口会过滤掉错误数据包或帧,对于故障排查错误的数据包和帧对于分析往往是有用的。

现在大部分数据中心在搭建是普遍会预装网络分路器(TAP)的形式便于日后进行数据采集和分析,分路器的优势首先不影响正常网络数据传输,其次能全限速把数据分给测试设备。同时也可以把多条链路汇聚到一条链路进行分析,也可以把一条关键链路分给多台设备进行分析。同时也可以接入相关安全设备进行分析。

3.2、部署方式
在核心网和关键节点部署明网网络分析系统,我们可以快速了解当前全网状况,如核心网与各分支节点发现网络异常时,我们需要快速分清是核心网的问题还是分支节点的问题,了解故障真实原因定位故障位置。

相关案例:

政府网络应对等保2.0实施如何改善

银行业务如何降低网络故障带来的巨额损失

相关推荐