您当前的位置:首页->研发中心
研发中心
BPS业务性能监测系统
 

 1. 银行业务监测解决方案

1.1 需求分析

1.1.1 项目背景

随着银行业信息科技风险精细化管理的深入推进,监管部门和银行机构需要关注和日常维护管理的科技风险指标越来越复杂,双方的科技风险管理工作量都日益剧增,传统的管理工作模式在实现对复杂科技风险隐患的“早发现、早干预、早处置”方面存在一定的难度。银行信息科技发展迅猛,运行风险事件时有发生,如何从海量、复杂的信息中准确、动态、自动的筛选出监管的重点指标成为信息科技非现场监管的又一难题。

中国银监会办公厅2015年印发《商业银行信息科技风险动态监测指标》,要求各家银行机构开展关键信息科技指标的监测、并报送银监会。

 

1.2 方案设计

本项目采用大数据解决方案,系统架构从功能上划分为:业务风险指标采集功能、业务风险指标分析及预警功能、风险指标报送和校验功能三大块。

1.2.1  风险指标采集

风险指标采集支持旁路抓包、日志、插件等多种数据源,并且各个功能完全模块化,提供相应的api接口。

 

1.2.2  可视化展示

    数据结果提供丰富的可视化图标,便于操作人员从不同角度进行跟踪和监控。

1.2.3  多级监管数据报送

 

本系统支持多级监管部门数据报送功能,且支持多种数据报送对接模式:

 

 1.3 明辰智航风险动态监控系统优势

明辰智航风险动态监控系统,拥有业内卓越的理念与最佳实践。系统优势与价值体现如下:

l  从用户终端、网络接入端、渠道类(用户接入)应用端实时获取各个业务的两大维度(交易类型交易渠道)、五大指标(交易代码、对端客户机构等多维度的交易量、成功率、响应时间、响应率)等交易指标,并建立每个指标每分钟时点的采样值组成的动态基线,全面准确反映业务应用系统的运行情况。

l  全面采集各个业务应用系统交易数据,可视化地展示某个交易代码、业务功能模块或业务系统需要经过的应用系统拓扑关系和交易路径(含应用逻辑节点的访问顺序关系)。通过对比交易路径或应用拓扑图上不同应用系统的总量/分量交易指标的变化情况,可以将故障自动定位到某个应用系统,甚至该应用系统的某个应用服务器节点。

l  前两个维度的交易指标监控,系统通过关联算法可以将故障定位到某个应用系统的服务器节点。这既可大幅减少事件处理的工作量,也可自动发现一组事件根源问题。

l  报送平台支持多级监管部门数据报送功能,且支持多种数据报送对接模式:

l  上述四个维度的工作,可以使用数据精确定位,所用用户以及某个用户的业务体验体验度,甚至包括传输业务、网络所经过组建的性能。同时将用户所需要的信息全方位的进行自动化的提取以及报送。

1.4 系统架构

在本方案中,采用明辰智航智航业务性能监控系统来搭建大数据实时决策平台,此平台实现业务监测数据的采集以及对数据的加工、分析、展示。

1.4.1  总体架构

银行大数据实时决策平台正是按照这个思路,结合商业银行的决策需求打造的一个大数据平台系统。该系统一方面通过应用一系列先进的互联网技术,建立了一个云计算架构的大数据实时采集、实时处理、可靠存储、深度分析和数据可视化平台;另一方面则通过提供一系列预制应用模块和应用框架,能够立即支持定制化的业务应用。

 

银行大数据实时决策平台从应用架构上分为三个层次,自底向上分别是业务层、平台层和应用层。其中业务层是承载当前银行业务的系统,如核心、前置、网上银行、信贷等等,这些系统本身为完成某些特定的业务目标而建立,并不属于/大数据实时决策平台系统,但它们是整个平台大数据的重要来源;平台层承担大数据的采集、实时处理、动态展示、可靠存储、深度分析等技术功能,是整个决策平台的处理中心;应用层包括基于大数据处理对银行提供实时决策支持的应用功能,比较典型的如领导决策支持、业务运行监控、IT运行监控、业务风险实时监控、互联网业务监控等,并能根据银行的需求进行快速地扩展。整个应用客户端支持PC端、大屏幕和移动设备,使得银行各级管理人员随时随地对业务状况和关键指标全面掌握,从而准确、迅速地做出各种决策,在新的金融形势帮助下银行提升应变能力,增强银行客户体验,有效控制各种风险,从而在竞争中占据优势。

 

1.4.2  逻辑架构

系统功能架构的应用划分如下,具体流程还将按##银行实际情况进行调整:

管理支持类应用

该类应用的核心目标是行内报表集中展现们和个人辅助办公,提供用户数据展现、数据查询、数据导入导出服务。

核心业务类应用

该类应用围绕着指标数据的定制、设计、维护、管理工作的展开,是该系统核心应用;包括:数据补录、指标管理、指标管理、风险缓释、报表报告等几大核心功能模块。

应用支持类应用

该类应用旨在为管理支持和数据管理的应用功能提供支撑与服务,基础管理主要包括:系统管理、系统配置、系统运维、系统监控等功能模块;数据管理主要包括数据采集服务管理、数据处理安排、数据质量维护管理等功能模块。

 

1.5 产品部署

基于旁路监听解析技术

系统主要采用旁路部署模式,流量实时分析原理,不改变现有网络任何环境,对业务性能和连续运行不会产生任何可能的负面影响;

 

 

1.6 实现目标

明辰智航BPS业务监控系统能够将全业务链的交易进行监控,从而构建出和应用一一对应的网络服务视图、业务可视视图。通过对核心业务系统、综合前置业务系统、综合前端系统、电子渠道系统(手机、网银、短信、电话等渠道)、IC卡系统、综合理财系统、ECIF系统建设最终建设成为全业务链交易级监控系统从而实现以下目标:

l  实时掌控业务运营当前状态

应用服务为中心,直观展现应用服务的业务逻辑和依赖关系,实时呈现每个业务内部组件、主机的关键性能指标,集中体现服务运行质量。

以应用视图为导向,基于服务路径规划功能,实时在应用架构图上展示业务运营状态数据。包括对交易类型、交易量、交易渠道、交易机构的动态统计与分析。

l  多维度自动化报送指标

根据用户需求定义各个不同类型的指标,指标完全摆脱人工干预,实现自动化报送。

l  地图展示

以省市为节点,展现相对应营业点、ATM的业务状态,可以通过流水号追溯到某个节点发出的交易。例如网银展示,可以通过地图快速查看当前所有网银节点点信息,以及区域业务量排名,健康度排名

l  精准解析应用性能

精准解析应用性能,关注围绕应用的交易量、响应时间、成功率、告警事件、响应率、健康度、返回码。

l  快速定位应用异常

自动关联IT组件的专业事件与业务应用的交易事件,并自动生成以根源交易事件为根的故障分析树。这既可大幅减少事件处理的工作量,也可自动发现一组事件根源问题,并发出告警信息。

l  IP关系梳理

能自动呈现被监控网络数据的IP连接性,快速梳理应用组件之间的逻辑访问关系,以及应用层协议信息。

l  多维矩阵分析

针对交易要素(交易类型、交易渠道、交易地域、交易量、交易路径、应用节点、性能数据、成功/失败等),围绕金融业务的诸多组件与因素,动态构建多维矩阵与影响因子。多角度、全面、动态分析业务运营与应用性能的关系。

l  单笔交易追踪

对于任一笔交易,系统必须能够追踪到在每个环节的信息:响应时间、出错报文等,以利于应对投诉和排障。在单个组件上,呈现每笔交易的详细信息,包括交易关键字(如流水号,可自选)、交易时间、交易结果、返回码等详细信息

支持异构环境下的多层关联,自动关联多层交易记录,为每笔交易区分在每个组件上的时间消耗,暴露性能瓶颈

提供单一关键字追踪分析,完整展现被查询对象的交易行为和每次交易的处理过程

l  交易历史数据的再利用展望

历史数据构建成一个交易矩阵,可以将历史数据抽象出生产环境交易基线,用来评估开发/测试环境下的数据与性能一致性问题。或者直接将历史数据打入开发/测试环境,用来验证系统的性能。

l  解码功能

系统要准确对业务系统进行解码,解码要实现自动解码。

l  辅助流程银行建设

系统具备交易路径图自学习功能,能够统计热点交易路径,敏捷发现创新交易路径。以及在线统计热点/创新交易路径的增长与消亡趋势。为流程银行建设提供生产环境真实数据实现流程统计、流程风控、流程优化、流程预测。

l  系统需支持分布式部署,包括双中心、多中心部署模式,以及负载分担部署模式,可以跨多个服务器对于所收集数据进行分布式统计和集中呈现。

l  系统需采用B/S架构,访问系统界面无须安装客户端程序。

l  系统要对原始数据进行7*24小时存储,存储数据格式可以使用任意抓包软件进行二次分析。

l  同时支持系统自身通过网卡进行数据包捕获。

l  系统需支持数据归档管理功能,支持设置数据过期时间。数据存储时间无限制,仅受服务器磁盘总空间影响。

l  要求系统支持多种TCP连接模式的应用交易解码分析,包括常规TCP连接、TCP长连接、异步双工模式的TCP长连接。

l  环境梳理,系统要准确梳理出来,业务系统TCP直接连接关系(长连接、半连接、异步双工连接)

l  地图展示,通过地图方式,展示现有业务的交易量、健康度等信息。

l  交易追踪,系统可以通过卡号、流水号、返回码、等数据进行单笔数据查看。

l  支持定位故障告警,当业务出现问题时候,系统要进行逻辑故障定位。 

1.7 产品功能

1.7.1 图形化配置功能

为使用简便,操作灵活提高系统易用性,需要内置图形化配置功能,通过简单的拖拉拽操作,配置服务路径其具体需求如下:

l  系统应提供图形化的配置接口,可以快速定义业务应用的服务路径图。

l  通过配置服务路径图,能够体现业务应用的访问和依赖关系,包括完成一笔业务交易,数据在客户端、防火墙、负载均衡、WEB、中间件等各层级应用服务器上流转的前后顺序。

l  通过配置服务路径图,能够体现业务应用组件服务的网络属性,包括IP地址、端口号、连接模式(TCP短连接、TCP长连接、TCP异步双工模式的长连接)。

l  支持站点定义,能够针对不同网段的客户端,提供IP地址的映射表,表项中包括区域(网段)名称、IP地址(地址段)。

l  支持地图区域显示,可以根据不同地方显示当前每分钟、小时、天交易量。

l  支持设置基准线设置,包括开启、关闭基准线,以及基准线参考周期设置,即按照某个设定的时间周期生成基准线。

l  支持告警模版定义,能够应用模版进行告警定义。

l  针对标准的XMLSOAP协议,支持配置化的协议解码,通过配置即可完成协议解码与字段提取。

1.7.2 服务仪表台

为规范巡检策略,细化巡检服务工作,系统需内置服务仪表台功能,方便值班、巡检人员按指标巡检、记录。

l  支持各应用服务运行状态的总览,在单一视图中呈现所有服务路径的最近30分钟的运行状态,以每分钟时间片的精度呈现,包括正常、有故障、数据处理中,并支持点击时间片直接关联至服务路径视图。

l  服务路径视图支持在单一视图中呈现各应用服务组件的关键指标,支持1分钟更新。

l  服务路径视图支持以时间轴的方式进行历史数据的查询,可以选择日期和时间,精度达到1分钟。

l  具备站点视图,支持在单一视图中呈现站点区分的关键指标,支持站点选择、搜索,支持站点分组。

l  在业务拓扑图上,要求具备色彩变化的告警警示功能,并在拓扑图上用色彩变化表标识出警示信息所涉及的业务应用环节,同时在该业务拓扑图上可直接点击显示告警内容。

l  在服务路径图的组件上支持由指标或告警信息关联至对应组件的统计视图。

l  支持故障定位的呈现,直接在服务路径上支持标识触发告警的组件,并标识告警原因。

l  由多台服务器组成的交易环节,要求系统具备展开查看每台服务器的交易关键指标的功能,以每台服务器进行指标统计。

l  支持双中心、多中心架构应用的监控,能够完整呈现双中心、多中心部署的应用逻辑拓扑,能够体现应用组件所在的数据中心,以及跨中心应用组件之间的访问关系,并集中呈现所有交易环节的监控指标。

l  支持异地双活架构应用的监控,包括交易的请求、响应分别在两地的场景,能够通过分布式部署,捕获并关联统计交易结果。

l  支持双向交易应用的监控,能够分离同一通道中的双向交易,每个交易方向各自做指标统计和分析。

1.7.3 统计指标

根据交易系统健康度指标,系统需对交易类型、交易渠道进行监控,并对交易成功率、响应时间、响应率、交易笔数进行监控,具体需求如下:

l  支持交易笔数、交易成功率、交易响应时间、交易响应率的指标统计。并提供时序图和快照两种统计方式,支持自行选择时间段。

l  交易笔数、交易成功率、交易响应时间、交易响应率的指标统计时序图支持实时刷新,并提供至少1分钟的显示刷新频率。数据统计精度达到1分钟。

l  针对具备交易类型、交易渠道字段的应用协议,要求提供区分交易类型/交易渠道的统计功能,支持按照交易类型/交易渠道进行交易笔数、交易成功率、交易响应时间、交易响应率的统计。

l  支持基准线的生成和呈现,交易笔数、交易成功率、交易响应时间指标支持基准线功能,能够在这些指标的时序图中呈现基准线,基准线的颗粒度至少达到5分钟。

l  支持交易返回码的识别和统计。

l  支持排名统计,提供按照最差交易性能排名的分析,即可以分析某个时间段内的性能最差的交易排名。

l  以上指标支持按照组件、服务器主机IP、站点区分进行统计。

l  支持以服务路径图进行导航,可以直接选择目标应用组件、以及构成某个应用组件的主机IP,以及客户端的站点,支持以所选中的应用组件、某个主机IP、站点为单位进行所有的指标统计和结果呈现。

1.7.4 多维度统计

为方便多角度查询,系统需提供多维度统计报表展示,其具体需求如下:

l  支持5个维度:交易类型、交易渠道、交易返回码、服务器IP、客户端IP

l  支持4个指标统计:交易笔数、交易成功率、交易响应时间、交易响应率。

l  支持按照任意维度进行4个指标的统计。

l  支持多维度统计,比如“交易类型=消费,返回码=00”的交易笔数、交易成功率、交易响应时间、交易响应率统计。

l  支持从任意维度作为起始点,逐层向下展开统计,比如在交易类型这个统计维度中列出所有交易类型的统计结果,再选择某一个交易类型展开交易返回码维度。

l  支持从任意维度关联跳转到交易追踪,并传递对应的交易查询条件。

l  支持将任意维度的统计结果直接导出为CSV

l  支持站点区分的统计。

1.7.5 交易追踪

系统需支持对单笔交易的追踪,可通过卡号、IP、关键字模糊查询等信息,追踪交易记录,具体需求如下:

l  交易查询追踪,能够按照时间段、客户端IP、服务器IP、交易类型、交易渠道、交易结果、交易返回码、无响应交易做单一或复合条件进行交易查询。并且支持增加协议内其他已解码字段作为扩展查询条件。

l  支持自定义交易关键字,可以选择任意解码字段作为交易关键字,以用作单笔交易追踪的关联字段。

l  交易查询的结果要求呈现交易请求/响应的摘要结果,提供信息包括交易响应时间、交易结果、交易类型、交易渠道、返回码值、客户IP、服务器IP,以及交易关键字。

l  交易查询结果要求支持展开为交易的原始记录,原始记录信息中则要求包含应用协议中所有的被解码字段。

l  若多层应用协议中具备交易关联条件,支持通过单一关键字或者多个关键字进行多层关联,即一笔交易经过多个应用层级关联在一起,体现一笔交易经过多层应用组件时在每个层级上的时间消耗。

l  要求系统具备敏感信息加密功能,支持对敏感字段信息的不可逆的加密、加扰,使敏感字段信息被保护,防止敏感信息泄露。

l  支持以特定关键字段为关联依据,进行单笔交易的多层关联追踪,能按照时间序列逐层排列交易的请求、响应记录,并统计每条交易记录的相对时间和交易记录之间的间隔时间。

l  支持将交易查询追踪、单笔交易追踪的结果直接导出为CSV

l  支持站点区分的统计。

1.7.6 可视化流量流向地图

系统需提供可视化流量地图功能,可全部直观看到所有监控点的实时流量情况,具体需求如下:

l  支持地图API显示,可以通过地图方式来显示每个区域已经每个交易的健康视图。

l  支持业务逻辑显示,可以根据不同业务框架来显示当前业务属性问题。

l  支持健康度显示,可以显示每个应用的健康度显示。

l  支持定制化个性需求,可以根据不同的要求输出相对应的API信息。

l  支持地图日期回溯查询

l  地图中边侧展示河南省地图以及当前所选流出流入业务量,显示查询栏及当前所选流出流入业务量数据图表。

1.7.7 告警功能

系统需内置告警功能,并可设置告警基线,达到故障第一时间通知响应的目的,具体需求如下:

l  支持独立的告警对象的开启/关闭,即可以针对某个应用交易组件独立开启/关闭告警,而不是全局开启/关闭。并且针对单个应用组件可选择开启/关闭哪些告警项目。

l  针对关键交易指标:交易笔数、无交易请求、响应时间、成功率、响应率,支持阈值加持续时间的复合条件告警,且支持基于组件、交易类型、交易渠道进行统计的阈值告警。

l  针对交易笔数、交易响应时间、交易成功率指标,支持基于基准线的动态告警,告警条件要求可设置超出或低于基线值百分比的阈值,同时复合超出或低于阈值的持续时间,作为最终产生告警的条件。

l  支持特定返回码告警,即捕捉到指定的返回码时立即产生告警。

l  支持逻辑可配置的故障定位算法,能够根据组件的依赖关系和各自的告警指标进行逻辑判断,定位引起故障的根源组件和原因。

l  支持排期功能,用户能够自定义时间段,使某个时间段不列入基线计算数据中;或者使某个时间段不触发告警通知。

l  支持告警记录功能,集中呈现告警信息记录,在告警信息记录中标识告警信息产生的时间、告警事件触发的时间、告警事件持续的时间、告警类型、事件、告警峰值/阈值,以及产生该条告警的组件、交易类型、渠道等定位信息。同时支持按照时间搜索告警记录,并支持按照告警记录内的多字段复合条件进行告警查询。

l  在同一告警持续发出的情况下,支持告警合并功能,将持续发出的同一告警信息合并为1条告警记录,并记录该条告警信息的触发时间和持续时间。

l  要求告警记录可关联至对应告警触发该告警的时间段的服务仪表台视图。

l  支持将告警记录通过syslog方式发送给事件管理平台。

1.7.8 风险数据报送及处理功能

l  对报文中数据的基本信息进行管理设置。可新增,修改,查看,删除各个数据的基本信息。

l  任务模板管理实现对任务模板的定义与管理,用户可通过新增、修改、下发、删除等功能进行任务模板管理。

l  系统支持将监管机构反馈的文档进行在线的导入,系统将对反馈的文档进行解析并定位。

l  系统支持补录功能,可对系统的参数、模板、任务等信息进行配置,并在前端平台进行数据补录,使系统能够更加效率、稳定的运行。

 

1.7.9 拓扑发现

l  根据应用服务的网络流量数据,自动生成IP连接关系图。

l  统计TCP会话记录信息,包括源IP地址、目标IP地址、源端口、目标端口、总字节数、单向字节数、TCP SYN标志位、TCP FIN标志位、TCP RST标志位。

l  支持分析TCP连接的模式,包括同步TCP、异步TCP

l  支持分析TCP连接的可用性,包括单向会话、重复数据。

l  支持按照IP地址、端口、设备名,或者以上条件的复合条件进行搜索,并在拓扑图上对搜索结果进行标识。

l  支持多次提取数据,能够在一张拓扑图中更换使用多份数据,并自动对比不同数据源中数据内容的增减。

l  支持IP节点合并,以及节点命名。

l  支持自定义节点的服务端口,并在拓扑图上标识客户端、服务器之间的访问方向。

l  支持IP地址的过滤。

l  能够按照组件与IP地址的对照表自动完成梳理。

l  支持IP地址与设备名的转换显示。

l  支持即时创建快照,在快照中提供访问关系、节点IP地址和服务端口列表。支持以快照为编辑的起始点,重新加载数据再次进行编辑。

l  支持数据包导出,能够按照服务端口导出数据包,能够全局打包导出数据包。

l  支持协议识别,能够根据采集的数据样本识别特定服务端口的协议类型和名称。

1.7.10   大数据分析

大数据分析主要包括四种基本功能,即历史查找、自定义报表、多维分析和预测模型。请参见下图。

第一种是对海量大数据的搜索功能,主要的包括历史回放、大数据搜索查询等,主要用于对银行业务、交易和IT运行的历史数据进行定点搜索与回放,帮助业务人员定位问题。自定义报表主要满足在全局数据上,根据客户需求生成跨系统、跨时间段的各种数据报表,并对业务关心的历史数据,如查询方式、交易笔数、交易金额等各种指标进行基线计算,为制定业务规则提供依据。多维分析子系统帮助业务人员对大数据从多个维度进行观察,发现新的业务指标和业务发展的规律。预测模型主要从客户价值、客户行为(包括购买意向、流失意向)、客户间网络关系、信用评估、违约倾向、产品间关系等多个主题,利用数据建模算法进行深度分析。

 

1.7.11   第三方接口

系统应支持第三方接口输出,可以对任何的第三方平台进行API接口关联。
 

2. 风险动态监控系统实施方案

2.1 解决方案

2.1.1 方案概述

本方案所采用的明辰智航 BPS基于先进的协议解码技术,通过成熟的设计、先进的产品、可靠的技术、合理的规划部署,帮助用户轻松应对应用管理中的常见问题:

Ø 各种指标的自动化报送

Ø 应用组件、主机的性能和可用性监控

Ø 交易量、成功率、响应时间性能评估

Ø 健康度、基于每个业务的健康的评估

Ø 分析不同交易类别、子交易类别、交易渠道的性能差异

Ø 追踪应用性能指标波动,分析连锁反应,找出根源组件、主机

Ø 交易追踪查询,快速故障诊断和分析

Ø 关联分析多层应用交易,找出深层原因

Ø 获得实时的性能事件告警,快速响应

Ø 获取网络层指标,掌握业务对网络资源的使用情况

Ø 区分应用层问题和网络层问题

Ø 自动故障诊断精确判断问题所在

Ø 应用架构不再难于梳理,通过网络数据进行精确梳理

Ø 地图显示、给予地图显示,可以快速区分每个区域交易状况

Ø 业务路径发现、可以准确识别业务的连接规律,以及传输方式

2.1.2 方案建议

项目建设的最基本目标是获得可测量的应用性能数据,为后续流程当中进行分析、追踪、定位提供数据和功能支持。通过即时获得有效的应用性能管理数据,了解、把握业务应用系统的运行状态,一旦发现异常波动,可以及时采取措施,在预防阶段捕捉并解决问题,避免因业务性能下降或中断范围扩大而导致业务经营损失;而在问题发生时,能够帮助北京银行IT部门加速分析、追踪和定位故障,减少业务中断时间,达成 SLAService-Level Agreement 目标。

业务性能管理着眼的是应用系统整体的性能管理,而非仅仅针对某个技术层次的“竖井”式的解决方案,因此从指标到覆盖范围,本方案对业务性能管理平台的建设制定了以下目标:

关注交易性能指标:业务性能管理应该重点关注应用交易的状态,交易量、成功率、响应率、响应时间、返回代码这五个是表征交易性能的重要指标。

端到端监视能力:多层级的应用组件串联在一起构成服务路径,这个服务路径最终交付的业务性能构成用户体验,业务性能管理应该端到端覆盖服务路径,提供准确的性能评估和定位信息。以最终用户的响应时间为主要的衡量标准,在第一时间将问题定位于某个组件层级,在问题解决之后,也会从应用整体响应时间的角度,测量改进之后的性能。

交易追踪和关联分析能力:业务性能管理应该保存原始交易记录,针对特定交易记录应提供可追踪分析的能力,并且能够关联多层级应用组件,以提供快捷和深入的问题分析定位能力。

实时性:实时数据是运维时效性的保障,实时获取业务性能数据并提供关键指标的统计有利于及时掌握、分析、追踪业务性能的动态变化,及时发现问题进入解决流程。

快速实施,可靠落地:应对不断扩张的业务需求和快速发展的复合应用架构,需要有快速实施、可靠落地的解决方案,以支撑持续的性能管理需求。

多数据中心覆盖能力:目前企业应用多采用双中心或多中心部署模式,以建立冗余备份机制以提高应用可靠性。一旦发生故障导致应用在数据中心之间切换,产生了数据流向的变化,业务性能管理平台需要具备全面覆盖多中心环境的能力,并且能够捕捉到数据流向变化以及因此对业务性能产生的影响。

2.1.3 技术设计

2.1.3.1.  设计目标

1.  对现有业务系统无影响

系统用旁路方式获取网络数据包,不向被监控系统发送任何数据,不占用被监控系统自身资源,不对被监控系统产生任何影响。

2. 集中数据管理和分析

按业务流程部署多个采集设备,并能够统一管理多个采集设备,集中进行数据汇总、分析。

3. 可以根据需要采用分布式部署,包括双中心、多中心部署模式,以及负载分担部署模式,可以跨多个服务器对于所收集数据进行分布式统计和集中呈现。方案采用B/S架构,访问系统界面无须安装客户端程序。

4. 设备具备非常强的处理能力、软件分析能力。设备处理效率设计目标:从业务数据采集到分析结果展示在1分钟以内完成,数据刷新方面在15s以内完成。

5. 支持各种常见网络协议和应用的解码、分析

包括HTTPXMLIBM WASIBM Websphere MQCICSWeblogic等。

7. 支持对复杂业务流程的全面监测:

对于多次交互才能够完成的业务,可以按照每一步骤进行分析,并组合成一笔业务进行展示。

8. 设计的数据保存时限:

支持数据归档管理功能,支持设置数据过期时间。数据存储时间无限制,仅受服务器磁盘总空间影响,数据可以进行压缩存储,压缩比例业界领先水平,最高压缩比例10/3

9. 设计提供的界面达到以下目标

可以图形化展示网络拓扑,并体现业务应用组件之间的依赖关系。对于相同功能的组件赢提供合并功能,方便快速掌握各组件的性能情况。能够在同一界面上展示不同组件的性能情况,帮助用户直观了解网络现状。

2.1.3.2.  设计原则

1、产品先进性

本次投标的明辰智航 BPS产品具有业界领先的设计理念和产品架构,采用直接从网络层旁路获取数据的方式对业务性能进行监控,数据实时、指标准确、部署简单、安全,完全避免了传统方式对业务有影响、有风险、实施复杂、落地困难等弊端,是业界领先的先进产品。

2、融合性:

本建议书提供的整体解决方案全面考虑用户运维需求,既可以从业务和应用指标来发现和分析应用问题,也可以通过网络层指标发现和定位基础架构的问题,并通过对应用协议的深入解码,与用户的业务环境深度融合,从宏观的业务整体健康度指标逐层钻取分析到微观的单笔交易追踪,具备了前所未有的融合性。

3、规范性:

本次投标的明辰智航 BPS产品采用业界领先的体系规范,无论产品本身的架构、访问方式、管理方式、展现方式,还是与第三方系统的接口,均采用国际通用的规范标准。

4、灵活性:

明辰智航 BPS产品采用先进的架构设计,从底层数据采集、核心数据处理一直到用户界面展示都具有很强的灵活性,可以随着被监控业务的变更而灵活调整,保证对业务的高适应性。

5、可扩展性:

本建议书设计的方案架构具备很强的可扩展性,可以随着被监控业务量的增加而纵向扩展,也可以随着多中心的建设而横向扩展;系统本身具备模块化设计,可以非常方便地增加新协议支持和新功能。

6、无干扰性:

本方案采用纯旁路的被动监控方式,对生产业务运行完全没有影响和干扰,在部署时和部署后也无需对现有生产系统进行任何改动,真正做到了无缝建设,对业务零干扰。

 

2.1.3.3.  架构设计

  

从被监控的交易系统分段获取流量,所需交换机镜像的流量输送到明辰智航 BPS服务器,BPS内置高性能数据抓取程序,可直接完成数据包的抓取,进而实现报文解码,完成监控、告警、故障诊断及报告等功能

根据监控需求,计划需要数十台交换机SPAN镜像,由于镜像源的数量超出明辰智航 BPS服务器的网卡数量,并且镜像精细度比较粗,流量较大超出明辰智航 BPS服务器处理能力,在这些情况 ,建议在部署架构采用TAP设备。

从应用镜像或分光出来的流量经过TAP Switch后,可完成汇聚、过滤及安全掩码等功能,经过TAP Switch处理后的流量再进入明辰智航 BPS服务器,可有效减少网卡数量和无关流量,使明辰智航服务器的工作更加高效准确。

2.1.3.4.  业务服务路径设计

在服务路径图中构建服务路径视图,以服务路径图为中心,直观展现集中交易应用服务的业务逻辑和依赖关系,实时呈现每个业务内部组件、主机的关键性能指标,集中体现服务运行质量;时间轴,实时更新每分钟的服务运行状态,标识故障点,移动时间轴即可回放故障演变过程。

2.1.4 软硬件配置

产品

数量

备注

风险动态监控系统

1

明辰智航BPS

高性能服务器(*

2

双路16核,64G内存,6xSAS硬盘Raid1

TAP Switch

2

流量汇聚交换机

 

详情咨询:王经理:13910824886

          

 

 

 

 

 

 

 

 

 
回到顶部