大连银行

2011-01-29 admin 4644
大连银行

客户简介
  大连银行股份有限公司全行现有员工3100多人。总行下设22个管理部门,五家分行,110个营业网点,资产规模达到1440亿元。在2010年7月出版的英国《银行家》杂志全球前一千家大银行排名中,大连银行股份有限公司位列第549位,在中国内地的银行中排名第36位。
  大连银行股份有限公司以创新为理念,积极拓展新业务,几年来获得了各类业务资格,业务范围不断扩大,公司经过几年的信息化建设,还推出了网银、反洗钱、客服、影像、柜面等业务系统,以满足客户的特定需求;公司有着专门的运维团队,对这些核心系统进行运维及管理。这些核心业务系统是否稳定运行直接影响到该行的收益,因此确保应用系统的安全、可靠、稳定运行成为系统维护部门越来越重要的工作。
客户面临的问题
系统问题:
行内拥有近百台应用服务器,数量庞大,系统维护存在如下困难:

  • 一旦出现系统故障,故障分析困难,人员技术要求高,部门协调困难。

  • 无法做到真正的实时监控,问题发生后才发现故障,没有预先处理的机会,被动应对故障,耗费时间,打乱正常工作秩序,影响客户满意度。

  • 监控数据分散,查看数据要通过很多技术方法,日志分析量庞大。

  • 历史记录分析困难,数据量庞大,很难针对特定事务及问题点进行分析去寻找故障原因。

工作负荷:

  • 由于各系统和服务器的独立性,对系统和服务器的监测和分析工作也独立进行,无法做到集中监测和分析。需要耗费大量人力和时间对各个独立的系统和服务器分别进行数据分析,工作量繁重,耗费时间长。

  • 当系统出现故障,需要协调网络管理人员、开发人员、实施人员、运维人员、数据库人员会议商讨,经常出现推诿甚至拖延现象,导致故障原因不能及时、准确的被找出,进而直接影响到故障解决的速度。

  • 服务器出现宕机前,由于运维人员对系统状况无法全面深入掌握,当系统宕机时,为了尽快解决无法处理的状况,多数对应方法都是将服务器进行重启,再进行大量日志分析,几乎需要所有与该宕机系统相关的部门参与处理,工作量庞大。即使是很微小的故障也需要大规模的人员为此进行协调分析。

费用开支:

  • 由于没有专门的软件工具分析故障原因,即便是分析很小的故障原因也需要专业技术水平非常高的技术人员;加之服务器数量庞大,对这类高水平技术人员的数量需求也较大,因而人员开支费用庞大。

  • 由于不能精确分析出导致服务器性能下降的原因,所以要购置大量的高端硬件以满足系统性能提升的需求。如果能正确的把握故障原因,准确的发现性能瓶颈,在硬件开支上也会降低成本,使硬件有效利用率最大化。

  • 在运维工作中为保证系统24小时正常运行,24小时都需要配备人员或相关应急措施,导致人员数量增加,开销加大。

捷骅APM解决方案的部署
  为了提高运维效率,节省运维成本,真正实现对生产系统状况了如指掌、可管可控,轻松有效应对系统各种问题故障,需对所有生产系统的应用性能实施监控管理,包括实时监控、性能分析、性能问题诊断、故障管理、统计分析、日志、报告、告警等,并通过组织、流程和制度的完善以及技术设施的建设来支撑和保障IT部门的整体服务水平,我们为大连银行股份有限公司提供了捷骅应用程序性能监控软件产品即APM解决方案。
  此次安装部署的业务系统有:税库银系统、办公系统、网银监控、网银个人、网银企业、手机银行、影像系统、客服系统、个人贷款系统、小企业、反洗钱系统等大小30余个系统。
捷骅应用程序性能监控系统是一款应用程序服务器性能监控系统。是一款能够深入、全面、集中监控应用程序和服务器各项性能指标并能及时预警的轻量级应用性能监控系统。
通过分阶段和批次的实施,彻底地改变了该行复杂庞大系统的运维管理局面。具体改变如下:

  • 实时性能监控:实时展示被监测各服务器的各项性能指标,包括服务和资源,无界面刷新,无延迟,实时掌握系统运行状况。做到对服务系统状况的随时掌握。

  • 集中化管理:将整个业务系统集中的在一个界面上进行全面监控,所有监控数据在界面中直观呈现,可以实现对任意一个节点或几个节点的信息的查看,实现细粒度分析。

  • 历史情境再现:可以将服务器历史记录还原成当时表现的情形,便于了解服务器在未查看时出现了何种异常,帮助我们对故障进行定位,解决故障发生的原因。

  • 警报方式:可以通过界面、邮件、手机短信等方式实现警告信息的发送,短时间内通报问题状况,加快问题处理,减少停机时间。

  • 深度代码剖析:实时监控每一个事务请求的全过程,从请求开始就以动态、丰富的图形进行实时展示,当业务经过了请求、分发、处理后将整个执行过程的全部经过通过顺序性文字展示出来,包括使用的类、SQL语句、执行中是否出现了异常、请求的ID、IP及各项响应时间都能被完整的记录下来,这样可以帮助我们对程序进行性能优化。

  • 各种形式的报告书:可以自定义实现报告书的输出,便捷地通过各种报告书的形式了解服务器的整体运行情况。

  • 智能负载控制:当业务系统繁忙时可以将重要的业务排放到系统前面进行业务处理,并且在极其繁忙时可以进行人工干预,将已经卡死的线程、请求进行强制关闭,已达到资源的及时释放。

成就客户 

1、实时掌握应用程序的运行状态,缩短问题解决的时间,提高效率

2、最大限度地减少停机时间

由于对实时性能数据的准确把握,即使系统宕机,也可以迅速找出原因,避免了之前大量的分析时间和责任推诿时间,为系统的快速恢复提供了时间上的保障。

3、确保故障的应对能力

改变以往出现问题后做大量分析才能得出结论的局面,通过捷骅应用性能监控系统,可以直观的看到问题所在,定位明确详细,增强了故障对应的能力。

4、节约总体成本

节省了对高技术水平人员需求的成本,解决问题流程多,涉及部门广,具有极大盲目性所带来的成本消耗;同时监控系统所提供的各项参数指标为硬件资源的合理调配提供依据,避免不必要的系统资源的浪费,使系统资源利用最大化。