经过几个月的艰苦奋战,SiteView ECC新版本的研发已接近尾声。作为IT 运维领域的重量级国产软件,媒体对SiteView ECC的关注程度也随着即将亮相的新品日益升温。近日,SiteView ECC产品经理陈新刚首次接受了媒体采访。
这次探讨式的媒体交流在游龙会议室内进行,大家在新品推出前即进行接触和了解,以期先睹为快。SiteView ECC产品经理陈新刚笑着介绍说,紧张的研发攻关刚刚结束,借此机会稍微舒一口气,要在前段时间,实在是难以抽身接受采访啊。
陈经理首先谈论大家最为关心的重点:“这次推出的是SiteView ECC7.0,前版本SiteView ECC6.2是通过.net、AC两项技术开发实现的,因此在性能上有一定的瓶颈需要突破;和以前的版本相比,SiteView ECC7.0采用最成熟的C++开发,可以很轻松的实现平台移植,真正实现跨平台操作和安装。基于 C++ 的高性能的监测引擎,平均每分钟监测500次,可运行在 Window 和 Linux 下,系统精巧、高效、稳定。”
亮点一:网络管理专用数据库
据了解,SiteView ECC 7.0一个新的亮点即是采用了网络管理专用数据库数据库,它是SiteView ECC专用高性能压缩加密数据库,基于监测数据库的表的特殊结构,支持海量监测数据(500GB)的高效存贮和查询,存贮和查询的效率比通用数据库高出几个数量级。完全解决了大型系统要使用复杂的 Oracle 数据库的限制。
新版本采用自主研发的专用数据库,存储数据更快,压缩模式更有针对性,是从20G到2G的转变。同时也实现环型数据结构,例如,3年的采集数据是60G,3年后将自动覆盖以前的过期的数据,不影响任何的网络监测,将数据的空间保持在60G。不用用户手动的删除更新,形成了循环的数据存储。
用C语言做接口,ECC的数据库吞吐的数据非常特殊,作为专用的数据存储系统,它本身的稳定性,也是通过多次验证,并且可以根据客户需求,留有二次开发的接口,可以将数据导入客户习惯使用的传统数据库。
亮点二:监测器专用语言
SiteView ECC7.0另一个新的亮点,就是独创语法简单、灵活的监测器专用语言 MSL (Monitor Specific Language),它十分方便用户添加行业特殊应用的监测,包括监测器专用语言开发器 MSL-IDE(编辑、调试和运行)和 MSL 的运行引擎。
亮点三:多级分布式,提供IDC功能
SiteView ECC 7.0的伸缩性非常好,内置功能可以实现多级数据同步,部署灵活,能够适应大中小型规模的网络。以往,分布在上海和北京两地的网管系统,可以通过Web方式相互查看界面,但是无法实现数据共享,或在原系统基础上再做二次开发实现数据共享;而SiteView ECC 7.0通过内核层开发,可以真正实现数据的同步共享,将北京、上海两个独立的系统完美结合成一个完整的系统,实现报警设置、报告分析统计、自定义等功能。
同时,对于电信运营商关注的IDC功能,SiteView ECC 7.0也得到很大完善,它同时支持多个用户登录,并保证每个用户登录的界面相对独立完整,好像每个用户都是登陆自己的系统一样。
由于时间有限,关于SiteView ECC7.0的其他性能,陈经理只能笼统介绍说:“非常完善,亮点很多,等新品发布后,推荐大家下载试用。比如,ECC7.0采用全 Web 架构,多语言版本,使用 Ajax Web 技术,完美的用户体验,同时支持 IE 和 FireFox;开放架构设计:支持SOA架构,易于与第三方系统集成,通过WebService发出报警信息和提供监测数据;支持代理和非代理的服务器监测,拥有十分灵活的部署方案等等。”
SiteView网管软件网络应用拓扑原理
SiteView的网络应用拓扑可以直观反映系统基础架构及其应用的运行状况,与其它的网络拓扑不同,它的拓扑节点上不仅可以表示为一个实际的网络设备,如服务器、路由器、交换机、防火墙等,还可以表示一个实际 的应用服务,如WWW服务,数据库服务,邮件服务等。如果拓扑节点所对应网络设备或应用服务发生故障,则该拓扑节点以红色或黄色标识。通过网络拓扑图用户可以迅速发现哪个网络节点发生故障,并进行处理。
SiteView适用于各种复杂的网络环境。不管是简单的局域网,还是遍布全国的庞大的广域网或存储局域网,SiteView都可根据你的需求生成各种相应的网络拓扑图,并且可以十分方便地在各个拓扑图间进行切换,从而使复杂的网络信息系统管理工作变得直观和轻松。
网络应用拓扑绘图模块是在微软的Visio2003基础上开发的,安装后经过环境参数的配置,就会出现在Visio2003的菜单中。由于Visio2003已经是微软开发的一种非常成熟强大的绘图工具,所以将SiteView的拓扑插件集成在Visio2003中,更加可以发挥强大的所见即所得的绘图功能。并且SiteView自带超大型图库,能逼真的标识不同厂家、不同型号的服务器和网络设备。利用Microsoft Visio这种成熟的软件,经过简单的拖拽就能十分方便地生成各种反映网络设备关联状况的美观的网络拓扑图,也可直接导入现有拓扑图或网络示意图,从而使复杂的网络环境变得直观和清晰。一旦网络环境发生变化,也能十分方便地作相应的调整。
SiteView自带超大型图库,能逼真的标识不同厂家、不同型号的服务器和网络设备。利用Microsoft Visio这种成熟的绘图工具,经过简单的拖拽就能十分方便地生成各种反映网络设备关联状况的美观的网络拓扑图,也可直接导入现有拓扑图或网络示意图,从而使复杂的网络环境变得直观和清晰。一旦网络环境发生变化,也能十分方便地作相应的调整。
美妙尝试SiteView ECC 7.0的新味道
随着网络应用和规模的不断增加,网络管理工作越来越繁重,网络故障也频频出现。人为去分析网络运行状况,评估出系统出现的瓶颈几乎是不可能实现的。另外,当系统出现故障后,不能及时发现、诊断都为网络完全瘫痪和系统崩溃埋下了隐患。
随着网络应用和规模的不断增加,网络管理工作越来越繁重,网络故障也频频出现。人为去分析网络运行状况,评估出系统出现的瓶颈几乎是不可能实现的。另外,当系统出现故障后,不能及时发现、诊断都为网络完全瘫痪和系统崩溃埋下了隐患。以前当网络出现故障时,许多企业会请专家来帮助分析,帮助调理网络,在付费的同时还欠下了一笔“人情债”。而当系统出现问题的时候,通过再购买一些服务器来解决问题。曾经走过风雨的网管员都清楚,运维一个网络要比组建一个网络更加难上加难。而现在你可能会考虑购买网管软件来加强网络管理,以优化现有网络性能,逃脱故障的束缚,开始恢复你的自信。
安装过程中的小插曲
SiteView ECC可以安装在任何一台windows 2003操作系统的PC机或服务器上,对系统资源的占用很少。当然,由于监测数量及监测频率的不同,SiteView ECC对系统资源的占用情况不尽相同,对硬件配置的要求也不一样。经过模拟测试,如下的配置完全可以支持100个左右的监控设备:
由于只有100多兆的苗条身躯,所以安全过程非常快,这让我回想起国外几个管理软件漫长的配置过程,不禁对ECC有了好感。在安装结束后,根据以往的经验我把安装光盘的内容翻箱倒柜的折腾了半天,终究没有找到客户端程序。咨询技术人员的答复如下:“SiteView ECC采用的是非代理、集中式的监测模式,可以安装在服务器或PC机上,无需在被监控服务器或网络设备上安装任何代理软件。”刚才的一丝好感马上被疑惑所代替,很少看到网络管理软件没有客户端程序的,带着这些疑问我开始测试7.0产品的每个功能模块。
针对每个功能模块的尝试 监控对象紧跟市场脚步
SiteView ECC 7.0支持Windows和Unix两种类型的操作系统。对远程NT主机的监测采用RPC方式,如果监测远程NT主机时,请检查该主机是否安装了WMI和WMIDE服务,如果跨越安全设备的时候需要建立开放TCP135、TCP2942端口进行连接。而对不同版本的Unix系统支持也非常好,比如Redhat、Solaris、AIX、FreeBSD、Unixware、HP-UX、OpneServer等所有主流操作系统的服务器。在网络设备的监控方面,ECC 7.0几乎覆盖了所有主流品牌 Cisco、Juniper、3com、NETGEAR、北电、华为、实达、迈普等多厂家的各种网络设备,支持CheckPoint、NetScreen、Cisco(PIX)、天融信、安氏、联想、东软等厂家的防火墙。
在中间件和服务监控方面的测试中,可以感觉到ECC 7.0中对中间件的支持要强于服务的支持,这可能与目前各应用服务器产品的同质化有关,毕竟现在的用户注重的是如何为应用提供更多的增值功能服务和更好的性能。应用服务器中间件作为软件的基础设施,可以把不同的应用软件作为构件整合到一个协同工作的环境里,并为应用提供了名字、事务、安全、消息、数据访问等服务,此外它还提供应用构件的开发、部署、运行及管理功能。由于标准接口对于可移植性和标准协议对于互操作性的重要性,中间件已成为许多标准化工作的主要部分。对于应用软件开发,中间件远比操作系统和网络服务更为重要,中间件提供的程序接口定义了一个相对稳定的高层应用环境,不管底层的计算机硬件和系统软件怎样更新换代,只要将中间件升级更新,并保持中间件对外的接口定义不变,应用软件几乎不需任何修改,从而保护了企业在应用软件开发和维护中的重大投资。
全面测试,充分模拟环境
很多网管员对网络管理软件理解不到位,很多人认为监控服务器、网络设备是否有故障就是网管系统的全部。其实监测服务器,即监测它的运行,是实现对服务器进行管理的两个重点要求—故障查找和优化—的一步。一般情况下,这些设备故障率是很低的,而后者才是对网络或系统的完全掌控。SiteView在物理层面上可以监测服务器物理硬件,包括监视温度、电源和部件(如硬盘)的机能。以往曾试用过几个国内的管理软件,但是这些产品对一些服务器的关键部件都不能支持监控,在此次测试过程中不但包括了IBM、HP等国外品牌还包括了国内联想和浪潮等不同级别的服务器。在监测服务器的性能方面7.0和其他几个厂商的网管软件大致相同,例如,CPU使用情况、可用硬盘空间和内存可用性等,这都为故障查找和优化提供帮助。
在服务监控方面7.0可以单独设置,也就是说针对企业的关键的网络服务单独监测,例如Email、SQLServer、Oracle、URL可用性、IIS Server、Apache Serve、WebLogic、FTP、DNS、TCP协议的运行情况等。还以上文中提到的服务器“中间件”,我们进行了全面测试,
SiteView可以对IBM的MQ、Webspher,BEA 的Tuxedo、WebLogic等中间件进行全面监测。以Tuxedo为例,SiteView能够对Client信息(请求数、事务处理数、Client状态等)、队列信息(队列的最大字节数、当前队列字节数、队列IPC消息数、机器状态等)、服务信息(总共的请求数、Server每秒请求数、Server每秒transaction数、并发的连接数、服务状态等)、WSH监测(请求数、WSH接收的字节数、WSH接收的消息数、WSH发送的消息数、WSH每秒接收的字节数、WSH每秒接收的消息数、WSH每秒发送的字节数数、WSH每秒发送的字节数数、WSH每秒发送的消息数、WSH状态等等)进行全面监测,有效帮助系统管理人员加强对中间件的监测和管理,提高工作效率。
在网络设备管理方面,我们不但测试了内部的网络设备的性能监控,同时几个单位的管理员利用不同的网络接入环境的差异,进行了跨WAN的监控测试。除部分采用Linux作为防火墙的单位没有参与外,其他单位基本上都按照说明手册的部分作完了全部实验。这其中包括:网络设备的接口的相关状态信息、接口流量、接口丢包率等。在网络设备的可用性方面的测试还包括CPU利用率、内存利用率、当前连接数、会话数(session)、防火墙的性能指标(如拒绝的数据包数、丢弃的数据包、IP欺骗攻击数、ICMP攻击数等性能参数)、配置文件的变化情况等。经过一系列的功能测试之后,不但前面的一些疑虑完全打消了,而其发现了更有趣的东西。
故障的自动诊断
SiteView的故障自动恢复功能可能是最有趣的一件事。以往,当设备出现问题当出现问题后,我们只能在收到报警讯息后作出处理,而这两者之间存在着一个时间差,看似短暂的时间差对于某些重要的应用可能是致命的。对于一个临时性的标准故障时,7.0自动恢复功能就会自动执行指定脚本或POST数据到指定的CGI程序,使服务恢复正常。比如,把一个挂起的服务器操作通过自动启动功能而使它重新运行;把一个耗费系统过多资源的进程停止或者重新启动设备。在Windows和UNIX平台,SiteView提供了重启指定服务、重启Web服务、重启主机、关机等故障自动处理功能。UNIX平台提供了扩展的接口实现故障处理模块,管理员可以自己定制用于对故障进行处理的UNIX脚本,这对很多习惯命令行模式的管理员可谓提供了更广阔的空间。
日志与报表
在一个完整的信息系统里面,日志系统是一个非常重要的功能组成部分。查看交换机、路由器和其他网络设备的日志,可以帮助网管员迅速解释和诊断问题。很多网管员经常将认为日志管理是信息安全管理的内容,和系统管理关系不大,这是绝对错误的。而很多硬件设备的操作系统也具有独立的日志功能,但在大量的设备面前,如果一台台的去查看,那么一天什么也别干了。SiteView系统中有接收SNMP TRAP、SYSLOG网络事件的功能,可以接收任何网络设备的Trap信息,如路由器、交换机等,使得用户可以更方便的了解设备Event。SiteView在接收到网络事件后,可以按照相应的格式进行分析,从而得到相应的事件信息。每次触发事件,系统自动将触发情况立即记录到相关角色、设备、线路、流程、资源的历史记录中,同时将此信息记录到事件报告中,并按照管理员的设定时间依次为依据形成事件报告并将相关人员的处理报告进行汇总,可以由集中应用监控平台的维护人员根据需求进行对各类事件的类型的制定和分类,可以实现对事件的过滤及分类。
站在程序员的角度去看7.0
很多管理软件由于是采用了WEB的操作界面,所以数据调用过慢的问题是一个通病,而服务器使用WEB服务技术后,在大规模部署后的稳定性也是衡量一个产品的指标。ECC使用AJAX和FastCGI技术,所以在整个过程中非常高速和稳定。由于参与测试的人员中有很多都是程序员转行过来的,通过他们的介绍,我们对SiteView ECC 7.0有了更深的认识:
——AJAX (Asynchronous JavaScript and XML)是多种技术的综合,它使用XHTML和CSS标准化呈现,使用DOM实现动态显示和交互,使用XML和XSTL进行数据交换与处理,。Ajax技术之中,最核心的技术就是XMLHttpRequest,它最初的名称叫做XMLHTTP,是微软公司为了满足开发者的需要,XMLHttpRequest为运行于浏览器中的JavaScript脚本提供了一种在页面之内与服务器通信的手段,页面内的JavaScript可以在不刷新页面的情况下从服务器获取数据,或者向服务器提交数据。
——我们对CGI工作的工作原理还是比较熟悉的,比如当客户机对服务器请求CGI应用程序时,服务器建立一个进程来处理用户请求,完成后结束进程。由于CGI程序的反复调用,这对服务器会操承负载问题:当负载很低时,CGI能很好地工作,但是一个大型的站点上的各种不同类型的请求随时发生,在客户请求的负载很高时,服务器进程的设置和初始化所用的时间就成为WEB服务性能的瓶颈。特别是像和数据库这样的应用程序连接时,初始化所用的时间较长。而使用FastCGI则是另外一种情况,由于它始终处于活动状态为来自服务器的请求提供服务,在服务器看来它始终是一个运行的“活程序”,所以在处理请求时没有启动新进程和对应用程序初始化的开销。
最后,我们站在用户成本的角度上去衡量了它设计了ECC 7.0,由于它是自有的环形数据库,能自动删除更新长期不用的数据,这样就可以为用户节省购买通用数据库的成本。而兼“精巧、效率、稳定为一体”的设计理念让我想起了手表的一个广告:“把握时间,把握生命,把握你自己”。
|