身着一件素色T恤,额头微鼓,眼神清澈,NCR Teradata数据仓库事业部(下称Teradata)首席技术官宝立明宝立明看上去就像一个大顽童。在美国,宝立明素有“天才少年”之称,曾撰写过大量数据管理和并行计算环境方面的文章和论文,被认为是全球系统应用突破领域的知名从业者。在接下来的访问中,他和我们分享了动态数据仓库的领先理念和目前的发展情况。
信息周刊:根据我们的了解,和传统的静态数据库相比,动态数据库可以更及时的处理更复杂的信息源。您如何看待动态数据仓库技术目前在中国的发展和应用情况情况?
宝立明:动态数据仓库在不同行业都有不同的应用。例如中国邮政的动态数据仓库应用主要集中在物流方面,用于追踪包裹的去向。包裹从A点送到B,在提取包裹的时候要用扫描器获取数据,提取之后把包裹放在运输车上又要再用一次扫描仪获取数据,每个环节都有获取数据的过程,这样你就能获得关于这个包裹非常详细的信息,从而追踪包裹的去向。
动态数据仓库在金融业的应用主要是预先预防和控管某些风险,而不是等到风险发生之后再报告,将原来的被动管理转化为现在的主动防范。金融行业动态数据仓库的一个应用实例是上海证券交易所,除了风险控管,还涉及到交易行为是否合乎某些规定的问题。上证所通过对数据的分析和整理来判定自己的交易行为,或者是客户的交易行为是否符合法律法规的要求,就也是动态数据仓库合规性的一种体现。
信息周刊:和其它厂商相比,Teradata的动态数据仓库方案有何不同?
宝立明:我了解到的是国际商业机器公司(IBM)和甲骨文公司(Oracle)所做的并不是真正意义上的动态数据仓库。他们做的是操作数据存储(OSD),OSD本质上是一种零散的、分散的、割裂的数据库。这种操作数据存储和真正的数据仓库是不同的。ODS数据之间相互复制,而真正的动态数据仓库里数据是集成在一起的,单一的企业视图。此外,ODS不具可扩展性,不能随着需求的增加而增添新的数据功能和应用。
信息周刊:企业如何来实现并应用动态数据仓库?
宝立明:可以从技术和业务流程两个角度考虑。
技术角度,动态数据仓库最基本的一点一定要具有可扩展性,因为企业今后要处理大量的查询,尤其是在动态数据仓库的使用过程中,由于整个系统是实时的、动态的,因此查询量比传统查询要大得多。再有,数据获取和数据提供做得好坏与否也将影响动态数据仓库的质量。第三,要有由动态的资源配置,这一点对于动态数据仓库是非常重要的,在这方面Teradata比竞争对手领先至少5年。
从业务流程角度,企业要能够在流程方面进行重组,或者重新调整,使之更有效、更快速地运用到数据。企业遇到的问题往往是数据提供给你了,而业务流程是不是能充分利用这些数据,这一点非常重要。所以为了充分利用数据,就需要对业务流程进行调整和重组。Teradata针对每个行业都有专业咨询顾问,帮助客户了解企业在这个行业种需要做什么事情,而我们用到的其实就是动态数据仓库,以及一些模型、分析工具和相关解决方案。
信息周刊:哪些因素会影响动态数据仓库的发展?
宝立明:谈到未来动态数据仓库的发展,实时应用,或者说是准实时应用是可以预见的。过去无法实现实时应用的意思是指,企业当天业务结束后对数据进行批处理,第二天就能拿到统一的最终结果。现在我们说的是一种更加直接的处理,即准实时或实时处理的过程。随着数据源源不断进入系统,你仍然可以处理数据,更快地向决策部门提供信息。
此外,在交易的同时也可以对数据进行实时分类、过滤或分析,从交易开始到做出决策的周期将会缩短,做出决策的速度会更快。这就是为什么面向服务架构(SOA)、网络服务和商业智能越来越重要的原因。过去企业把重点更多地放在交易过程中,而现在则更多地放在决策过程中。未来基于网络的服务、商业智能和SOA都会成为非常重要的概念。