会员登陆:
载入中…
我要发布
联系我们
广告合作
推荐:系统管理 信息安全 企业管理 大众消费 多媒体 存储备份 商业智能 系统软件 PK 企业库 软件商城 威客 在线演示 我要发布

| 数据仓库 | 报表工具 | OLAP Server | 数据挖掘 | ETL工具 |

Informatica | IBM | Microsoft | SAS | BO | Cognos 其它
您现在的位置: 中华软件网|中国软件导购网 >> 商业智能 >> ETL工具 >> 解决方案 >> 商业智能正文
企业新闻
推荐商业智能SAS加快引领中国商务智能步伐
推荐商业智能Informatica看好数据整合潜力
推荐商业智能SAS整合产品来提供卓越的绩效管
推荐商业智能SAS发力数据整合市场
推荐商业智能INFORMATICA 发布历史上最具创
推荐商业智能BO:一切为了客户
推荐商业智能基于IT基础设施 SAS提供开放可
导购论坛
·常用软件导购
·
报表工具软件导购
·
数据备份软件导购
·
系统管理软件导购
·
信息安全软件导购
·数据库软件导购
·基础软件导购
·行业软件导购
软件购买咨询
      请登陆导购论坛
产品评测
推荐商业智能加快 ETL 设计,改进数据质量
推荐商业智能SAS9 获金软件奖
推荐商业智能Informatica获读者评最佳ETL奖
推荐商业智能SAS ETL SERVER效能世界第一
推荐商业智能Leading Analyst 公司称Inform
推荐商业智能Informatica是企业数据集成领域
推荐商业智能BO被评选为企业ETL工具市场一级
相关软件下载
相关技术白皮书
在线体验
服务点评
  • 此栏目下没有推荐商业智能
  • 专家点评
    推荐商业智能ETL设计要点
    推荐商业智能ETL应用浅析
    推荐商业智能探求数据仓库关键环节ETL的本质
    推荐商业智能四种数据ETL模式
    推荐商业智能BI厂商加码ETL工具 奠基商业智
    推荐商业智能选择合适的ETL工具
    推荐商业智能ETL的思考
    客户评价
    推荐商业智能阿迪达斯公司评价Business Obj
    推荐商业智能Jet Services评价SAS商业智能解
    推荐商业智能德国邮政统一采用INFORMATICA 
    推荐商业智能INFORMATICA幫助PFIZER JAPAN 
    推荐商业智能美疾控中心利用INFORMATICA防止
    推荐商业智能上海宝钢评价SAS商业智能系统
    推荐商业智能中国网通评价BO商业智能解决方
    负面报道
  • 此栏目下没有推荐商业智能
  • 解决方案
    推荐商业智能IBM DB2 Warehouse Manager 应
    推荐商业智能微软商业智能解决方案
    推荐商业智能天维数码采用IBM ETL解决方案
    推荐商业智能IBM DB2 Universal Database 的
    推荐商业智能Business Objects公司EIM解决方
    推荐商业智能Business Objects商务智能中国
    推荐商业智能Informatica-ETL工具解决方案
    Google
    论坛
    IBM DB2 Universal Database 的 ETL 解决方案
    作者:佚名    商业智能来源:IBM    点击数:    更新时间:2007-1-10

    本文主要讨论为 IBM®DB2® Universal Database (UDB)(包括 UNIX®Linux® Windows® 上的实现)提取、转换和加载(ETL)数据,还将介绍 IBM 和其他厂商提供的主要选项、技术和产品。作者 Dan Simchuk 将详细阐述为大型资料库获取数据的实用选项 —— 在单分区和多分区系统上运行的数据仓库、数据集市和操作性数据存储等。此外,还将探讨 ETL 的未来发展和实现 ETL 的一些新方法。

        简介

        

        在有效地使用数据资料库之前,通常需要从很多数据源创建或者更新资料库。最常见的情况是,在外部系统上累积数据(供以后更新资料库使用),这些数据的格式也与资料库的要求有所不同。获得这些数据并将其转化成有用、一致、准确的数据的过程通常称为 ETL,其中的三个字母分别代表提取(Extraction)、转换(Transformation)和加载(Load)。

        

        提取就是从源系统中获取数据(无论是何种格式)。这个过程可能很简单,只需要从数据库或者电子表格转储文本文件(flat file);也可能很复杂,需要建立与外部系统的联系,然后控制数据到目标系统的传输。

        

        转换通常不仅仅是数据格式的转换(虽然这是将数据导入系统的关键一步)。外部系统中的数据可能包含不一致或者不正确的信息,这取决于外部系统上实施的检查和平衡。转换步骤的一部分是"净化""拒绝"不符合条件的数据。这个阶段常用的技术包括字符检查(拒绝包含字符的数值性数据)和范围检查(拒绝超出可接受范围的数据)。被拒绝的记录通常存放在单独的文件中,然后使用更复杂的工具处理,或者手工改正问题。然后将这些数据合并到已转换集合中。

        

        加载阶段将获取并转换的数据存放到新的数据存储中(数据仓库、数据集市等)。对于 DB2 UDB,该过程可以用 SQL 命令(IMPORT)、工具(LOAD)或集成工具(Data Warehouse Manager Information Integrator)来完成。另外,整个 ETL 过程也可使用第三方应用程序来完成,这样做通常可以减少编程,或者不需要自己编程。

        

        ETL 过程可能非常简单,只需要将一些数据从一个表传递到相同系统中的另一个表。也可能非常复杂,需要从数千英里之外的完全不同的系统获取数据,然后重新安排和重新格式化,使其符合完全不同的系统。下面将描述完整的 ETL DB2 UDB 的方法(但不一定没有遗漏)。只要有可能,我会提供有关该方法的详细信息的链接。

        

            

    Copyright@ 2003-2008 www.soft2008.com.cn All Right Reserved
    京ICP备06062655号