会员登陆:
载入中…
我要发布
联系我们
广告合作
推荐:系统管理 信息安全 企业管理 大众消费 多媒体 存储备份 商业智能 系统软件 PK 企业库 软件商城 威客 在线演示 我要发布

| 数据仓库 | 报表工具 | OLAP Server | 数据挖掘 | ETL工具 |

Informatica | IBM | Microsoft | SAS | BO | Cognos 其它
您现在的位置: 中华软件网|中国软件导购网 >> 商业智能 >> ETL工具 >> 专家点评 >> 商业智能正文
企业新闻
推荐商业智能SAS加快引领中国商务智能步伐
推荐商业智能Informatica看好数据整合潜力
推荐商业智能SAS整合产品来提供卓越的绩效管
推荐商业智能SAS发力数据整合市场
推荐商业智能INFORMATICA 发布历史上最具创
推荐商业智能BO:一切为了客户
推荐商业智能基于IT基础设施 SAS提供开放可
导购论坛
·常用软件导购
·
报表工具软件导购
·
数据备份软件导购
·
系统管理软件导购
·
信息安全软件导购
·数据库软件导购
·基础软件导购
·行业软件导购
软件购买咨询
      请登陆导购论坛
产品评测
推荐商业智能加快 ETL 设计,改进数据质量
推荐商业智能SAS9 获金软件奖
推荐商业智能Informatica获读者评最佳ETL奖
推荐商业智能SAS ETL SERVER效能世界第一
推荐商业智能Leading Analyst 公司称Inform
推荐商业智能Informatica是企业数据集成领域
推荐商业智能BO被评选为企业ETL工具市场一级
相关软件下载
相关技术白皮书
在线体验
服务点评
  • 此栏目下没有推荐商业智能
  • 专家点评
    推荐商业智能ETL设计要点
    推荐商业智能ETL应用浅析
    推荐商业智能探求数据仓库关键环节ETL的本质
    推荐商业智能四种数据ETL模式
    推荐商业智能BI厂商加码ETL工具 奠基商业智
    推荐商业智能选择合适的ETL工具
    推荐商业智能ETL的思考
    客户评价
    推荐商业智能阿迪达斯公司评价Business Obj
    推荐商业智能Jet Services评价SAS商业智能解
    推荐商业智能德国邮政统一采用INFORMATICA 
    推荐商业智能INFORMATICA幫助PFIZER JAPAN 
    推荐商业智能美疾控中心利用INFORMATICA防止
    推荐商业智能上海宝钢评价SAS商业智能系统
    推荐商业智能中国网通评价BO商业智能解决方
    负面报道
  • 此栏目下没有推荐商业智能
  • 解决方案
    推荐商业智能IBM DB2 Warehouse Manager 应
    推荐商业智能微软商业智能解决方案
    推荐商业智能天维数码采用IBM ETL解决方案
    推荐商业智能IBM DB2 Universal Database 的
    推荐商业智能Business Objects公司EIM解决方
    推荐商业智能Business Objects商务智能中国
    推荐商业智能Informatica-ETL工具解决方案
    Google
    论坛
    ETL设计要点
    作者:佚名    商业智能来源:数据仓库之路    点击数:    更新时间:2007-1-10


        由于数据源的多样性,数据传输条件等不确定性以及用户对最终统计数据的选择性等因素,使得ETL在处理上需要考虑业务数据处理的要求,还要考虑数据传递过程中如何解决这些多样性和不确定性,以及数据转换的复杂性等方面都需要考虑。ETL的设计一定是针对具体的应用相关的,针对不同的业务和分析模型有不同的抽取要求。

       
    所以ETL整体架构的灵活性和可扩展性都是非常重要的。但无论依赖的条件多么变化在设计过程中都要依照一下原则

        1.
    ETL设计之前需要根据业务的特性确定分析的主题,和分析模型的结构,区分维度数据和和事实数据,建立相应的数据仓库的模型。在设计过程中需要考虑是否需要预留字段,增加属性等等。

        2.
    数据的粒度,在同一CUBE中必须统一。事实表中的粒度就是维度表与事实表中相关联的最小级别的数据。在分析过程中尽可能采用粗的粒度可以有效的减少数据量。但是在不同的分析中可能会有差异,比如在话务量的趋势分析和预测的分析主题中可以以小时为粒度,但是在一些实时性要求比较高的忙时分析中需要采用15分钟甚至5分钟的粒度。

        3.数据周期的确定,在设计ETL时需要事先确定抽取的时间,这个可能根据用户实时性的要求作为调整的依据。

        4.
    抽取的方式尽量采用增量的抽取以减小每次抽取的数量。

        5.
    数据流和工作流的概念.ETL中需要考虑数据在每个步骤中的状态和转换行为,数据的清洗转换和加载过程世分为很多步骤完成的,每个步骤一定是数据的一个原子业务操作。步骤可以根据需要进行调整,在数据流当中可能会出现分支的情况,也就是说,在不同条件下采用不同的处理逻辑。

        6.
    流程的异常处理。在流程中需要考虑各种可能的异常的存在,如网络闪断,数据的延迟产生等等。需要在流程中加入一些补救的措施已于纠正。保证入数据仓库的数据绝对正确。(但是流程的设计尽量依照简单高效的原则)

        7.ETL
    的调整,运行管理以及监控。针对ETL程序的运行应该有相关的管理和监控工具。一方面用于ETL的设置和调整,另一方面也是方便在ETL处理出现异常时能够及时通过人工的方式进行干预。保证ETL的正常运行。

        8.
    针对业务的需求进行ETL的配置和设置界面,方便专业维护人员和开发人员能够对抽取的任务进行调整和灵活配置。

        9.ETL
    CUBE的管理,ETL程序除了需要针对数据仓库的管理和数据的处理以外很重要的部分是对cube的管理。根据cube的特性需要考虑对维度,cube进行更新,以及对cube中分区的新建,处理,合并等一系列操作。

        10.
    数据仓库有一个初始化的过程也就是将以前的业务数据进行整理和加载,但是数据量是非常巨大的需要花费较长的时间来完成的,而且抽取的策略和平时的抽取不同。

        11.
    程序具有自修复功能,任务在任何一步出现异常,ETL程序都能够回到抽取前的状态,而不需要人工干预,更不能影响到已抽取的数据。    

     

    Copyright@ 2003-2008 www.soft2008.com.cn All Right Reserved
    京ICP备06062655号