数据仓库和企业智能化及应用这两个概念经常混用。前者强调数据的整合与存储,而后者则主要集中在数据的表现与展示.一般来说,常用的数据仓库解决方案至少应涵盖三大部分:创建数据模型(Data Modeling),数据整合与存储(ETL)以及数据表现与展示(BI)。
创建数据模型:在数据库和数据仓库领域,常用的三大数据模型有关系型(ERD),多维关系型(DMR)和多维数据模型。
关系型数据模型在ERP产品中得到了完美的应用,特点是减少数据的冗余,保证数据以最快的速度写入数据库,缺点是数据从数据库读出慢(查询速度慢),不适合作为企业的报表系统。
多维关系型(DMR)数据模型弥补了关系型模型的缺陷,通过对关系型模型的重组,以达到查询性能的最优化,模型由维度表和事实表两部分组成。维度表主要涵盖企业感兴趣的事物之属性,如时间,客户,产品,区域,供货商,批发商,总帐等等,每一个维度表本身还可包含树状关系以提供给用户更为细致的分析功能。事实表主要包括衡量企业经营业绩的指标,也就是企业最高决策者们常说的KPI。每一个行业有各自的标准KPI,每一个企业又有独特的KPI,在具体设计模型时,须根据用户的需求而定。维度表和事实表的联系依旧遵循关系型模型的基本原则。
多维数据模型与前二者有很大的不同,因为它的存储基本单元为多维数据结构,可以用人们常玩的”魔方”来作比喻,“魔方”的每一面代表着维度,其多立面的内外相交点既为KPI。任意玩转”魔方”,即可获得任意组合下的KPI,这种模型为企业的分析师提供了强大的工具。三大数据模型各有优缺点,在具体实施数据仓库项目时,一般都会采用。
数据整合与存储:简而言之,数据整合就是人们常提及的ETL,ETL将数据源从不同的系统中抽取(大多数为ERP,CRM,SCM和IBM主机等),经过复杂的转换和计算,按照既定的规则,标准和流程,经过不同的阶段,将数据传输到数据库或其它存储介质中,数据整合过程涉及到许多复杂的数据库问题,诸如:数据增量提取,存储设计,表分区,索引创建和删除,性能优化,备份与恢复等等。ETL一般要占到整个项目的60-70%的精力。当用户所要的数据已全部传输到最终数据库后,就进入数据的表现与展示阶段。
数据表现与展示:不管数据模型建立的多么周密,数据整合的多么完美,若不将数据以多姿多彩的方式展现出来,用户体会不到数据仓库和企业智能化的美妙之处。数据的表现与展示有多种多样的方式,诸如,企业级标准报表(资产负债表,损益表,现金流量表等等),随意查询,多维数据结构分析,仪表盘,平衡积分卡,甚至更多的延伸服务:数据统计和数据挖潜等。数据也可以以不同的形式 (html, PDF, Excel等) 通过不同的载体(屏幕,email, 移动设备等)来体现。
数据仓库和企业智能化的魅力在于它的灵活性,但又都遵循基本的行业标准。虽然各软件巨头都有各自独特的解决方案,但企业很少有独用一家的。根据多年的实践,在Oracle数据平台上,用Informatica 作为ETL的开发工具,借助Cognos BI工具来展示数据可能是最为通用的组合了。
免费咨询电话:(416)921-8886/(905)415-9989。网站:www.mitcedu.com