“数据仓库与企业智能化(DW/BI),作为IT行业中崛起的新星,正在创造出更多的就业机会。”Frank博士如是说。Frank博士从事IT工作15年,是美国联邦政府、加拿大联邦政府及多家北美大型企业数据库和数据仓库领域的高级顾问,曾执教于上海同济大学,就职于世界顶级的咨询公司KMPG Consulting & Deloitte Consulting,长期从事Data Warehouse/BI 设计和实施的工作,客户遍及美国,加拿大和中国,经验丰富,见多识广,充分了解不同客户的不同要求,积累了一套完整的数据仓库解决方案。
Frank博士对Oracle 数据库、Informatica ETL 和Cognos BI有着深厚的功底、独到的见解和特别的专长。聆听其授课必将使你的技术和管理技能迅速见长。Frank博士说,通过学习参加数据仓库(DW/BI)的培训课程,将缩短你自我探索数据仓库技术的时间至少六个月以上,提前找到自己喜爱的工作,也省下一笔不菲的费用。更主要的是帮助你建立良好的数据仓库知识体系,带你进入数据仓库的技术群体,交流技术问题,获得技术支持。
课程的设置和讲授始终围绕着如何做数据仓库与项目同步进行。听课的过程就是积累北美经验的过程,全真数据、全真项目、全真过程,应用最新技术、最流行工具,获得完善的理论及实践知识。理论结合实践,知识结合经验,这一点非常重要。学员可成为我们的数据仓库和企业智能化社区及论坛的社员,交流技术问题,享受就业优先推荐,并可获得技术支持。提供求职专业化辅导,完成成功就业的一大步。其实,找工作机遇和实力都很重要,如果自身技术条件过硬,何愁找不到专业工作。
正是由于通过利用企业数据资产数据分析,可以帮助决策者做出更加明智的决策,进而提升企业的竞争优势。所以越来越多的企业正在招聘有关方面人员,因为它的确能为企业带来真正的效益。因而,此领域正在造就越来越多的就业机会。学习数据仓库,找到专业工作可谓正是时机。时间不等人,机会不等人,如果你具有IT基础知识或相关专业知识,还在为找专业方向而左右徘徊,犹豫不决,那么,通过学习DW/BI的相关技术,提升自已的专业技能,使自身条件更加符合招聘工作要求。
数据仓储(Data Warehouse)是一个容量较大的关系型数据库,用来储存决策支持(Decision Support system)所需要的数据和帮助客户快速建立数据仓储的工具而决策支持所需要的数据,以便让决策人员很快从数据仓储中找到所需要的数据。也是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。
首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。
ETL是Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程。作为BI/DW(Business Intelligence)的核心和灵魂,能够按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。如果说数据仓库的模型设计是一座大厦的设计蓝图,数据是砖瓦的话,那么ETL就是建设大厦的过程。在整个项目中最难部分是用户需求分析和模型设计,而ETL规则设计和实施则是工作量最大的,约占整个项目的60%~80%,这是国内外从众多实践中得到的普遍共识。
ETL是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。信息是现代企业的重要资源,是企业运用科学管理、决策分析的基础。目前,大多数企业花费大量的资金和时间来构建联机事务处理OLTP的业务系统和办公自动化系统,用来记录事务处理的各种相关数据。
据统计,数据量每2~3年时间就会成倍增长,这些数据蕴含着巨大的商业价值,而企业所关注的通常只占在总数据量的2%~4%左右。因此,企业仍然没有最大化地利用已存在的数据资源,以致于浪费了更多的时间和资金,也失去制定关键商业决策的最佳契机。于是,企业如何通过各种技术手段,并把数据转换为信息、知识,已经成了提高其核心竞争力的主要瓶颈。而ETL则是主要的一个技术手段。
商业智能也称作BI,是英文单词Business Intelligence的缩写。商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。这里所谈的数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商等来自企业所处行业和竞争对手的数据以及来自企业所处的其他外部环境中的各种数据。商业智能的概念最早在1996年提出。当时将商业智能定义为一类由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及其应用。
目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。而商业智能能够辅助的业务经营决策,既可以是操作层的,也可以是战术层和战略层的决策。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。
因此,把商业智能看成是一种解决方案应该比较恰当。商业智能的关键是从许多来自不同的企业运作系统的数据中提取出有用的数据并进行清理,以保证数据的正确性,然后经过抽取(Extraction)、转换(Transformation)和装载(Load),即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图,在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者,为管理者的决策过程提供支持。