数据挖掘(Data Mining)就是从大量数据中发现潜在规律、提取有用知识的方法和技术。
数据挖掘不但能够学习已有的知识,而且能够发现未知的知识;得到的知识是“显式”的,既能为人所理解,又便于存储和应用,因此一出现就得到各个领域的重视。
从80年代末的初露头角到90年代末的广泛应用,以数据挖掘为核心的商业智能(BI)已经成为IT及其它行业中的一个新宠。
目前数据挖掘技术在零售业的货篮数据(Basket data)分析、金融风险预测、产品产量、质量分析、分子生物学、基因工程研究、Internet站点访问模式发现以及信息搜索和分类等许多领域得到了成功的应用。
如果你访问著名的亚马逊网上书店会发现当你选中一本书后,会出现相关的推荐数目,这背后就是数据挖掘技术在发挥作用。
数据挖掘的真正普及是建立在数据仓库的成功应用之上。
一个设计完善的数据仓库已经将原始数据经过了整理和变换,在此基础上再进行深入挖掘就是顺理成章的事情。
数据挖掘渗透到某些行业,产生了一些特定的应用,比如现在经常会听到的客户关系管理(Customer Relationship Management, CRM)。
客户关系管理的概念由来已久,但现代的客户关系管理一般指以客户数据为处理对象的一类商业智能应用。
通过挖掘客户信息,发现潜在的消费趋势或动向。
比如电信公司通过分析用户通话模式(通话时间,时段,通话量等),制订不同的计费方案,满足用户的同时也提高自己的利润。
同其它应用一样,客户关系管理发展到一定阶段,会出现相应的系统供应商。
据2003年1月的一项调查,CRM市场的领先者从高到低依次为PeopleSoft, Seibel, Oracle, SAP. 微软公司也将加入CRM市场。
从上可以看出,商业智能的应用领域非常广泛。
它通常以数据仓库为基础,以数据挖掘为核心,演变出类似CRM这样的应用。
一个商业智能系统的开发涉及到很多知识和技能,能够从事商业智能系统开发,那当然是最好不过的。
如果没有这样的机会,对于想进入商业智能领域的朋友,应该如何规划自己的职业发展?
六大专家联合主讲:
Sam Shao – 资深北美IT专家,教育家,18年北美IT工作经验,10年IT培训经验,培育学生数以千计,其教授的Unix系统管理与数据库管理是多伦多的黄金品牌课程,深受好评。
、