什么是数据挖掘(DM)
来源: 编辑:duliying 更新日期:2008-6-2 16:09:46 浏览:210 次
什么是数据挖掘(DM)
过去的二十年,我们已经看到信息或以电子格式存储的数据在量上有了戏剧性的增长。数据的累积已经在以爆炸性的速率发生。人们已经评估出世界上信息的数量每二十个月翻一番,并且数据库的数量与大小正在以更快的速度增长。诸如“销售点”或远程传感设备等的电子数据采集设备的增长更加剧了可用数据的爆炸。数据挖掘是一种从这些大型数据库抽提预测信息的方法。数据挖掘未来将变成业界的主要工具,将是在市场上保持商业竞争位的重要因素。数据挖掘与在线分析处理(OLAP)以及决策支持系统(DSS)紧密相关,但又有所不同。
数据挖掘是一种潜在的功能强大的新技术,它能帮助企业在他们的数据仓库中找到最重要的信息。数据挖掘工具能预测未来趋势和行为,使得商务活动具有前瞻性,并作出具有知识驱动的决策。数据挖掘所提供的自动的预期分析已经远远超出由典型的决策支持系统工具对过去事件所做的回顾性分析的范围。数据挖掘工具可以回答传统上需费很多时间解决的商务问题。它能搜遍数据库去查找隐藏的模式,找出那些专家也会错过的预测信息,因为它并不在人们期待的位置上。
在商务和新闻界,数据挖掘很热门。正像闪过我们文化的众多电波一样,现实和浪漫的分离必须引起我们的注意。数据挖掘只是一个有用的工具,一种结合发现和分析的新的方法。数据挖掘不是一个新近才发现的将在软件中具体化的数学分支,当数据库疯狂地加大时,人们不自觉地就需要揭示包含在那些存贮其自身的成千上万的数据记录间的商务洞察信息,并且这些信息是非常重要的。它是一个对那些竞争性的商务将变得日益不可缺少的领域。
编译自:http://faculty.ed.umuc.edu/~jmeinke/inss690/lubel.htm
数据挖掘(Data Mine)简称 DM,其本质就是发现数据实质与数据间的关系的探索过程,找出潜在于数据中的现实事务的规律和趋势,进而把感觉转化为事实。数据挖掘大致可分为三类:关系发现、模式发现、趋势行为发现。数据挖掘技术主要应用于决策支持系统(DSS)。
数据挖掘从技术上讲有如下几种:
神经网络(Neural Networks)、联系发现、分类(连续维?)、分簇(离散维?)、连续发现(基于时间的?)。另外的分法还会有:决策树(Decision Tree)、分类和衰退树(Classification And Regression Tree)、遗传算法(Genetic Algorithm)、规则归纳(Rules Induction)、最近邻居算法(Nearest Neighbor)。正方自动交互发现(Chi Square Automation Interactive Detection, CHAID)。
决策支持系统(DSS)的演变史也是数据挖掘技术的演变史,请看 Wheelhouse 公司的开发部高级主管 Kurt Thearling 博士的 DM 白皮书,该站点也包含一个不错的 DM 的资源列表。
基本历史脉络:数据收集(1960s)、数
第1页/总2页
第一页 上一页
下一页 最后一页
【发表评论】