一般来说,” 采矿 “是指在计算机科学的背景下,从地球上提取一些有价值的物质的过程,例如采煤、钻石开采等。” “数据挖掘” 可称为 数据知识挖掘、知识提取、数据/模式分析、数据考古学和数据挖掘 基本上是从大量数据或数据中提取有用信息的过程 数据仓库。 可以看出,这个词本身有点令人困惑。在煤炭或钻石开采的情况下,开采过程的结果是煤炭或钻石。但在数据挖掘的情况下,提取过程的结果不是数据!!相反,数据挖掘结果是我们在提取过程结束时获得的模式和知识。从这个意义上说,我们可以将数据挖掘视为知识发现或知识提取过程中的一个步骤。
格雷戈里·皮亚特斯基·夏皮罗 创造了这个词 “数据库中的知识发现” 1989年。然而,这个词 “数据挖掘” 在商界和新闻界变得更受欢迎。目前,数据挖掘和知识发现可以互换使用。
如今,数据挖掘几乎应用于所有存储和处理大量数据的地方。例如,银行通常使用“数据挖掘”来找出可能对信用卡、个人贷款或保险感兴趣的潜在客户。由于银行拥有客户的交易细节和详细资料,他们会分析所有这些数据,并试图找出模式,帮助他们预测某些客户可能对个人贷款感兴趣,等等。
数据挖掘的主要目的
数据挖掘
基本上,数据挖掘已经与其他领域的许多其他技术相结合,例如 统计学、机器学习、模式识别、数据库和数据仓库系统、信息检索、可视化、, 收集更多有关数据的信息,帮助预测隐藏的模式、未来趋势和行为,并允许企业做出决策。
从技术上讲,数据挖掘是从不同角度、维度、角度分析数据,并将其分类/汇总为有意义信息的计算过程。
数据挖掘可以应用于任何类型的数据,例如。 数据仓库、事务数据库、关系数据库、多媒体数据库、空间数据库、时间序列数据库、万维网。 数据挖掘的全过程 数据挖掘的整个过程包括三个主要阶段:
- 数据预处理——进行数据清理、集成、选择和转换
- 数据提取——精确数据挖掘的出现
- 数据评估和展示——分析和展示结果
在未来的文章中,我们将介绍每个阶段的细节。
数据挖掘的应用
- 财务分析
- 生物分析
- 科学分析
- 入侵检测
- 欺诈检测
- 研究分析
数据挖掘的现实例子
市场篮子分析 :这是一种仔细研究顾客在超市购物情况的技术。这个概念基本上用于识别客户一起购买的商品。比如说,如果一个人买面包,他/她也会买黄油的可能性有多大。这种分析有助于促进公司的报价和交易。在数据挖掘的帮助下也可以做到这一点。
蛋白质折叠: 这是一种仔细研究生物细胞并预测生物细胞内蛋白质相互作用和功能的技术。这项研究的应用包括 阿尔茨海默氏症、帕金森氏症、, 以及蛋白质错误折叠导致的癌症。
欺诈检测: 如今,在这个手机王国,我们可以使用数据挖掘来分析手机活动,以比较可疑的手机活动。这可以帮助我们检测克隆手机上的通话。类似地,使用信用卡时,将购买情况与历史购买情况进行比较,可以发现被盗卡的活动。
数据挖掘也有许多成功的应用,如商业智能、网络搜索、生物信息学、健康信息学、金融、数字图书馆和数字政府。
本文由 希娜·科利 .如果你喜欢GeekSforgek,并想贡献自己的力量,你也可以使用 写极客。组织 或者把你的文章寄去评论-team@geeksforgeeks.org.看到你的文章出现在Geeksforgeks主页上,并帮助其他极客。
如果您发现任何不正确的地方,或者您想分享有关上述主题的更多信息,请写下评论。