数据挖掘技术
被考次数: 2次
被考频率: 低频率
答错率:    39%
知识难度:
考试要求: 掌握     
知识路径:  > 电子商务系统程序设计基础  > Web 设计基础  > 数据库技术  > 数据仓库、联机分析处理和数据挖掘  > 数据仓库、联机分析处理和数据挖掘


本知识点历年真题试卷分布
>> 试题列表    
 

 
       数据挖掘的基本思想就是从数据中抽取有价值的信息,其目的是帮助决策者寻找数据间潜在的关联,发现被忽略的要素,而这些信息对预测趋势和决策行为也许是十分有用的。
       从数据库的角度看,数据挖掘就是这样一个过程,它从数据库的数据中识别出有效的、新颖的、具有潜在效用的并最终可理解的信息(如规则、约束等)的非平凡过程。非平凡是一个数学概念,用来描述其复杂程度,即数据挖掘既不是把数据全部抽取,也不是所有数据都不抽取,而是抽取出隐含的、未知的、可能有用的信息。
       从决策支持的角度看,数据挖掘是一种决策支持的过程,主要基于人工智能、机器学习、统计学和数据库技术等多种技术,能高度自动地分析企业原始的数据,进行归纳推理,从中挖掘出潜在的模式,使系统能通过这些发现的知识来预测客户的行为,帮助企业的决策者调整市场策略,从而减少风险,辅助做出正确的决策。它是提高商业和科学决策过程质量和效率的一种新方法。
       数据挖掘和联机分析处理都可以在数据仓库的基础上对数据进行分析,以辅助决策,那么它们之间是否有差别呢?答案是肯定的。从某种意义上来说,联机分析处理还是一种传统的决策支持方法。即,在某个假设的前提下通过数据查询和分析来验证或否定这个假设,所以联机分析处理是一种验证型的分析。一般来说验证型的分析有如下局限性:
       (1)常常需要以假设为基础。用户的假设能力有限,只能局限于对几种变量进行假设。
       (2)联机分析处理需要对用户的需求有全面而深入的了解,然而实际上有些时候用户的需求并不是确定的。
       (3)抽取信息的质量依赖于用户对结果的解释,容易导致错误。
       我们可以看出,联机分析处理是由用户驱动的,很大程度上受到用户水平的限制。与联机分析处理不同,数据挖掘是数据驱动的,是一种真正的知识发现方法。使用数据挖掘工具,用户不必提出确切的要求,系统能够根据数据本身的规律性,自动地挖掘数据潜在的模式,或通过联想,建立新的业务模型,帮助决策者调整市场策略,并找到正确的决策。这显然利于发现未知的事实。从数据分析深度的角度来看,联机分析处理位于较浅的层次,而数据挖掘则处于较深的层次。所以,联机分析处理和数据挖掘的主要差别就在于是否能自动地进行数据分析。
       近几年,越来越多的联机分析处理产品融入了数据挖掘的方法,所以联机分析处理与数据挖掘间的界限正在逐渐模糊。
 

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2025 All Rights Reserved
软考在线版权所有