数据挖掘在电子商务中的应用
被考次数: 2次
被考频率: 低频率
答错率:    19%
知识难度:
考试要求: 了解     
知识路径:  > 信息系统数据资源维护  > 信息系统数据资源的开发与利用  > 信息系统数据资源的开发与利用方法  > 信息系统数据资源的开发与利用


本知识点历年真题试卷分布
>> 试题列表    
 

 
       由于数据挖掘能带来显著的经济效益,它在电子商务中(特别是金融业、零售业和电信业)应用也越来越广泛。
       在金融领域,管理者可以通过对客户偿还能力以及信用的分析,进行分类,评出等级。从而可减少放贷的麻木性,提高资金的使用效率。同时还可发现在偿还中起决定作用的主导因素,从而制定相应的金融政策。更值得一提的是,通过对数据的分析还可发现洗黑钱以及其他的犯罪活动。
       在零售业,数据挖掘可有助于识别顾客购买行为,发现顾客购买模式和趋势,改进服务质量,取得更好的顾客保持力和满意程度,提高货品销量比率,设计更好的货品运输与分销策略,减少商业成本。
       电信业已经迅速地从单纯的提供市话和长话服务演变为综合电信服务,如语音、传真、寻呼、移动电话、图像、电子邮件、计算机和Web数据传输以及其他的数据通信服务。电信、计算机网络、因特网和各种其他方式的通信和计算的融合是目前的大势所趋。而且随着许多国家对电信业的开放和新型计算与通信技术的发展,电信市场正在迅速扩张并越发竞争激烈。因此,利用数据挖掘技术来帮助理解商业行为、确定电信模式、捕捉盗用行为、更好地利用资源和提高服务质量是非常有必要的。分析人员可以对呼叫源、呼叫目标、呼叫量和每天使用模式等信息进行分析,还可以通过挖掘进行盗用模式分析和异常模式识别,从而可尽早发现盗用,为公司减少损失。
       数据挖掘的具体应用方面
       (1)找到潜在客户。在对Web的客户访问信息的挖掘中,利用分类技术可以在因特网上找到未来的潜在客户。使用者可以先对已经存在的访问者根据其行为进行分类,并依此分析老客户的一些公共属性,决定他们分类的关键属性及相互间关系。对于一个新的访问者,通过在Web上的分类发现,识别出这个客户与已经分类的老客户的一些公共的描述,从而对这个新客户进行正确的分类。然后从它的分类判断这个新客户是有利可图的客户群还是无利可图的客户群,决定是否要把这个新客户作为潜在的客户来对待。客户的类型确定后,可以对客户动态地展示Web页面,页面的内容取决于客户与销售商提供的产品和服务之间的关联。若为潜在客户,就可以向这个客户展示一些特殊的、个性化的页面内容。
       (2)实现客户驻留。在电子商务中,传统客户与销售商之间的空间距离已经不存在,在因特网上,每一个销售商对于客户来说都是一样的,那么使客户在自己的销售站点上驻留更长的时间,对销售商来说则是一个挑战。为了使客户在自己的网站上驻留更长的时间,就应该全面掌握客户的浏览行为,知道客户的兴趣及需求所在,并根据需求动态地向客户做页面推荐,调整Web页面,提供特有的一些商品信息和广告,以使客户满意,从而延长客户在网站上驻留的时间。
       (3)改进站点的设计。数据挖掘技术可提高站点的效率,Web设计者不再完全依靠专家的定性指导来设计网站,而是根据访问者的信息特征来修改和设计网站结构和外观。站点上页面内容的安排和连接就如超级市场中物品的货架摆布一样,把具有一定支持度和信任度的相关联的物品摆放在一起有助于销售。网站尽可能做到让客户轻易地访问到想访问的页面,给客户留下好的印象,增加下次访问的概率。
       (4)进行市场预测。通过Web数据挖掘,企业可以分析顾客的将来行为,容易评测市场投资回报率,得到可靠的市场反馈信息。不仅大大降低公司的运营成本,而且便于经营决策的制定。
       面向电子商务的数据挖掘过程
       一般的数据挖掘的流程如下图所示。
       
       数据挖掘流程
       面向电子商务的数据挖掘过程可以分为以下3个步骤。
       (1)准备数据。进行数据挖掘的时候,一般并不是对原始的数据进行挖掘,而是先要对数据作一些预处理,包括合并数据,将多个文件或多个数据库中的数据进行合并处理;选择数据,提取出适合分析的数据集合;数据清洗、过滤,剔除一些无关记录,将文件、图形、图像及多媒体等文件转换成可便于数据挖掘的格式等。
       (2)发现模式。根据不同的挖掘目标,可以相应采用不同的挖掘方法,得到有意义的数据模式。数据挖掘的方法有很多种,主要包括3大类:统计分析、知识发现、其他可视化方法。统计分析方法主要用于检查数据中的数据规律,然后利用统计模型和数学模型来解释这些规律,通常使用的统计方法有线性分析、非线性分析、线性回归、因子分析,单变量曲线和双变量统计以及时间序列分析等。知识发现方法源于人工智能和机器学习,利用数据搜寻过程,得到一个有意义的数据模式,从中可以发现规律。可视化方法可以给出多变量的图形分析,同时显示多变量间的关系,有助于分析以前挖掘的数据,进一步增强数据挖掘能力。
       (3)分析、解释模式。通过技术手段,对得到的模式进行数据分析,得出有意义的结论。常用的技术手段有:①关联规则,揭示数据之间的内在的联系,发现用户与站点各页面的访问关系。②分类,给出类的公共属性描述,并将新的记录分配到预先定义好的类中去或分类新的项。③聚类,分类的逆过程,按照“类内相似性最大,类间相似性最小”的原则,对数据进行类的聚集,多指客户群体聚类和Web网页聚类。客户群体聚类将具有相似浏览模式的用户分在一组,而Web网页聚类提供有针对性的网络服务应用。④序列模式,侧重于挖掘出数据的前后时间顺序关系,分析是否存在一定趋势,以预测未来的访问模式。⑤路径分析,可以发现一个Web站点中最经常被访问的路径。
 

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2025 All Rights Reserved
软考在线版权所有