搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
技术学习(版主发帖区)
›
大数据扩展学习
›
数据挖掘
›
介绍解说
›
什么是数据挖掘?
0
1
0
分享
什么是数据挖掘?
InSight
2014-10-27 22:06:10
发表于
介绍解说
[显示全部楼层]
阅读模式
关闭右栏
1
10293
About云VIP帮助找工作和提升
问题导读:
1.什么是数据挖掘?
2.为什么现在就要学习它?
什么是数据挖掘?
是
知识发现、商业智能、预测分析还是预测建模。其实都可以归为一类:数据挖掘是一项探测大量数据以发现有意义的模式(pattern)和规则(rule)的业务流程。
这里谈到了发现模式与规则,其实就是一项业务流程,为业务服务。而我们要做就是让业务做起来显得更简单,或直接帮助客户如何提升业务
。在大量的数据中找到有意义的模式和规则。
在大量数据面前,数据的获得不再是一个障碍,而是一个优势。在现在很多的技术在大数据集上比在小数据集上的表现得更好——
你可以用数据产生智慧
,也可以用计算机来完成其最擅长的工作:提出问题并解决问题。模式和规则的定义:就是发现对业务有益的模式或规则。发现模式就意味着把保留活动的目标定位为最有可能流失的客户。这就意味着优化客户获取资源,既考虑客户数量上的短期效益,同时也考虑客户价值的中期和长期收益。
而在上面的过程,最重要的一点就是:
如何通过数据挖掘技术来维护与客户之间的关系,这就是客户关系管理,CRM。
专注于数据挖掘在营销和客户关系管理方面的应用——例如,为交叉销售和向上销售改进推荐,预测未来的用户级别,建模客户生存价值,根据用户行为对客户进行划分,为访问网站的客户选择最佳登录页面,确定适合列入营销活动的候选者,以及预测哪些客户处于停止使用软件包、服务或药物治疗的风险中。
两种关键技术:生存分析、统计算法。在加上文本挖掘和主成分分析。
经营有方的小店自然地形成与客户之间的学习关系。随着时间的推移,他们对客户的了解也会越来越多,从而可以利用这些知识为他们提供更好的服务。
结果是:忠实的顾客和盈利的商店。
但是拥有数十万或数百万客户的大公司,则不能奢望与每个客户形成密切的私人关系。面临这样困境,他们必须要面对的是,学会充分利用所拥有的大量信息——几乎是每次与客户交互产生的数据。这就是如何将客户数据转换成客户知识的分析技术。
数据挖掘是一项与业务流程交互的业务流程。数据挖掘以数据作为开始,通过分析来启动或激励行为,这些行为反过来又将创建更多需要数据挖掘的数据。
因此,对于那些充分利用数据来改善业务的公司来说,不应仅仅把数据挖掘看作是细枝末节。相反,
在业务策略上必须包含:1、数据收集。2、为长期利益分析数据。3、针对分析结果做出分析。
CRM(客户关系管理系统)。在各行各业中,高瞻远瞩的公司的目标都是理解每个客户,并通过利用这种理解,使得客户与他们做生意更加容易。同样要学习分析每个客户的价值,清楚哪些客户值得投资和努力来保留,哪些准许流失。把一个产品为中心的企业转变成以客户为中心的企业的代价超过了数据挖掘。假设数据挖掘的结果是像一个用户推荐一个小首饰而不是一个小发明,但是如果经理的奖金取决于小发明的季度销售量而不是小首饰的销售量(即便后者更为有利可图或者收获长期盈利更多的客户),那么数据挖掘的结果就会被忽视,这就导致挖掘结果不能产生决策。
为什么是现在要学会它?
数据正在产生,不断的产生,不断的更新
数据正在存储在数据仓库中——数据仓库以一个共同的格式汇集许多不同来源的数据,具有一致格式的关键字和字段定义。业务系统旨在快速向终端提供结果,就对数据的格式和字段有额外的要求。数据仓库的建立是为提供决策而设计,简化数据挖掘工作者的工作。
计算能力能够承受
对客户关系管理的兴趣非常强烈
商业的数据发掘软件已经形成
数据挖掘人员的技能:需要有数字技能;Excel表格使用能力,现在Excel表格处理能力相当强大。自从Office 365出来之后,此势不可小觑。
一种态度:不畏惧为了得到结果可能需要处理大数据量和复杂的过程。处理大型数据集、数据仓库以及分析沙箱是数据挖掘成功的关健。数据挖掘不仅仅是产生技术结果,结果必须用来帮助人们(或者帮助越来越多自动化的流程)做出更明智的决定。产生技术结果只是第一步,通过结果了解真正的需求,把结果转化为信息,信息转化为行动,行动转化为价值,才是真正的目的。
数据挖掘的良性循环的重心在于业务的结果,而不只是利用先进的技术。
识别业务机会
挖掘数据将其转换成可操作的信息
根据信息采取行动
度量结果
数据挖掘成功的关键是把其结合到业务流程中,并能够促进数据挖掘人员和使用结果的业务用户之间的通信。首先,必须明确,找到合适的业务需求,很多的人员,没有在意这一点,导致解决的是对业务没有帮助的问题。
在面临不断日新的社会,进步,远不在改变,而在与变中的不变。即使改变时绝对的,但是仍有未改进之处以及没有可能改变的方向:如果经验不会保留,永远保持幼年,那些不吸取教训的人,注定要重蹈覆辙。
当与业务人员讨论数据挖掘的机会时,确保重心在业务而不是技术和算法。让我们的技术专家专注技术,同时让我们业务专家专注业务。
转。
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(1)人评论
电梯直达
正序浏览
永无止进
发表于 2014-10-28 20:18:50
学习学习了
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
InSight
中级会员
关注
33
主题
141
帖子
11
粉丝
TA的主题
从机器学习谈起【推荐】
2015-5-11
solr添加中文IK分词器,以及配置自定义词库
2015-5-11
京东私有云建设:挑战与应对之道
2015-5-8
Hive作为Mondrian的数据源
2015-5-5
Win7下面安装hadoop2.x插件及Win7/Linux运行MapReduce程序
2015-5-4
24小时热文
Flink CDC:新一代实时数据集成框架
蚂蚁面试就是不一样
如何高效学习
人情世故速查速用大全集
框架思维
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈