数据分析、数据挖掘、大数据的区别
小职 2020-10-21 来源 : 阅读 1036 评论 0

摘要:在大数据领域里,经常会看到例如数据挖掘、数据分析、大数据数据等等的专业词汇。如果仅仅从字面上,我们很难说清楚每个词汇的意义和区别。本篇介绍了数据分析、数据挖掘、大数据的区别,希望对大数据相关的的学习能有所帮助。

在大数据领域里,经常会看到例如数据挖掘、数据分析、大数据数据等等的专业词汇。如果仅仅从字面上,我们很难说清楚每个词汇的意义和区别。本篇介绍了数据分析、数据挖掘、大数据的区别,希望对大数据相关的的学习能有所帮助。

数据分析、数据挖掘、大数据的区别

在大数据领域里,经常会看到例如数据挖掘、数据分析、大数据数据等等的专业词汇。如果仅仅从字面上,我们很难说清楚每个词汇的意义和区别。很多人在刚入门的时候,这几个概念经常会分不清,问十个人这几个词的意思,你可能会得到十五种不同的答案。

今天,我们就来通过一些例子,来为大家说明白—数据挖掘、大数据、数据分析的区别。


先看看数据分析与数据挖掘的区别:

首先要搞懂,什么是数据,什么是信息,这两者本质的区别就是数据是存在的,不用人脑,而信息是需要人脑进行处理。


▶ 例如你要为家里买一个新衣橱,那么首先就是要去测量室内各处的长、宽、高,而这些数据都是客观存在的,我们只需要测量就能得到,这些就是数据。

而信息却不同,你来到家具商场购买衣橱,你会说,我们放3米的衣橱放在房间刚刚好,2米的有些短,看着不大气,4米的又太大了,忒贵!那这种就属于信息,是需要人们经过大脑去主观判断的,而判断的依据就是数据(客观存在)。


其次,数据分析是对客观存在的已知的数据,通过各类维度的分析,得出一个结论。


▶ 例如我们发现用户注册量下降:

可以从:

区域上看,某区域的注册量下降了x%

渠道方面,搜索引擎带来的注册了下降了X%

年龄来看,20岁~30岁的注册量下降了X%

等等,这样不同的业务类型去看过去一段时间发展的趋势来做结论判断。


数据挖掘则更注重洞察数据本身的关系,从而获得一些非显型的结论,这是我们从数据分析中无法得到了,例如关联分析可以知道啤酒与尿布的关系、决策树可以知道你购买的概率、聚类分析可以知道你和谁类似,等等,重在从各个维度去发现数据之间的内在联系


因此两者的目的不一样,数据分析是有明确的分析群体,就是对群体进行各个维度的拆、分、组合,来找到问题的所在,而数据发挖掘的目标群体是不确定的,需要我们更多是是从数据的内在联系上去分析,从而结合业务、用户、数据进行更多的洞察解读。


▶ 例如一个人想找一个女朋友,他可以很快很容易的知道这个女孩的身高、收入、学历等情况,但是无法从这些数据中得知这个女孩是否适合自己、她的性格与自己是否能够相处融洽……这时我他就需要从一些日常行为的数据进行推断,一种是主观的推断,他觉得、他估计、他认为,能不能在一起。


另一种是客观+主观的推断,比如整合社交平台数据(可以知道朋友圈、微博的日常内容、兴趣爱好等等),和自己的行为进行数据挖掘,来看看数据内在的匹配度有多少,这时候,他就可以判断出,他们在一起的概率有99%,从而建立信心,开始行动.....


当然统计学上讲,100%的概率都未必发生,0%的概率都未必不发生,这只是小概率事件,不要让这个成为你脱单的绊脚石。


最后,思考的方式不同,一般来讲,数据分析是根据客观的数据进行不断的验证和假设,而数据挖掘是没有假设的,但你也要根据模型的输出给出你评判的标准。

我们经常做分析的时候,数据分析需要的思维性更强一些,更多是运用结构化、MECE的思考方式,类似程序中的IF else

分析框架(假设)+客观问题(数据分析)=结论(主观判断)

而数据挖掘大多数是大而全,多而精,数据越多模型越可能精确,变量越多,数据之间的关系越明确

什么变量都要,先从模型的意义上选变量(大而全,多而精),之后根据变量的相关系程度、替代关系、重要性等几个方面去筛选,最后全扔到模型里面,最后从模型的参数和解读的意义来判断这种方式合不合理。


分析更多依赖于业务知识,数据挖掘更多侧重于技术的实现,对于业务的要求稍微有所降低,数据挖掘往往需要更大数据量,而数据量越大,对于技术的要求也就越高需要比较强的编程能力,数学能力和机器学习的能力。

从结果上来说,数据分析更多侧重的是结果的呈现,需要结合业务知识来进行解读。而数据挖掘的结果是一个模型,通过这个模型来分析整个数据的规律,一次来实现对于未来的预测,比如判断用户的特点,用户适合什么样的营销活动。显然,数据挖掘比数据分析要更深一个层次。

数据分析是将数据转化为信息的工具,而数据挖掘是将信息转化为认知的工具。


以上就是我认为的三个区别,其实不论数据分析还是数据挖掘,能抓住老鼠的就是好猫,真的没必要纠结他们之前的区别,难道你给领导汇报时,第一部分是数据分析得出,第二部分是数据挖掘得出?他们只关注你分析的逻辑、呈现的方式。


大数据对我的感觉并不是数据量大,也不是数据复杂,这些都可以用工具和技术去处理,而是它可以做到千人千面,而且是实时判断规则。


▶ 例如定向广告的推送,就是大数据,它根据你以往的浏览行为,可以准确的给你推相关的信息,基本做到了你一个人就是一个数据库,而不是一条数据。但我们所作的数据分析更多是针对群体的,而非针对每个个人。要做到千人前面,侵犯你隐私数据是避免不了的,或多或少都有知道一些,而做到千人千面的大数据不就是要更多的了解你,引导你、杀你、留住你吗?为了达到这类手段,就要不断的去完善自家数据,甚至要购买数据来360度的让你在数据下裸奔,从而解决数据孤岛的问题。


所以大数据时代也显露出了各类问题,数据的隐私、数据杀熟、数据孤岛等,这也许就是我们目前看到大数据分析更看重的是技术、手段的原因,它其实是一门纯技术,但有时候确实可能需要艺术。


在数据君看来,我们不需要纠结所谓的“专业名词”,作为一个数据分析师,我们的目标是帮助业务更好的发展、减少决策的风险、提取重要的信息,所以业务的套路和理解才是我们的立足之本,数据分析毕竟是我们达成某种目标的工具,疗效才是对我们更深层次的验证。


在小职看来,我们不需要纠结所谓的“专业名词”,作为一个数据分析师,我们的目标是帮助业务更好的发展、减少决策的风险、提取重要的信息,所以业务的套路和理解才是我们的立足之本,数据分析是我们达成某种目标的工具,疗效才是对我们更深层次的验证。



关注“职坐标在线”公众号,免费获取最新技术干货教程资源哦!

本文由 @小职 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程