数据挖掘和数据分析的主要区别
作者:YXN 阅读量:141 发布日期:2021-07-12
数据分析
1)定义:简单来说,数据分析就是对数据进行分析。专业的说法,数据分析是指根据分析目的,用适当的统计分析方法及工具,对收集来的数据进行处理与分析,提取有价值的信息,发挥数据的作用。
3)方法:主要采用对比分析、分组分析、交叉分析、回归分析等常用分析方法;
4)结果:数据分析一般都是得到一个指标统计量结果,如总和、平均值等,这些指标数据都需要与业务结合进行解读,才能发挥出数据的价值与作用。
什么是数据挖掘
1)定义:数据挖掘是指从大量的数据中,通过统计学、人工智能、机器学习等方法,挖掘出未知的、且有价值的信息和知识的过程。
2)作用:数据挖掘主要侧重解决四类问题:分类、聚类、关联和预测(定量、定性),数据挖掘的重点在寻找未知的模式与规律;如我们常说的数据挖掘案例:啤酒与尿布、安全套与巧克力等,这就是事先未知的,但又是非常有价值的信息;
3)方法:主要采用决策树、神经网络、关联规则、聚类分析等统计学、人工智能、机器学习等方法进行挖掘;
4)结果:输出模型或规则,并且可相应得到模型得分或标签,模型得分如流失概率值、总和得分、相似度、预测值等,标签如高中低价值用户、流失与非流失、信用优良中差等。
数据挖掘和数据分析的主要区别
1、数据分析的重点是观察数据,而数据挖掘的重点是从数据中发现“知识规则”KDD。
2、数据分析得出的结论是人的智力活动结果,而数据挖掘得出的结论是机器从学习集(或训练集、样本集)发现的知识规则。
3、数据分析得出结论的运用是人的智力活动,而数据挖掘发现的知识规则,可以直接应用到预测。
4、数据分析不能建立数学模型,需要人工建模,而“数据挖掘”直接完成了数学建模。如传统的控制论建模的本质就是描述输入变量与输出变量之间的函数关系,数据挖掘可以通过机器学习自动建立输入与输出的函数关系,根据KDD得出的“规则”,给定一组输入参数,就可以得出一组输出量。
5、数据分析可分为广义数据分析和狭义数据分析。广义数据分析包括狭义数据分析和数据挖掘。我们通常所说的数据分析是指狭义的数据分析。
数据挖掘和数据分析的区别示例
有一些人总是不及时向电信运营商缴钱,如何发现它们? 数据分析:通过对数据的观察,我们发现不及时缴钱人群里的贫困人口占82%。所以结论是收入低的人往往会缴费不及时。结论就需要降低资费。 数据挖掘:通过编写好的算法自行发现深层次的原因。原因可能是,家住在五环以外的人,由于环境偏远不及时缴钱。结论就需要多设立一些营业厅或者自助缴费点。
YXN
2021-07-12