如何用Excel做数据分析?

伙伴云伙伴云
3分钟阅读
2022-03-24
分享
微信扫码查看分享

对于高级的数据分析而言,不一定非得求助于SPSS,SAS这类专业的分析工具,有时候Excel的数据分析功能也能实现从低级到高级层次的跳跃~ 

so,这里给你介绍几种Excel在数据分析里的实际应用~ 

1、数据透视表 

数据透视表是一种交互式的表,可以对数据的不同项目进行快速地统计,并且动态地改变数据的版面布置,让分析以不同的角度来分析数据。 

Excel的数据透视表是一个强大的工具,它可以将海量数据做成各种报表,并实现报表数据的快速切换。 

还可以对数据进行统计、排序、筛选。使用交互工具,如切片器、日程表,可以从项目名称和时间的角度动态地查看数据。 

举个栗子: 

货物销售数据量十分大,每天都会产生大量的销量数据,如下图所示,仅仅只是销售数据的冰山一角。面对这样的如何,如何快速分析,不同日期下,不同商品的销量?不同地区的销量?不同商品的售价波动情况?不同地区的退货量?不同销售员的总销量大小?不同销售员的退货总量大小? 


答案是将海量数据建立成数据透视表,可以通过选择字段的方式,快速切换数据版面,从不同的角度汇总商品数据。 


【切片器】功能可以通过交互动态的查看数据,如下图所示,选择需要查看的条件(王强销售员的相关数据),就能快速显示符合条件的数据。 


2、图表 

数据分析少不了图表分析,图表不仅是后期制作数据报告时,数据展现的重要形式,还能在数据分析过程,以直观的方式带给分析者“灵感”,发现数据中隐藏的信息量。 

在Excel中,选中数据后,打开【插入图表】对话框,可以看到所提供的图表类型,一共15种图表类型,每一种图表类型下,又细分为多种形式的图表。 

Excel图表的种类如此丰富,基本能覆盖90%的数据分析需求。 

两个注意点:可以将图表的格式设置好后,添加到【模板】中,方便下次快速调用;图表的呈现形式是多种多样的,通过调整布局元素的格式,可以制作出效果丰富、惊人的图表。重在不要固化思维,多思考与数据切合的呈现形式。 


3、条件格式

条件格式适用于表格数据的分析,通过更改表格数据的格式,让分析者快速掌握表格数据的概况。 


1)快速找出符合要求的数据:使用【突出显示单元格规则】菜单中的选项,可以快速找出符合一定数值范围的单元格数据,并为这些数据单元格填充底色突出显示; 

2)找出数值排名靠前、靠后的数据:利用【最前/最后规则】选项可以突出显示数值排名靠前多少位、靠后多少位的单元格数据; 

3)根据单元格数据大小添加长短不一的数据条,通过数据条的长度来快速判断单元格数据大小的分布,方法是使用【数据条】选项功能; 

4)根据单元格数据大小添加颜色深浅不一的数据条,通过数据条的颜色深浅来快速判断单元格数据大小的分布,方法是使用【色阶】功能; 

5)为单元格中不同类型的数据添加图标,以示区分,方法是使用【图标集】选项功能;通过函数实现更复杂的数据突出显示功能。 

6)通过【新建规则】选项,可以编写函数同,实现更复杂的单元格数据显示。

4、分类汇总

分类汇总提供了将数据以不同形式汇总的功能。比如如果需要统计不同数据项目的总和,以便对数据的总数值有一个了解,同时对比各项目的总和大小等等场景。 

举个例子: 

原始表格中,包含多个项目,有产品名称、型号、销售部门、销量、日期、单价、销售额项目,使用分类汇总功能: 

  • 可以汇总不同日期下的商品销量、销售额; 
  • 汇总不同销售部门的商品销量、销售; 
  • 汇总不同商品的销量、销售额; 
  • 汇总不同商品型号的销量、销售额。 

针对一份数据的不同汇总要求,均能快捷简便地实现。如下图所示,是汇总不同日期下销售额总值的效果。 


5、回归分析 

这个算是Excel在数据分析里比较高级的功能了,在详细进行回归分析之前,首先要理解什么叫回归? 

实际上,回归这种现象最早由英国生物统计学家高尔顿在研究父母亲和子女的遗传特性时所发现的 一种有趣的现象:身高这种遗传特性表现出”高个子父母,其后代身高也高于平均身高;但不见得比其父母更高,到一定程度后会往平均身高方向发生’回归’”。 这种效应被称为”趋中回归”。 

现在的回归分析则多半指源于高尔顿工作的那样一整套建立变量间的数量关系模型的方法和程序。 这里的自变量是父母的身高,因变量是子女的身高。 

这里举个电商的例子:电子商务的转换率是一定的,网站访问数一般正比对应于销售收入,现在要建立不同访问数情况下对应销售的标准曲线,用来预测搞活动时的销售收入,如下所示: 


在使用之前,首先得安装Excel的数据分析功能,默认情况下,Excel是没有安装这个扩展功能的,安装如下所示: 

1)鼠标悬浮在Office按钮上,然后点击【Excel选项】: 


2)找到【加载项】,在管理板块选择【Excel加载项】,然后点击【转到】: 


3)选择【分析工具库】,点击【确定】: 


4)安装完后,就可以【数据】板块看到【数据分析】功能,如下所示: 


接下来,我们看下它的实操应用。 

1、首先,利用散点图描绘图形: 



2. 添加趋势线,并且显示回归分析的公式和R平方值: 



从图得知,R平方值=0.9995,趋势线趋同于一条直线,公式是:y=0.01028x-27.424 

R 平方值是介于 0 和 1 之间的数字,当趋势线的 R 平方值为 1 或者接近 1 时,趋势线最可靠。因为R2 >0.99,所以这是一个线性特征非常明显的数值,说明拟合直线能够以大于99.99%地解释、涵盖了实际数据,具有很好的一般性, 能够起到很好的预测作用。 

3. 使用Excel的数据分析功能 

1)点击【数据分析】,在弹出的选择框中选择【回归】,然后点击【确定】: 


2)【X值输入区域】选择访问数的单元格,【Y值输入区域】选择销售额的单元格,同时勾选如下所示的选项,包括残差、标准残差、残差图、线性拟合图和正态概率图。 


3)以下内容是残差和标准残差: 



4)以下是残差图: 


残差图是有关于实际值与预测值之间差距的图表,如果残差图中的散点在中轴上下两侧分布,那么拟合直线就是合理的,说明预测有时多些,有时少些,总体来说是符合趋势的,但如果都在上侧或者下侧就不行了,这样有倾向性,需要重新处理。 

5)以下是线性拟合图: 


在线性拟合图中可以看到,除了实际的数据点,还有经过拟和处理的预测数据点,这些参数在以上的表格中也有显示。 

6)以下是正态概率图 


正态概率图一般用于检查一组数据是否服从正态分布,是实际数值和正态分布数据之间的函数关系散点图,如果这组数值服从正态分布,正态概率图将是一条直线。回归分析不一定得符合正态分布,这里只是仅仅把它描绘出来而已。 

以上数据表格和图表都说明公式y=0.01028x-27.424是一个值得信赖的预测曲线,假设搞活动时流量有50万访问数的话,那么预测销售将是51373,如下图所示: 


不过实话实说,用excel做数据分析报表或多或少还是有一定的使用门槛的,需要有持久的定力外加百分之200%的专注度和探索精神。

立即开启零代码之旅
免费使用