五、多维数据透视分析
发布时间:2024-08
浏览量:87
本文字数:2265
读完约 8 分钟
创建一个BI报表要先后使用ETL、DW、OLAP及数据可视化4个不同阶段的软件技术。其中OLAP技术是进行BI分析最为关键的步骤,在该步骤中主要完成两项任务,第一项任务是创建多维数据模型,第二项任务是创建针对度量的汇总计算规则。有了多维数据模型及汇总计算规则,就可以完成针对度量的多维数据透视分析,再通过可视化技术将多维数据透视分析的结果以交互式可视化图表的形式加以呈现,一个BI报表就创建完成了。
一、多维数据模型
多维数据模型中的维度在分析过程中代表业务角度。多维指的就是多个不同的业务角度。多维数据是用来映射多个不同业务角度的数据信息。
1、多维数据模型概述
我们将搭建多维数据模型的过程称为建模。在数据分析领域中有两类不同的建模工作:一类建模工作是搭建多维数据模型,而另一类建模工作是搭建分析所需要的数学模型。
多维数据模型为进行多维数据透视分析提供完整数据信息,有了多维数据模型才能从多角度用数据全面映射业务问题的实际情况。
2、多维数据模型创建方法
影响连接汇总计算结果的要素主要有3个,它们分别是筛选器的方向、对应关系及汇总角色。
筛选器的方向决定了维度字段与度量字段的出处。用维度字段汇总度量字段的过程称为筛选。筛选器分为两类,分别是单向筛选器及双向筛选器。
在一对多的对应关系下,使用单向筛选器进行汇总计算时,应遵循“一表出维度字段是附表,多表出度量字段是主表,一表筛选多表”的规则进行连接汇总计算。
在Power BI工具中,一对一的对应关系默认使用双向筛选器。双向筛选器可以在两表中进行相互筛选
在多表连接环境下,维度表与事实表间可以构成3种不同的连接模型,它们分别是星型模型、雪花模型及星座模型。(1)星型模型:一个事实表和多个维度表相连接构成的连接模型。(2)雪花模型:维度表和其他维度表连接再与事实表连接后构成的连接模型。(3)星座模型:多个事实表与某些维度表连接后构成的连接模型。
二、5W2H思维模型
1、5W2H思维模型概述
5个W构成的单词和2个H构成的短语已经几乎能概括出人类生产 生活的绝大多数事项了,所以我们常用此思维模型来将看上去复杂的事项进行分类概括整理,以便于我们能从纷繁复杂的事项中厘清线索,从而循序渐进地展开分析工作。
2、5W2H思维模型应用案例
销售漏斗模型
首先初步梳理出5W2H各自的框架概念。
(1)What:分析的对象,即销售进度管理。
(2)Why:分析的目的,即为了发现并控制销售阶段风险。
(3)Where:分析的空间维度,即销售地点等。
(4)Who: 分析的参与角色,即买方和卖方(客户、销售人员及渠道商)。
(5)When:分析的时间维度,即围绕商机进展的时间信息。
(6)How much:分析的度量,即商机金额、商机数量、商机规模等。
(7)How to do:方法,即如何制定有效的销售策略才能减少商机成交风险。
接下来继续从框架概念落实数据信息。
(1)What:销售进度管理,即商机维度,包括商机规模、商机号、商机来源等。
(2)Why:控制销售阶段风险,即商机维度,包括销售阶段、上周销售阶段、赢单率等。
(3)Where:销售地点,即销售大区、销售城市、销售的区域等。
(4)Who: 客户、销售人员及渠道商。
① 客户:客户负责人、与客户以往交易情况、客户需求等。
② 销售人员:商机发现者、商机管理者、销售人员能力水平、销售人员成本等。
③ 渠道商:渠道商可提供的相关数据。
(5)When:围绕商机进展的时间信息,即商机创建、预计成交、阶段变化等的时间节点。
(6)How much:分析的度量,即商机金额、商机数量、商机规模等。
(7)How to do:方法,即如何制定有效的销售策略才能减少商机成交风险。
通过5W2H思维模型梳理出数据线索后,就可以进一步使用ETL功能在多个数据源中将需要的数据信息提取、清洗转换、上传到DW中,再进一步就可以使用OLAP技术创建多维数据模型,计算维度项下的度量值,最后用可视化技术将分析结果展示在BI报表内,从而为销售管理人员提供丰富的决策依据。
三、多维数据透视分析应用案例
进销存业务情况的多维分析,分析目的是帮助该经销商优化进销存各环节业务流程行为,实现进销存一体化管理来加快资金的周转速度,以实现企业利润最大化的目的。
经销商的主要业务行为在进、销、存3个业务环节的轮转过程中进行。经销商为了提高利润收入,要想办法提高在单位时间内完成进销存业务周转的次数。提高进销存业务周转的次数就要监控进销存各环节的业务表现情况。当客户缺货时,需要及时供货并同时加大进货量;当客户需求减少造成自己的库存货品积压时,需要及时减少进货并同时加大清仓力度。如果能在每一个客户需求、每一个产品的进货需求上都做到精细把控,就能实现进销存一体化管理,就能让单位时间内的周转速度加快,从而最终实现企业利润最大化的目的。
为了做到对细节问题的精细把控,就需要使用数据对业务流程进行全程监控。为了收集到用于监控的数据内容,就需要先通过5W2H思维模型梳理出数据范围。我们之所以要做这件事情,是因为要优化进销存各环节业务流程行为。该行为的空间维度有哪些?进销存业务涉及的空间维度主要有进货来源、库存场地等。参与的角色有哪些?主要有厂商、经销商和卖场。时间维度有哪些?主要有进货时间、入库时间、出库时间、销售时间及退货时间等。进销存业务分析涉及的度量有哪些?主要有进货金额、进货量、库存量、销售金额、销售量等。
有了数据线索使用ETL技术将数据加载到DW后,就需要为这些数据创建多维数据模型。
进销存业务模型
创建好业务模型后,我们再设计出指标的计算规则,按照可视化方法的要求,设计并制作出可视化报表
可视化报表