互联网本身具有数字化和互动性的特征,这种属性特征给数据搜集、整理、研究带来了革命性的突破。与传统的数据分析师相比,互联网时代的数据分析师面临的不是数据匮乏,而是数据过剩。因此,互联网时代的数据分析师必须学会借助技术手段进行高效的数据处理。更为重要的是,互联网时代的数据分析师要不断在数据研究的方法论方面进行创新和突破。

四、数据采集与数据预处理(采集方法、市场调研、错误\缺失数据处理)
商业策略分析 427 阅读
四、数据采集与数据预处理(采集方法、市场调研、错误\缺失数据处理)

一、数据采集方法、市场研究中的数据按照数据的收集方式,可以将数据分为实验数据和观测数据。按照描述对象与时间的关系,可以将数据分为时间序列数据、截面数据和面板数据。时间序列数据是按时间顺序在不同时点收集某个个体的多期数据,可以表现研究对象随时间变化的情况。截面数据是在某个时点对不同对象的调查数据,可以表现对象在某个时点的变异情况。面板数据是对一个观测群体进行多个时点的观察,在时间序列上取多个截面,在

三、指标体系与数据可视化(python可视化图表、描述性统计分析与绘图、搭建指标体系)
商业策略分析 392 阅读
三、指标体系与数据可视化(python可视化图表、描述性统计分析与绘图、搭建指标体系)

对于不同层级的决策而言,有一个统一的指标体系是支持决策的关键。第一,统一规范,如在机构范围内形成对指标的一致认识,避免出现“同名不同义”“同义不同名”等容易产生混淆和歧义的情况;第二,用数服务,如未来为公司不同业务用户自主灵活地用数和查询统计提供良好的指标基础,为用户提供用数服务,引导用户自主用数,提升数据使用能力;第三,决策支持,如从企业业务战略的高度梳理并展现业务经营、财务、风险、绩效等方面的

二、数据处理(Pandas读写数据、数据查询/类SQL操作、数据清洗)
商业策略分析 320 阅读
二、数据处理(Pandas读写数据、数据查询/类SQL操作、数据清洗)

在实际的数据处理工作中,经常需要同时处理多张表,以及对多张表的字段进行合并、提取等操作。本章主要介绍数据处理的基本方法,包括数据读取、数据整合及数据清洗。一、使用pandas读取结构化数据pandas是Python中的一个库,它是基于NumPy开发的更高级的结构化数据分析工具,提供Series、DataFrame等数据结构,可以很方便地对序列、截面数据(二维表)进行处理。DataFrame即我们常

一、EDIT模型概述
商业策略分析 366 阅读
一、EDIT模型概述

在“感知型企业”的概念中,把企业分为个不同的阶段,分别是敏捷分析阶段、行为数据阶段、协同思维阶段、分析应用阶段和自主决策阶段。在敏捷分析阶段,主要针对业务宏观方面的分析,如财务报表、财务报告或经营分析等,希望能够从业务宏观角度把控结果。行为数据就是用户与企业交互中产生的动账类数据和非动账类数据。在行为数据阶段,我们其实需要预测用户未来的行为是什么。在进行预测时,我们是在用户个体层面上进行分析、建立

商业策略分析 327 阅读
商业策略数据分析概貌

PART 1 数据采集与处理(占比9%) a.数据采集方法(占比1%) b.市场调研和数据录入(占比 3%) 市场调研流程 样本选取 问卷设计及录入 c.数据探索与可视化(占比2%) d.数据预处理方法(占比3%) PART 2 指标体系(占比3%) a.指标标准 b.指标体系的定义和意义 c.构建指标库 PART 3 数据治理与数据模型管理(占比6%) a.数据治理(占比3%) 数据治理的驱动因

七、业务分析报告与数据可视化报表
业务数据分析 246 阅读
七、业务分析报告与数据可视化报表

业务分析工作的最终产出结果主要包括分析报表与分析报告两部分内容。一、可视化分析图表通过数据分析得到的结果一般以图或者表的形式呈现给阅读者。使用合适的图表展示不同的分析结果有助于提高数据信息的传递效果。正确的图表可以帮助阅读者快速、全面及准确地理解数据分析结果背后的业务意义。、业务图表决策树在业务图表决策树中,根据使用方式的不同将各种图表归类为比较、序列、构成及描述种不同类别业务图表决策树、比较类图

六、业务分析方法
业务数据分析 271 阅读
六、业务分析方法

业务分析方法的三个主要构成部分——业务指标分析、业务模型分析及业务分析方法论。一、业务指标分析业务指标分析方法是业务分析方法的核心内容。指标是某种观测或行为的数值量化方法,而具体量化计算后得到的数值结果则被称为指标值。指标值的作用是帮助阅读者观测企业经营结果好坏情况的窗口。阅读者通过指标值,可及时发现企业经营过程中的问题,并及时想办法解决问题,未来才能得到更为理想的经营结果。为了得到有参考价值的指

五、多维数据透视分析
业务数据分析 221 阅读
五、多维数据透视分析

创建一个BI报表要先后使用ETL、DW、OLAP及数据可视化个不同阶段的软件技术。其中OLAP技术是进行BI分析最为关键的步骤,在该步骤中主要完成两项任务,第一项任务是创建多维数据模型,第二项任务是创建针对度量的汇总计算规则。有了多维数据模型及汇总计算规则,就可以完成针对度量的多维数据透视分析,再通过可视化技术将多维数据透视分析的结果以交互式可视化图表的形式加以呈现,一个BI报表就创建完成了。一、

四、描述性统计分析
业务数据分析 281 阅读
四、描述性统计分析

()统计学的定义、框架、应用、基本概念,掌握数据分析工作的流程和常用概念。()基础的数据分析方法中描述性统计分析的常用方法,掌握集中趋势(主要是众数、中位数、算术平均数)、离散程度(主要是方差、标准差、离散系数)、分布形态(主要是偏态、峰态)的度量。()复杂的数据分析方法的理论基础——常用的分布,掌握两点分布、二项分布、正态分布(含标准正态分布)、χ分布、t分布、F分布的概念、性质和简单计算应用。

三、数据库应用
业务数据分析 242 阅读
三、数据库应用

一、数据库介绍数据库是存储、调用、分析数据的仓库,主要分为关系数据库和非关系数据库。关系数据库关系数据库是用来存放结构化数据的数据库。关系数据库以行和列的形式存储数据,这一系列的行和列被称为表,一组表组成了数据库。非关系数据库非关系数据库是用来存放非结构化数据的数据库,它不像关系数据库局限于固定的结构,而是采取开放式结构来存储数据,其标准也不像关系数据库那样统一,常用的存储标准有键值对,即键(Ke

^