()统计学的定义、框架、应用、基本概念,掌握数据分析工作的流程和常用概念。()基础的数据分析方法中描述性统计分析的常用方法,掌握集中趋势(主要是众数、中位数、算术平均数)、离散程度(主要是方差、标准差、离散系数)、分布形态(主要是偏态、峰态)的度量。()复杂的数据分析方法的理论基础——常用的分布,掌握两点分布、二项分布、正态分布(含标准正态分布)、χ分布、t分布、F分布的概念、性质和简单计算应用。
数据分析指用适当的统计、分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
()统计学的定义、框架、应用、基本概念,掌握数据分析工作的流程和常用概念。()基础的数据分析方法中描述性统计分析的常用方法,掌握集中趋势(主要是众数、中位数、算术平均数)、离散程度(主要是方差、标准差、离散系数)、分布形态(主要是偏态、峰态)的度量。()复杂的数据分析方法的理论基础——常用的分布,掌握两点分布、二项分布、正态分布(含标准正态分布)、χ分布、t分布、F分布的概念、性质和简单计算应用。
一、数据库介绍数据库是存储、调用、分析数据的仓库,主要分为关系数据库和非关系数据库。关系数据库关系数据库是用来存放结构化数据的数据库。关系数据库以行和列的形式存储数据,这一系列的行和列被称为表,一组表组成了数据库。非关系数据库非关系数据库是用来存放非结构化数据的数据库,它不像关系数据库局限于固定的结构,而是采取开放式结构来存储数据,其标准也不像关系数据库那样统一,常用的存储标准有键值对,即键(Ke
结构化数据与非结构化数据成为大数据时代背景下的数据主体。结构化数据是指数据结构规范、完整的数据。在使用结构化数据对业务问题进行描述性分析时主要应用的IT工具有电子表格工具、数据库操作语言、ETL工具及数据可视化工具等。非结构化数据是指数据结构不规范、不完整、格式多样、难以理解、难以进行标准化处理的数据。来自企业系统之外的数据,大部分都属于非结构化数据。根据对结构化数据进行加工处理、分析、展现所使用
、数据分析概述数据分析(DataAnalysis)可以被定义为:用适当的分析方法和挖掘方法对收集来的数据进行研究总结,提取有用的信息,形成结论并支持决策的过程。数据分析的分类用于商业决策的数据分析方法主要分为业务描述性分析方法与数据挖掘分析方法两大类。业务描述性分析是以数据为分析对象,以探索数据内的有用信息为主要途径,以解决业务需求为最终目标,包含业务理解、数据采集、数据清洗、数据探索、数据可视化
一、数据分析概述与职业操守(占比 6%) 数据分析概念、方法论、角色(占比1%) 数据分析师职业道德与行为准则(占比1%) 大数据立法、数据安全、隐私(占比4%) 二、数据结构(占比 12%) 表格结构数据特征(占比2%) 表格结构数据获取、引用、查询与计算(占比2%) 表结构数据特征(占比4%) 表结构数据获取、加工与使用(占比4%) 三、数据库应用(占比 17%) 数据库相关概念(占比1%)
语法规则: 正则表达式 regexp_like 的用法详解: ORACLE中的支持正则表达式的函数主要有下面四个: 1, REGEXP_LIKE :与LIKE的功能相似 2, REGEXP_INSTR :与INSTR的功能相似 3, REGEXP_SUBSTR :与SUBSTR的功能相似 4, REGEXP_REPLACE :与REPLACE的功能相似 它们在用法上与Oracle SQL 函数LI
一、什么是窗口函数 窗口函数,也叫OLAP函数(Online Anallytical Processing,联机分析处理),可以对数据库数据进行实时分析处理。 语法大致如下 <窗口函数>over(partition by 分组字段 order by 排序字段)--分组和排序字段不是必须项,视问题情况而定 主要分为3类,分别是聚合窗口函数、排序窗口函数、偏移窗口函数 聚合窗口函数是avg、sum、c
1、从左开始截取字符串 # 语法 SELECT LEFT(str,len) str:被截取的字符串 len:截取长度 # 示例 SELECT LEFT('TF-8220210412003-1', 10) # 结果为:TF-822021012345678 # 语法 SELECT substring(str,len) SELECT substring('123456', 1) # 结果为:1 2、从右