数据挖掘概论

发布时间:2025-06

浏览量:104

本文字数:479

读完约 2 分钟

数据挖掘概要

从现有的大量数据中,撷取不明显、之前位置、可能有用的知识

数据挖掘的发展历程

image.png


数据挖掘方法论

数据库中的知识发掘

字段选择

数据清洗

字段扩充

数据编码

    归并数据

数据挖掘

结果报告

数据预处理:

建立数据仓库的过程即是数据预处理的过程,数据预处理是最重要的一个步骤,其重要性和所花费的时间,均居于其他步骤的首位(可能花费60-80%的时间)

有高质量的数据才有高质量的数据挖掘结果


数据挖掘技术的产业标准

IBM SPSS :CRISP-DM

商业理解

数据理解

数据预处理

建模

结果报告

应用部署

image.png

SAS EM :SEMMA

数据取样

数据探索

数据处理

建模

结果报告



image.png


基础数据挖掘技术

探索性数据分析

描述性统计

可视化技术

案例为本的学习


进阶数据挖掘技术

描述性的数据挖掘

关联规则

    找出哪些事件常常一起出现

序列模式

    找出哪些事件常常循序出现

聚类分析

    找出数据间的内部结构


预测型的数据挖掘

分类

    预测数据所隶属的类别

    贝叶斯网络、逻辑回归、决策树、神经网络、支持向量机、K-最近邻

预测

    预测数据所对应的数值

    线性回归、时间序列、决策树、神经网络、支持向量机、K-最近邻


数据分析相关网站

kdnuggets

Kaggle

Data Castle





数据挖掘&算法工程-更多文章

^