LOGO2

企业内训

企业内训

当前位置: 首页> 企业内训> 课程体系> 职业技能

SPSS Modeler数据分析与挖掘

课程难度:中高

课程目的

对于很多分析人员来说,缺乏建模的理念会导致分析的低效甚至无效。本课程希望在短短的3天之内,让学员系统的学习建模方法和实施方式,以提升以下能力:

1. 学会建模的概念和建模的全过程

2. 学习各种算法的原理和应用场景,提升数据分析的科学性

3. 学会将建模的结果与业务实施部署结合起来,以分析提升绩效


SPSS Modeler对于未接触过建模工具的学员来说,是最佳的入门工具。由于其界面简单易操作,便于在短时间内完成掌握复杂的统计学算法。

授课对象

各部门的分析岗位中,有一定的基础,并希望学习流程式建模方法的学员。

课程时长

3天

授课方式

理论授课+案例分析+模拟演练

课程大纲

一、 概述


1. SPSS Modeler简介

2. Modeler的CRISP实现

3. Modeler的开发界面简介

案例:一个完整的数据挖掘项目全过程。


二、 数据导入和数据类型设置

1. 数据源类型

2. 字段的测量和角色

3. Type节点描述


三、 数据审核和数据清洗

有问题的数据将带来有问题的结果,因此在分析之前应该对数据进行质量的审核。


1. 数据审核的目的

2. 定性变量和定量变量的不同审核方法

3. 数据审核的步骤

a) 极端值和缺失值的发现

b) 数据分布特征

4. 数据清洗

a) 缺失值处理策略

b) 极端值处理策略

c) 保持数据的一致性

5. 数据处理节点

a) 重新分类

b) 分箱

c) 过滤


四、 数据特征描绘-图形节点

业务分析之时,发现数据的特征或者规律,是一个分析人员必备的技能,本节用图形化的方式,描绘数据中的特征和规律。


1. 常用图形节点

a) 直方图

b) 分布图

c) 多重散点图

d) 时间散点图

2. 图形板工具:向导式图形工具

3. 网络图:数据关系的图形化测度



五、 建模工具简介

1. Modeler模型总体介绍

2. 各算法的适用场景介绍


六、 异常值分析

如何发现异常数据的方法。

1. 异常值分析原理

2. 相关节点

a) 异常值

b) 临近值法


七、 时间序列分析

预测技术可以使工作更具有前瞻性,本节介绍预测的概念和工具。

1. 周期分析

2. 新产品和老产品在时序特征上的不同

3. 主流的时间序列算法

a) 曲线回归

b) ARIMA

c) 指数平滑

4. 相关节点

a) 时间序列

b) 线性

c) 回归


八、 聚类分析

客户细分是大数据时代精确营销的先决条件,聚类分析算法有助于快速对数据进行聚类,找到最佳的客户分类方式。


1. 聚类分析的用途

2. 聚类分析算法

a) 快速聚类

b) 系统聚类

c) 两步聚类

3. 相关节点

a) K-Means

b) 自动聚类

c) 两步


九、 关联规则

关联规则的主要应用在客户行为规律的发现上,典型的应用是购物篮分析,分析客户的购物习惯以提升交叉销售的业绩。


1. 关联规则的原理及应用

2. 关联规则的分类

a) Apriori

b) 序列


十、 分类算法

分类算法的用途很多,以数据库营销的概念为例:传统针对所有客户的群体推送带来成本过高,效率偏低的问题。分类算法的优点在于通过精准的客户定位,提升内容推送的精准度,减少对客户的骚扰,降低成本,缩短时间,提升企业利润。


1. 概述

2. 不同的决策树算法

a) CHAID

b) C&R树

c) Quest

d) C5.0

3. Logistic回归

4. 神经网络

5. SVM

6. 贝叶斯网络

7. 综合案例