分段 |
主题 |
内容 |
第一部份
|
【1】 |
数据挖掘原理 |
数据挖掘发展
贝叶斯公式
大数定律
条件概率
损失函数
二项式分布 |
【2】 |
MATLAB基本统计方法
|
MATLAB基本技能
MATLAB矩阵运算
特征函数与数学期望
各种距离定义
皮尔逊相关系数
斯皮尔曼秩相关系数
【案例】各类统计指标计算 |
第二部份
|
【1】 |
MATLAB数据整理方法
|
MATLAB数据类型
时间数据处理
异常值处理
数据图示化展示
【案例】数据图示化实例 |
【2】 |
Windows自带统计工具箱
|
MATLAB统计量
主成分计算
正态分布
卡方分布
泊松分布
【案例】公共汽车到站概率 |
第三部份
|
【1】 |
MATLAB回归分析
|
线性回归
非线性回归
Robustfit稳健回归
逻辑回归
极大似然函数
回归参数显著性分析
CART分类
C4.5分类
【案例】个人信用评级实例 |
【2】 |
MATLAB时间序列模型 |
偏相关系数分析
ARMA模型
GARCH模型
ARMA-GARCH模型
单位根检验
【案例】沪深A股时间序列模型 |
第四天
|
【1】 |
MATAB智能算法 |
拟退火算法
神经网络模型
SVM支持向量机
决策树模型
【案例】网络入侵智能检测 |
【2】 |
MATLAB聚类分析 |
文本情感分析
K-Means
SOM聚类
朴素贝叶斯(NaiveBayes)聚类
KNN邻近分类
【案例】城市经济结构分类 |
第五部份
|
【1】 |
模型整合 |
Apriori推荐算法
Adaboost多模型整合
随机森林
【案例】网络舆情分析 |
【2】 |
模型评价指标 |
ROC指标
AUC指标
IV值
信息增益
熵理论
【案例】数据挖掘经验分享 |