理论(32 学时)
第 1 周 数据挖掘介绍(2 学时)
本次课程介绍什么是数据挖掘,包含数据挖掘的主要任务、被挖掘的有用信息、常用的技术手段及应用等。
第 2 周 数据预处理(2 学时)
本次课程介绍与数据相关的一些问题,包含数据类型、数据质量及数据预处理的常用技术等。
第 3-5 周 分类:概念与常用模型 (6 学时)
本次课程主要介绍分类的基本概念和常用技术,包含逻辑回归、决策树、临近分类、贝叶斯分类、支持向量机、集成学习
等模型和方法。
理论课 6-7(4 学时):回归:概念、常用线性及非线性回归模型
本次课程主要介绍回归的基本概念和常用技术,包含线性回归、多项式回归、岭回归、神经网络、RBF 模型、高斯过程
回归模型等。
理论课 8-9(4 学时):关联分析:概念及常用技术
本次课程主要介绍关联分析的概念及常用技术,包含频繁项集产生、规则产生、关联模式评估等。
理论课 10-11(4 学时):聚类分析:概念及常用算法
本次课程介绍聚类的概念和常用算法,包含 k-均值、层次聚类、基于密度的聚类、簇评估等方法。
理论课 12(2 学时):异常检测
本次课程介绍异常检测的概念和方法,包含基于统计、临近度、密度、聚类等的方法。
理论课 13(2 学时):文本挖掘简介
本次课程简要介绍文本挖掘的一些概念,包含词频、词袋模型、词向量模型、词频-逆文档频率、N-Gram 模型等。
理论课 14(2 学时):模型评估