COMP4204 数据挖掘教程:从数据仓库、预处理、关联规则到分类与聚类
这篇文章根据 COMP 4204 / DSAI 4204 课程资料整理,主题是数据挖掘的完整工作流。它不是只讲模型,而是从数据仓库、数据预处理和特征工程开始,再进入关联规则挖掘、分类、集成学习、聚类、DBSCAN 和 Web Mining,形成一条从数据组织到模式发现的学习路线。
如果说统计机器学习更关心“模型为什么有效”,数据挖掘更关心的是:
面对真实、混乱、不完整的数据,如何把它整理成可以被分析、建模、解释和部署的知识。