
内容介绍
随着数据集规模和复杂度的持续上升,分析员必须利用更高级的软件工具来执行间接的、自动的智能化数据分析。《数据挖掘:概念模型方法和算法(第2版)》介绍了通过分析高维数据空间中的海量原始数据来提取用于决策的新信息的尖端技术和方法。本书开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊逻辑和演化计算等学科的具有代表性的、最前沿的挖掘方法和算法。本书还着重描述如何恰当地选择方法和数据分析软件并合理地调整参数。每章末尾附有复习题。本书主要用作计算机科学、计算机工程和计算机信息系统专业的研究生数据挖掘教材,高年级本科生或具备同等教育背景的读者也完全可以理解本书的所有主题。

章节目录
第1章 数据挖掘的概念1.1 概述1.2 数据挖掘的起源1.3 数据挖掘过程1.4 大型数据集1.5 数据仓库1.6 数据挖掘的商业方面:为什么数据挖掘项目会失败1.7 本书结构安排1.8 复习题1.9 参考书第2章 数据准备2.1 原始数据的表述2.2 原始数据的特性2.3 原始数据的转换2.3.1 标准化2.3.2 数据平整2.3.3 差值和比率2.4 丢失数据2.5 时间相关数据2.6 异常点分析2.7 复习题2.8 参考书目第3章 数据归约3.1 大型数据集的维度3.2 特征归约3.2.1 特征选择3 .2.2 特征提取3.3 Relief算法3.4 特征排列的熵度量3.5 主成分分析3.6 值归约3.7 特征离散化ChiMerge技术3.8 案例归约3.9 复习题3.10 参考书目第4章 从数据中学习4.1 学习机器4.2 统计学习原理4.3 学习方法的类型4.4 常见的学习任务4.5 支持向量机4.6 kNN:最近邻分类器4.7 模型选择与泛化4.8 模型的评估4.9 90%准确的情形4.9.1 保险欺诈检测4.9.2 改进心脏护理4.10 复习题4.11 参考书目第5章 统计方法5.1 统计推断5.2 评测数据集的差异5.3 贝叶斯定理5.4 预测回归5.5 方差分析5.6 对数回归5.7 对数-线性模型5.8 线性判别分析5.9 复习题5.10 参考书目第6章 决策树和决策规则6.1 决策树6.2 C4.5算法:生成决策树6.3 未知属性值6.4 修剪决策树6.5 C4.5算法:生成决策规则6.6 CART算法和Gini指标6.7 决策树和决策规则的局限性6.8 复习题6.9 参考书目第7章 人工神经网络7.1 人工神经元的模型7.2 人工神经网络的结构7.3 学习过程7.4 使用ANN完成的学习任务7.4.1 模式联想7.4.2 模式识别7.5 多层感知机7.6 竞争网络和竞争学习7.7 SoM7.8 复习题7.9 参考书目第8章 集成学习8.1 集成学习方法论8.2 多学习器组合方案8.3 bagging和boosting8.4 AdaBoost算法8.5 复习题8.6 参考书目第9章 聚类分析9.1 聚类的概念9.2 相似度的度量9.3 凝聚层次聚类9.4 分区聚类9.5 增量聚类9.6 DBSCAN箅法9.7 BIRCH算法9.8 聚类验证9.9 复习题9.10 参考书目第10章 关联规则10.1 购物篮分析10.2 Apriori算法10.3 从频繁项集中得到关联规则10.4 提高Apriori算法的效率10.5 FP增长方法10.6 关联分类方法10.7 多维关联规则挖掘10.8 复习题10.9 参考书目第11章 Web挖掘和文本挖掘11.1Web挖掘11.2 Web内容、结构与使用挖掘11.3 HITS和LOGSOM算法11.4 挖掘路径遍历模式11.5 PageRank算法11.6 文本挖掘11.7 潜在语义分析11.8 复习题11.9 参考书目第12章 数据挖掘高级技术12.1 图挖掘……第13章 遗传算法第14章 模糊集和模糊逻辑第15章 可视化方法附录A 数据挖掘工具附录B 数据挖掘应用
使用说明
1、下载并解压,得出pdf文件2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读试读>
下载仅供下载体验和测试学习,不得商用和正当使用。
下载体验