数据挖掘原理与算法(第3版)教师用书

当前位置:首页 > 教材 > 研究生/本科/专科教材 > 数据挖掘原理与算法(第3版)教师用书

  • 版 次:1
  • 页 数:103
  • 字 数:168000
  • 印刷时间:2017年03月01日
  • 开 本:128开
  • 纸 张:胶版纸
  • 包 装:平装-胶订
  • 是否套装:否
  • 国际标准书号ISBN:9787302451211
  • 丛书名:21世纪高等学校计算机专业核心课程规划教材
作者:毛国君出版社:清华大学出版社出版时间:2017年03月 
编辑推荐
本书为《数据挖掘原理与算法(第3版)》配套的教学用书。书中提供了习题答案、各章授课内容重点与课时分配、课时安排建议、试卷及其参考答案等内容,便于教师教学。 
内容简介
《数据挖掘原理与算法(第3版)》全面介绍了数据挖掘和知识发现技术,具有内容系统、知识含量高等特点,被许多高校作为本科生或者研究生教材使用。为了让教师更好地使用教材《数据挖掘原理与算法(第3版)》,作者又编写了这本教师用书。本书分四个部分: (1)对教材每章的部分习题给出了参考答案; (2)介绍各章授课内容重点与课时分配; (3)针对不同的授课学生对象给出了课时安排的建议; (4)提供了两套样本试卷及其参考答案。 本书供使用《数据挖掘原理与算法(第3版)》一书的教师作参考。
目  录
目录

第一部分各章习题及部分参考答案

第1章绪论

第2章知识发现过程与应用结构

第3章关联规则挖掘理论和算法

第4章分类方法

第5章聚类方法
前  言

前言
媒体评论
评论
在线试读部分章节
第3章关联规则挖掘理论和算法

1. 简单地描述下列英文缩写或短语的含义。(1) Parallel Association Rule Mining (2) Quantities Association Rule Mining (3) Frequent Itemset(4) Maximal Frequent Itemset (5) Closed Itemset参考答案: (1) 并行关联规则挖掘。它是指利用并行处理技术、使用并行挖掘算法或在并行计算的环境下完成数据的高效挖掘工作。(2) 数量关联规则挖掘。它是指对含有诸如工资、价钱等非离散的数值属性的数据进行挖掘的技术。数量关联规则挖掘需要解决连续属性的离散化等问题,有更广泛的商业应用。(3) 频繁项目集。它是指出现频率高的项目对应的集合,反映交易数据中项目出现的频度信息。挖掘频繁项目集是关联规则挖掘的基础,许多关联规则挖掘方法是基于频繁项目集发现的。(4) 最大频繁项目集。它是指在频繁项目集中不出现相互包含的项目子集。最大频繁项目集可以使用最少的信息来保证频度信息的不丢失。(5) 关闭(或闭和)项目集。简单地说,对于一个关闭项目集的任何元素,要么不被任何元素所包含,要么只被小于它的支持度的元素所包含。
2. 解释下列概念(1) 多层次关联规则(2) 多维关联规则(3) 事务数据库(4) 购物篮分析(5) 强关联规则参考答案: 略。


3. 给出一个项目集I1在数据集D上的支持度(Support)的定义,并直观地解释它的含义。参考答案: 设I1I,项目集I1在数据集D上的支持度是包含I1的事务在D中所占的百分比。直观上说,一个项目集在一个数据集D上的支持度反映了这个项目集在数据集中出现的频率。
4. 从统计学的观点说明一个项目集I1在数据集D上的支持度的含义。参考答案: 略。
5. 满足什么样条件的项目集是频繁项目集和最大频繁项目集?参考答案: 对项目集I和事务数据库D,D中的所有大于或者等于满足用户指定的最小支持度的项目集称为频繁项目集。在最大频繁项目集,任何元素是频繁的而且不被其他元素所包含。
6. 以购物篮应用为例说明挖掘频繁项目集所蕴含的商业价值。参考答案: 略。
7. 给出一个规则的可信度(Confidence)的定义,并直观地解释它的含义。参考答案: 给定一个被讨论的项目集I和数据库D,规则I1I2的可信度是指包含I1和I2的事务数在只包含I1的事务数所占的百分比。利用支持度定义可以描述为
书摘插画
插图

 数据挖掘原理与算法(第3版)教师用书下载



发布书评

 
 

 

PDF图书网 

PDF图书网 @ 2017