数据预处理

当前位置:首页 > 社会科学 > 社会学 > 数据预处理

  • 版 次:1
  • 页 数:130
  • 字 数:120000
  • 印刷时间:2011年03月01日
  • 开 本:大32开
  • 纸 张:胶版纸
  • 包 装:平装
  • 是否套装:否
  • 国际标准书号ISBN:9787561538258
  • 丛书名:经管学术文库
作者:刘云霞 著出版社:厦门大学出版社出版时间:2011年03月 
内容简介
数据归约是数据挖掘过程的关键环节,因此对数据归约技术的研究具有重要的意义。当前已有的数据归约方法多偏重于有监督学习,而无监督情形下归约方法的研究还相对不够丰富。鉴于这种情况,刘云霞编著的《数据预处理——数据归约的统计方法研究及应用》的重点内容是尝试对无监督数据归约的统计方法及其应用进行研究。
在《数据预处理——数据归约的统计方法研究及应用》第一章中,首先阐述了选题的研究背景和研究意义。之后,在概述相关背景知识和总结国内外数据归约研究方法现状的基础上,明确了本书的研究内容及创新之处。
数据归约两项重要的基础工作——缺失值填补和异常值探测是第二章探讨的内容。在本章,根据对统计学中常用的各种缺失值填补和异常值探测方法的分析,总结出了一些适合数据挖掘使用的方法。此外,通过将几种异常值探测方法应用在某地区移动通信用户缴费数据库上,对手机用户的消费行为进行了实证分析。
数据归约包括元组的归约和属性的归约。本书在第三章探讨了元组归约的两种主要方法——连续属性离散化和概念分层。在对当前的离散化方法和概念分层中面向属性归纳方法综述的基础上,提出了两种从独立性角度考虑的连续属性离散化方法,分别是基于可辨识矩阵的离散化方法和基于似然比假设检验的离散化方法。并通过在Iris样本集上对这两种方法进行模拟,验证了它们的有效性。
目  录
摘要
第一章 绪论
第一节 选题的研究背景和研究意义
第二节 相关背景知识
一、数据挖掘的发展概况
二、数据归约的主要内容
三、数据归约的重要作用
第三节 国内外研究现状
一、属性离散化方法研究的现状
二、属性排序和属性子集选择方法研究的现状
第四节 本书的研究内容及创新点
一、本书的研究内容和结构
二、本书的创新点
第二章 缺失值的填补与异常值的探测

 数据预处理下载



发布书评

 
 

 

PDF图书网 

PDF图书网 @ 2017