数据约简-样例约简与属性约简

当前位置:首页 > 工业技术 > 一般工业技术 > 数据约简-样例约简与属性约简

  • 版 次:31
  • 页 数:
  • 字 数:
  • 印刷时间:2015年05月01日
  • 开 本:B5
  • 纸 张:胶版纸
  • 包 装:平装
  • 是否套装:否
  • 国际标准书号ISBN:9787030440969
  • 丛书名:信息科学技术学术著作丛书
作者:翟俊海出版社:科学出版社有限责任公司出版时间:2016年03月 
编辑推荐
  《数据约简——样例约简与属性约简》可作为应用数学、计算机科学与技术、自动化等专业高年级本科生和研究生的教材, 也可供从事相关研究工作的科研人员参考. 
内容简介
  数据约简包括样例约简和属性约简, 是从不同角度对数据进行约简. 《数据约简——样例约简与属性约简》在分类的框架下介绍数据约简的方法, 重点介绍了确定性与不确定性环境下的样例约简方法和属性约简方法. 样例约简方法包括交叉选择样例算法、压缩模糊K近邻规则方法、概率神经网络样例选择算法. 属性约简方法包括最小相关性最大依赖度属性约简方法、模糊属性约简方法及属性约简方法在模型选择中的应用. 另外, 《数据约简——样例约简与属性约简》还介绍了样例选择准则和特征子集评价准则. 《数据约简——样例约简与属性约简》以监督学习的基本理论为基础, 全面系统地讨论了数据约简中的主要问题.
目  录
《信息科学技术学术著作丛书》序
前言
第1章 预备知识
1.1 分类问题与回归问题
1.2 不确定性度量
1.2.1 随机变量的不确定性度量
1.2.2 认知的模糊性度量
1.3 数据约简
参考文献
第2章 粗糙集及其扩展模型
2.1 经典粗糙集模型
2.1.1 上近似和下近似
2.1.2 粗糙集模型的特征
2.1.3 属性约简与核
在线试读部分章节
  第1章预备知识
  本章介绍后续章节将要用到的基础知识,包括分类与回归的概念、随机变量不确定性度量、模糊集、样例约简和属性约简的形式化定义。
  1.1分类问题与回归问题
  下面通过一个例子介绍什么是分类问题[1],并在此基础上给出回归问题的定义.因为本书在分类的框架下讨论问题,所以本节重点介绍分类问题。
  例1.1.1疾病诊断问题设某疾病的诊断要化验d个指标。这些指标也称为属性或特征,表1:1给出了n个患者的化验结果及医生的最终诊断结果。其中,要么等于1,要么等于1,表示患有这种疾病,yi=1表示没有患这种疾病.我们希望根据这些数据,对新来的病人只检测这d个指标,就可以推断该病人是否患有这种疾病,这类问题就称为分类问题。
  如表1:1所示的数据集称为分类数据集,也称为决策表,可以用以下两种形式抽象地表示。
  1)用二元组表示
  表1:1所示的分类数据集,可用二元组(xi,yi)抽象地表示成如下形式,即
  其中,xi表示第i个样例,yi表示样例xi所对应的类别标号
  2)用四元组表示
  表1:1所示的分类数据集,也可以抽象地表示为四元组,即
  其中,是n个样例的集合,是描述对象(或样例)的条件属性(或特征)集合,是决策属性(或类别属性)集合,V是d个属性值域的笛卡儿积,是属性ai的值域是信息函数:
  用式(1.2)表示的四元组也称为决策表,为了描述方便,本书中这两种等价表示会交替使用.
  表1:1所述的分类问题是一个二类分类问题,对于多类问题,y的取值范围不再是,而是由多个离散值构成的集合,如对于手写数字识别问题,y的取值范围是,当然也可以用其他符号来表示,如。下面针对多类分类问题,从数学的角度给出分类的定义。
  定义1.1.1给定分类数据集,如果存在一个映射使得对于任意的都有成立.根据给定的分类
  数据集D寻找函数y=f(x)的问题,称为分类问题.函数y=f(x)也称为分类函数.
  说明:

 数据约简-样例约简与属性约简下载



发布书评

 
 

 

PDF图书网 

PDF图书网 @ 2017