基于内容的音频检索技术

当前位置:首页 > 工业技术 > 电子 通信 > 基于内容的音频检索技术

  • 版 次:1
  • 页 数:
  • 字 数:
  • 印刷时间:2014年08月01日
  • 开 本:16开
  • 纸 张:胶版纸
  • 包 装:平装
  • 是否套装:否
  • 国际标准书号ISBN:9787030416629
  • 丛书名:信息科学技术学术著作丛书
作者:周明全 等著出版社:科学出版社出版时间:2014年08月 
编辑推荐
  可作为高校、科研院所及企业中从事有关模式识别应用、信号与信息处理、基于内容检索和音频处理等相关研究人员的参考书,亦可作为高校电子工程、数字媒体技术等相关专业研究生教材。 
内容简介
  基于内容音频检索技术》从理论方法研究与实现技术角度对基于内容音频检索技术的研究与进展进行总结归纳,融入作者多年来的相关研究与应用成果,系统地介绍了基于内容音频检索技术的的主要概念、基本原理、典型方法、实用范例以及新动向,包括基于内容音频检索的基本理论、 基于声学特征级和语义级的音频检索技术。《基于内容的音频检索技术》共8章5部分。第1部分概述,分析了基于内容音频检索的体系结构、技术现状和发展趋势。第2部分讨论音频特征表示与提取方法,给出音频低层特征和高层语义特征提取算法以及基于内容音频检索的总体框架;第3部分重点介绍声学特征级检索中音频信号的处理、底层特征提取与检索的技术;第4部分重点介绍声学语义级检索技术中语音识别与检索、说话人识别与检索和音乐检索。第5部分介绍我们研发的音频检索原型系统设计与性能评介,并给出设计实现的原型检索系统的相关应用实例。
作者简介
 
目  录
《信息科学技术学术著作丛书》序

前言
第一章 绪论
1.1 基于内容的音频检索技术概述
1.1.1 基于内容的音频检索意义
1.1.2 基于内容的音频检索概述
1.2 基于内容的音频检索发展
1.2.1 基于元数据检索的研究现状
1.2.2 音频分类研究现状
1.2.3 基于内容的音频和音乐检索研究现状
1.3 本章小结
参考文献
第二章 基于内容的音频处理概述
前  言
 
媒体评论
 
在线试读部分章节
第一章绪论
随着现代信息技术,特别是多媒体技术和网络技术的迅速发展,多媒体信息的数据量急剧增多,但由于缺乏有效的多媒体检索技术,人们难以充分有效地利用这些海量资源。例如,人们知道巨大的网络信息海洋中有自己需要的歌曲和电影,但却不知道它们到底在哪里。因此,如何在浩如烟海的数据中快速准确地挑选出感兴趣的信息,对于充分利用不断积累的信息资源具有极其重要的意义。
音频是一类重要的多媒体数据,包含大量信息,如何从众多音频资料中检索出需要的信息是一个迫切需要解决的问题,具有非常重要的研究价值。
1.1基于内容的音频检索技术概述
对声音进行数字化处理和保存得到的结果称为音频。音频媒体是除视觉媒体外最重要的媒体,占总信息量的20%左右。音频信息按内容可以分成语音类和非语音类。语音是人类发出的含语义内容的声音,含有词字、语法等语素,是一种高度抽象的概念交流媒体。非语音包括音乐、音效、非规则声音等,其中音乐是人声和(或)乐器等声响配合构成的一种声音,具有节奏、旋律或和声等语义要素。音效是由声音所制造的效果,是指为增进场面的真实感、气氛或戏剧信息,而加于声带上的杂音或声音。非规则声音则是指没有规律的声音。我们能够听见的音频频率范围是20Hz~20kHz,其中语音大约分布在300Hz~4kHz之内,而音乐和其他自然声响是全范围分布的。
从大量音频文件中查找想要的音频片段就是音频检索,目前音频检索主要分为基于文本关键词的检索和基于音频内容的检索。基于文本关键词的检索主要是采用文件名、文件大小和文件属性等已知的或人工标注的信息进行检索,目前已经发展得非常成熟,已经熟悉的如Google、Baidu和Yahoo等搜索引擎采用的就是这种技术。由于已知的属性和标注的信息有限,不能表示音频所有内容,因此基于内容的音频检索(content based audio retrieval,CBAR)研究应运而生。
基于内容的音频检索是指通过音频特征分析,对不同音频数据赋以不同的语义,使具有相同语义的音频在听觉上保持相似。它主要是研究如何利用音频的幅度、频谱等物理特征,响度、音高、音色等听觉特征,词字、旋律等语义特征实现基于内容的音频信息检索。它涉及多方面领域的知识,包括数字信号、模式识别、统计学习、神经网络和语音识别等。
1.1.1基于内容的音频检索意义

 基于内容的音频检索技术下载



发布书评

 
 

 

PDF图书网 

PDF图书网 @ 2017