基于动态流通语料库的汉语熟语单位研究

当前位置:首页 > 社会科学 > 语言文字 > 基于动态流通语料库的汉语熟语单位研究

  • 版 次:1
  • 页 数:
  • 字 数:
  • 印刷时间:2009年06月01日
  • 开 本:16开
  • 纸 张:胶版纸
  • 包 装:平装
  • 是否套装:否
  • 国际标准书号ISBN:9787561923108
作者:杨建国 著出版社:北京语言大学出版社出版时间:2009年06月 
内容简介
本书基于汉语词典学界和中文信息处理界重“词”轻“语”的现象,对词组研究、熟语研究进行了反思,提出“熟语单位”(Idiom Unit,IU)的概念。所谓“熟语单位”,就是“结合紧密,使用稳定”、功能相当于熟语的结构单位,是符合人的认知规律并被人们经常当做一个词来使用的定型化了的固定短语或凝固表达式。我们判别IU的三条原则为:是否“结合紧密,使用稳定”;是否符合人们的认知规律(IU的长度一般为7±2);流通度是否达到一定的阈值。IU理论上包括一切具有熟语性的词语组合单位。本书讨论的IU范围包括三字格中的惯用语和像“差不多、靠不住、来不及”这样介于词和短语之间的结构串,四字格中的成语和新固定短语,简称略语、插入语和字母词语等。
本研究选用的是《人民日报》2001-2003年三年的文本,约8000万字。文章以动态语言知识更新理论为指导,以流通度理论为基础,以年平均流通度阈值(0.5)作为主要筛选依据,运用规则和统计相结合的方法对“熟语单位”(IU)进行了初步的提取研究,并对部分提取结果的噪声环境作了定量与定性分析。
对于IU的提取,我们采取的策略和基本步骤是:
(1)利用点号和“的、是、在、和、了、有”等高频词(字)将文本化短;自动提取时牺牲包含切分点的字符串,该部分字符串另行补救。
(2)数据格式转换。将切分得到的形式上“完整”的2-8字串转为数据库格式。
作者简介
杨建国,北京语言大学首都国际文化研究基地副研究员,硕士研究生导师。主要研究方向为语言学及应用语言学、汉语文化教育等,已发表语言、文化及教育类论文30余篇。曾参与编写《四库大辞典》《中国传统文化》等工具书及教材。
目  录
摘要
Abstract
第一章 引论
1.1 本研究提出的背景
1.2 本研究的目标
1.3 本研究的意义
1.4 本研究的创新点和难点
1.5 小结
第二章 汉语熟语单位
2.1 熟语单位的界定
2.2 熟语单位的判定原则
2.3 熟语单位的范围
2.4 熟语单位的判定方法
2.5 小结

 基于动态流通语料库的汉语熟语单位研究下载



发布书评

 
 

 

PDF图书网 

PDF图书网 @ 2017