细嗅蔷薇——心理动词构建“主谓-宾语(主谓短语)”句型实证

当前位置:首页 > 社会科学 > 语言文字 > 细嗅蔷薇——心理动词构建“主谓-宾语(主谓短语)”句型实证

  • 版 次:1
  • 页 数:
  • 字 数:
  • 印刷时间:2016年05月05日
  • 开 本:16开
  • 纸 张:胶版纸
  • 包 装:平装
  • 是否套装:否
  • 国际标准书号ISBN:9787564343125
作者:刘丽静出版社:西南交通大学出版社出版时间:2016年04月 
内容简介
本书是玉林师范学院文学与传媒学院组织的挂榜山文集第五册,是中文语言学和应用语言学学科方向的博士毕业课题成果。本书从实证角度出发,以计算机语料库中的大型博客语料数据为基础,提取符合心理动词构建“主谓—宾语(主谓短语)”句型的313个句子,对这种句型所包含的句法、语义成分和句法关系、语义关系,以及所包含的全部句型结构以及所包含的全部句法结构、语义结构进行定性、定量的分析和描述,与理论研究相互验证。
作者简介
刘丽静,女,汉族,生于1963年,广西容县人。1984年毕业于广西师范学院汉语言文学专业。2013年获华中师范大学文学院语言学与应用语言学专业博士学位。现为玉林师范学院文学与传媒学院副教授,主要研究方向为现代汉语语法学、语用学,应用语言学、普通话。
目  录
目 录
句型的研究综述·············································································· 4
句型中的总体语法构成统计····························································· 30
语法分布、分类统计······································································ 30
前  言
前 言
本书从实证角度出发,以计算机语料库中的大型博客语料数据为基础,提取符合心理动词构建“主谓— 宾语(主谓短语)”句型的313个句子,对这种句型的句法、语义成分和句法关系、语义关系,以及所包含的全部句型结构、句法结构、语义结构进行定性、定量的分析和描述。目的是全面、准确、深入了解在自然语言中这种句型的句法语义构成、特征、关系和使用情况分布等,与理论研究相互验证。
第一章主要梳理了心理动词研究和心理动词构建“主谓 —宾语(主谓短语)”句型的研究线索和脉络。首先对语言学界对心理动词的分类情况进行了简要说明。然后对心理动词构建“主谓—宾语(主谓短语)”句型进行了研究综述。考证了此一句型的历史渊源、句型性质、在结构上的归属,句子中各构成成分句法、语义的研究情况以及功能归属等。对本书的研究内容、研究方法等做出了说明。
在线试读部分章节
6.2.2 关于数据的提取
本书一共经过了两次提取程序。第一次是经北京大学自动分词系统对文本中所有句次进行分词,变成了可以人工操作的数据。经对动词进行分类后,提取出全部心理动词。然后又在对心理动词分类的基础上,以502517个男女共用的心理动词为线索,通过Powerbuilder开发工具,结合Sqlserver数据库,对全部包含有心理动词大谓语的句式进行提取,得出一个新的数据库。
6.2.3 关于数据的加工
计算机数据库的优点是可以对自然语言进行集中和自动分词,帮助研究者认识其表层语法结构,但是深层语法功能结构和语义关系结构计算机目前是无法标注出来的,还需要进行深加工。每次提取语料前,都要给出提取的条件,编写成程序才能让计算机自动识别,因此需要借助有关专家参与这个工作。在通过Powerbuilder开发工具,结合Sqlserver数据库进行提取全部包含心理动词句子的语料时,就经过了这些程序:首先根据提取目的,编写很长的字符串处理程序,然后析句。分句子的时候,要根据标点符号(标点符号的种类很多,在编程的时候用到了一个集合,将所有可能出现的标点符号全部用一个集合存储起来,只要出现了标点符号的地方,一个句子就结束了)判断句子的结束。不仅如此,将文章分割成句子的时候,还要把标点符号去掉。在分割文字和词性的时候,由于词性的标志是不定长的,用到了专门的函数来区别文字和词性。所建立的数据库中大概有5.5亿的数据量。
6.2.4 数据库和本体有机结合的研究体验
一、正确认识计算机的功能
分析清楚哪些是计算机可以操作的,哪些是计算机不能处理的。目前计算机处理语料只能做到这一步:对浅层句法结构和词性进行标注,对深层语义成分和组合关系无法进行有效标注,而且对句法关系也只限于标注成分,无法表明句法关系。如例172“我/r觉得/v他/r懂/v这/r首/NUM歌/n”,从这个切分里,只能看到句子是由什么成分构成的,无法看到成分之间的关系。所以数据库所提供的切分数据只对认识句法成分有明显的帮助,对功能和语义的揭示还无法做到。
二、要对计算机自动分词后的语料进行甄别
因为自动分词系统对表层句法成分的标注存在着偏误,如对“就是”的切分,有些句子中切分为“就/d是/v”,有些切分为“就是/v”,在分析时要仔细辨析。

 细嗅蔷薇——心理动词构建“主谓-宾语(主谓短语)”句型实证下载



发布书评

 
 

 

PDF图书网 

PDF图书网 @ 2017