内容简介
本书共分五章。
第一章“面向信息处理的语言研究”主要介绍了中文信息处理的发展与成就、汉语自动分析的难点、计算机背景下的汉语语法研究以及“句管控”与汉语信息处理等内容。我国的中文信息处理经历了“字”处理和“语”处理两个时期,现在集中力量对“句”处理进行攻坚。信息时代对语言学研究提供了新的机遇,同时也提出了新的挑战,由于研究对象、研究目的、研究手段和研究视角的转换,注定了汉语语法研究要面向计算机,为信息处理服务。“句管控”理论对我们的启示是能否改进或改变以往的研究范式,把从小到大的策略与从大到小的策略结合起来。这一部分的内容反映了作者对当前中文信息处理现状的思考,意在既要“埋头拉车”,又要“抬头看路”。
第二章“虚词知识库的建设”主要介绍了虚词与虚词研究概貌、汉语虚词知识库的重要性、虚词知识库建设的难点以及虚词知识库建设的构想等内容。虚词知识在中文信息处理的词法分析、句法分析和具体应用等方面都有重要作用。但由于汉语虚词的个性很强,运用范围很广,使用频率较高,有的还一词多类兼多义,而且汉语虚词使用很灵活且缺省现象比较严重,因此汉语的虚词特别是信息处理用虚词词典的研究有很大难度。本书提出了一个三位一体的虚词知识库建设方案。首先,按照虚词的“用法”填写虚词机器词典;再在虚词词典的基础上标注语料库,同时利用语料库也可以检验虚词词典的填写;最后在虚词词典和标注语料库的基础上提炼出虚词规则库。
第一章“面向信息处理的语言研究”主要介绍了中文信息处理的发展与成就、汉语自动分析的难点、计算机背景下的汉语语法研究以及“句管控”与汉语信息处理等内容。我国的中文信息处理经历了“字”处理和“语”处理两个时期,现在集中力量对“句”处理进行攻坚。信息时代对语言学研究提供了新的机遇,同时也提出了新的挑战,由于研究对象、研究目的、研究手段和研究视角的转换,注定了汉语语法研究要面向计算机,为信息处理服务。“句管控”理论对我们的启示是能否改进或改变以往的研究范式,把从小到大的策略与从大到小的策略结合起来。这一部分的内容反映了作者对当前中文信息处理现状的思考,意在既要“埋头拉车”,又要“抬头看路”。
第二章“虚词知识库的建设”主要介绍了虚词与虚词研究概貌、汉语虚词知识库的重要性、虚词知识库建设的难点以及虚词知识库建设的构想等内容。虚词知识在中文信息处理的词法分析、句法分析和具体应用等方面都有重要作用。但由于汉语虚词的个性很强,运用范围很广,使用频率较高,有的还一词多类兼多义,而且汉语虚词使用很灵活且缺省现象比较严重,因此汉语的虚词特别是信息处理用虚词词典的研究有很大难度。本书提出了一个三位一体的虚词知识库建设方案。首先,按照虚词的“用法”填写虚词机器词典;再在虚词词典的基础上标注语料库,同时利用语料库也可以检验虚词词典的填写;最后在虚词词典和标注语料库的基础上提炼出虚词规则库。