已绑定手机 已实名认证
|
来源: 中国汉字网 3. 3 意义泛化度
类词缀在意义上尚未完全虚化,一般来说,它们在类缀字组中仍部分保留了原有的词汇意义,我们总是能在词典中发现跟类词缀关系密切的义项,但是类词缀的意义并不能从该义项中得到完全的解释。如“家”由“家庭的住所”、“家庭”引申为“经营某种行业的人家”(“农家、船家、渔家”)、“具有某种身份的人”(“东家、行家”),再引申为“掌握某种专门学识或从事某种专门活动的人”(“科学家、艺术家”),意义引申的线索很清楚。但随着社会的发展,“专门的学识”或“专门的活动”门类越来越多,更新越来越快,“-家”的配合能力也就越来越强,“在某种学科或活动门类中”和“地位高”的附加义也就越来越强,“人家”的意义则完全失去了。
3. 4 组合能力
这里首先区分两个概念:一是参与构造已有词语的能力,我们称之为“组合能力”,放在本节讨论;另一个是构造从未出现过的新词、新语的能力,也即构造新词的潜能,我们称为“新生类推潜能”,放在下节讨论。许多论著仅笼统地讨论“构词能力”、“生成能力”或“能产性”,这样会遗漏许多重要的现象。
组合能力可以用某个共时语料库的统计得出。
词缀、类词缀和助字的组合能力都很强,但有量的差别。比如在8亿语料中有“-子”缀词760―1000余例,“-式”类缀词或类词3466例,“-的”短语接近2,000,000(二百万)。①
可以看出,“-子”和“-式”虽然有频率上的差异,但都可以归入“高频”范畴;而“-的”却与它们有较明显的差异,属于“超高频”的范畴。这是助词不同于词缀或类词缀的根本特点。
3. 5 新生类推潜能
新生类推潜能指根据现时需要随时创造新词语的能力。
新生类推潜能与组合能力不是一个概念。词缀、类词缀、助字的组合能力都属于“强”的级别,只是程度上有不同。而它们的新生类推潜能却有本质性的区别。
词缀的新生类推潜能极弱,甚至弱于一般词根。比如,以最严格的标准,“-子”缀词也有760余例,不可谓不多;但近年来大量出现了各种新生名物,如“微波炉、香波、鼠标、光盘、手机、邮编、网页、U盘、闪存”等等,许多构词能力不如“-子”的单字都参与了新词的构造,但却不见“-子”的身影。也就是说,“-子”在现代汉语中已丧失了类推构造新词的潜能,“-子”缀词已经是历史造词的遗留,属凝固词语。可以预见,今后它的搭配频率将会逐渐减少而不是增多。因而,只要我们使用的语料库足够大且足够平衡(比如说2亿字),就几乎可以涵盖词缀的所有搭配,即使增加新的语料,也很少会有新的用例出现。
类词缀的新生类推潜能却很强,以致统计出的搭配频率总赶不上变化。比如,已有的“-家”的数量并不一定比“-子”多,我们从8亿语料库随机抽取1000例含“家”字组后人工鉴别只得到“-家”类缀组合68例,通过其他参考资料和内省又得到38例。但这106例绝不是“-家”类缀可能组配的全部。最近我们用“百度网”搜索,又发现有“性学家、周易预测学家、信息产业学家、军事历史学家、农经学家、茶学家、激光物理学家”;在报纸的一版上又发现有“电波传播学家、核农学家、大地构造学家、土壤化学家、职业神经病学家”等我们以前未见过的新组合。以上偶尔拾得的就又有12例。可以想见,每出现一门新学科或新分支学科,某一领域突然热了起来,就会出现一种新的“-家”,它今后的搭配频率只会增加而不是减少。因而,只要扩大新的语料,类词缀的搭配频率就可能有较大的变化。
通过对语料库的检索我们意识到,类词缀的能产性比我们设想的还要强许多,很多类词缀都有所有词典(包括新词新语词典)均未收录的、我们从来没有听说过、用内省法也无法得到的用例。仅以“-式”为例。我们对8亿语料库检索到含“式”语段共303104例,经人工鉴别和去重得到“-式”缀字组3466例。这些用例许多都是根据需要、根据说话人个人对样式、方式的分类临时创造的。比如对结婚方式的分类有“家庭结婚式、教会结婚式、佛前结婚式、神前结婚式”,对管理方式分类有“超前预防式、大棒压制式、放任自流式、金屋藏娇式、全权委托式”的分类。还有许多用例,孤立看时甚至要怀疑其合法性,但在前后文中却是很自然的用例。比如“全面透过式(取景屏)、西服背心式(防刺服)、‘浓眉大眼红脸蛋’式(婚纱照)、老伯式(眼镜)、旅游式(三包)、抛弃式(隐形眼镜)、拖鞋式(凉鞋)、香肠式(奶酪)”等等。由于4音节以上类词性质的VP和NP的数量实际上是无限的,所以理论上说,这些类词缀的搭配潜能也是无限的。
据张家太(1988)考察,20世纪80年代产生的新词中,有相当大的一部分是由类词缀构成的,如“优化、企业化、一次性、可读性、一把手、外语热、留学热、气功热、开放型、外向型、知名度、回头率”等等。最近几年产生的新词也有很多跟类词缀有关,例如“无公害、无抗、纯天然、网员、股评家、量贩式、美白型、信息化、房地产热、非典”等。
新生类推潜能强是类词缀不同于词缀的重要特点,是类词缀需要单立一类的重要原因。
助字的新生类推潜能最强。任何新的思想,都可以用助字短语的形式表达出来。虽然体词性类后缀的搭配潜能已经是无限多,但体词性助词搭配潜能的集合显然要大大多于类后缀。比如,凡“-式”的后面都可以再加“-的”,而“-的”还可以加在自由短语的后面,还可以层层套用,“-式”则不可以。关于这一点似无不同意见,不赘述。
3. 6 组配的规则性
组配的规则性是指搭配的成分及搭配后的整体意义是否可以用语法或语义的类来控制。规则可分为两类:生成向周遍性的和接收向周遍性的。②
生成向周遍性的规则是指某一语义类的全部成分均可周遍地与另一类(或一个成分)搭配,搭配后的整体义也都可以用成分义和结构义的相加来预测,“第-”是这一类的典型代表。
接收性周遍的规则是指某一语义类的不少成分(不是所有同类成分)可以与另一类或另一个成分搭配,但只要能搭配,搭配后的整体义总是可以用成分义和类后缀义的相加来预测。
词缀基本上不是生成向规则的,它们大多无法用语法或语义的类来控制。如“-子”、“-儿”、“-头”是名词性词缀,但它们并不是可以加在所有的名词或单音名的后面。语义的类也很难控制。比如一般的说法是“小的事物可以与‘儿’搭配”,但缝衣服的针很小,却不能加“-儿”,打毛衣的“针”反而要加“-儿”;缝衣服的线很细不加“-儿”,抽象的“线索”义的“线”却可以加“-儿”,等等。词缀从接收向来看也很难说是规则的,因为加词缀后的整体义也很难从类的搭配来预测,如“眼”加“儿”义为“窟窿”,“门”加“儿”可以表抽象比喻义的“门路”,但“灯”加“儿”并不表抽象比喻义等等。因此,由词缀构成的词大多需要在词典中一一收录,语言学习也需要一一学习。
少数词缀与少数语义类可以周遍地配合,如“老/小+单音节姓氏”,和“第+数词结构”。这样的情况在词缀中并不多见。而且,如果另外分出“类词缀”这一类,“第-”恐怕要改归为类词缀才更加合适,因为它可以自由地与类词性质的表数字组搭配。
与词缀不同,大多数类词缀的组配成分不少可用生成向的规则控制。例如“-式”具有跟所有表国家、民族的名词性成分相配的潜能(如“中式、中国式、日式、日本式、美式、美国式、藏式、蒙式、蒙古式、满式……”),类前缀“副”可以与所有官名相配(“副经理、副总经理、副部长/局长/司长/科长/股长/班长/组长、副主任……”)。有些组配之前也许从来没有被使用过,但今后有出现的潜能。比如我们的语料中没有出现过“通州式”,但如果今后几年它的发展速度极快,并被立为典型而广泛宣传,则“通州式发展速度”就一定会出现。
从生成向看不能用周遍性规则控制的类词缀组配,从接收向看基本上是周遍性可理解的。例如类前缀“总”并不能与所有表示官职的名词性成分组配(“总经理、总工程师、总参谋长、总司令”,但“
总主任、
总部长”);类后缀“家”也不可以与所有表示乐器的名词性成分组配(“小提琴家、钢琴家”,但“
黑管家、
大号家、
笛子家”),但凡能搭配者,其整体意义就可以从成分义和类词缀义的相加来推知,也即它们的语义是透明的。
当然,所谓“语义透明”也是有层次的。“专名+式”语义透明的层次比较浅,比如从“伊斯兰教式[建筑]”的组配中,人们都能得知的只是伊斯兰教有一种特定样式的建筑,至于该样式到底有什么特点,则依赖于个人的百科知识。一般来说数字式武器型号可以提供的词汇语义内容最少,而四音节以上NP或VP提供的语义内容最多。
考察发现,几乎每个类词缀都有一条或几条生成周遍性的规则,而接收向的周遍规则性对于类词缀来说则几乎是无一例外适用的。这是类词缀与词缀最大的不同。
4 类词缀与词典收词和第二语言教学
由于类词缀字组语义上的透明性,母语者并不需要通过查字典来得知其语义,所以以母语者为对象的语文词典几乎不收录它们是合理的。但计算机和第二语言学习者并不具备母语者这种潜在的语言知识,因此需要对类词缀字组做相应的处理。怎么处理呢?以下几点应注意:
1)与词缀不同,类词缀目前正处于能产活跃期,其新生类推潜能是无限的。因此任何一部词典,即使是大型词典也不可能穷尽地收录类词缀所搭配的所有字组。
2)与词缀字组不同,不少类词缀字组(特别是其中多音节的)的复现率极低,它们是根据需要而临时创造的。如“‘浓眉大眼红脸蛋’式[婚纱照]”在8亿语料中仅出现一次,再增加语料也未必会再次出现。也即,许多类词缀字组收录在词典中是很不经济的。
3)与助词不同,类词缀字组的内部不涉及句法语义范畴,也即类词缀字组的句法作用只相当于一个词。如果类词缀字组能与句法分开处理,无论是对于信息处理还是外国人学习汉语都是十分有必要的。正确地划定类词缀字组的界线,自动处理这一部分的语义信息,是进行句法分析之前的前期工作。
类词缀字组的整体功能由类词缀决定。一旦确立了类词缀的性质,就可以相应地确立类词缀字组的语法类别,类词缀可成为计算机标注词性或第二语言学习者理解句子结构的一个指示灯,可以用它来确定整个字组的语法性质,切分出句子结构的一些较大的单元。
也就是说,虽然词典无法也无须收录所有的类词缀字组,但信息处理和第二语言习得却又都需要在运用句法之前判定类词缀字组的边界和整体语义。
4)与词缀、词根不同,类词缀字组有相当部分是生成向周遍可控的,几乎全部都是接收向周遍可控的。因此,它们可以不收录词表而又能够达到自动划界和理解。
其策略应该是:把类词缀单独列表,并给出每个类词缀有哪些生成向周遍的搭配规则,有哪些接收向周遍的搭配规则。
计算机只需要接收方向的组配规则。有了这些规则,知道了某个类词缀可以与哪些格式或哪些语义类的成分搭配,就可以在相当程度上自动处理文本中类词缀字组的外边界(还会遇到歧义切分问题)和整体语义。
第二语言习得者不但需要接收方向的组配规则,还需要生成方向的规则,以避免生成不正确字组 (如“
笛子家”)。
此外,单音节与类词缀搭配的字组有些特殊。除一些封闭性义场(如地名或民族的简称、姓氏、英文字母)外,它们中有不少语义不透明、同类类推能产能力差、产生时代早(如“作家、画家”,“版式、复式”)。这些组配的后字虽然与类词缀同形且有语源上的联系,但其实该组配产生之时后字尚未虚化为类后缀,是按普通复合词创造的,之后又以复合词的身份增加了附加义。它们与类缀字组差别较大,而与一般复合词性质相同,最好收录词典。
目前,信息学界对类词缀问题已有不少关注和研究成果,如台湾中央研究院资讯科学研究所中文词知词库小组(1996)、吴赣(1998)、富丽(2001)等。当然,要使计算机能够达到对类词缀字组的自动处理,还需要更多、更细致的研究。
对外汉语教学方面对类词缀的重视明显不够。比如,一位教员告诉笔者,一个留学生曾经抱怨,课本上出现的“无权”一词,自己从未学过,为什么未收入生词表。可以想见,确定一些常用的类词缀,给留学生讲解类词缀接收向的意义推导规则、生成向的音节搭配规则和哪些语义类可以周遍生成的限制,定会提高留学生理解和运用汉语的能力。
总之,从应用方面词根、词缀、助词与类词缀应该采用的不同处理策略,也可以看出在汉语中应该把类词缀作为单独一类的必要性。
注释:
①此数为估算数值:根据北工大两亿语料“的”的字频减去所有含实义“的”的问和成语的频率再乘4倍而估得8亿语料中助词“-的”频率为1,868,440。
②陈保亚教授指导的李洪彦同学2004年本科论文首次提出这两个概念,只是“接收向”称为“理解向”。
《参考文献》
[1]北京大学中文系现代汉语教研室 1993 《现代汉语》,北京:商务印书馆。
[2]卞成琳 2000 《汉语工程词论》,济南:山东大学出版社。
[3]陈保亚 1999 《20世纪中国语言学方法论》,济南:山东教育出版社。
[4]陈光磊 2001 《汉语词法论》,上海:学林出版社。
[5]端木三 1999 重音理论和汉语的词长选择,《中国语文》第4期,246―254页。
[6]端木三 2000 汉语的节奏,《当代语言学》第4期,203―209页。
[7]冯胜利 1997 《汉语的韵律、词法与句法》,北京:北京大学出版社。
[8]冯胜利 1998 论汉语的“自然音步”,《中国语文》第1期,40―47页。
[9]冯胜利 2003 韵律制约的书面语与听说为主的教学法,《世界汉语教学》第1期,87―97页。
[10]富丽 2001 《现代汉语类词缀研究――兼论附缀字组的成词性及词库收词问题》,北京大学中文系硕士论文。
[11]葛本仪 2001 《现代汉语词汇学》,济南:山东人民出版社。
[12]胡明扬 2000 《语言学概论》,北京:语文出版社。
[13]胡裕树 1981 《现代汉语》(增订本),上海:上海教育出版社。
[14]黄伯荣 廖序东 1990 《现代汉语》(增订版)上册,北京:高等教育出版社。
[15]黄居仁 1997 《资讯处理用中文分词规范》设计理念及规范内容,《语言文字应用》第1期,92―100页。
[16]梁源 2000 二字结构凝固度分级考察,《语言文字应用》第2期,21―32页。
[17]刘叔新 1990 《汉语描写词汇学》,北京:商务印书馆。
[18]刘源 谭强 沈旭昆 1994 《信息处理用现代汉语分词规范及自动分词方法》,北京:清华大学出版社,南宁:广西科学技术出版社,联合出版。
[19]陆志韦 1957 《汉语的构词法》,北京:科学出版社。
[20]吕叔湘 1979 《汉语语法分析问题》,北京:商务印书馆。
[21]马庆株 1995 现代汉语词缀的性质、范围和分类,《中国语言学报》第6期,101―137页,北京:商务印书馆。
[22]朴爱阳 2002 《现代汉语派生词研究》,南开大学博士论文。
[23]沈孟璎 1987 略论新词语的特征,载沈孟璎《新词・新语・新义》,福州:福建教育出版社。
[24]沈阳 1997 现代汉语复合词的动态类型――谈语言教学中的一种词汇/语法单位范畴,《语言教学与研究》第2期,24―40页。
[25]孙茂松 李行健 王洪君 富丽 2001 《信息处理用现代汉语分词词表》,教育部九五社科重点项目结项报告(未刊)。
[26]台湾中央研究院资讯科学研究所中文词知词库小组 1996 《“搜”文解字――中文词界研究与资讯用分词标准》,技术报告96―01(未刊)。
[27]王洪君 1994 从字和字组看词和短语――也谈汉语中词的划分标准,《中国语文》第2期,102―112页。
[28]王洪君 1998 从与自由短语的类比看“打拳”、“养病”的内部结构,《语文研究》第4期,1―11页。
[29]王洪君 2000 汉语的韵律词和韵律短语,《中国语文》第6期,525―536页。
[30]王洪君 2001 音节单双、音域展敛(重音)与语法结构类型和成分次序,《当代语言学》第4期,241―252页。
[31]王洪君 2002 普通话中节律边界与节律模式、语法、语用的关联,《语言学论丛》第26辑,279―300页,北京:商务印书馆。
[32]王洪君 2005 动物、身体两义场单字组构两字的结构模式,《语言研究》第1期,1―11页。
[33]王立 2003 《汉语词的社会语言学研究》,北京:商务印书馆。
[34]吴赣 1998 《现代汉语文章中后缀词语的动态归并》,北京工业大学人工智能研究所硕士论文。
[35]叶蜚声 徐通锵 1981 《语言学纲要》,北京:北京大学出版社。
[36]俞士汶 1999 《现代汉语语料库加工――词语切分与词性标注规范与手册》,北京大学计算语言学研究所(未刊)。
[37]张家太 1988 汉语新词语琐议,《沈阳师范学院学报(社科版)》第2期。
[38]赵元任 1979 《汉语口语语法》(中译本),吕叔湘译,北京:商务印书馆。
[39]朱德熙 1980 《现代汉语语法研究》,商务印书馆。
[40]朱德熙 1982 《语法讲义》,北京:商务印书馆。
[41]朱亚军 2001 现代汉语词缀的性质及其分类研究,《汉语学习》第2期,24―28页。
作者:王洪君/富丽 |
|