首页 » 语言本能:探索人类语言进化的奥秘 » 语言本能:探索人类语言进化的奥秘全文在线阅读

《语言本能:探索人类语言进化的奥秘》形形色色的构词法和不计其数的单词

关灯直达底部

与此相对的是,心理词典却缺少这种光环。它看上去仅仅是一张枯燥乏味的单词表,必须通过死记硬背才能录入大脑之中。作家塞缪尔·约翰逊(Samuel Johnson)在自己编纂的《英语词典》的序言中说道:

从事卑微工作的人注定要接受这样的命运:他们的努力完全是出于对不幸的恐惧,而并非是为美好前景所吸引。他们备受责难,得不到任何赞扬。他们因为失败而名誉扫地,因为疏忽而遭受惩罚,而且即便成功也听不到掌声,付出也得不到回报。

词典编纂者就是这些不幸人士中的一员。

约翰逊在词典中将“词典编纂者”定义为“一种无害的苦工,整日埋头于探寻词源、描述词义的工作”。然而,我们将在本章中看到,这是一种有失公允的见解。就神奇精妙而言,词语世界并不逊于语法世界,甚至还更胜一筹。因为人们不但在造字构词上表现出与构造短语和句子同样丰富的创造力,而且在对个别单词的记忆上也需要用到某种专门的技艺。

回想一下前面提到的“wug测试”,几乎所有学龄前儿童都可以顺利通过。“这是一只wug,现在这里有两只了,这里有两只______。”在接受测试之前,孩子们既没有听过“wugs”一词,也不曾因为说出“wugs”一词而得到过奖赏。因此,单词并不是简单地从心理档案中调取出来的,人们必定拥有一套心理规则,能够在现有单词的基础上生成新的单词,好比说“如果要将名词变成复数,必须在词尾加上后缀‘-s’”。作为一种离散组合系统,人类语言背后的工程技巧至少表现在两个不同层面:一是依据句法规则,将单词组成句子和短语;二是依据一套所谓的“词法”(morphology)规则,将一些更小的元素组合成单词。

与其他语言相比,英语词法的创造力就显得相形见绌。在英语中,名词只有两种形式(“duck”和“ducks”),动词只有四种形式(“quack”“quacks” “quacked”和“quacking”)。而在现代意大利语和西班牙语中,每个动词都有大约50种形式。在古希腊语中,动词形式达到350种。土耳其语的动词形式则更为惊人,居然有200万种!我前面提到的许多语言,如爱斯基摩语、阿帕切语、霍皮语、奇温久语和美国手语,都以这种惊人的创造力著称于世。它们是如何做到这一点的呢?我们不妨以奇温久语为例:奇温久语是班图语的一支,据说这种语言与英语比起来就像是国际象棋与国际跳棋。在奇温久语中,动词“Näïkìm´lyìïà”的意思是“他在替她吃它”,这个单词一共由8个部分组成:

● N-:“主题”标记。它表明这个单词是当前谈话的“中心”。

● -ä-:“主语一致性”标记。它表示“吃东西的人”属于16种词性中的第一性,即“单数的人”(前面已经说过,语言学家所说的“性”与性别无关,而是“种类”的意思)。其他名词词性还包括:复数的人、狭窄或长形的物体、成双或成群的物体、量词“双”或者“群”,工具、动物、身体部位、指小词(事物的缩小状态或小巧形态)、抽象的特性、准确的位置以及一般的地点。

● -ï-:现在时态。班图语中的时态类型还有:今天、今天早些时候、昨天、不早于昨天、昨天或更早的时候、遥远的过去、日常性的、正在进行的、连续性的、假设中的、将来发生的、时间未定的、尚未发生的、有时发生的。

● -kì-:“宾语一致性”标记。此处表示“被吃的东西”,属于第7性。

● -mˊ-:“受益者”标记。它表明该动作的发生是为了谁的利益,此处的受益者属于16种词性中的第1性。

● -lyì-:动词“吃”。

● -ï-:“受事”(applicative)标记。它表明在整个动作中多出了一个参与角色,此处指的是受益者。如果用英语来打比方,这就如同要求我们在说到“I baked her a cake”(我为她烤了一块蛋糕)时,必须在动词“bake”后加上某种后缀,以区别于“I baked a cake”(我烤了一块蛋糕)。

● -à:词尾元音。表明此处是陈述语气,而非虚拟语气。

如果你将以上7种前后缀的组合方式全部列举出来,大致可以得到50万个结果,而奇温久语中的每个动词都有这么多的可能形式。可以说,奇温久语和其他类似的语言是将整个句子装进了一个复杂动词之中的。

不过,我对英语的看法似乎略欠公平。在“屈折”(inflectional)构词——通过词形变化来实现语法功能方面,英语的确显得简单粗糙,例如给名词加上“-s”表示复数,或给动词加上“-ed”表示过去时态。但是,英语拥有自己的“派生”(derivational)构词法,即在原有单词的基础上派生出新的单词。比如后缀“-able”可以将表示“去做某事”的动词转变为形容词,表示“能够做成某事”,例如“learnable”(可学会的)、“teachable”(可教会的)以及“huggable”(可拥抱的)。在英语中,派生后缀的数量多得惊人,以下是一些较为常见的后缀:

此外,英语拥有一套轻松自如的“复合”(compounding)构词法,它可以将两个单词灵活地组合起来,构成一个新的单词,例如“toothbrush”(牙刷)和“mouse-eater”(食鼠怪)。多亏有了这些方法,才使得“词法贫瘠”的英语可以拥有海量词语。计算机语言学家理查德·史伯乐(Richard Sproat)曾将美联社自1988年2月中旬以来的新闻稿件中共计4 400万个单词进行了汇集,以便从中梳理出个体单词的数量。截至当年12月30日,他一共收集到30万个不同的单词,大约相当于一部足本英语词典的收词量。你或许会认为这一定已经包含了所有可能出现在新闻稿件中的英语单词,但当史伯乐翻到12月31日的新闻稿时,他又发现了至少35个新词,如“instrumenting”“counterprograms”“armhole” “part-Vulcan”“fuzzier”“groveled”“boulderlike”“mega-lizard”“traumatological”和“ex-critters”。

更令人印象深刻的是,每种构词规则又可以与其他规则相结合,或者进行自我重复,以形成新的单词。例如,我们可能会说到某些炸薯条是“不可以用微波加热的”(unmicrowaveability),或者提到某个用来存放牙刷架吸盘的“牙刷架吸盘存放盒”(toothbrush-holder fastener box)。这使得语言中可能拥有的单词数量更为庞大,它就像句子的数量一样,可以是无穷无尽的。撇开那些为打破吉尼斯纪录而杜撰出来的古怪单词不谈,迄今为止,英语中最长的单词或许是“floccinaucinihilipilification”,《牛津英语词典》对其的解释是“将某物看得一文不值”。但纪录总是要被打破的:

floccinaucinihilipilificational:

与“将某物看得一文不值”有关的。

floccinaucinihilipilificationalize:

使某物与“将某物看得一文不值”有关。

floccinaucinihilipilificationalization:

使某物与“将某物看得一文不值”有关的行为。

floccinaucinihilipilificationalizational:

与使某物与“将某物看得一文不值”有关的行为有关的。

floccinaucinihilipilificationalizationalize:

使某物与使某物与“将某物看得一文不值”有关的行为有关的行为。

如果你患有“恐长字症”(sesquipedaliaphobia)的话,你可以想一想你的曾祖母(great-grandmother),你的曾曾祖母(great-great-grandmother),你的曾曾曾祖母(great-great-great-grandmother),而一共可以有多少个“曾”字,就看你的家族自夏娃以来一共经历了多少代了。

更重要的是,单词和句子一样有精密的层级结构,而并非出自字串机之手(这种机器从某个列表中选取一个元素,再移到下一个列表选取一个元素,然后是再下一个列表……)。当里根总统提出战略防御计划,也即人们熟知的“星球大战”计划时,他设想在未来的世界里,美国可以用“反导弹导弹”(anti-missile missile)拦截苏联发射的导弹,但批评人士指出,苏联完全可以用“反反导弹导弹导弹”(anti-anti-missile-missile missile)予以还击。不过这并不是问题,那些毕业于麻省理工学院的工程师们宣称,我们只须制造一个反反反导弹导弹导弹导弹”(anti-anti-anti-missile-missile-missile missile)就行。这些高科技武器也需要一种高科技语法,用以记录单词的开头有多少个“anti”,以便在同等数量的“missile”之后再添加一个“missile”,从而结束这个单词。单词的结构语法(即单词的短语结构语法)能够通过在“anti”和“missile”之间嵌入单词来实现造词目的,而字串机则做不到这一点,因为当它移动到这个冗长单词的末尾时,早已忘记了自己在词头部分放置了什么。

词是词干的扩展

和句法一样,词法也是一个设计精巧的系统,许多看似古怪的单词都是其内在逻辑的预期结果。单词拥有一个精密的结构,构成部件叫作“语素”(morpheme),它们以特定方式组合在一起。单词的结构系统是X-杠短语结构系统的延伸,在这个系统中,大的名词性成分建立在小的名词性成分之上,而小的名词性成分又建立在更小的名词性成分之上,以此类推。与名词有关的最大短语是名词短语,名词短语中包含了一个N-杠,而N-杠中包含一个名词——单词。我们只需要将这个解剖过程继续下去,将单词分解成更细小的名词性部件,就可以从句法跳到词法了。

下面是单词“dogs”的结构图:

位于这棵小树顶端的N代表“名词”,这意味着整个单词可以插入任何一个名词短语的名词插槽之中。在单词之下的层级中,我们看到了两个部分:一是名词原形“dog”,通常被称为“词干”(stem);一是复数的词形变化“-s”。此处涉及的词形变化规则(即著名的“wug测试”)十分简单:

N → Nstem Ninflection

一个名词可以由一个名词词干加上一个名词词形变化构成。

这一规则能够与心理词典很好地衔接:“dog”可以被列为名词词干,意为“狗”;“-s”则可以被列为名词的词形变化,意为“复数的”。

这是最简单、也最精练的语法规则。在我的实验室中,我们将它看作一个易于研究的心理语法实例。通过它,我们可以详细了解语言规则的心理表现,从婴儿到老年,从正常人到神经受损的患者,这与生物学家通过果蝇来研究基因机制大致相同。将词干与词形变化黏连起来的规则虽然简单,但却是一项功能强大的运算操作,因为它能够辨认出抽象的心理符号,例如名词词干,而不是与某个特定的单词、语音或者意义列表相关联。我们可以将这个规则应用于位于心理词典“名词词干”条目之下的任何项目,而不必在意这个单词的含义。我们不仅可以将“dog”转变成“dogs”,还可以将“hour”转变成“hours”、“justification”转变成“justifications”。同样,这个规则允许我们将任意一个名词转换成复数,而不必管它的读音是什么,我们同样懂得如何将不规则发音的单词变成复数,例如“the Gorbachevs”“the Bachs”。同样的道理,这个规则可以完美地应用到全新的名词上,例如“faxes”“dweebs”“wugs”和“zots”。

正因为我们可以毫不费力地运用这个规则,所以也许只有将它和许多计算机学家标榜为未来潮流的计算机程序进行对比时,才能吸引些许赞赏的目光。这些被称作“人工神经网络”(artificial neural networks)的程序运用的是不同的规则,它们依靠的是类比。“wug”之所以应该转变成“wugged”,是因为它与网络所能识别的“hug-hugged”“walk-walked”等成千上万个动词变形实例大体相似。但是,当网络碰到一个与以往经验毫不类似的全新动词时,它就不知所措了,因为这种网络缺乏一个抽象的、包罗万象的范畴“动词词干”助它一臂之力,为它添加词缀。我们不妨将人和人工神经网络在“wug测试”中的一些典型做法进行对比:

同样,词干也可以由位于复合词较深层级的部分构成,例如复合词“Yugoslavia report”(南斯拉夫报告)、“sushi-lover”(寿司爱好者)、“broccoli-green”(西兰花般的绿色)、“toothbrush”(牙刷):

这两个词干连在一起,构成一个新的词干。规则如下:

Nstem → Nstem Nstem

一个名词词干可以由一个名词词干加上另一个名词词干构成。

在英语中,复合词通常由一个连字符来连接,或者直接将两个单词合并而成,不过也可以将两个部分分开拼写,就像两个独立的单词。这种情况往往会让你的语法老师产生混淆,他会告诉你说,这里的“Yugoslavia”(南斯拉夫)是一个形容词。然而,只要将“Yugoslavia”和真正的形容词(如“interesting”)进行一番比较,你就知道语法老师的说法并不正确,你可以说“This report seems interesting”(这份报告似乎很有趣),但不能说“This report seems Yugoslavia”(这份报告似乎很南斯拉夫),这是区分复合词与短语的一个简单方法。复合词的重音通常落在第一个单词上,而短语的重音则往往在第二个单词上。例如短语“dark róom”指的是没有光亮的房间,而复合词“dárk room”(暗室)则是指摄影师冲洗照片的暗室,在冲洗完照片之后,暗室是可以开灯的。短语“black bóard”指的是黑色的木板,而复合词“bláckboards”(黑板)则可以是绿色的,甚至可以是白色的。如果缺乏读音或标点上的线索,一些字串既可以被看作是短语,也可以被看作是复合词。例如下面几则新闻标题:

Squad Helps Dog Bite Victim

警方救护被狗咬伤的受害者。——又可理解为:警方助狗咬伤受害者。

Man Eating Piranha Mistakenly Sold as Pet Fish

吃人的水虎鱼被误作为观赏鱼出售。——又可理解为:吃水虎鱼的男人被误作为观赏鱼出售。

Juvenile Court to Try Shooting Defendant

少年法庭审问枪击事件的被告。——又可理解为:少年法庭试图枪击被告。

旧的词干加上某种词缀(前缀和后缀),也可以形成新的词干,例如“-al”“-ize”和“-ation”。通过循环使用这些词缀,我可以制造出长度无限的单词(就像“sensationalizationalization”)。举例而言,动词加上“-able”可以创造出一个形容词,如“crunch-crunchable”,后缀“-er”可以将任何动词变成名词,如“crunch-cruncher”,后缀“-ness”可以将任何形容词变成名词,如“crunchy-crunchiness”。

它的结构规则是:

Astem →Stem Astemaffix

一个形容词词干可以由一个词干加上一个后缀构成。

在心理词典中,后缀“-able”的条目大体如下:

-able:

形容词词干的词缀

意思:能够被X的

附着于动词词干之上

与屈折变化一样,词干词缀也具有杂交性,它可以与正确类别下的任何词干进行匹配,所以我们可以创造出“crunchable”“scrunchable”“shmooshable”“wuggable”等一系列形容词,它们的含义也是可预测的:“能够被压碎的”“能够被碾碎的”“能够被缓解的”,甚至“能够被wugged的”,无论wug的意思是什么。当然,我可以找到一个例外:句子“I asked him what he thought of my review of his book, and his response was unprintable”(我问他怎么看待我为他的书所写的评论,他的回答是不宜刊登的),“unprintable”一词的意思比“incapable of being printed”(不能够被刊登出来)更具深意。

我们可以依据构成元素的意义来计算整个词干的意义,这类似于句法中所使用的方法。一个特殊的元素是中心语,它决定了整个单词的指涉对象。正如短语“the cat in the hat”涉及的是一只猫,“cat”是它的中心语一样,“Yugoslavia report”涉及的是一份报告,“shmooshability”涉及的是一种能力。因此,“report”和“ability”是这些单词的中心语。英语单词的中心语就是位于最右边的语素。