首页 » 语言本能:探索人类语言进化的奥秘 » 语言本能:探索人类语言进化的奥秘全文在线阅读

《语言本能:探索人类语言进化的奥秘》是Walkmen,还是Walkmans?

关灯直达底部

语法中的不规则现象就像人类某些古怪变态的行为一样。不规则的形式在“理性设计”的语言中被明确地废除,例如世界语、奥威尔的新话以及罗伯特·海因莱因(Robert Heinlein)的科幻小说《星际时代》(Time for the Stars)中行星联盟所使用的辅助性语言。也许是为了挑战这种严格的控制,某位女士最近在《纽约书评》(New York Review of Books)上刊登了一则别出心裁的广告,希望寻求到一位不拘传统的灵魂伴侣:

你是不是一个不规则动词,相信名词比形容词更有力量?本人离异5年,白人,职业女性,身居欧洲,兼职小提琴手。本人身材苗条、具有魅力,孩子已婚……寻求一位情感细腻、积极乐观、充满活力的男子为伴,要求年龄在50~60岁之间,注重健康,爱动脑筋,为人诚实、忠贞和坦诚。

小说家玛格丽特·尤瑟纳尔(Marguerite Yourcenar)也曾对语法的不规则现象和人类的普遍处境进行了一番点评:

语法,既拥有逻辑的规则,又掺杂着武断的用法,它让年轻的头脑预先品尝到法律、道德这些关乎人类行为的科学,以及建立在人们本能经验之上的一切固有秩序带给他们的滋味。

虽然不规则现象象征着不受羁绊的人类精神,但它却被严格地密封于单词的构造系统之中。总体而言,这个系统设计得非常巧妙。不规则形式是词根,它位于词干之内,词干则包含在单词之内,而部分单词又可以通过常规变形来生成。这种分层方法不仅可以对许多英语单词的合理性做出预测(例如,为什么“Darwinianism”听起来比“Darwinismian”要更加顺耳),它还提供了一个简明的解释,可以回答与那些看似不合逻辑的用法相关的许多琐碎问题。例如,为什么在棒球比赛中,击球手是“flied out to center field”(击出腾空球至中外场被守方球员接住而出局),而不是“flown out to center field”?为什么多伦多冰球队名叫“Maple Leafs”(枫叶)而不是“Maple Leaves”?为什么多数人认为“Walkman”(随身听)的复数形式是“Walkmans”而不是“Walkmen”?当一个人说自己女儿的朋友都是“low-lives”(人渣)时,我们为什么会觉得非常别扭?

为什么这些不规则形式都被弃之不用?翻开任何一本写作手册或者语法指南,它们提供的解释不外乎以下两种,而这两种解释都是错的。第一种解释是,现代英语已经对不规则单词关上了大门,所以新加入的单词都必须以规则的形式出现。这种说法并不正确,我可以创造出一些新的单词,例如“re-sing”和“out-sing”,它们的过去式显然是“re-sang”和“out-sang”,而不是“re-singed”和“out-singed”。同样,最近我读到一篇文章,说的是一些中国农民带着小油罐在油田四处转悠,从无人看守的油井中盗取石油的事情。文章把这些人称作“oil-mice”(油耗子),而非“oil-mouses”。第二种解释是,当一个单词获得了与字面内容毫不相干的全新意思时,例如棒球中的“fly out”,它就必须遵循规则变化。然而,“oil-mice”的例子就是一个明显的反例,此外,还有许多具有象征意义的词语由不规则名词构成,它们依然保持着不规则的变化形式,例如“sawteeth”(而非“sawtooths”)、“Freud’s intellectual children”(而非“childs”)、“snowmen”(而非“snowmans”),等等。同样,动词“blow”在俚语“to blow him away”中表示“暗杀”的意思,在“to blow it off”中表示“无视”的意思,但它的过去式仍然采用不规则变化,例如“blew him away”和“blew off the exam”,而非“blowed him away”和“blowed off the exam”。

能够真正解释“flied out”和“Walkmans”等形式变化的是我们用以解读复合词的心理算法,即依据其内部单纯词的意思来诠释复合词的意思。我们曾经提到,如果某个大词是由较小的单词建构而成的,那么这个大词的所有特性都来自其内部最后端的那个单词,也就是中心语。动词“overshoot”的中心语是动词“shoot”(发射),因此“overshooting”属于“shooting”的一种,而且它是一个动词,因为“shoot”是一个动词。同样,“workman”(工人)是个单数名词,因为它的中心语“man”是个单数名词,它指的是一种人,而不是一类工作。这两个单词的结构如下:

重要的是,这条从中心语一直延伸到树形图顶端的管道将中心语携带的所有信息都传递了上去,其中不仅包括中心语的名词性或动词性和包括中心语的意思,还包括它的不规则形式。举例而言,在心理词典中,“shoot”一词的条目会注明:不规则的过去式“shot”。这一信息将会向上传递,并和其他信息一样,成为复合词“overshoot”的特性,因此“overshoot”的过去式是“overshot”而非“overshooted”。同样,“man”一词携带着复数形式“men”的标签,由于“man”是“workman”的中心语,这个标签也会上移到代表复合词“workman”的上,所以“workman”的复数形式是“workmen”。这也是我们为什么采用“out-sang”“oil-mice”“sawteeth”和“blew him away”的原因。

现在我们可以回答那些琐碎的问题了。“flied out”和“Walkmans”之所以显得有些奇特,是因为它们都没有中心语。无中心语单词是一种特殊词干,出于某种原因,它们的特性与位于词中最右端的元素有所不同,而普通单词的特性则往往取决于词中最右端的元素。举一个简单的例子,“low-life”就是一个无中心语单词,它指的不是一种“生活”(life),而是一种人,一种活在社会底层的人。因此在“low-life”一词中,正常的传输管道被阻塞了。而且,单词内部的管道不可能只阻塞某一种信息,一旦管道因为某种原因出现了阻塞,所有的信息都不能通过。因此,如果“low-life”无法获取“life”的意思,它也就无法拥有“life”的复数形式。“life”一词的不规则形式“lives”被束缚于心理词典之内,无法应用到“low-life”上,而通用的规则变化“添加后缀-s”则趁机占领了阵地,因此出现了“low-lifes”的形式。通过类似的无意识推理,英语使用者很自然地选择了“saber-tooths”(剑齿虎,它指的是一种老虎,而非一种牙齿)、“tenderfoots”(初级童子军,它指的不是某种类型的脚,而是身体还很柔弱的小孩)、“flatfoots”(它也不是某种类型的脚,而是“警察”的俚语)和“still lifes”(静物画,它指的不是一种生活,而是一种绘画类型)。

自从索尼公司发明“Walkman”(随身听)以来,人们都不确定它的复数形式应该是“Walkmen”还是“Walkmans”(即便是毫无性别歧视的替代词“Walkperson”也解决不了这个难题,因为我们仍然必须在“Walkpersons”和“Walkpeople”之间作出选择)。很多人觉得“Walkmans”正确,是因为它是一个无中心语单词:“Walkman”指的不是某种类型的人,因此它的意思并非获自其内部单词“man”,而根据无中心语词的结构逻辑,它也无法借用“man”的复数形式。不过,无论采用哪一种复数形式,它都显得很不自然,因为“Walkman”和“man”之间的关系令人颇感费解,之所以这么说,是因为这个单词并非是依据某种广受认可的方式组合而成的。它是一种在日本非常流行的“伪英语”,常常用于标语和产品名称。例如,日本有一种名为“Sweat”的软饮料,深受大众喜爱,此外在一些T恤上还印着“CIRCUIT BEAVER”“NURSE MENTALITY”、“BONERACTIVE WEAR”等不知所云的标语。对于如何表述两个以上的随身听,索尼公司曾有一个正式的答复。由于害怕自己的商标像“阿司匹林”(aspirin)、“舒洁”(kleenex)一样沦为普通名词,索尼公司坚持认为“Walkman”的复数形式是“Walkman Personal Stereos”,以此绕开语法上的问题。

那么“fly out”一词呢?作为一个棒球术语,它并非直接源于我们熟知的动词“fly”(飞行),而是源于名词“fly”(腾空球)。“fly out”的意思是“因击出腾空球而被接杀出局”,当然,作为名词的“fly”本身是源自动词“fly”,这种层层引申的结构可以用下面这个竹竿状的树形图来表示:

根据树形图最顶端的标签,整个单词属于动词的范畴,但位于下一层级的构成元素却是一个名词。因此,“fly out”就像“low-life”一样,是无中心语单词。如果名词“fly”是中心语,那么“fly out”也应该是个名词,但它不是。由于缺少中心语和联通管道,原动词“fly”的不规则形式(“flew”“flown”)被束缚在树形图的最低层级,不能上升至整个单词的层面。所以,“添加后缀-ed”的常规方案便临危受命,充当起表明时态的角色,因此我们才会说出“Wade Boggs flied out”这样的句子。让“fly out”失去不规则变化能力的并不是它的特殊含义,而是因为它是一个基于名词生成的动词。正是依照相同的逻辑,我们才会说“They ringed the city with artillery”(他们用大炮包围了这座城市)而非“They rang the city with artillery”,“He grandstanded to the crowd”(他在人群面前招摇地表演)而非“He grandstood to the crowd”。

这是一个普遍适用的原则。还记得宇航员萨利·莱德(Sally Ride)吗?她是美国首位飞上太空的女性,因此受到广泛关注。但就在最近,一位名叫梅·杰米森(Mae Jemison)的女性抢了她的风头。杰米森不仅是美国第一位黑人女航天员,而且她还被《人物》(People)选为1993年度“全球50位最美人士”之一。因此就知名度而言,她可谓“比萨利·莱德还萨利·莱德”(out-Sally-Rided Sally Ride,而非out-Sally-Ridden Sally Ride)。一直以来,新新监狱(Sing Sing)都是纽约州最为臭名昭著的监狱,但自从1971年阿提卡(Attica)监狱爆发骚乱之后,阿提卡监狱就变得“比新新监狱还新新监狱”(out-Sing-Singed Sing Sing,而非out-Sing-Sung Sing Sing)。

至于“Maple Leafs”,这个复数形式并不是加在单词“leaf”(叶子)上,而是加在专有名称“Maple Leaf”(枫叶)上的,它是加拿大的国家象征。名称与名词有所不同。例如,名词前面可以加冠词“the”,而名称则不行。例如你不能把某个人称为“the Donald”,除非你是唐纳德·特朗普(Donald Trump)的前妻、以捷克语为母语的伊凡娜·特朗普(Ivana Trump)。因此对于冰球队而言,“Maple Leaf”是一个无中心语名词,因为这个名词是基于一个非名词的单词形成的。如果一个名词的名词性并非源自其内部的某个名词,那么它也无法获得其内部名词的不规则变化。因此,“Maple Leafs”便成为了默认选项。这个解释也可以回答脱口秀主持人大卫·莱特曼(David Letterman)提出的一个问题,在最近一期《深夜秀》(Late Night)节目中,莱特曼一直困惑不解:为什么迈阿密新组建的棒球大联盟球队被叫作“Florida Marlins”(佛罗里达马林鱼队)而非“Florida Marlin”呢,“marlin”(马林鱼)一词本身不就是复数形式了吗?事实上,这个解释适用于所有建立在名称之上的名词。

I’m sick of dealing with all the Mickey Mouses(而非“Mickey Mice”)in this administration.

我讨厌处理这个部门的琐碎事务。

Hollywood has been relying on movies based on comic book heroes and their sequels, like the three Supermans(而非“Supermen”)and the two Batmans(而非“Batmen”).

好莱坞一直以翻拍英雄漫画及其续集为支撑,例如三部《超人》电影和两部《蝙蝠侠》电影。

Why has the second half of the twentieth century produced no Thomas Manns(而非“Thomas Menn”)?

为什么20世纪下半叶产生不了托马斯·曼式的人物?

We’re having Julia Child and her husband over for dinner tonight. You know, the Childs(而非“the Children”)are great cooks.

我们今晚和朱莉娅·查尔德夫妇共进晚餐。你知道的,查尔德一家厨艺非凡。

可见,不规则形式位于单词结构树形图的最底层,也就是心理词典中的词根、词干的插入层。发展心理语言学家彼得·戈登(Peter Gordon)曾利用这一特性,通过一个巧妙的实验,揭示出孩子们的心智结构是如何依据单词的结构逻辑设计的。

戈登关注的是一个古怪的语言现象,这个现象最早为语言学家保罗·柯帕斯基(Paul Kiparsky)所发现:复合词可以由不规则复数构成,但不能由规则复数构成。例如一间鼠患成灾的房子可以形容为“mice-infested”,但如果用“rats-infested”就显得不伦不类了。我们可以“rat-infested”来表示鼠患成灾的意思,尽管从定义上说一只老鼠(rat)构不成一场灾害。同样,人们只会说“men-bashing”(对男性的攻击),但不会说“gays-bashing”(正确的说法是“gay-bashing”,对同性恋的攻击),只会说“teethmarks”(牙印)但不会说“clawsmarks”(正确的说法是“clawmarks”,爪印)。曾经有一首名为“purple-people-eater”(紫色吃人怪)的歌曲,但如果把它改成“purple-babies-eater”就不合语法了。虽然不规则复数和规则复数一个符合要求,一个不符合要求,但它们在意义上却是相同的,因此一定是语法的不规则性导致了这种差别。

单词结构理论可以轻松解释这一效应。不规则的复数形式显得特立独行,因此被作为词根和词干存储于心理词典中,而无法通过规则来生成。由于这种特殊的身份,它们可以用于复合词的构造,通过“词干+词干”的方式形成新的单词。但是,规则复数却不是作为词干存储于心理词典之中,它们是在必要的时候,依据词形变化规则临时组装的合成词。它们出现在“词根→词干→单词”的装配过程的末尾阶段,因此无法应用于复合规则之中,因为复合规则只能从心理词典中提取词根或者词干。

The

Instinct

Language

语言认知实验室

戈登发现,3~5岁的孩子能够严格地遵从这一规则。他首先向孩子们展示一个木偶,并对他们说:“这是一只喜欢吃泥巴(mud)的怪物,你该怎么称呼它呢?”然后把答案公布出来:“mud-eater”。孩子们很喜欢这个游戏,而且这个怪物吃的东西越是恶心,孩子们就越兴奋,急切地想填上问题的答案,这常常使一旁观看的家长感到十分无奈。接下来是实验的关键部分,当戈登问“喜欢吃老鼠(mice)的怪物叫什么”时,孩子们的回答是“mice-eater”,但如果戈登将“mice”换成“rats”时,孩子们的回答却不是“rats-eater”了,而是“rat-eater”。而且,即便有些孩子平时会将“mouse”的复数形式错认成“mouses”,他们也不会把这个木偶叫作“mouses-eater”。换句话说,对于复合词构造过程中的这些细微要求,孩子们表现出了充分的尊重。这表明,这些规则既存在于成人的潜意识中,也存在于孩子们的潜意识中。

不过,当戈登着手调查孩子是如何掌握这一语法要求时,他的发现就显得更为有趣了。戈登一开始的想法是:通过倾听父母的日常谈话,孩子们懂得了复合词中出现的复数形式应该是不规则的,然后将这一原则应用到其他各类复合词上。但他发现这是不可能的,母亲对孩子的谈话中不可能出现包含复数的复合词。大多数复合词包含的都是单数名词,例如“toothbrush”。像“mice-infested”这样的复合词虽然有语法上成立,但却很少有人这么说。虽然儿童无法从成人的言语中获悉相关的语法规则,但却能正确地选择“mice-eater”而非“rats-eater”,这再一次证明了儿童能够在“输入贫乏”的前提下掌握语言,同时也说明语法的另一个基本层面具有先天性的特点。正如我们在前文所见,史蒂芬·克雷恩和中山峰春的实验表明,在句法的层面上,儿童能够自动区分字串和短语。同样,戈登的“mice-eater”实验证明,在词法的层面上,儿童能够自动区分心理词典中的词根和依据规则创造出来的屈折词。

单词,句法规则下的最小单位

总之,单词是一个复杂的东西,但单词究竟是个什么东西呢?我们已经看到,“单词”是依据词法规则由各个部件构造而成的,但它与短语和句子有什么不同呢?它是不是就是索绪尔所说的那种必须死记硬背、毫无道理的“符号”,例证了语言机制的第一原理呢(另一原理是离散组合系统)?我们之所以感到困惑,是因为我们日常所说的“单词”(word)一词并不是一种科学的精确表述。它拥有两种含义。

到目前为止,我在本章所使用的“单词”一词都是一个语言学概念,虽然它是依据词法规则由各个部件构造而成的,但相对于句法规则而言,它却是不可分割的最小单位,相当于“句法原子”(syntactic atom)——在希腊语中,原子一词就是“不可分割”的意思。句法规则可以深入到一个句子或短语的内部,对包含其中的更小短语进行切割和黏连。例如,疑问句的生成规则可以深入句子“This monster eats mice”(这只怪物吃老鼠)的内部,将与“mice”对应的短语移到句子开头,变成“What did this monster eat”(这只怪物吃什么)。但是,句法规则在短语和单词的分界线上止步不前,尽管单词也是由各个部件组合而成的,但句法规则却不能探入单词内部去摆弄这些部件。例如,问句规则无法探入句子“This monster is a mice-eater”(这只怪物是个食鼠者)中的“mice-eater”一词之内,将与“mice”对应的语素移到句子开头,由此形成的问句就会显得莫名其妙:“What is this monster an-eater?”(答案是“mice”)。同样,句法规则可以将副词插入短语之中,例如“This monster eats mice quickly”(这只怪物迅速地吃老鼠),但却不能将副词插入单词之中,例如“This monster is a mice-quickly-eater”。鉴于以上原因,我们认为,虽然单词是依据一套固定规则由各个部件构造而成的,但它与短语存在差别,短语依据的是一套不同的规则。因此,通常所说的“单词”一词的精确定义是:一种建立在词法规则之上且不能被句法规则分割的语言单位。

“单词”还拥有另一个迥然不同的含义,它指的是一种需要我们死记硬背的语块:即一串与某个特定意义形成任意关联的语言材料,也就是我们的心理词典列出的一个个条目。语法学家安娜·迪休洛(Anna Maria Di Sciullo)和埃德温·威廉姆斯(Edwin Williams)创造了一个术语“句素”(listeme),即需要死记硬背的语言单位,用以指代“单词”这一含义(这个术语以词法单位语素和语音单位音素为参照对象)。需要注意的是,句素的概念与“单词”的第一个精确含义(即句法原子的概念)并不完全吻合。句素可以是树形图上任意大小的分支,它不是由某个规则自动产生的,而是必须强行把它记住。不妨以成语为例,我们无法依据中心语和扮演角色的关系原则,通过构成部件的字面意义推导出以下成语的意义:“kick the bucket”(一命呜呼)、“buy the farm”(死于非命)、“spill the beans”(泄露秘密)、“screw the pooch”(把事情搞砸)、“give up the ghost”(驾鹤西游)、“hit the fan”(遭遇麻烦)、“go bananas”(精神错乱)。我们必须强行记住这些短语大小的语言单位所表达的意义,就好像它们是一些简单的单词,这就是句素。从这个意义上说,这些成语是名副其实的“单词”。迪休洛和威廉姆斯以“语法沙文主义者”的口吻对心理词典做了如下描述:“如果将心理词典看成是一群句素的集合,那么就本质而言,这部词典也显得太过乏味了……心理词典就像是一个监狱,它只容纳那些不法之徒,它的收容对象只有一个共同点:无法无天,不受管束。”

在本章的余下部分,我将专门探讨“单词”的第二个含义:句素。这将是一场“监狱改革”,我想证明的是,虽然心理词典容纳的都是一些不守规则的句素,但它仍然值得我们的尊敬和重视。也许在语法学家看来,让孩子们将父母所说的单词一个个强记心中是种非常野蛮的刑罚,但它其实是一门精妙绝伦的技艺。

句素

心理词典有一个非凡的特征,它拥有令人惊叹的记忆能力。一个普通人大约知道多少个单词?如果你像大多数人一样,以人们听过或读过的单词数量为计算标准,你可能会认为未受教育者的单词量大概是几百个,受过教育的人的单词量大概是几千个,而像莎士比亚这样的天才作家则可以达到15 000个(这是莎翁戏剧集和十四行诗里出现过的单词总数)。

然而,这与真正的答案相去甚远。人们认识的单词比他们在具体的时间、场合下使用过的单词要多得多。为了检测一个人的词语量(这里的词语指的是句素的概念,而非词法规则的产物,因为后者是无穷无尽的),心理学家采用了以下方法。首先,找来一本容量最大且未经删节的词典,如若词典太小,人们知道的许多单词就有可能没有收录进去。此处以芬克与瓦格诺出版社(Funk & Wagnall)出版的《新版标准足本词典》(New Standard Unabridged Dictionary)为例,它一共有45万个词条,数目非常可观。不过对于测试而言,这个数目显得太大了一点,即使一个单词30秒钟,一天工作8个小时,也需要一年多的时间才能全部测完。因此我们可以进行抽样,比如说,每8页的左手页第一列第三个词条。每个词条通常都含有多个含义,例如:“hard:(1)坚固的(2)困难的(3)严厉的(4)费力的……”,如果把它们都计算在内,就需要硬性地对这些含义进行合并或者区分,因此可行的方法是,一个人只要知道某个单词的一个含义,就可以将这个单词计入他的词语量中,而不必知道该单词的所有含义。研究人员向测试对象展示样本中的每个单词,并要求他们从提供的选项中选出意思最为接近的词。经过猜测校正后,再将正确率乘以词典的收词数,就可以估算出一个人的词语量。

事实上,还有一个校正工作必须事先执行。词典是一种商品,而非科学工具。出于广告的目的,词典编纂者通常会虚报他们的收词数量(例如:“最具权威!包罗万象!总字数超过170万,16万个词条,还包括16页彩色图表!”)。他们常常将一些复合词或者词缀形式加入词条,以达到“增肥”的目的,而这些都是可以依据词根的意思和词法规则来推测其意思的语言单位,而非真正的句素。例如,我的案头词典在词条“sail”(帆)之下就列有许多派生词:“sailplane”(滑翔机)、“sailer”(帆船)、“sailless”(无帆的)、“sailing-boat”(帆船)以及“sailcloth”(帆布)。事实上,即便我以前从未见过这些单词,也可以推断出它们的意思。

The

Instinct

Language

语言认知实验室

最精确的估算来自心理学家威廉·纳吉(William Nagy)和理查德·安德森(Richard Anderson)。他们从一份包含227 553个单词的列表入手,其中有45 453个词根、词干。在剩下的182 100个派生词和复合词中,他们认为除了42 080个单词之外,其他的都可以根据其构成部件的含义进行解读。因此,整个列表中句素的总量为45 453+42 080=87 533。通过进一步的抽样和测试,纳吉和安德森计算出美国一名普通高中毕业生的词语量大致为45 000个单词,这是莎士比亚的单词使用量的3倍!实际上,这还是一个低估了的数字,因为专有名词、数字、外来词语、缩略词以及许多不可拆分的常用复合词仍被排除在外。我们没有必要在估算词语量的时候遵循拼字游戏的规则,这些单词都属于句素,完全应该被计算在内。如果把它们包括在内的话,美国一名普通高中毕业生的词语量可能上升到60 000个单词(相当于4个莎士比亚),而那些阅读量更大的优秀学生的词语量则可能再翻一番,相当于8个莎士比亚。

60 000个单词是多还是少?我们可以计算一下学习这些单词所需的速度,以帮助我们了解这一问题。一个人通常是在12个月大的时候开始学习单词,因此一位高中毕业生有17年的时间学习这些单词,这等于说从他们一岁起平均每天必须学习10个单词,或者说在睡觉之外的时间里平均每90分钟就必须学习1个单词。运用同样的方法,我们可以推算出6岁大的孩子的平均词语量约为13 000个,所以像《迪克和简》(Dick and Jane)这样的儿童读物才会显得乏味枯燥,因为它们极大地低估了儿童的词语量。通过这些简单的计算,我们可以发现学龄前儿童虽然接触到的语言环境比较有限,但却像一台真空“吸词器”,在他醒着的时候,每隔两个小时就会吸入一个新的单词,日复一日,连续不断。而且需要注意的是,我们所谈论的对象是句素,它们的意思都是任意生成的,这就像你从蹒跚学步开始每醒着的90分钟内就要记住一个全新的击球率、约会日期或者电话号码。大脑似乎为心理词典预留了一个容量超大的存储空间和一个运转迅速的转录设备。事实上,心理学家苏珊·凯里(Susan Carey)的一项自然性研究已经证明:当你和一个3岁的孩子聊天时,如果你无意之中说出某个新的颜色词,比如说“橄榄色”,这个孩子很可能在5个星期之后还能记起这个单词。