《伏尼契手稿》是一部非常古老的书,232页,配有插图,全书用密码写成,至今无人能破译。作者是谁?主题是什么?阐释什么意义?这些都是未解之谜。甚至没有人知道,这些密码在解码之后是什么语言。书中奇异的插图——裸体的妇人、怪异的发明、不存在的植物群落和动物群落,吸引密码破译者进行研究。彩色插图以中世纪医书的严谨风格绘制而成,而这些画表现的景象和意境却是在地球上和天空中前所未见的。一些平面图展示了古怪的、弯管风格的管道系统,图中美丽的少女坐在浴盆里嬉戏,浴盆连着有分叉、可转动的水管。这部手稿有一种非常奇异的风格,似乎是对另外一个宇宙的完美而精确的描述。这些画反映的是正文的主题吗?抑或只是一种伪装?没人知道。
一封写于1666年的信宣称,神圣罗马帝国皇帝、波希米亚的鲁道夫二世(Rudolf II of Bohemia,1551~1612)以600达克特金币买下了这部手稿。他可能是从约翰·迪伊博士(Dr. John Dee)手中买下的。迪伊是一个油嘴滑舌的占星术士兼数学家,游走于各国宫廷,追名逐利。鲁道夫认为,这份手稿的作者是英国僧侣兼哲学家罗杰·培根(Roger Bacon,1220~1292)。
这个猜想很有道理。罗杰·培根是一位方术大师,他死后,历代后人把他视为半人半神、半学者半巫师的人物。他是神秘书籍的收藏家。他知道火药,他还在著作中暗示,他知道其他一些东西,但是还没准备公布。他死时,他的著作被认为是极端危险(根据浪漫的幻想)的,人们把他的书钉在牛津大学图书馆的墙上,让它们在风雨侵袭下被剥蚀。
据说,《伏尼契手稿》曾经在意大利弗拉斯卡蒂的蒙德拉贡耶稣派学院沉寂多年,1912年被威尔弗里德·M·伏尼契(Wilfred M.Voynich)买下,此人是波兰出生的科学家兼藏书家。伏尼契是逻辑学家乔治·布尔(George Boole)的女婿,他的妻子埃塞尔·莉莲·伏尼契(Ethel Lillian Voynich)是在苏联和中国名气最大的英国作家之一(革命小说《牛虻》是她的作品,这部小说在很早以前就被西方遗忘了)。这部手稿没有我们能理解的标题,因此,就以伏尼契的名字命名。伏尼契把手稿带到美国,在那里,手稿得到了广泛的研究。在过去的75年里,学者和幻想家对手稿进行了几轮分析,然后又把它遗忘。它现在收藏于耶鲁大学贝内克珍本及手稿图书馆。
这部手稿采用的密码非同寻常。如果用的是普通密码,那么在很早以前就被解开了。它没有采用罗马字母,也没有用任何欧洲大陆人使用的字母或符号。它不是利用我们熟悉的字母做镜像或简单变形生成的。这个密码系统采用了大约21个花体符号,这隐约地暗示着它是一种中东文字。当然,在任何已知的中东文字字母表中都找不到这些符号。有些符号连在一起,就好像乐谱上的连音符号。有些符号极少出现,也许它们只是其他符号的潦草的变形。符号组成“单词”,词与词之间留有空格。
下表显示了手稿中最常见的符号,符号下面标记的字母根据小威廉·拉尔夫·班尼特(William Ralph Bennett,Jr.)设计的方案而来。班尼特是物理学家,利用计算机分析这部手稿。他分配字母的方案是任意的,目的只是为了录入计算机。
《伏尼契手稿》对开本第79页的左页
有些符号(与A、I、L、M、N对应的符号)和小写的罗马字母相似。班尼特认为,其他字母看起来像是西里尔字母(古代斯拉夫语)、格拉哥里字母(古代保加利亚语言)和埃塞俄比亚语的字母。和Y对应的符号则像是中文。
a)《伏尼契手稿》中最常见的符号以及小威廉·拉尔夫·班尼特为这些符号分配的字母
b)常见的符号组合以及班尼特分配的字母
更令人困惑的是,在手稿的第17页有些用中高地德语书写的注释。这些注释未必出自原作者,内容是关于马蒂奥柳斯草药的。手稿中有些占星用的图表,其中的月份标以西班牙语。封面上似乎有一个密码表,但是因为年久褪色变得不可识别。
手稿中大约有40页不见了。最初在手稿中,每16页折在一起构成一个单元,总共有17个单元。手稿的最后部分没有文字,只在页边绘有星图。这暗示,图是先画上去的,而文字是后加上的。如果确实如此,那么这些图也许只是装饰。尽管如此,还有很多人试图从这些画中发现秘密。有人主张,每页上星星、妇人和花朵的数目也是编码的一部分。植物学家取得了一些成绩,他们认出了图中的植物。93页图中画的好像是向日葵(也可能不是)。101页图中的果实像是辣椒。这二者都是美洲植物,在哥伦布从美洲返回(1493)以前,欧洲人不知道这些东西。此时距罗杰·培根去世已有200年。
人们设想过各种稀奇古怪的可能性:这部手稿是用一种已经失传的语言写的;为了为难破译者,手稿故意避免使用原来的语言中最常见的字母;手稿是为了骗钱而伪造的,根本没什么实际内容(伪造者是约翰·迪伊,耶稣会的教士,还是伏尼契?);作者像詹姆士·乔伊斯 (James Joyce)一样,发明了一种自己的语言;这部手稿是被人遗忘多年的疯子的狂躁的胡言乱语。伏尼契手稿令我们想起博尔赫斯的短篇小说《特伦、乌克巴尔、奥尔比斯·特尔提乌斯》(可以设想,博尔赫斯受到伏尼契手稿的启发)。在博尔赫斯的故事中,一个古怪的百万富翁设计了一个阴谋:让一群学者编造一部关于“特伦”的百科全书,特伦是他们幻想出来的国度。第一稿是用英语写的,但是根据计划,百科全书要被翻译成“特伦语”(当然这也是编造出来的),并且用漂亮的手写体书写出来,最后炮制出一部天衣无缝的作品。
现在,伏尼契密码已成为密码破译师们竞相攀登的珠穆朗玛峰。许多20世纪最天才的军事密码破译师试图解开伏尼契密码,以显示自己的才华。赫伯特·亚德利(Herbert Yardley)是美国密码专家,曾在“一战”期间破解了德国人的密码,也曾攻克日本人的外交密码——虽然他并不懂日语。约翰·曼利(John Manly)破译过瓦贝斯基密码,威廉·弗里德曼(William Friedman)破译过40年代日本人的“紫色密码”。但是在伏尼契密码面前,他们都失败了。近些年,计算机被应用于这项破译工作,但仍然没有进展。
有些人会觉得奇怪,计算机竟然对伏尼契密码无能为力。在实际操作中,解密码的工作主要在于发现其“破绽”。在切割钻石时,必须沿着晶体本身的狭隙入手。同样的道理,破译密码的关键在于找到泄漏天机的规则。伏尼契密码看来是一种难以驾驭的密码,它只是一串符号,各种普通语言的统计规律在这里都消失了。人们对它无处下手,就好比在切割钻石时才发现,整个钻石完美无缺,无处下凿子。
除非这部手稿是编造的,否则,手稿的文本对于作者来说一定有某些意义。(下面我们将看到,几乎可以肯定它不是编造的。)这意味着,作者部分地根据自己在当时的思想写下了手稿。但是,这些意义是依附于这种符号模式之中,还是依附于已经失传的密钥中?或者依附于以上二者的结合之中?我们破解密码的可能性依赖于它的意义,而意义既隐藏在符号模式中,又存在于现在我们已不可能了解的作者的心理活动中。
我们很难相信,培根(或者其他中世纪作者)单枪匹马地设计出了一种比几十种后世的军事密码更安全的密码。有些人因而主张,伏尼契密码是无意义的符号串。一组符号未必有意义。那么,有什么办法鉴别一组符号中是否包含信息吗?这是知识研究中最困难的问题之一。
设想在非常遥远的未来,某人挖到了一个藏有文物的罐子,里面是一张我们这个时代的报纸。当时,英语已经失传,就连拉丁字母也被遗忘了。一位考古学家见到这张报纸,认为这一定是一部作品。他希望破解这部作品,以此了解埋下这个罐子的那个时代人们的生活。可是另一位考古学家说:“不要浪费你的时间!那不过是墙纸!人们把它贴在房间的墙上。那些小小的黑色涂雅是装饰图案,当时流行这玩意儿。”
也许你会认为,第一位考古学家很容易证明,这份报纸是作品而非装饰图案。在报纸上可以找到规律——常见字母,常见单词,句子结束的地方有句号。这些规律说明,它是作品。问题在于,装饰图形也能找到规律。我们不能随随便便地下结论说,这种规律性一定属于某种未知的文字,而非某种未知的图案。这种文字(或图案)越奇异,我们做判断时越缺乏信心。
第一位考古学家为了证明他的观点,不一定非得破解出报纸上的文字。人们根据埃及象形文字作品本身从未找到破解之法,只是意外发现的罗塞塔碑文向现代世界透露了这个秘密。
伏尼契手稿提供了一种让人们忧喜参半的吸引力。解读这部手稿的意义不仅在于发现一部中世纪日记、一本魔法书或违禁的色情作品,更重要的是,伏尼契手稿难以解读的性质提示了知识的脆弱性。
罗杰·培根
有两位培根都是科学方法的先驱,一位是13世纪的方济各会修道士罗杰·培根,另一位是三个世纪以后的伊丽莎白时代的政治家弗朗西斯·培根爵士(1561~1626)。这两个人中,罗杰·培根要神秘得多。关于他的生平,我们所知甚少,只能根据他的著作做些推测。我们知道他是一个教育家,在牛津和巴黎讲课。在某个时间,他加入了方济各修道会,立誓过清贫的生活。
那个时代的人相信亚里士多德的学说,大约在1247年,培根对此越来越不满。他认为,直接观察和实验优先于对权威的信赖。他把强调实验的观点归功于迪朗·德圣普凯(Durand de Saint-Pourcain),此人是法国哲学家,关于此人我们同样知之甚少。1267年,培根报告说,若干年来他在实验和“秘籍”上已花费了2 000多巴黎镑。他从一本秘籍中学到了火药的配方。他语焉不详地介绍了配置炸药的过程。
培根的观点与方济各修道会产生了冲突。幸运的是,他的一位朋友做了教皇,即克莱门特四世。克莱门特从一部哲学百科全书中了解到培根的观点,命令培根送给他一份抄件。这位教皇认为,这些观点已经有人发表过了。实际上,培根只是在与朋友的通信中大致描述过这些观点。但是培根没有做解释,而是继续工作。他瞒着修道会的同事从事研究,也没请抄写员。一年半以后,他完成了三部曲——《大著作》《小著作》和《第三部著作》。
这些著作使培根以幻想未来技术而闻名。他描述了望远镜(但是没有做出实际的模型)。他设想了汽车,而且不大精确地设想了飞机。培根设想的是人力飞行器,用人的手臂拉动人造翅膀提供动力。他还得出结论:在气球内填充比空气轻的气体可以使气球飘起来。
培根相信地球是圆的。《大著作》描述了一段从西班牙到印度的海上旅行。红衣主教皮埃尔(Cardinal Pierre d’Ailly)在他的《世界图像》(1480)一书中剽窃了培根的文字,哥伦布读过这段文字,在写给裴迪南和伊莎贝拉(西班牙国王和王后)的信中,哥伦布引用了这个段落。
最终,培根精通巫术的名声害了他。1278年左右,方济各修道会把他监禁,罪名是“涉嫌异端”。据说他死后,他的敌人销毁了他的著作,但是这种说法显然是假的。据我们所知,他的主要著作都保留下来了。
假破译
有些人因为研究伏尼契手稿,即使没疯,也陷入了严重的妄想症。有不止一人至死都相信自己破解了伏尼契手稿。
1921年,宾夕法尼亚大学的威廉·罗曼·纽博尔德(William Romaine Newbold)教授宣布,他已经破译了伏尼契手稿,并且将在美国哲学学会的一次会议上公布自己的发现。纽博尔德和许多人一样,相信这部手稿是罗杰·培根写的。他认为,这部手稿证明培根已经造出了显微镜和望远镜,比伽利略和范·列文虎克(van Leeuwenhoek)分别早几个世纪。纽博尔德认为,第68页的图是仙女座的螺旋星云,这个星云从培根的望远镜来看就是这个样子。他还报告说,望远镜的镜片花了培根相当于现在1 500美元的钱。其他图显示了精子和卵子。纽博尔德的简短披露吸引了媒体和大众。一位妇女对纽博尔德已掌握了培根的黑咒语充满信心,她跑了几百英里的路来求纽博尔德为她驱鬼。
不幸的是,现在看来,被鬼迷住的正是纽博尔德本人。最初,他不愿意公布太多自己的发现。密码本身并未解开,他不过是把自己的直觉加了进去。他公布的发现越多,这种情况就变得越明显。纽博尔德让培根用一架反射望远镜发现了仙女座星云的螺旋结构,但是天文学家指出,这种螺旋结构不可能用任何望远镜发现,只能通过定时曝光照片显示。纽博尔德还没让培根发明照相机。从地球观测仙女座星云,看到的几乎全是侧面。第68页的画无论画的是什么,总之画的是正面,它的轮廓是圆形的。
纽博尔德从手稿中“发现”的密码是一厢情愿的幻想的典型。他在手稿的最后一页找到了一个几乎无法识别的“密钥”。(不止一个学者曾经设想,这段铭文就是密钥。也有人认为,这段铭文的笔迹与正文不同,所以是作者以外的其他人加进去的。)纽博尔德宣称,这些符号翻译成拉丁语是“A mihi dabas multos portas”(你正在给我许多入口)。他认为这句话表示手稿用到了不止一种密码。
纽博尔德认为,培根的原文是拉丁语,用双字母密码加密。应用双字母密码,原文中的一个字母转换成密码表现为两个字母。以13世纪密码学的发展水平衡量,这是极为巧妙的设计,应当足以确保作者的文字不被破解。
纽博尔德主张,这仅仅是一个环节,手稿还采用了一环套一环的密码系统。在普通的双字母密码中,加密后的信息(称为“密文”)长度是原文(称为“明文”)的2倍。纽博尔德认为,培根为了使密文更精简,精心选择了字母对,使得一对字母中的后一个总是与下一对字母中的前一个相同。例如,当培根加密拉丁语单词“unius”时,他会以“or”代替u,以“ri”代替n,如下表:
下一步,培根消掉了重复的字母,结果变成“oritur”。为了进一步增加密码的复杂程度,对于一个给定的字母,可以用不止一个字母对替代,而发音相似的字母(如b、f、p、ph)可以用同一个字母对替代。
你被搞糊涂了吗?反正纽博尔德的听众是糊涂了。那些认真研究纽博尔德的理论的密码学家发现,这种加密方法是完全不切实际的。
不仅如此。如果一个字母对包含单词“conmuta”中的某个字母,那么这个字母对需要进一步的加密,这个加密程序被纽博尔德称为“代偿”,但是为什么这样做却从来没有得到完整的解释。下一步,将整段文字前后颠倒,形成上一个阶段成果的回文形式。
下面到了最复杂的一步。纽博尔德说,在手稿中可见的符号不过是掩饰,它们没有任何意义。纽博尔德相信,如果你用放大镜观察这些符号,会发现,每个符号都是由大约10个独立的笔画构成的。他猜想,培根利用他新发明的显微镜造出了这些微小的符号。这些微小的笔画是古希腊语的简写符号。真正的信息隐藏在微粒般的简写希腊语中。为了解开手稿,你必须把这些微观符号翻译成字母,然后执行错综复杂的加密过程的逆过程:颠倒次序,代偿,分配字母对。
纽博尔德的微观符号像火星轨道一样不守规矩,更有甚者,纽博尔德是唯一能看到这些符号的人。这些所谓的符号其实只存在于纽博尔德的头脑中,如果当作客观的对象来研究,它们只是不均匀的墨水在粗糙的纸面上留下的不规则痕迹。
如果手稿的作者确实利用了纽博尔德的方法,对某些信息如此加密实在是一件疯狂的事。而且一旦加密,就没有可靠的方法解开密码。你得到的总是一系列由字母组成的回文,看起来像是真正的信息。
纽博尔德对他的微观符号的评论令人遗憾,堪称自我欺骗的典范。他写道:
然而,识别这些密码符号是非常困难的。我认为,当这些字母最初被写下时,在适当的放大倍数下它们是清晰可见的。但是历经600多年的岁月,许多页面上的字母褪色、脱落和磨损,受损严重,几乎已完全不可识别。除此之外,很多情况取决于培根在书写时使用的放大倍数是多少。有些线在肉眼看来非常简单,但是放大以后,经常发现这些线有三种、四种甚至五种不同的直径,内部包含一些独立的元素;如果进一步放大,这些元素还可以分解成其他元素。其中许多元素可以当作字符……还有一个巨大的困难是由于这些字符难以琢磨造成的。字符和字符之间的差异非常微小,在显微镜下书写这些符号,即使由培根本人来写,这些差异也经常表现得模糊、晦涩。而且,这些字符严重地混杂在一起,以至于根本无法把它们分开……例如,我经常发现,我无法保证两次解读同一段文本得到完全相同的结论。
一位美国医生利奥·列维托夫(Leo Levitov)宣布破解了伏尼契手稿,他的方法更奇怪。1987年,列维托夫声称,手稿是用一种未知的欧洲语言书写的,12世纪前后一个崇拜伊希斯的教派使用这种语言。列维托夫相信,由于西班牙宗教裁判所的迫害,这个教派没有留下任何东西——除这份手稿以外。列维托夫对手稿插图的解释令人毛骨悚然:这个教派崇尚安乐死,具体方法是人在温暖的浴缸里割开血管,插图中神秘的洗浴者展示了这种放血的自杀方法!
列维托夫的古怪语言包括24个动词和4个拼写不固定的代词。他的翻译混乱而不统一,充满语病,很难让人接受。(例如,第一页开头是,“人们以死亡款待每一个垂死的病人;每个令伊希斯不快的人,死亡都在等着他。”[1]
以上两种破解方案令人叹息。我们都在用复杂而难以言传的方式解释语言乃至经验,我们也不能说,纽博尔德和列维托夫的解释一定是错误的。这至少是可以想象的——作者记录的就是纽博尔德或列维托夫提出的内容,而加密方式就是纽博尔德或列维托夫发现的方案。
大多数有理智的人会对纽博尔德和列维托夫的成果不屑一顾。但是精确地阐明为什么不屑一顾并不容易。苏珊·桑塔格(Susan Sontag)把才智定义为“在思想方面的品位”,而这种品位难以言传。
意义与胡话
人们经常谈论密码学问题与实验方法的关系。密码学家约翰·查德威克(John Chadwick)写道:
密码学是一门科学,核心在于演绎和控制实验。形成假说,进行检验,频繁地抛弃假说。未被抛弃的假说通过了检验,它们不断发展、成熟,最后在某一时刻,实验者发现他已经获得了坚实的基础:他的假说前后一致,意义的片断脱去伪装呈现出来。于是密码被攻克。也许这个时刻最好这样界定:这个有希望的方向产生令人目不暇接的进展。这就像核物理中的连锁反应的开端一样:一旦突破临界状态,反应便会自我增殖。
为便于讨论,假定伏尼契手稿是完全无意义的胡话,作者是一位聪明而狡猾的人。看来确实有一种简单的办法,不必破解密码就可以断定它是不是无意义的胡话。
密码学家的工作依赖于对语言的统计分析。并非每个字母都同样常见。这意味着,在许多种密码中,可见符号出现的频率不同。
英语中最常见的字母是“e”。这个字母并非在所有语言中都最常见(在俄语中最常见的是“o”),但是,在每一种自然语言中,都有一些字母比其他字母更常见。
也许你会认为,随机地选出一些符号,构成一组无意义的、假冒的密文,则每个符号的频率都差不多。未必如此。你可以尝试“随机”地写出一串字母或数字。你会无意识地使某些字母或数字更加常见,你很难不这样做。人类的大脑不可能创造真正的随机性。一段假冒的密文可能使某些字母更常见,各字母出现的频率可能碰巧与作者的母语(或其他语言)频率相同。
这并不是说统计方法没有用;这里有更加细腻的考虑。在真正的密码中,字母被符号替代,此时,某些字母组成的“对”应当比其他的“对”更常见。例如,“th”和“is”在英语中是非常常见的组合,而“q”的后面几乎总是跟着“u”。
这种规律还可以反着用。有些字母对相对罕见。在英语里,字母“c”和“d”很常见,但是“cd”的组合很难见到,同样的原理也出现在三个(或更多)字母的组合中。所有的元音字母经常出现,许多由元音字母组成的对也是常见的,但是由连续三个元音字母构成的组合是罕见的,甚至不存在。
这些原理确实提供了一种方法来鉴别真正的密码和无意义的胡说,例如,对巴尔扎克《婚姻生理学》中的假密码的分析。《婚姻生理学》出版于1829年,是一本关于婚姻和婚外情的讽刺性手册。书中有一句话:“L’Auteur pense que La Bruyere S’Est trompe.en Effet,……”,在这句话后面插入了两页密码,这段密码从来无人破译。许多读者猜想,这段文字一定非常色情,以至于出版商不敢直接印出来,这种想法驱使许多人致力于破解这段密码。这本书问世多年以后,巴尔扎克给出了一些提示。
这段密码中包含大写字母和小写字母,许多字母带有重音符号,有些字母头朝下。其中还有数字和标点符号,但是只有几个空格。有些人认为,一个重要的线索在于,密码的结尾一定是“全文完”,而且其中一定有“可耻!”这个感叹句(在英语中也是这样)。
对巴尔扎克密码进行频率统计,结果发现它与法语和其他欧洲语言迥异。据此,几乎可以肯定这些符号是随机选出来的,而且很可能是排版工人干的。这本书后来再版时,这段“密码”甚至有了变化。
伏尼契手稿也受到了类似的详细审查。但是与巴尔扎克密码不同,伏尼契手稿表现出与真实语言非常相似的统计模式。有一些符号对经常组合在一起(例如AM、AN、QA、QC,根据班尼特的表示法)。有一些常见符号很少组合在一起。实际上,这些模式甚至比英语的模式更明显。伏尼契密码比任何已知的欧洲语言都更少了一些随机性。
字母(或其他符号)在文本中形成重复模式的程度可以用一个统计量“熵”表示。出于一种奇怪的巧合,伏尼契手稿中每个字母对应的熵与波利尼西亚语大致吻合。关于伏尼契手稿的猜想很多,但是从来没人设想过它是根据夏威夷人或塔希提人的语言加密而成的。
波利尼西亚语以字母精简而著称。夏威夷字母表中仅有12个字母,再加上一个极常用的撇号。伏尼契手稿中有21个常见符号,加上几个不常见符号。手稿的“熵”显示,它的原文本比大多数自然语言更符合一定规则。
这是支持伏尼契手稿是真正的密码而非无意义的胡话的有力证据。很难相信,一部赝品会做得如此精密,竟然骗过了语言统计学。
这也证实,手稿不是对某种欧洲语言的简单加密。手稿似乎使用了一种常见单词比欧洲语言少的“语言”。也许像纽博尔德推测的那样,作者把发音相似的字母合并起来了。还有一种可能,作者创造了一种类似于世界语的语言,原文是以这种语言写的。当代学者普遍认为,这部手稿是在哥伦布从美洲返回之后完成的(显然,作者不是培根)。
洞穴寓言
许多从密码学衍生出来的问题已经和日常生活没什么关联了。我们解释经验的方式很像破译密码。我们关于世界的心理图景是内嵌于流淌的感觉经验中,还是主要存在于一种解码方式——我们的大脑对这些经验的解释方式——之中呢?
柏拉图的《理想国》中有一个“洞穴寓言”,本书中的思想实验源自这个经典的前身。《理想国》第七卷开头是苏格拉底和格劳孔的对话:[2]
苏格拉底:接下来让我们把受过教育的人与没受过教育的人的本质想象成下述情形。让我们想象有一个洞穴式的地下室,它有一条长长的通道通向外面,可让和洞穴一样宽的一束亮光照进来。有一些人从小就住在这洞穴里,头颈和腿脚都被绑着,不能走动也不能转头,只能向前看着洞穴后壁。让我们再想象,在他们背后远处高一些的地方有东西燃烧着发出火光。在火光和这些被囚禁者之间有一条上升的路。沿着路边筑有一道矮墙。矮墙的作用像傀儡戏演员在自己和观众之间设立的一道屏障,他们把木偶举到屏障上头去表演。
格劳孔:我看见了。
苏格拉底:接下来让我们想象有一些人拿着各种器物举过墙头,从墙后面走过,有的还举着用木料、石料或其他材料制作的假人和假兽。而这些过路人,你可以料到有的在说话,有的不说话。
格劳孔:你说的是一个奇特的比喻和一些奇特的囚徒。
苏格拉底:不,他们是一些和我们一样的人。你且说说看,你认为这些囚徒除了火光投射到他们对面洞壁上的阴影而外,他们还能看到自己的或同伴们的什么呢?
格劳孔:如果他们一辈子都被限制了头颈不能转动,他们又怎样能看到别的什么呢?
苏格拉底:那么,后面路上人走过去时举着的东西,除了它们的阴影而外,囚徒们能看到它们别的什么吗?
格劳孔:当然不能。
苏格拉底:那么,如果囚徒们能彼此交谈,你不认为,他们会断定,他们在讲自己所看到的阴影时是在讲真物本身吗?
格劳孔:必定如此。
苏格拉底:而且,如果一个过路人发出声音,引起囚徒对面洞壁的回声,你不认为,囚徒们会断定,这是他们对面洞壁上移动的阴影发出的吗?
格劳孔:他们一定会这样断定的。
苏格拉底:因此,毫无疑问,这种人不会想到,上述事物除阴影而外还有什么别的实在。
我们关于世界的心智图像与外部实在的关系至今仍吸引和困扰着我们。洞穴寓言的几个现代版本把这个问题推到了极致。
电子洞穴
对于柏拉图描述的情景,我们可以设计许多技术化的版本。设想一个囚徒被困在洞穴中,他只能通过一个闭路电视屏幕观察外部世界。和柏拉图寓言中的情景一样,这个囚徒一出生就被拴在洞穴的墙上。洞穴外的一个摄像机不断地把画面传送到囚徒的电视屏幕上。此外,囚徒的头位于一个旋转装置上。当他向右扭头时,电视通过一个完全平稳而无声的轴承滑到了右侧,电视屏幕仍然填满他的整个视野。同时,洞穴外的摄像机以同样的角度旋转,所以,屏幕上的视野同步变化,在囚徒看来,变化方式是完全自然的。
利用这种设置,洞穴囚徒的看守者可以玩一些更奇怪的把戏来欺骗囚徒。如果摄像机总是通过一面成45度角的镜子进行拍摄,而囚徒并不知道,将会如何?囚徒看到的一切都是左右颠倒的。洞穴里的人永远不会知道,他所看到的是实在的镜像。如果他学习如何读书,在阅读摄像机前面的书时,他将学着从后往前读。
电视屏幕的图像也可以上下颠倒。同样,洞穴居民会以为,他看世界的方式是正确的。事实上他看到的电视图像上下颠倒,但是这并没有什么影响,正如呈现在我们视网膜上的图像从物理的角度说也是上下颠倒的一样,但是这对我们并无影响。假如囚徒一生看到的都是上下颠倒的图像(他视网膜上的图像是正的),他不会意识到图像是颠倒的,就像鱼意识不到水一样。[3]
洞穴居民面对的最严重的限制在于缺乏反馈(在这个版本中以及在柏拉图最初的版本中都是如此)。洞穴居民不能推动某个东西以观察它在推动之下的运动。人们有数以千计的方法调整环境,但是洞穴居民观察不到其中的任何一种。
如果让一个洞穴居民学会一种机器人技术,他将获得更多的主动性。他的手臂和腿上装了传感器。实际肢体的运动会传递给洞穴外的机器人身体,机器人位于摄像机附近。当洞穴居民抬起手指时,机器人的手指做同样的动作,很像放射性实验室中的情况。在精密的机器人技术的辅助之下,可以模拟“缸中之脑”的情况。洞穴居民会以为,他存在于外部世界中的机器人体内,他永远无法知道自己实际上在洞穴里,而且,如果有人说他活在洞穴中,他也不会相信。
以上设想提出一个问题:为了创造一个关于外部世界的心智图像,有多少“信息”是必不可少的。下面是一个更极端的困境。囚徒面前的电视屏幕是一个可视图文终端。屏幕显示的不是图片,而是滚动的文字(以英文显示),文字的内容是对洞穴外面正在发生什么的介绍,在每个时刻,文字都充满屏幕。囚徒永远见不到鸟,也看不见鸟的电视图像,他只能看见屏幕上的文字信息滚过屏幕,例如,“一只鸟刚刚落在洞口外的一株树上”。
这种情景非常像破译一种失传的语言时面临的局面。同样,洞穴居民根本没有关于外部世界的经验。他一生下来就被绑在洞穴的墙上。除非他猜出了充满他视野的奇怪符号的意义,否则,他不懂阅读。他可能猜出符号的意义吗?
囚徒很可能掌握很多关于英文书写的知识。他会把每个字母和标点的形状记在心里。在洞穴里没有别的事占用他的时间,他的大量想象力都用在屏幕上的这些图形文字上了。也许他会自然地逐渐记住所有常见单词,就像一个牧童可以辨认出几十种野花一样——虽然他不知道花的名字。
但是学习单词的意义是另外一回事。语言以共同经验为基础。我们无法向一个天生的盲人解释什么是红色。洞穴居民的生活如此贫乏,以至于几乎没什么东西可供指示。
可以设想,囚徒会注意到,每隔一定时间“太阳正在升起”这句话就会出现。只要有足够的耐心,他会发现,有些词或词组(例如“早晨”“猫头鹰”“满月”和“雪”)会在某些时间出现,但在其他时间不会出现。这些时间线索也许会提供理解文字含义的入手点(虽然看起来囚徒不大可能取得多大进展)。
二进制洞穴
关于某事的、可传达的、绝对最小量的信息是一个简单的“是”或“否”,用计算机科学的术语说,就是“比特”或二进制数。下面考虑洞穴寓言的终极版本。洞穴外是电视摄像机,和以前一样。摄像机把外部景象转化为电信号。关于亮度、色调、饱和度的信息,包括视觉上的所有清晰印象,全部编码为一系列的“1”和“0”:01011010011001010110111001101111……这就是数字视频设备可以识别的信号。这些信息通过电缆传入洞穴。在洞穴内没有电视屏幕,这些二进制的信息流通过一个设计简单得多的设备显示出来。当接收到一个“l”时,有一束白光射到囚徒对面的墙上,产生一个亮点;当接收到一个“0”时,墙是黑暗的。囚徒一生都盯着墙上的情况:或是亮点闪烁,或是什么也没有。
从严格的意义上说,我们的处境与这个囚徒相同——我们关于这个世界的全部经验都是一系列的神经信号的集合,这些信号可以表达成一连串的“1”和“0”。令人惊异的是,我们根据这些如此贫乏的输入信号竟然可以得出结论。所有事情——从“世界是三维的”这个事实到对世界职业棒球大赛结果的预测——都是从这些抽象的输入衍生出来的。这些符号似乎不能表达关于这个充满多样性的世界的任何东西,但是我们是如何从这些符号中获得意义的呢?这是一个关于知识的谜团。
在这个洞穴居民旁边还有一个居民。第二个居民的处境与第一个完全相同。他一生都在盯着代表一系列的“1”和“0”的闪烁的光点。借助神奇的想象力,他建立起了关于外部世界的丰富的心理图景,包括世界的几何学、远古历史和遥远的未来。但是由于机械故障,他看到的光点随机明灭,他的世界图像是完全错误的。[4]
一颗“缸中之脑”是否可能发现真相?
现在看来似乎是不可能的。我们稍微改变一下讨论背景。假定有两颗“缸中之脑”。大脑A接受的信息流经过精心处理,创造了一个关于世界的幻象;但是由于硬件故障,大脑B收到的是随机的信号流。当然,在A得到的输入中有一个类似于“世界”的东西,但是在B得到的随机输入中没有。B根本无法理解自己得到的输入。我们会猜想,意义蕴含在A得到的输入中。
有几个哲学家用“缸中之脑”思想实验展开关于意义的讨论。在《理性,真理与历史》(1981)中,普特南断言:我们不是“缸中之脑”,我们可以知道。他的说法引起争议。哲学界传来反对的呼声。普特南的论证很聪明,但是并不像表面上看来那样有说服力。
我们将采用归谬法。首先引入相反的假设:假设我们是“缸中之脑”。于是,当我们说“保龄球”时(当然我们并不是真正用嘴说,我们的嘴唇没动),我们指称的不是一个圆形的、有三个孔的物理对象,世界上可能没有保龄球。(缸中之脑实验室以外的“真实世界”中,也许根本没有保龄球馆。)即使如此,“保龄球”这个词依然指示某种东西。它指示一种特定的电信号模式,实验室的疯狂科学家利用这种模式创造了保龄球的幻象。这就是与思想对应的物理结构,是语词指称的对象。
我们可以说,存在着两种语言:“缸内语言”以及“缸外语言”。缸外语言中的“保龄球”指称一个有三个孔的球形东西;缸内语言中的“保龄球”指称一个电信号,这种信号创造了有三个孔的球形东西的心理意象。
在缸内语言中,如果“保龄球”这个词指称电信号,那么,“脑”这个词指称什么呢?它指称的不是一团灰色的神经细胞,而是另外一组电信号,这组信号创造了物理性的“脑”的幻象。“缸”这个词指称的也是电刺激。于是,如果我们是缸中之脑,那么“缸中之脑”这个词指称的不是一个物理性的“缸”里面的一颗物理性的“脑”,而是一种电信号“内部”的另一种电信号。“是的,我是缸中之脑”这种说法是错误的,因为我们不是电信号,我们是真正的缸中的真正的脑![5]
普特南根据以上分析得出结论:“我是一个缸中之脑”这个判断一定是错误的。这个判断也许可以和“宇宙位于一只大乌龟的背上”这个判断相提并论。我们可以这样论证:这个判断一定是错误的,因为“宇宙”意指所有东西,包括这只大乌龟在内——如果大乌龟确实存在的话。宇宙不可能位于任何其他东西之上,因为根据定义,宇宙以外别无他物。
以上论证并非不可反驳,因为它忽略了语言的灵活性。根据普通人的理解,“宇宙位于一只大乌龟的背上”的含义是,由星星和星系构成的已知宇宙位于一只未知的大乌龟的背上。我们很自然地对“宇宙”这个词做了重新界定,以适应这句话的语境。在做出“我们是缸中之脑”这个判断时,也是如此。
一个缸中之脑可以做到,在不造成语义混乱的前提下表示事件的“真实”状态。它必须意识到缸内语言与缸外语言的差异。正确的表述应当是这样的:“我是缸外语言所说的‘缸中之脑’”。于是,这种说法避免了误用指称的问题,因为在缸内语言中,“缸外语言”是一个形而上学的词汇,不具备物理相关性。
孪生地球
普特南最著名的思想实验向“意义是‘头脑中’的某种心理状态”这种观点提出挑战。普特南说,假定在我们的星系中存在另一个星球,我们称之为“孪生地球”。孪生地球几乎在每个方面都与地球完全一样。在孪生地球上,生活着外表普通的人们,他们甚至也说英语(像许多科幻电影中的情景一样)。孪生地球与地球之间的相似性极其惊人,孪生地球上的居民把他们的星球称为“地球”。(如果他们把自己的星球称为“孪生地球”,确实有点傻。)
两个星球之间有一个差别:孪生地球上的海洋、河流、湖泊、雨滴和眼泪等是由一种看起来与水完全相同的透明液体构成的,但是这种液体并不是水。具体地说,它的化学结构与水分子不同——它的分子式不是H2O而是另一种形式,我们写为XYZ。但是孪生地球的居民经历了与我们相同的进化过程,惊人的相似性使得他们也把这种液体称为“水”。当他们谈论浇草坪时,他们的意思是用XYZ浇。如果把H2O浇在他们的草坪上,会把草杀死。
在孪生地球上也有水,水保存在化学实验室里,装在几只密封的瓶子里,但是他们不把它称为“水”。在地球上也有XYZ。两个星球上的化学家利用简单的手段可以区分二者的化学结构。
请考虑这个场景:几个世纪以后,我们派出宇宙飞船前往孪生地球。我们的宇航员走出飞船,脱去宇航服,用英语向当地居民做自我介绍。过了一会儿,一个宇航员渴了,要水喝。孪生地球上的一位东道主打开水龙头,用漂亮的高脚杯接了一杯“水”。我们的宇航员把杯子举到唇边,呷了一口,然后吐了出来!地球人化验之后发现,孪生地球上的“水”是有毒的、不能饮用的XYZ。
我们把日历调到1750年。无论在地球上还是在孪生地球上,这个年代都被称为“公元1750年”,因为两个星球上的日历完全一样。人类尚未驾驭太空旅行,我们的天文学家用制作粗糙的望远镜无法发现孪生地球的存在,同样,孪生地球上的天文学家也不知道我们的存在。当时,化学也处在萌芽期。我们的化学家尚未发现水是由氢和氧构成的。同样,孪生地球上的化学家也不知道他们的“水”是由、y和Z构成的。
在1750年的地球上,有一个叫“奥斯卡”的人;在孪生地球上,有一个极其相似的人,也叫“奥斯卡”。这两个奥斯卡如此相似,以至于他们在生命中的每个时刻想法都是一样的。当地球上的奥斯卡使用“水”这个词时,这个词引起的记忆和心理联系与孪生地球上的奥斯卡使用这个词时的心理状态完全一样。这两个人都回想起学校操场上的某个喷泉;第一次见到大西洋(在两个星球上大西洋的地理特征相同);大雨天从他们的屋顶滴下来的水。如果你让地球上的奥斯卡解释什么是水,他会说成如此这般;你再去问孪生地球上的奥斯卡,得到的回答一模一样。在两个奥斯卡的意识中,对水的理解没有任何差别。然而,两种水是不一样的。普特南的结论是:“不管怎么说,‘意义’就是不在头脑里面!”
然而,如果意义不在头脑里面,它在哪儿呢?
孪生地球的化学
许多哲学家确实相信,意义主要存在于“头脑中”。一个像“水”这样的词可以意指任何东西。这个词的含义是它偶然所意指的东西,是当我们说“水”这个词时我们所想到东西,与这个词的书写形式无关。如果我们发现一份很短的卷轴,是用一种已经失传的文字书写的,全部内容只有一个字:“水”,那么我们不可能把它翻译出来。
我们每个人都经历过不知道“水”这个词的含义的阶段。父母以及其他成年人在特定的语境中说“水”这个词,由我们自己来确定这些语境有什么共同之处。作为成年人,我们认为,我们的经验足以消除模糊性。在我们长大以后,“水”这个词还有可能表示与我们想的不一样的东西吗?
针对普特南的思想实验,有两种反对意见经常被提出。孪生地球在化学上似乎是不可能的,虽然这个问题未必至关重要,但确实如此。为了避免这个问题妨碍我们深入讨论,我们先整理一下孪生地球应当具备的化学性质。
在1975年的一篇论文中,普特南把假想的“XYZ”描述为一种“化学分子式非常长而复杂”的液体。据说,它在一定的温度和压力范围内保持液态,这个范围与水的相同。当然,在孪生地球上,它可以用来解渴,而且,在生态学和生物化学方面,它扮演了水在地球上所扮演的角色。
在所有已知的物质中,没有任何东西与水的相似性达到这种程度。是否会有某种分子式复杂的东西满足这些要求,这也是可疑的。水之所以在地球的生化反应中如此重要,原因在于它的分子较小。分子式长而复杂的液体通常是油性的、呈黏稠状的,还有其他一些与水不同的性质。
过氧化氢(H2O2)是除水以外唯一的氢氧化合物,它很不稳定,不能以海洋的形式存在。(药店里卖的“过氧化氢”其实是浓度很低的过氧化氢水溶液。)硫化氢(H2S)在化学结构方面与水相似,但它是气体。气态的氨(NH3)和氟化氢(HF)与水有点相似。氟化氢是剧毒的酸,沸点刚好在地球环境的室温之下。
某些科幻小说作家设想过一些外星生命,在这些生命形式中,氨取代了水的地位。这些生命所处的星球必须比地球冷很多,因为氨只有在零下36华氏度(相当于零下33摄氏度)以下才是液体。(作为窗户清洁剂出售的液态“氨”是氨气的水溶液。)
很可能有很多星球,其体积与地球或月球相仿,而且其温度范围使得氨表现为液态。与上面提到的其他化合物不同,氨是常见的(木星上有氨气云),而且可以形成湖泊、海洋和河流。和水一样,氨也是极性化合物,这意味着它可以溶解很多种物质。对于任何一种可设想的生物化学系统来说,这个性质看来都是至关重要的。
然而,普特南的XYZ不可能是氨——如果孪生地球果真与地球完全相似。随便列举几件事:孪生地球的居民用什么来清洁窗户?他们不能用NH3,因为对他们来说这就是“水”。如果孪生地球和地球非常相似的话,他们应当有一种商品,商标也是Windex,但是成分却不是“水”。如果温度使得氨是液态的,那么水银就是固态的。在温度计和气压计里不会有水银。牙齿填充剂也不会用水银化合物。他们也不会把其他液体金属称为“水银”,因为在这种温度下所有金属都是固态的。当然,以上只是最简单的例子。我们不需要沿着这个思路走太远,就可以发现成千上万的差异。以氨为基础的生化系统很可能无法推动进化出与人类相似的物种(即使我们承认以氨为生存基础的智慧生物是有可能存在的)。
另一种反对意见直接针对普特南的表述(“意义不在头脑里面”)。人体主要由水构成。我们不仅说到和想到“水”,当我们在说和想的时候,水就在我们的头脑里。如果孪生地球的化学系统确实以XYZ为基础,那么每个孪生地球人的头脑中应当有XYZ型的“水”。意义毕竟是在头脑里的!
我认为,以上两种反对意见都没有切中普特南论证的要害——当然,有些人对此会不太同意。普特南在文章中给出了一些不太生动,但同样可以说明论点的例子。例如,他指出,如果孪生地球上的“铝”锅其实是钼制的,而他们所说的“钼”实际上指铝,结果会如何?
从化学家的角度看,这个例子并不高明,普特南应当可以找到更有说服力的例子。钼比铝重很多,而且二者在其他方面也有重要差别。不过,有些元素在化学属性和物理属性方面非常相似。稀土元素中的许多种,除非借助于极其精密的化学分析,否则是无法区分的。此外,这些元素与人体没有关系。如果有必要,我们可以假定人类和孪生地球人的大脑中一丁点儿这类元素都没有。
这些稀土元素都不常见,除化学家以外,没有人熟悉它们。镍和钴这两种元素非常相似,人们对它们了解得比较多。在外观上,镍和钴没有差别,它们的密度和熔点也几乎相同,二者都属于少数几种可磁化的金属,而且化学性质接近。
假定孪生地球的居民所说的“镍”其实是钴,他们的“钴”其实是镍。在孪生地球上也有两个国家:“美国”和“加拿大”,这两个国家发行的硬币也叫作“镍币”。之所以这么叫,是因为硬币含有金属“镍”,不过实际上是钴。尽管如此,孪生地球上的镍币与我们的镍币看起来一模一样。在人体中,镍和钴都不占重要地位,所以孪生地球上的宇航员不会存在缺乏这两种元素的问题。注意到这个差别恐怕要花很长时间。
最终,某个化学知识水平较高的宇航员也许会研究孪生地球上的化学元素周期表,发现“Ni”和“Co”这两个符号好像颠倒了。(不过我觉得,即使在大学里化学成绩很好的人,也很容易对这个差别视而不见。)另外一个情况可能泄露这个差别:在地球的日常语言中,“钴”这个词经常表示一种深蓝的颜色,而非钴元素。钴蓝是画家的一种颜料,由氧化钴制成。在孪生地球上恐怕没有钴蓝,这种鲜艳的、有点发绿的蓝色颜料不得不称为“镍蓝”。
普特南的思想实验表明,一切经验都是不确定的。两个奥斯卡对于“水”的经验是相同的。在孪生地球上的奥斯卡喝XYZ的味道与地球上的奥斯卡喝H2O的味道甚至都是相同的。两个人大脑中的神经元的运作方式可能完全一样,然而,与神经元的状态相一致的外部实在不止一种。
亚特兰蒂斯图书馆
假定在地球和孪生地球之间有另一个细微的差异:在孪生地球上有一块地球上没有的大陆——亚特兰蒂斯。这块大陆有自己的语言,这种语言与孪生地球上的其他语言没有亲缘关系。(孪生地球上的其他语言与地球上的语言相同,除了几个有问题的单词——如“水”、“钼”等——以外。)
一位地球宇航员在翻译的陪同下参观了亚特兰蒂斯的一家图书馆,翻译会说英语和亚特兰蒂斯语。宇航员惊讶地发现,书架上有一本乔纳森·斯威夫特(Jonathan Swift)的《格利佛游记》,至少看起来像是这本书。书的封面上用英文和罗马字母写着这些字,宇航员翻了一下这本书,看到书中是自己熟悉的斯威夫特式的讽刺文字,是用英语写的。这是两个星球平行演化的又一个例证!
宇航员对翻译发表评论说,地球上有同一个作者的同一本书。“真的吗?”翻译说,“你知道的,这本书基于一个真实的故事。”
“别告诉我,孪生地球上真有一个叫作‘小人国’的地方!”
“什么?噢,当然没有。你正拿着的这本书是一个剧本的亚特兰蒂斯语译本,原剧本名为《亨利六世》,作者名叫威廉·莎士比亚。把《亨利六世》翻译成亚特兰蒂斯语之后,表面看来,就像是英语的《格利佛游记》——这件事经常让人们困惑。”
他们进一步交流后发现,真正的《格利佛游记》被翻译成亚特兰蒂斯语后,看起来像是英语的《愤怒的葡萄》,而《愤怒的葡萄》被翻译成亚特兰蒂斯语后,看起来像是1982年的塔拉哈西电话号码本。据翻译说,说英语的人和说亚特兰蒂斯语的人可以读同一本书,对于其中一个人来说,这本书是《祝酒笑话1001则》,但是对于另一个人来说,这本书是《可兰经注释》。因此,孪生地球上有一句谚语:“意义在书外。”
这个翻译是在开宇航员的玩笑吗?
当然,两种语言碰巧具备以上描述的关系是极不可能的。问题在于,这是否完全不可能。上面提到的所有书(可能除了那个电话号码本以外)重复了许多常见词,如“这个”、“的”和“一个”。例如,英语中的“这个”翻译成亚特兰蒂斯语可能就变成了“的”。也许亚特兰蒂斯语中每一个词的拼写都与一个(不同的)英语单词拼写相同。于是,把英语翻译成亚特兰蒂斯语之后,再以英语的角度看就是一团乱麻。这些词当然不能组成有意义的句子。无论如何,在《格利佛游记》中单词的重复模式不同于《亨利六世》。把《亨利六世》从英语翻译成任何语言,都不会得到《格利佛游记》。
一定不会——只要翻译是一个词对应一个词的直译。然而,在亚特兰蒂斯语文本中,表面上的单词是不是单词,这个问题完全没有搞清。存在这种可能:在亚特兰蒂斯字母表中,“单词”之间的空格是真正的字母,而某些“字母”实际上是插在单词之间的、表示间隔的空白符号。
实际上,大多数翻译不是一个词对应一个词的直译。在某些场合(例如英译德)直接对译是不可能,因为句子中的词序不同。也许有些语言与英语的差异很大,以至于在翻译的时候必须把一个段落(或更大的部分)当作一个整体处理。这样,某一本书以某种外语来读就成为另一本书是可以设想的——虽然这种情况过于奇幻,可能性不大。
密码系统比语言的自由度大。举一个极端的例子:《伏尼契手稿》有可能是对《葛底斯堡宣言》文本的加密。如何实现呢?如下加密法就是可行方案之一:“如果你想加密《葛底斯堡宣言》的文本,先写下一连串的花体字(把《伏尼契手稿》的内容抄一遍),然后把想加密的东西颠倒字母顺序加进去。”我们不能肯定,《伏尼契手稿》用的是不是这种加密方法。
爱伦·坡的“iiiii……”密码
埃德加·艾伦·坡是一个业余密码学家,他曾经在杂志上发起过一场密码竞赛,请读者提供需要解密的密码。在一篇关于密码学的跟踪报道中,他提到一种可能性:密码中可能出现这样一串字母:iiiii……。我们知道,在英语里,任何单词都不会包括这么多的重复字母,我们如何进行解码呢?
出现连续的10个i是有可能的。当然,如果采用简单的密码,在全文中用一个字母替换另一个字母,不会遇到这种情况。我们甚至可能遇到这种情况:整个信息是由同一个字母的不断重复构成的。
有一种可能是,密码的含义是完全不确定的,字母i可以代表26个字母中的任何一个,加密者在密文的基础上自由地设计原文。另一种可能是,在这段密码采用的加密方法中,原文中的每个字母应用了不同的字母替换规则。
在这样一段密码中,意义与密文无关。为了说明这一点,我们设想这个场景:某人发现了一部密码手稿,里面全都是i,除此以外什么都没有。此人宣称,这些密文破译之后就是《葛底斯堡宣言》的内容。这种说法是胡说八道。我们可以说,这些密文破译之后是一切我们指定的东西。如果这些密文有意义的话,其意义存在于密码系统中,或者存在于写出原文的那个人的头脑中。由于密文无意义可言,它是不可破译的。
大多数常见的“代码”其实是密码。莫尔斯“代码”是一种密码;许多重要的军事“代码”也是密码。在真正的代码中,符号表示观念。在一个红圈里画一支香烟,在香烟上画一条斜杠,这个图案表示“禁止吸烟”——这是代码的一个例子。在机场等公共场合,可以见到数十种其他的国际通用符号,它们都是代码。代码为意义赋予了单独的符号。
用代码很难传达信息。代码的符号只能传达那些被代码设计者考虑到的常见的词和信息。利用代码通讯,一旦遇到未曾预料的情况,就会发现代码是笨重的、无用的。因此,军事、谍报和外交等方面的重要“代码”采用密码。
在密码中,符号代表字母。在使用密码时,你可以先用普通英语(或任何其他语言)把你的信息写出来,然后转化成符号。信息的接收者可以破译这些符号,把密文还原成原文,与最初的形式一模一样。
密码把一个字母(或其他造字符号)替换成另一个。有些替换规则很简单,有些则比较复杂。为了表示字母之间的替换关系,可以把字母表按照通常的顺序列出来,然后在这些字母下面标出要替换的字母。(如果密码用到标点符号和数字,也要列出来,标出对应的符号。)下表是一个简单的替换方案:
A变成B、B变成C、C变成D,依此类推。在字母表中,每一个字母被编码成下一个字母,最后一个字母被编码成第一个字母。“MESSAGE”这个词转化为“NFTTBHF”。密码的接收者很容易利用逆过程还原。
在这种加密方案中,一个字母始终用某个其他字母替换。这种密码被称为“恺撒密码”,因罗马诸皇帝使用过这种密码而得名。奥古斯都·恺撒使用上表的密码,朱利乌斯·恺撒使用一种相似的密码,把原文的A替换成D、B替换成E,等等。
恺撒密码有26种。在上表中,下面那行字母可以串两个位置,也可以串三个位置,等等(第26种恺撒密码就是以每个字母替代它本身)。每种恺撒密码可以用一个数字或字母指明。奥古斯都·恺撒使用的密码被称为“密码B”,朱利乌斯·恺撒使用的密码被称为“密码D”。
恺撒密码很容易破译。例如,在一种恺撒密码中,E可能总被替换成U。由于在许多语言中E都是最常见的字母,在密文中,U很可能成为最常见的字母。这样秘密就完全暴露了。破译者可以识别出最常见的几个字母,然后利用这些字母识别出常见的简单词,而后迅速地解破整个信息。
从恺撒的时代起,密码学取得了长足的进步。现在,任何国家都不会使用像恺撒密码那样简单的密码了。然而,以恺撒密码为基础可以设计出不可破解的密码,现在的超级大国使用的就是这种改造过的密码。
关键在于,应该对于每一个字母应用不同的恺撒密码。对于第一个字母,应用一种恺撒密码;对于第二个字母,应用另一种;对于第三个字母,再换一种,如此等等。
一方面,这种方案使得密码的复杂性剧增。你需要一个“密钥”告诉你,对于每一个字母应用的是哪种恺撒密码。密钥的长度至少和信息一样长。这种方案的优点是密码非常安全。密文中的任何一个字母可以代表任何字母。应用一种确定的密钥,可以把《葛底斯堡宣言》加密成一连串的“i”;换一种密钥,又可以加密成《格利佛游记》的一部分;再换一种密钥,会得到我们期望的“随机”字母组合(实际上这种情况是最有可能的)。
这种密码即“一次性便笺密码”。密钥被写在一个便笺簿上,每一页上写一个密钥,只用一次,用完销毁。例如,每一页上的密钥针对信息中的一个字母,指明对这个字母应用哪一种恺撒密码,对信息中的每个字母连续应用便笺簿上的密钥。如果用字母指明恺撒密码(如上文介绍的),那么整个密钥看起来就像一长串随机字母。
对于“MESSAGE”这个单词,用恺撒密码“C”、“R”、“F”、“B”、“Z”、“F”和“D”进行加密。在恺撒密码C中,M替换成O;在恺撒密码R中,情况是这样:
E替换成V。最终,“MESSAGE”变成“OVXTZLH”。
与“NFTTBHF”(用密码B加密的结果)相比,“OVXTZLH”要好得多。如果密码只采用单一的替换方案,会留下线索,让破译者很容易入手,解开任意长度的密文。通过对密文的“熵”进行分析,我们可以识别出原文是哪种语言。从“NFTTBHF”可以看出,原文中间有两个相同字母,而且第二个字母和最后一个字母相同。即使仅从这一个单词出发,你也可以(正确地)猜出,F代表英语中最常见的单词E。然而,在“OVXTZLH”这段密文中,没有任何线索。原文中连续的两个S变成了两个不同的字母。由于对每个字母都应用了不同的、随机选择的替代方案,显然,“OVXTZLH”完全可能代表任何由7个字母组成的单词。由于一次性便笺密码系统具备彻底的不确定性,在没掌握密钥的情悦下,任何破译企图都注定不可能得逞。
一次性便笺密码系统的问题在于,如何向密文发送者和接收者提供密钥。密钥不能和密码一起发送。如果一起发送,任何截获信息的人都可以解开密码。鲁道夫·亚伯(Rudolf Abel)是苏联间谍,1957年在纽约被捕。
他用的就是一次性便笺密码系统,密钥被记在一个邮票大小的便笺簿上,每一页都密密麻麻的。如果真的把密钥记在便笺簿上,每一页则需要写上数以百计的数字或字母,这样才能应付信息长度的实际需要。这个问题使得一次性便笺密钥的应用范围局限于重要且不是很长的信息。
通过选择适当的密钥,利用一次性便笺密码可以把任何文本转化成iiiii……,然而,你必须先拿到文本,而后针对文本制作特定密钥。这与设计密码的初衷相悖,通常,密码的目的是交换未来的未知信息。既然已知密文是iiiii……,无论它代表什么,它都无法传达未知的新信息。这段密码只能告诉我们信息有多长。
“iiiii……”这段密文的熵已达到最低限度,远低于任何一种实际语言。通常,密文的熵等同或高于原文。当熵下降时,这意味着部分信息量被塞进了密码系统中。(《伏尼契手稿》就是这种情况,除非原文就是塔希提语!)此时,密文是不确定的。解开这段密文依赖于密文之外的信息:一种密钥,或者信息的原作者所具备的、从意义不明的密文重建原文的能力。
暴力法
假定《伏尼契手稿》的原文是一种基于罗马字母的欧洲语言,手稿中的每一个花体符号对应一个字母,加密方法是不可破译的、不确定的一次性便笺密码。像班尼特那样把每个花体符号表示为字母。假设一共有26个不同的有意义符号。把这些符号排列成任意一种顺序,做出一个“字母表”,有26种恺撒密码可以把罗马字母转化为伏尼契符号。
我们不知道伏尼契符号的字母表顺序(如果这种字母表存在的话)。我们也不能肯定,《伏尼契手稿》的密码系统只使用了恺撒密码。除恺撒密码以外,还有很多办法可以把字母转化为符号。但是为简单起见,我们假定字母表的顺序是已知的,而且手稿的密码系统只应用恺撒密码。
密钥的功能就在于,指出手稿中的每一个符号应用了哪种恺撒密码。如果有人宣称找到了密钥,我们可以把密钥应用于几十个符号,看看是否能得到属于某种欧洲语言的有意义的单词。如果通过检验,我们可以把密钥应用于整个手稿。如果结果是有意义的信息,这样密码就解开了。
我们没有密钥。看起来我们可以用暴力法破解这个密码。我们可以检验所有伏尼契文本可能采用的加密方案。
有两个原因注定这个办法行不通。对于第一个字母需要检验26种可能性,对于第二个字母又有26种可能性,对于第三个字母也有26种可能性……(实际问题的复杂性远超于此,因此此处尚未考虑伏尼契符号的字母表顺序有很多种可能性,而且有可能应用了非恺撒密码。)用n表示在密文中抽取的样本所包含的符号数,则需要考虑的可能性为26n种。如果样本包括100个符号,则需要考虑26100种可能性,即10141左右。这个数太大了,即使拥有宇宙的全部时间,也无法完成检验。
确实如此。但是我们还是可以设想,检查10141种可能性的超级艰巨任务是有可能完成的。虽然在现实中做不到,但是在理论上是可以完成的。然而,即使如此,完成这些检验也是无用的。由于我们已经检验了所有可能的密钥,我们一定已经找到了一种密钥,逆向应用于《伏尼契手稿》后得到了《格利佛游记》。比方说,我们可以这样做:对于《格利佛游记》中的第一个字母,有一种恺撒密码可以把它转化为《伏尼契手稿》中的第一个字母;对于《格利佛游记》中的第二个字母,找到另一种恺撒密码,把它转化为《伏尼契手稿》中的第二个字母,如此这般。(两部作品中比较长的那部会留下一些多余的符号。)
另外一种密钥可以把《伏尼契手稿》转化为《葛底斯堡宣言》。其他一些密钥可以把手稿转化为任何可能的文本,只要目标文本的长度相符。暴力法的繁复搜索工作即使在物理上可行,也是毫无意义的,因为它可以把手稿解释为任何可能的有意义的信息。每种解释与密文的匹配程度都同样高。[6]
检验破译结果
那么,人们怎样才算破解了某个密码呢?(更实际的问题是,人们怎样向自己和他人证明自己破译的结果是正确的呢?)我们这样考虑:
一个得到经验证实的事实是,随机选择的密钥不会导致有意义的破译结果——这种概率太低了。在《伏尼契手稿》上随机地尝试一种密钥,将得到一串无意义的字母。
因此,一种任意选择的错误密钥导致有意义的破译结果的概率是微乎其微的。如果一种密钥从密文解出了有意义的信息,实际上可以肯定此密钥是正确的,除非事先给定了破译结果,而后针对破译结果特意设计出密钥。
为了证明某种破译方案是正确的,需要进行四个步骤:
第一,指出密码系统及其密钥。这里的“密钥”是指为了破译密码必须掌握的最低限度的信息,它是否表现为可以书写的形式则无关紧要。
第二,针对密文进行加密过程的逆过程,得出待检验的明文。
第三,确保明文是有意义的信息,不是胡言乱语。
第四,密钥可以简洁地表达。例如,“全文应用恺撒密码J”;“密钥是写在一张纸上的一串字母,这张纸是在罗杰·培根的财物中发现的”;“密钥是《格利佛游记》第一版第一页上的字母”——这些都是简洁表达的密钥的例子。
第四个要求是必不可少的,目的是为了排除倒推出来的密钥:先选定预期的明文,然后把密钥拼凑出来。密钥必须是“特殊”的,它在本质上必须是简单的,或者必须具备历史性的合理理由。在所有可能的密钥中,大多数是人类的头脑永远无法清晰地构想出来的。人类实际应用(乃至构想)过的密码只是其中特选出来的极少数。一种解码方案必须给出理由令我们相信,其密钥是在应用于破译这份密文以前就存在的。
最简单的密码就是保持原文原封不动,次简单的密码是在全文中采用一个不变的字母替代方案。在谜题书中出现的密码都属于这种类型(例如,埃德加·爱伦·坡的《金甲虫》和柯南道尔的《跳舞小人》中的密码)。所有这些密码属于极少数,一旦表明一份密文可以用这类密码转换为一段有意义的信息,就足以令我们信服,即密码就是这样,得到的信息是正确的。
在更复杂的密码中,密钥是可变的,可以用一串任意的字母(或数字)表示密钥。如果以《葛底斯堡宣言》为密钥,把一份密文转换为一段有意义的信息,则同样可以令我们信服其正确性。(在实际应用中,以书或其他文本作为密钥的情况很常见。)虽然有许多种密钥都能把一份给定的密文转换为有意义的信息,但是密钥本身就是有意义的信息的概率是微为其微的。
这并不是说,有效的复杂密钥只能是从书本上的段落衍生出来的。在一次性便笺密码中,密钥是随机的(否则这种密码就无用了)。从历史的角度说,这种随机密钥是特殊的。在所有无法构想的可能密钥中,有一种被选出来印在了一个便笺簿上。从便笺簿上翻出一页,发现上面的字母可以把一份密文转换为一段有意义的信息,这足以令我们信服解密方法的有效性。
意义何在?
那么,意义在哪里呢?是在信息里,还是在“密钥”里,抑或在理解它的人心中?很少有人反对,意义最终在人心中。意义在人心中,正如颜色和声音在人心中。一个更精妙的问题是,意义的客观对应物是存在于信息中,还是存在于语言中,抑或存在于密码系统中?
答案是,应视具体情况而定。一段密码可能由一连串的i构成,这个例子代表了一类情况:意义全部在密钥中。更常见的情况是,意义同时处于信息和密钥中。然而,我们很难设想一种情况,即意义完全处于信息中,与密钥无关。从理论上说,如果某种语言是完全透明的,对于所有人来说其意义都是明显的,则属于这种情况。但是,设计一种这样的语言的努力远未实现其目标。(例如:机场的图形符号、世界语、为了与外星生命进行无线电通讯而设计的人工语言。)
我们期望科学理论帮助我们理解世界的意义,其功用非常类似于密钥。某些理论把大量信息放在分析中,另外一些理论则只是揭示世界本身的信息。
关于第一种情况,缸中之脑假说是一个极端的例子,这个例子相当于爱伦·坡的“iiiii……”密码。缸中之脑假说需要对每一件事设计特定的假设。例如,昨天下雨了,这是由电信号的一个特定模式造成的;玫瑰是红色的,这源起于电刺激;杰拉尔德·福特(Gerald Ford)当选总统,这也是一种电信号;心情、天气、动物、人、运气,乃至于所有东西都用电刺激解释。缸中之脑没有做出预言的权利,如果我们是缸中之脑,我们看到的下一颗苹果完全有可能从下往上“落”。(对比“iiiii……”密码,这种密码无法表示未知的未来信息。)所有事都有可能发生,我们永远无法了解下一步邪恶天才将如何行事。
相反的极端情况,可以牛顿的引力理论为例。牛顿的理论建立起世界范围的内在规律性。苹果不会向上“落”,这是在世界内部规定的,不需要借助于一系列特定假设。这种理论是简单的,而且有预言能力。
和其他场合一样,此处我们也不能说,某一种理论不容置疑地正确,另一种则是错误的。归根结底这是一个方便与否的问题。应用和记忆一种比较简单的假说更容易。
[1] 原文晦涩难解,充满语法错误,译文仅作参考。——译者注
[2] 以下对《理想国》的引用摘自郭斌和、张竹明两位前辈的精美译文。——译者注
[3] 1928年,因斯布鲁克大学的西奥多·埃里斯曼(theodore Erismann)以志愿者为研究对象,用特殊的研究把他们的视觉扭转成奇异的形式。连续戴了几周眼镜以后,研究对象适应了眼镜。这些眼镜使视野上下(或左右)颠倒,或者通过一组镜子使得实验对象只能看见自己脑后的东西。一个研究对象戴着左右颠倒的眼镜骑摩托穿越城市街道。所有人在摘掉眼镜以后必须重新适应。
[4] 本节的思想实验非常精妙,发人深省,但是技术细节似应再做推敲。由于人眼的视觉暂留现象,亮点闪烁的频率不能高于每秒24次,也就是说,从外界输入信息的效率非常可怜:低于每秒24比特。据粗略估算,一张中等品质的数码照片按这个速度传输,需要大约5天。囚徒活到80岁时,从外部获得的全部信息量相当于一张DVD光盘。如此低效率的通讯方式恐怕不足以达到智能水平,因为智力的发展需要非常充分的信号刺激。这个思想实验的关键缺陷在于,不能假定囚徒最初就是有智力的。 ——译者注
[5] 以上分析是一个精巧的归谬法。首先假定我是缸中之脑,而后导出一个矛盾:如果我是缸中之脑,那么“我是缸中之脑”这个判断就是假的。——译者注
[6] 以人类目前掌握的计算能力,暴力法的应用相当有限。暴力法能够得手,通常因为密钥或者密码系统的设计有破绽。在实际应用中,暴力法通常只尝试潜在的设计漏洞。——译者注