作者:曹则贤 (中国科学院物理研究所)
在生物学中,三十条和十五对是不等价的
—— 曹逸锋1)
I know numbers are beautiful. If they aren't beautiful, nothing is
—— Paul Erdős2)
Die ganzen Zahlen hat der liebe Gott gemacht, alles andere ist Menschenwerk
—— Leopold Kronecker3)
Όλα είναι αριθμός
—— Πυθαγόρας4)
Non mi legga chi non e matematico
—— Da Vinci5)
数字表达是科学文献的重要组成部分。其实,日常生活中也不乏基于数字的表达。因为是科学工作语言的缘故,英文如何表达数字是科学工作者普遍关切的问题。又因为英文自身的复杂历史问题,英文中的数字表达多样、繁琐,容易产生误用。本文试图就西文科技文献中的数字表达给一个较为全面的介绍,特别地,造成英文数字表达混乱局面的语言源流问题会予以格外关注。限于作者见识短浅,本文虽然历经15 年酝酿之久仍难免挂一漏万,容以后再慢慢收集补充。
鉴于本文篇幅较长, 内容繁多,叙述拉杂,恐对读者们的耐心是个考验,故作如下粗略章节划分:1、数的来源;2、0 的引入;3、几种语言中数的写法;4、关于零的表述;5、数的进制;6、西文的大数表示; 7、10 次方记号体系;8、关于多重性的表示;9、月份与星期中的数字与非数字;10、具有特殊意义的数字;11、关于数字的零星知识;12、结语。
数学是物理的语言载体,所凭藉之物。限制我们在物理学领域的深入程度的,除了理解物理的能力严重不足以外,还有数学知识的严重不足。柏拉图学园的门上,赫然刻着ἀγεωμὲτρητος μηδεὶς εἰσίτω(不通几何者莫入)。这句话挂在物理的门上,也一点没有违和感——如果物理学确实有门的话。物理学几何化所涉及的几何之深邃,远高于柏拉图时代对几何学的认知。当然了,物理学所需要的及其所带来的数学,岂止是几何学一门。欲治物理者,当知晓充分多的数学。这与其说是对物理学家的为难,不如说是对有志成为物理学家者的额外奖赏。
数学是一门符号语言,最基础的是数字的记号(notation),来自自然和人的自然行为。不管是中文的一二三, 还是罗马的I, II, III,它们首先都是划痕。可以想象,人类一开始计数,如同记事一样,用的是图形化的符号。数字,首先肯定应是划痕的简单重复,这划痕可以是短杠,可以是圆点,或者是楔形的痕迹。古代中国用的是短杠(图1),圆点加短杠的计数见于玛雅文化(图2),而楔形数字(文字)见于古巴比伦(图3)。
图1 古代中国用竖杠和横杠表示数字1—9
图2 玛雅文化中的数字1—19
图3 古巴比伦的数字1—59
如今国际通用的是阿拉伯数字。据说阿拉伯数字1、2、3、4、5、6、7、8、9、0 是在公元三世纪由印度婆罗米(Brahmi)人发明,在公元八世纪由阿拉伯人所创建的波斯帝国所采用,后流行于天下。然而,最近有学者认为,印度是拼音文字,不大可能单独为数字重新制定额外的10 个字符。笔者以为这个观点有道理。中文的数字是现成的字,罗马数字是用现成的字母,都没有另外再创造数字字符。有中国学者猜测,阿拉伯数字可能是由汉字的草书(图4)进一步演化而来的。草书出现于汉初,比阿拉伯数字的出现早了500 年。比较一下印度某地发现的数字写法(图5),这种说法就更显得有道理了。印度文字能影响整个欧洲, 有印欧语系的说法,汉字输入阿拉伯文化几个表示数字的字符,应该不过分。
图4 可能的汉字经草书到阿拉伯数字的演变(来自中文互联网)
图5 印度的婆罗米数字(取自History of mathematics-wiki)
阿拉伯数字可能是来自汉字草书的说法,不能细琢磨,笔者越琢磨越觉得有道理。图6 是1956 年在西安发现的“阿拉伯幻方”6),比较图6 和图4, 是有那种发现了缺失的进化阶段证据的感觉。
图6 1956 年在西安发现的铸铁“阿拉伯幻方”,现存陕西历史博物馆
科学的一部分努力就是构造符号体系,为数字构造符号,为化学元素构造符号,为电子元器件构造符号。一套好的符号让科学在其基础上的发展成为可能,并把科学引向我们不能想象的高度和新境界。关于这一点,比照一下用西方字母a11,a12,a13 和用甲乙丙表示的矩阵及其运算就能体会一二。没有对数字的灵活运用,那依赖于数字灵活运用的科学就要被耽误了。就算术运算来说,阿拉伯数字0,1,2,3的发明具有至关重要的意义,它的字形同与其进化有关的Hindu—arabic number system (印度—阿拉伯数字体系) 相比较是最简洁的。就表达来说,简洁是硬道理。中文的壹、贰、叁、肆用来防止涂改账本或者支票无疑是科学的,用来进行三位数乘法都困难。罗马字母的I,V,X,L,C,D,M 数字记号体系,用来纪年凑合,用来计算就要了命了。埃及数字更复杂, 100 是一段盘绕的绳子, 1000 是一朵白色的睡莲, 10000 是一个竖起的手指,100000 是一只青蛙(图7)。这样的体系的一个要命缺陷是,你看不到这样的数字既是一个个具体的量,但还是有序的、具有结构的体系。今天的人们不需要再创造数字体系,但是确实需要懂得其结构,从而发展出对数的感知与运算(Presentday students do not have to create anumber system, but they do need tounderstand its structure in order to develop number sense and operations)。
图7 古埃及的数字
说到数的结构,毕达哥拉斯学派认为whole number as the criticalfoundation of all natural phenomena( 整数是一切自然现象的关键基础)。The central position of numberwas everywhere evident (支撑数之中心地位的证据是随处可见的)。后世认为物理世界可以通过mathematization加以理解多少归于毕达哥拉斯学派的观点。整数概念的产生,来自物理上我们能够将某些对象同环境分离开来,从而作为一个unit(单元、一)处理。这种分离从来都是理想的产物。两个看似互相独立的对象,也许存在我们看不到的关联——但是看不到真好。人们能理想化出十进制的自然数是因为我们的手指头是分立的。对鸭子来说,这种可能就不是显然的。由对某些整数“三人组” (triad)成立的毕达哥拉斯定理—— 古埃及人就知道(3,4,5)是这样的triad ——能得出无法表述成整数的东西,比如√2 。这突破了它赖以建立的基础的范围。难怪毕达哥拉斯学派的人对它避之如瘟疫。无理数,非公度,它带来的冲击源于我们的计数是以分立的整数为基础的,而整数来自于自然,属于直观的层面。
毕达哥拉斯学派重视数在认识自然中的作用。毕达哥拉斯说万物皆数固然没啥道理,但他发现了数在音乐中的重要性。他建立的音乐同算术之间的联系存在于harmonicmean (调和平均数),harmonic progression(调和序列)7) 等概念中。毕达哥拉斯用形状思考数,这引入了constructiblenumbers, figuratenumbers 的概念。我们至今还在使用的“squares (平方)and cubes ( 立方)of numbers” 就归功于他。他还使用过oblong numbers(矩形数),triangularnumbers (三角数), pyramidalnumbers ( 金字塔数), 这是用单元堆积出的相应形状所要求之单元的个数(下文会有详细讨论)。这些数,如果学习晶体学的、研究线粒体的人们不能了然于胸,那相应的研究就不过是无头苍蝇的乱撞——而这竟然曾是科学史上真实的一幕。
计数问题,取决于语言自身的发展历史,也取决于文明发展的程度,在各种语言中会有不同的表现。以汉语为例,汉语的计数用表述有简写的一、二、三、四、五、六、七、八、九、十、百、千、万、亿(亿以后的词汇见下文),还有大写的壹、贰、叁、肆、伍、陆、柒、捌、玖、拾、佰、仟(古文和金融体系在用),以及国际通用的阿拉伯数字。而在有些语言里,三就太多了,所以没有三以上的数字。注意,因为一、二、三以一般人的智力都是可以熟练运用的,稍有一点历史的文明的语言里,一、二、三就可能有多种说法,且说法也有多种花样,如汉语的俩(对、双)、仨(一对半)等。数字的形式是有具体的文化语境的,“咱二人年貌相当……”,“ 咱俩儿谁跟谁呀?”来自浓郁的乡土文化,而“2个人认识1 年多了”的写法,据信是当今的出版标准。
洋文也同样有多套数字表述系统且体现不同文化底蕴的问题。以英文为例,试看five-fold symmetry (五次对称性), cinquefoil (五叶植物),pentagon (五边形), quintuplet(五胞胎),这四个涉及“五”的不同表达,分别来自德语、法语、希腊语和拉丁语。读者由此可以感受到英语层次之低,以及奉英语为圭臬的non-english-speaking 科学家写英文文章该有多难。使用来自希腊语或拉丁语的表述,对于说英语的人来说,是一种心灵上的救赎。最近读到一个笑话,说一个学新闻的英国姑娘在电视节目中用了decade(十年,源自希腊语)这个词,被老师臭骂了一通。老师的理由是,电视是给没文化的人看的,应该直接说ten years 才对。英语用词层次之丰富,实在让人无语——这也是国人学英文时不易准确把握的地方。英语用词层次丰富,在数字表述上也给科学表达带来了极大的麻烦,相信学习物理、化学、生物、医学等学科的人们感受会很深。满篇飞舞的来自各种语言的数字,估计说英语的本土人都忘了其本源了。
数是最有表现力的工具。从计数的萌芽, 经0 概念的发明,再到无穷大的发现,这是一部惊心动魄的人类智力演化史。数字的功能是计数,计数的前提是存在,这样看来,计数的体系中一开始没有0就可以理解了。当计数形成层次体系,就会遭遇某个层次缺失的问题,比如水泊梁山的将领数目是一百单八将。这百位数和个位数之间就有个空, void, 汉语是用个“单”字连接的,它是个位数的修饰词。“0”的发明,首先是位数表达的需要(positional notation),以区别比如54 和504。直觉上这个标记应该和1—9 的记法截然不同,用圆点是个最自然的选择。据说古埃及数字还没有0,0 的概念由玛雅人最早提出来的。今天我们用的数字0是印度人发明的,印度在公元前三世纪出现了比较有代表性的婆罗门式的数字1—9,到了笈多王朝(公元320—550 年)时期才出现0 的写法。当时是实心小圆点,后来才演化成为小圆圈“0”。近期对巴克沙利(Bakhshali) 手稿(成书年代尚无定论)里的数字(图8)研究表明,那时0 不只是用来表示数位,人们已经学会thinking zero in a numericalway,将0当作用于运算的数了。
图8 发现于巴克沙利手稿里的数字,0 是个实心的圆点
从前没有0,现在它有了,它就是一个存在,而且有非常重要的功能。比如作为代数加法的单位元素,它是必不可少的! 这中间的深刻哲学,值得玩味。
注意,汉语的零,在作为数字以外的用法都不是0 的意思。零,余雨也。零,见于零碎、零星,对应英文的piece,fraction,scattered。
中文的数字写法为〇、一、二、三、四、五、六、七、八、九、十、百、千、万、亿、兆、京、垓、秭、穰、沟、涧、正、载、极,等等,不过,兆以后的数字笔者从未用过。汉字表示大数的字,其所表示的数到底多大,基本是没谱的。《风俗通》云“ 千生万,万生亿,亿生兆,兆生京,京生秭”,天知道这“生”字对应哪个数学算法。具体地, 比如秭,《广韵》说“秭,千亿也”,而《说文》则说“秭,数亿至万曰秭”,诚可谓莫衷一是。至于兆,汉语解释是万亿为兆,那是1012,不过当前中文科学文献中, 兆是百万(106), 用于兆赫(MHz)、兆帕(MPa)。为了防止记账时篡改,汉字的数字〇至千还有大写形式,分别为零、壹、贰、叁、肆、伍、陆、柒、捌、玖、拾、佰、仟。此外,还有廿(20)和卅(30)。严格说来,这不是新的数字体系。
中文的数字是单音节字,且中文的数字是严格按照顺序排列和读出的,因此用中文数数和进行简单计算是可以迅速掌握的。这可能不是啥好事。入门容易,常让学习者起轻蔑意,以为那学问也不过尔尔,而这是做大学问的大忌。数字入诗,可以方便数字的教学。论及中文教数字,北宋邵雍的《山村咏怀》是经典,可用来教小儿唱歌加数数儿:
一去二三里,烟村四五家,
亭台六七座,八九十枝花。
数字入诗词,还有助于提升表现力。带数字的诗词,笔者最喜欢的是元朝张明善的小曲《水仙子·讥时》:“说英雄谁是英雄。五眼鸡岐山鸣凤,两头蛇南阳卧龙,三脚猫渭水飞熊!”。数字的使用满足Benford定律,因此十进制的数字,用一开头的比例高达log102,故而中文中可见卖弄“一”字的诗就不奇怪了。清王士祯的《题秋江独钓图》乃其中上品,有大情趣,诗云:“一蓑一笠一扁舟,一丈丝纶一寸钩;一曲高歌一樽酒,一人独钓一江秋。”
数字的一些常见西文语种的写法如下。认识不认识的,请耐心做到脸熟。
阿拉伯数字:1,2,3,4,5,6,7,8,9,10.
希腊语: Ένα, δύο, τρία,τέσσερα, πέντε, έξι, επτά, οκτώ,εννέα,δέκα.
拉丁语:Unus,duo,tres,quatuor,quinque, sex, septem, octo,novem,decem.
俄语:Один,два,три,четыре,пять, шесть, семь, восемь,девять,десять.
法语:Un,deux,trois,quatre,cinq,six,sept,huit,neuf,dix.
意大利语: Uno, due, tre,quattro, cinque, sei, sette, otto,nove,dieci.
德语:Eins,zwei,drei,vier,fünf, sechs, sieben, acht, neun,zehn.
英文:one,two,three,four,five,six,seven,eight,nine,ten.
为了方便体会对英、德、法等语种与数字相关表达的影响,希腊语的0—10 及其拉丁语转写罗列如下: μυδεν (meeden, 0), ένας(enas, 1), δúο (duo, 2), τρείς(treis, 3), τέσσερα (tessera, 4),πέντε (pente, 5), έξι (hexi, 6),επτά (hepta, 7), οκτώ (octo, 8),έννέα (ennea, 9), δέκα (deca,10)。梵语的1—10,可惜我只看得懂拉丁语转写, 也罗列如下: eka(1), dvau (2), trayas (3), catvaras(4), paca (5), sat (6), sapta (7),astau (8),ava (9),dasa (10)。西语同梵语的关系,从这些数字来看几乎是显然的。顺便说一句,发现西语源于梵语,提出印欧语系这个概念的人是物理学家哈密顿,就是那个命名了Hamiltonian 的Sir WilliamRowan Hamilton。物理学,如同数学,首先是一门语言,自然语言。这下你相信了吧!
德语的11—20 是elf, zwölf,dreizehn, vierzehn, fünfzehn,sechzehn, siebzehn, achtzehn,neunzehn, zwanzig。这里elf 11 是新词,zwölf 12 和zwanzig 20 是基于2 构造的词,13—19 用的是个位数字+ zehn (10) 的方式。再往后,dreiβig 30, vierzig 40, fünfzig 50,sechzig 60,siebzig 70,achtzig 80,neunzig 90,则是个位数字+zig 的形式,而zig 就是zehn 10 的变体。这个体系,大体和中文数字体系相同,但它别扭的地方是念两位数时要先念个位数。
英语是条顿化了的德语,自然其数字的表示也和德语有渊源。英文的11—20 为eleven 11, twelve12, thirteen 13, fourteen 14, fifteen15, sixteen 16, seventeen 17,eighteen 18, ninteen 19, twenty20,可见eleven 11 是新词(字面是10 后1), twelve 12 和twenty 20 是基于2 构造的词(twenty,即意大利语的venti),13—19 用的是个位数字+ teen 的方式。这里的teen 就是ten 10。因为13—19 都以teen 结尾,所以英文的teenager (teen+age+r)就是年龄在13—19 岁的人。汉语把teenager译成少年,有失偏颇。
意大利语的11—20 的说法是:undici 11, dodici 12, tredici 13,quattordici 14, quindici 15, sedici16, diciassette 17, diciotto 18, diciannove19,venti 20。注意,11—16 都是把10 放在后面, 而自17起,10 放到了前面。30—90 依次是trenta 30,quaranta 40,cinquanta 50,sessanta 60, settanta 70, ottanta80,novanta 90。大数数字用cento,mille,milione,miliardo (109)。
法语的11—20 依次是onze,douze, treize, quatorze, quinze,seize, dix-sept, dix-huit, dix-neuf,vingt,其中11—16 是个位数+ze (比较德语的10,zehn)的结构,17—19是10 (dix)+个位数的结构,vingt 20是基于2 的新词。后面的数字,采用的是trente 30, quarante 40,cinquante 50,soixante 60 分别加上1—9 构成的。注意, 它的six 6,seize 16,soixante 60 的写法,字头也不尽相同。到了70, 麻烦来了,法语采用的是60+的模式,用短杠连接, 如soixante-trois 63,soixante-treize 73。因为un 1 和onze 11 是元音开头的,为了可读性,有soixante et un 61 和soixanteet onze 71 的写法。到了八十,更麻烦了,八十被用20 进制表示成了quatre-vingts (4 个20), 81—99 是用quatre-vingt+1—19 构成的, 如quatre-vingt-onze 91, quatre-vingtdix-sept 97。其大数单位为cent,mille,million,milliard,与拉丁语同。法语的1% 用的是centieme。一个货币单位,1 元,的1%为1 分。我记得中文的《我的叔叔于勒》等汉译法国文学作品里是把分分钱译成生丁的,其实没必要。
为了掌握西文数词,必须要深入、详细地了解拉丁语和希腊语数词,因为这是现代西文数词的基础。一些新出现的词如果包含数字,一般都会以拉丁语或者希腊语为基础构造,这显得有学问。虽然学习自然科学的人都非常熟悉希腊语的字母,但习惯阅读希腊文字的人不是太多,因此在下面介绍希腊语数词时,注音符号大多时候就不加了,因为输入不方便。希腊语数字会加上相应的拉丁化形式(可能有误!),这样大家就能从英语、德语或者法语文献中的数词看到其可能的希腊语来源了。
希腊语的一些基数词(拉丁语转写)如下,注意与上节中略有出入,这是希腊语自己有变迁的缘故,转写也没有规范,还有随性的变化。许多希腊语词转写入拉丁语就造成了谬误且流传了下来。ένα (ena)1, δυο (dyo) 2, τρία (tria) 3,τέσσερα (tessera) 4, πέντε(pente)5, έξι (eksi) 6, επτά (hepta) 7,οκτώ (octo) 8, εννέα (ennea) 9,δέκα (deka)10, έντεκα (enteka) 11,δώδεκα (dodeka) 12, δεκατρία(dekatria) 13, δεκατέσσερα (dekatessera)14, δεκαπέντε (dekapente)15,δεκαέξι (dekaeksi) 16,δεκαεπτά(dekahepta) 17,δεκαοχτώ (dekaoxto)18, δεκαεννέα (dekaennea) 19,είκοσι (eicosi) 20, εκατό (hekato)100, χίλια (xilia) 1000, εκατ-ομμύριο (ekatommyrio) 1000000。拉丁语系的mille 猜测是来自χίλια,miiliard 来自μμύριο。另外, 在μιαφορά (mia fora, once), δυο φορές(dyo fores,twice)的表达中,μια 是比较特殊的。希腊语数字也有阴阳性的问题,比如1,είς (阳性。让人想起德语的eins), μία ( 阴性), εν(中性en。让人想起英语的不定冠词an);2,δύο,(duo);3,τρεϊς (阳性,阴性,treis),τρία (中性,tria);4,τέτταρες (阳性,阴性,tettares),τέτταρα (中性,tettara),等等。太麻烦了。
希腊语的序数词(拉丁语转写)如下: πρώτος (protos) 1, δεύτερος(deyteros) 2, τρίτος (tritos) 3,τέταρτος (tetartos) 4,πέμπτος (pemptos)5, έκτος (hectos) 6, έβδομος(evdomos) 7, όγδοος (ogdoos) 8,ένατος (enatos) 9,δέκατος (dekatos)10, ενδέκατος (endekatos) 11,δωδέκατος (dwdekatos) 12, δέκατοςτρίτος (dekatos tritos) 13, δέκατοςτέταρτος (dekatos tetartos) 14,δέκατος πέμπτος (dekatos pemptos)15, δέκατος έκτος (dekatos ektos)16, δέκατος έβδομος (dekatos evdomos)17, δέκατος όγδοος (dekatosogdoos) 18, δέκατος ένατος (dekatosenatos) 19, εικοστός (eikostos)20。如今英文里的源自希腊语的数字,可能字面上没有序数词的意思,但却又是来自希腊语的序数词,如tetrahedron,(正)四面体,来自τέταρτος (第四)。
注意,希腊人是把字母当作数字使用的,α 1,β 2,γ 3,δ 4,ε5, ζ 7, η 8, θ 9, ι 10, κ 20, λ30, μ 40, ν 50, ξ 60, ο 70, π80,ρ 100,σ 200,τ 300,υ 400,φ 500,χ 600,ψ 700,ω 800,注意6,90,900 比较特别,看似更像希伯来语字母,或者是古字母弃置不用了?输入不便,故此处不论。
拉丁语的基数词1,2,3 有性的变化。1, unus( 阳性), una( 阴性),unum (中性);2,duo (阳性、中性),duae(阴性);3,tres (阳性、中性),tria (阴性)。四以后没有性的变化。4,quattuor;5,quinque;6, sex; 7, septem; 8, octo; 9,novem;10,decem;11,undecim;12, duodecim; 13, tredecim (decimet tres); 14, quattuordecim;15, quindecim; 16, sedecim; 17,septendecim; 18, duodeviginti ( 二十少二。或者octodecim); 19,undeviginti (二十少一。或者novendecim);20, viginti; 21, vigintiunus; 22, viginti duo; 23, vigintitres; 30, triginta; 38 duodequadraginta( 四十少二); 39 undequadraginta( 四十少一); 40,quadraginta;48,duodequinquaginta(五十少二);49,undequinquaginta(五十少一);50,quinquaginta;60,sexaginta; 70, septuaginta; 80,octoginta; 90, nonaginta; 100,centum;200,ducenti;300,trecenti;400, qudringenti; 500, quingenti;600, sexcenti; 700, septingenti;800, octingenti; 900, nongenti;(100 至900,是复数形式的,有性的变化。前面给出的是阳性复数形式,阴性复数形式结尾为-ae;中性复数形式结尾为-a);1000,mille。
拉丁语的序数词变化很烦,但是影响着现代西语中的序数词形式,所以还是应该知道。第1,2,3 有性的变化。第1,primus;第2,secondus 或者alter; 第3, tertius;第4, quartus; 第5, quintus; 第6, sextus; 第7, septimus; 第8,octavus;第9,nonus;第10,decimus;第11,undecimus;第12,duodecimus;第13,tertius decimus;第14,quartusdecimus; 第15, quintus decimus;第16,sextus decimus;第17,septimusdecimus; 第18, duodevicesimus(octavus decimus); 第19, undevicesimus(nonus decimus); 第20, vicesimus; 第21, vicesimusprimus (unus et vicesimus); 第22,vicesimus secundus (alter et vicesimus);第30, trigesimus (tricesimus);第40, quadragesimus; 第50,quinquagesimus;第60,sexagesimus;第70, septuagesimus; 第80,octogesimus;第90,nonagesimus; 第100, centesimus; 第200,ducentesimus; 第300, trecentensimus;第400, qudringentensimus;第500, quingentensimus; 第600,sescentensimus; 第700, septingentensimus;第800, octingentensimus;第900, nongentensimus; 第1000, millensimus; 第2000, bismillensimus,等等。
还有罗马数字的说法,即拉丁语用字母表示数字,这些表示法还见于钟表、墓碑以及一些文献中。具体地,1,I ; 2,II;3,III;4,IV,IIII; 5,V;6,VI;7,VII;8, VIII; 9, IX, VIIII; 10, X;11, XI; 12, XII; 13, XIII; 14,XIV, XIIII; 15, XV; 16, XVI;17, XVII; 18, XVIII; 19,XIX,XVIIII; 20, XX; 21, XXI; 22,XXII; 28, XXVIII; 29, XXIX,XXVIIII;30,XXX;38,XXXVIII;39,XXXIX,XXXVIIII;40,XL,XXXX; 50, L; 60, LX; 70,LXX; 80,LXXX;90,XC (一百少十), LXXXX; 100, C; 101,CI; 200, CC; 300, CCC; 400,CD ( 五百少一百),CCCC; 500,D; 600, DC; 700, DCC; 800,DCCC; 900, CM ( 千少一百),DCCCC; 1000, M; 2000, MM。这里,X (10), 是两个5 (V)。L(50) , L 是字母C (100) 的下半部;C (100) 是centum 的首字母, M(1000),是mille的首字母。
相较于拉丁语,意大利文的序数词简单多了,这代表的是该语系的正确演化方向。意大利文的序数词1—10 为primo, secondo, terzo,quarto,quinto,sesto,settimo,ottavo,nono,decimo。自11起,序数词由基数词(略有变化)加词尾-esimo构成,如sedicesimo 16,diciasettesimo17,等等。
英文中的多少年周年纪念、植物多少年生等带数字的表达,用的是拉丁语表示,但也偶尔有希腊语和一些古怪的表达法,兹罗列如下( 括号里为对应的数字): Biennial(2), Triennial (3), Quadrennial(4), Quinquennial (5), Sexennial/Hexennial (6), Septennial (7), Octennial(8), Novennial (9), Decennial(10),Hendecennial (11), Duodecennial(12), Tredecennial (13),Quattuordecennial (14), Quindecennial(15),Sextodecennial (16),Septendecennial(17),Duodevigintennial(20-2),Undevigintennial (20-1),Vigintennial or vicennial (20), Trigentennial(30),Quadragennial (40),Semicentennial or Quinquagenary( 半百, 50), Sexagennial(60), Septuagennial(70), Demisesquicentennialor Septuagesiquintennial ( 半一百五十,75),Octogintennial (80),Nonagintennial(90), Centennial (100),Quasquicentennial (125), Sesquicentennial(150), Septaquintaquinquecentennialor Terquasquicentennial orquartoseptentennial (175, 3 × 25 +100,7/4×100),Bicentennial (200),Quasquibicentennial (225), Semiquincentennialor bisemicentennial(250,半个五百,两个半百),Tercentennialor Tricentennial (300),Quadricentennial 或者Quatercentenary(400), Quincentennial (500), Quinsemicentennial(550, 五个半百),Sexacentennial (600), Septuacentennialor Septcentennial (700), Octocentennial(800), Nonacentennial(900), Millennial (1000), Bimillennial(2000), Quindecimillenial(15000),etc。
据说菲波那契在他的《算书》(Liber Abaci) 里把阿拉伯的0 (sifr)译成了cephyrum,在意大利语中它变成了zefero,最后变成了法文的zéro 和英文的zero。在德语里,这个字变成了Ziffer,是数字的意思,对应英语的cipher。Cipher 作动词成了密写、解算术难题,进一步地,decipher 是破解数字密码。德语里的0 是Null。电线接法里面的零线,德语是Nulleiter。测量仪器的零位是Nullage。此外,德语的Nicht 是not,nothing,但表达0.0 时会说null comma nichts。
法语的0, 既有zéro, 也有nul。Null 作为0 在英语中也常见。Michelson—Morley 实验不能证实有地球相对于固定以太的运动,但他们(或者持存在光以太观点的人们)原以为是有的,因此这个实验被说成是failed to detect the existence ofether,或者failure of the Michelson—Morley experiment to detect the existenceof ether, 这里的failure,fail,不是说实验失败了,而是指取得了null-result,零结果——那个期待的地球相对以太的运行速度得到的确实是零结果。另一个用法是null method (zero method), 即将待测信号同已有信号同时引入探测器,两者相等时会使得探测器零响应(zero response)。用Wheatstone 电桥法测电阻,用的就是这种策略。“安培于是切换到null method,他相信这个方法能提供精度和一般性,其结果只能得到zero。”
英语里源于null 的词有不少,如nullification 归零,(法令)废止,nullable (可空的)。此外,aught 指任何事物,零,见于for aught I care。Naught 就代指0, 有comes to naught 的说法。Nought 也是0。在拉丁语中,nihil 是nothing,是0,量子力学中的annihilation operator(湮灭算符),其词干就是nihil。Nihil的缩写nil 在英语里是0,见于nilpotential等数学概念,“the nilpotent(0) ensures that they are unique (1)units (1)”。你看这里0 作为单元和1联系起来了。zero 是加法的identity元素,任何数加0 等于自身。1 是乘法的identity 元素,任何数乘以1 等于自身。只有乘法的封闭体系构成了群,既有乘法又有加法的封闭体系构成了代数(algebra,字面意思是阿拉伯语的加法)。
小时候在乡下读书,同学中考零分的事情时常发生,老师会谐谑地说“给你个大鸭蛋,拿回家去就着馍吃。” 鸭蛋代表0 绝对合格,西人也说“the resembance between an egg and a nought。” Egg 代表数字算啥神奇,它还是行星绕太阳轨道的首选呢。有趣的是,在英语中还会用love 代表零,在足球网球比赛中,三比零会说成three love。一场0:0 的比赛会被描述为love-all。这里的love, 是对法语l'oeuf, the egg (蛋),的(故意?)误用。另一说法是英国在17 世纪就有play for love的说法,意思是没有彩头的比赛,除了love 以外没有别的考量——靠玩公益发财的都这么说。
用有限的符号,表示无限个的数字,数系(numerical systems)就自然生成了。二进制(base 2-,binary),只用两个基数就够了。黑白、上下、左右、有无、开关等物理状态,都可以赋予0 和1 的角色来实现二进制。但是,有无、开关这类的物理体系,无信号的状态是容易造成误判的,故可靠的体系都会选择有信号的状态再进一步区分两种状态出来,比如摩尔斯码用电磁波信号的长短来区分0 和1,而模拟电路会采用高低电平来区分0 和1。二进制是莱布尼兹(1646—1716)发展出来的,可见其出现之晚。它应该是属于抽象的、公理化层面的存在。
计数是人类最初的科学实践,最方便的工具就是自身的手指,故数字是digital (来自digitus,手指)。两手伸开,如果不出意外,我们会发现我们每只手有5 个手指头。五是自然的进制,历史上军队以五人为一小组,设伍长,有队“伍”之说。我们两手共有10 个指头,所以十进制最后成了最常用的进制。The decimal numeral system (also called base ten or occasionally denary)has ten as its base,这句话里的decimal, ten, denary 都来自数字10。在10 不够用的场合,算算术要连脚丫子一起上的,所以有20 进制(vigesimal)。此外, 一年有12 个月,那是因为一年的天数(~365.25)除以一个月的天数(~29.5)约等于12,是取整得来的。10 和12 的最小公倍数是60,西方有60进制(sexagesimal),中国的天干地支纪年也是采用60 进制。一年有365 天, 取整,得360。360 是一个有大量除数的数,好用。我们看到,一个圆被分出360 度,或者分成12 个扇面,每个扇面表示1 小时。一个小时,或者一度,又被分成了60 小部分,称为pars minuta prima,字面意思是第一级小部分,以minuta (小) 表示之,故minuta 汉译为——或者说对应汉语的——分,很恰当。把第一级小部分再细分成60 小部分,称为pars minuta secunda,字面意思是第二级小部分,以secunda (第二)表示之,seconda 汉译为秒(小也。参照渺)。如果愿意,还可以定义parsminuta tertia,第三级小部分。我们看到圆的度数360 不是一个关于圆的好量度,你把它定义成60 度也行。圆的正确度量是其弧度为2π,这是一个等曲率曲线之积分长度与其曲率半径的比值,是关于一个特殊几何对象的微分几何描述。
印度的数进制特别乱。有十进制,那是肯定的。在耶柔吠陀梵书(Yajurveda Samhita) 中有eka (1),dasa (10),sata (100),sahasra(1000),ayuta (1000), niyuta (10000) 等关键词。这些十进制的数字项被称为dasagunottara samjna (decupleterms)。这些梵语词进入了西文中, 比如1 在希腊语和俄语(ena,odin)中,10 就是deca,而sata 就是centa。门捷列夫曾用梵语的一、二、三(eka,dvi,tri)做前缀命名他所预言的八种元素。他精确地预言了他称为ekasilicon ekaaluminium 和ekaboron 的元素,就是今天的germanium(锗),gallium (镓) 和scandium(钪)。印度还有二十、六十和百进制。据《摩诃僧只律》卷十七记载,一刹那者(箭头穿过一片花瓣的时间定义为一刹那。这再再说明, 时间不过是物理事件的计数!) 为一念,二十念为一瞬,二十瞬为一弹指,二十弹指为一罗预(亦作罗豫、腊缚),二十罗预为一须臾,一日一昼为三十须臾。又据《大智度论》卷三十载,六十念为一弹指。可见20 进制和60 进制在古代印度已然成形。此外还有百进制的。《佛说普曜经》(Lalitavistara)中有百进制(centesimal scale)的数,在那里koti 是107,100 kotis 是1 ayuta(109), 100 ayutas 是1 niyuta (1011),100 niyutas是1 kankara (1013),等等。
法语的数字是10-, 20-,60-进制混用的,也算是奇葩。英语中也保留了表示12 和20 的专门的词dozen 和score。英语的dozen,字面就是2+10,故是12,汉语将之音译为“打”, a gross=a dozen dozen,即144。不知这可否看作是12 进制的表示。在A. E. Housman 的这首诗中,“Now, of my threescoreyears and ten,Twenty will not comeagain, And take from seventysprings a score,It only leaves me fiftymore”, score 是20。所谓threescoreyears and ten,就是汉语的70高龄。
二进制物理上容易实现, 但一个位(bit,a small piece)只能表示两个数,这样表示的数字会很长。4个bits 可以表示16 个数,编程的时候就可以用16 进制, hexadecimalsystem。在电子学和计算机科学领域,会把8 个bits 称为一个byte (字节),可表示512 个数。再多一位,可表示1024 个数,1024 在这个语境下被表示为1 k (kilo,千)。
十进制用于表示小数,便利明显。荷兰学者Simon Stevin (1548—1620) 于1585 年出版了小册子deThiende (荷兰语1/10) ,引入了十进制的小数(decimal fraction)。有了十进制小数,则比如0.66 是当作66个0.01 处理的。这个十进制用于重量/长度的测量、铸币以及弧的划分等。十进制的小数,英文为a decadicfraction,长相类似0.893425671;二进制的小数,英文为a dyadic fraction,形如0.10010110; 而三进制的小数, 英文是a triadic fraction,形如0.212201102,等等。
数字用不同的进制表示,结果是不同的, 但是数论研究的数自身的性质, 与进制无关。比方说9 是个平方数,用什么进制表示都不改变这个事实,这叫科学。科学的特征是刚性,跟科学家的脾气和性别无关。自然决定了数学的结构。
西文表示大数字,一般是用拉丁语词头,仍以英语为例讨论。在美国以及所谓的学术界(scientific community),大数字以103为单位分段,词干“llion” 对应的是103。在这个体系里,大数依次是thousand103, million 106, billion 109,trillion 1012, __________quadrillion 1015, quintillion1018, sextillion 1021, septillion1024, octillion 1027, nonillion1030,decillion 1033,等等。这里的规律是,n-llion 代表的数字,n 用拉丁语给出,是10的 (n + 1) × 3 次方。所以,例如novemdecillion 字面上是19-llion,代表的数字是10(19+1)×3=1060。在英国(整个欧洲?) 的体系里, thousand 103, million 106,1000 million or milliard 109, billion1012, trillion 1018, quadrillion1024…。这里的规律是,n-llion 代表的数字是10 的6n 次方。在这个体系里,举例来说,1060=1010×6,所以是decillion,即10-llion。
还存在关于其它奇葩大数的专门表述。Googol 是10100。因为一个有钱没文化的主儿错签了支票,这个字变成了google (有钱是硬道理啊!)。因为更加没有文化,这个google 进一步地变成了谷歌。有趣的是,谷歌的中文对应物为百度,不知可否理解为10 的一百度自乘,这恰是10100。Googolplex 是10googol=1010100,gigaplex 是1 后面跟1 trillion个零, 更吓人。此外, zillion 表示任意大的整数。作为记号,n-plex 代表10^n = 10n ,n-minex代表10^(-n) = 10-n 。据说数学证明用到了10^10^10^10^10^7 这么大的数。
大数的产生,如在印度与玛雅文化中,是为了因应计时和天文学(星星太多了)的需求,故大数有天文数字之说。遇到大数,没有约定的数学计数体系的话,可干脆就用具体的物理对象做类比来形象地加以描述,如印度人的恒河沙数。含含糊糊也是一种策略, 如英文的billions upon billions,miriads of milliards,以及中文的多如牛毛、数不胜数、不计其数,等等。大数儿自然也见于微观世界,如细菌的数目,一滴水中水分子的数目,这些都是大数。丹麦诗人Piet Hein写了一首名为atomyriades的诗,这题目就是atom+myriad。这首诗原文照录如下:Nature,it seems is the popular name for milliards and milliards and milliards of particles playing their infinite game of billiards and billiards and billiards.看到没,诗里有milliards and milliards and milliards 和billiards and billiards and billiards的说法。
就运算而言,排列组合中时刻用到的阶乘(factorial) 轻易就能产生大数。为了处理n! ,引入了Stirling近似,ln n!= n ln n - n +O(ln n) ,这个公式是统计物理学的灵魂。一个人口大国,让人们在同一时刻以传统节日的名义互访,是对阶乘的蔑视。
在10 次方记号体系中,数字同数字前缀(缩写。注意大小写!)可总结如下,1024 yotta- (Y),1021 zetta (Z), 1018 exa- (E), 1015 peta- (P),1012 tera- (T), 109 giga- (G), 106mega- (M),103 kilo- (k),102 hecta-(h), 101 deca- (da), 10 -1 deci- (d),10-2 centi- (c),10-3 milli- (m),10-6micro- (μ),10-9 nano- (n. 小九儿),10-12 pico- (p),10-15 femto- (f),10-18atto- (a),10-21 zepto- (z),等等。负10-次方的数,常见于单位显得太大了的物理量的表示中,比如原子间距的典型值为0.2 nm (nanometer),电容器常见单位pF (picofaraday),激光脉冲宽度fs (femtosecond),等等。记住,即便是关于同一个物理量,每一个尺度上也都是截然不同的物理。波长500 nm的可见光和波长0.5 nm 的X-光,光物理是不一样的。同样是波长500 nm 的可见光,脉冲宽度为1 ps 和宽度为1 fs的脉冲激光束,其光路上也在发生不同的故事。
1) 逸锋2010 年说这话时14 岁。有儿可为师,不亦庆幸乎!
2) 我知道数字是美的。如果它们不是美的,那就没别的了——厄尔多什
3) 上帝创造了整数;其它的都是人类的杰作。出自Heinrich L.Weber, Kronecker: Jahresbericht der Deutschen Mathematiker-Vereinigung2, 5-23 (1891/1892) p.19.
4) 万物皆数——毕达哥拉斯
5) 不通数学者,莫读我作品——达芬奇。此句的流行英译有Let no one read me who is not a mathematician.
6) 这是一个6×6 的幻方。幻方有很多,其要求是沿行、列和对角线运算得来的数字是相同的。
7) Harmony,本意是安装得当。把hamony (hamonic)译成和谐、调和,妨碍了对相关问题的正确理解。说什么宇宙的和谐,其实人家是在讨论宇宙中的天体是如何恰当地装配的。
本文选自《物理》2018年第6期
8. 隐身漫谈
10. 四十载风雨兼程再出发初心不忘——写在中国科学院理论物理研究所建所40 周年之际
END