晓明's profileGarden of Lazy CatPhotosBlogListsMore Tools Help

Blog


    March 11

    Zebra Crossing vs. Crosswalk

      昨天和Chris闲聊,说起来中国和美国交通标志的差异。我给他举例子说,机动车道上的白色空心菱形,在美国表示car pool车道;但是在中国则表示前方有人行横道(zebra crossing)。不过没想到Chris居然听不懂zebra crossing,问我这是动物表演么…… 于是我给他解释说,就是那种黑白相间的线,用来让行人横穿机动车道的。Chris恍然大悟,告诉我,这东西在美国不叫zebra crossing,而是叫crosswalk。

      回来查字典,Colins上倒是明确标明zebra crossing和pedestrian crossing都是英国用语。但是维基百科上则说zebra crossingpedestrian crossing的一种,并且二者都没有标明是英国用语。而crosswalk则被直接重定向到了pedestrian crossing。

    February 12

    纯粹好奇

      日语中的地理名词比如山(やま),島(しま),浜(はま),沼(ぬま);还有表示空间的词比如隈(くま),端(つま),隙(ひま)都是以ま结尾。这是一个巧合呢,还是说有其来源呢?这几个词都是同一类型的词,都是日本本土读音——训读,严重怀疑是有原因的。

      Google之,未果……

    February 11

    斜体

      “斜体”顾名思义,就是一种倾斜的字体。斜体来源于书法,或者说手写体。在西文中,斜体通常向右倾斜;而在阿拉伯文等从右向左书写的系统,斜体通常向左倾斜。而在汉语文化圈的语言中中,则不应该使用斜体。这是一个显而易见的事实,汉字的书写讲究横平竖直,中正,怎么可能会允许有斜体的存在。

      在西文中,其实倾斜的字体有两大类,Italic和Oblique(也称为Slanted),两者都被笼统的翻译成了“斜体”。对CSS比较熟悉的人会知道,在CSS里font-style的三个有效值是:normal, italic,和oblique。

      简单的说,Italic与Oblique的区别是:Italic会引起字形的变化,而Oblique只是简单的倾斜字体。说起来比较抽象,比较一个实际的例子就可以看出来区别了。

    Untitled

      可以看出来,在Italic中f, a, Q三个字母发生了明显的变化。f的尾巴拉长了,a变成了单层,Q的尾巴变了形状。而在Oblique中,这些变化都没有出现。事实上仔细看就会发现,其实Italic的衬线也都有所变化。

      此例中,上边两行为“Times New Roman”,下边两行为“Verdana”。二者都是在Word中选中之后,按下工具栏上的“I”按钮得到的结果。感兴趣的不妨试试。

      现在问题来了,肯定有人会问,为什么同样是按下“I”按钮,结果却一个是Italic,一个是Oblique呢?答案是,并不是所有的字体都作了Italic…… 如果某个字体没有做Italic,那么在处理Italic的请求的时候,就由计算机的字体引擎直接把原字体中的字形扭一个角度来充当Italic。Times New Roman作了Italic,而Verdana没有。这就是产生差异的原因。用过LATEX的中文处理应该会知道,使用ttf2tfm把ttf字体转为tfm字体的时候,就可以加上slant选项,指定一个扭转角度来充当Italic。只有极少部分的字体同时支持Italic和Oblique。

      可能会有这样的问题,在翻译文稿的时候,需要保持原来的格式。文稿中的西文有斜体的,翻译成中文的怎么办?这可以具体问题具体分析。我们知道西文中斜体的最主要使用场景有三个:一个是强调,一个是出版物的名称,还有一种是引用,比如诗歌之类的。对于强调,我们在翻译过来的时候可以选择黑体或者粗体。对于出版物名称,如果不翻译,保持原文,那就保持斜体;如果翻译,就用正文字体加上书名号。对于引文,可以转为中文手写体,比如楷体等等。总之可以灵活变通,根据实际的含义选择不同的中文字体。但是千万不要用斜体。因为中文斜体实在是太难看了!中国人写字不应该斜着写。

    November 19

    凑趣说“呵呵”

      最近网上有篇谈论“呵呵”出处的文章流传相当广泛,大意说先有人发现苏轼(1037-1101)用过这个词,后面又有人发现韦庄(851-910)也用过这个词,比苏轼更早。

      然而若因此说韦庄是“呵呵”一词的始作俑者,则是太欠考证了。中国的小学名著有一本名叫《广雅》的,是三国时魏明帝太和年间(227-232)博士张揖编撰,名字含义就是《尔雅》的增广本。在《广雅·卷第六上·释训篇》中有如下一条:

      唏唏、㰤㰤、hehe1 [1]、呵呵、hehe2[2]、啞啞,笑也。

      显然在三国时代,呵呵这个词就已经存在了,并且就是代表笑得意思。也就是说,至少在韦庄出生600年前,呵呵一词就已经被人们使用了。

      不过《广雅》后,唐前的文献中甚少有呵呵这个词出现,估计还是因为这个词太口语化了。韦庄是晚唐人,我们抛开《广雅》不论,然而在初唐,盛唐也有使用呵呵的文字流传下来。如房玄龄等人于贞观二十二年(公元648)年写成的《晋书·载记第七·石季龙下》有如下文字:

      嚴兵發哀于太武殿。宣乘素車,從千人,臨韜喪,不哭,直言呵呵,使舉衾看屍,大笑而去。

      有唐一代,诗僧辈出。以王梵志为代表的梵志体多以口语、俗语入诗。道理浅显,言语清新。如寒山,神晏,文偃,智常等高僧均有以呵呵二字入诗,入偈的。这也说明,在唐朝时,呵呵绝对是生活中的常用语。可见,韦庄也不过是以时语入词而已。


    [1] Unicode编码无此字

    [2] Unicode编码为U+27963。

    October 07

    氨,胺,铵

      《现代汉语词典》第五版到手了,验证了我的记忆。氨、胺、铵这三个字的读音是不同的。

      氨是NH3,读音为ān。胺是氨分子中的氢部分被烃基取代的有机化合物,读音为àn。铵则是NH4+,也就是氨分子衍生的阳离子,读音为ǎn。

      化学名词的读音和写法真是很头疼,在三聚氰胺风波之前,比较大的恶性化学品食物风波就是二噁英事件了,而这个名字被绝大多数媒体写成了二恶英。

    August 21

    柯林斯高阶英语学习词典

      推荐一下,柯林斯的COBUILD系列的确相当不错。这个系列的词典最大的特色是用语境来解释单词,而不是简单的短语,这样就很容易理解词汇的细微差别。比如这四个词汇 complusory, imperative, mandatory,以及obligatory,我一直分不清它们的区别,《柯林斯高阶英语学习词典》解释如下:

    compulsory  
      If something is compulsory, you must do it or accept it, because it is the law or because someone in a position of authority says you must.
    imperative  
      If it is imperative that something is done, that thing is extremely important and must be done.
    mandatory  
      If an action or procedure is mandatory, people have to do it, because it is a rule or a law.
    obligatory  
      [1] If something is obligatory, you must do it because it is a rule or a law.
      [2] If you describe something as obligatory, you mean that it is done from habit or custom and not because the person involved has thought carefully about it or really means it.

      读了这个解释之后,基本上我能搞清楚它们的使用场合了。

    July 03

    波罗蜜多心经

      最近几天的心情颇为低落,躺在床心绪不宁的时候突然想起来颂《心经》,结果心下慢慢安稳了下来,渐渐昏昏睡去。从小受到的教育让我不仅成为无神论者,也成为了无信仰者。也许将来老去的时候,彷徨无计的时候,选择一门宗教来作为精神依托的话,佛教其实是个不错的选择。从今天开始,晚上睡前又多了一门功课,凝神静气,颂一遍《心经》。

      《心经》是佛教中一部极为重要的经典,被认为是《大般若经》的核心所在,故名心经。最早由支遁译为汉文,但支遁译本已经亡佚。目前保留下来的主要译本有玄奘译本和鸠摩罗什译本,以玄奘译本流传最广,影响最大。

    梵文 प्रज्ञापारमिताहृदयसूत्रं
    拉丁转写 Prajñāpāramitā Hridaya Sūtra
    英译 The Heart Sutra
    玄奘译 摩訶般若波羅蜜多心經
    鸠摩罗什译 摩诃般若波罗蜜大明咒
        prajñā(般若):智慧
        pāramitā(波羅蜜多):到达涅磐之彼岸
     
    梵文 आर्यावलोकितेश्वरो बोधिसत्त्वो गंभीरायां प्रज्ञापारमितायां चर्यां चरमाणो व्यवलोकयति स्म ।
    拉丁转写 āryavalokiteśvaro bodhisattvo gaṃbhīrāyāṃ prajñāpāramitāyāṃ caryāṃ caramāṇo vyavalokayati sma
    英译 The noble bodhisattva Avalokiteshvara practising a deep practice of the perfection of wisdom percieved
    玄奘译 觀自在菩薩,行深般若波羅密多時,照見
    鸠摩罗什译 觀世音菩薩,行深般若波羅蜜時,照見
        ārya:神圣的
        avalokiteśvaro(观自在):ava+lok = to look, iteśvaro意为自在。
        bodhisattva:音译“菩提萨埵”,简称菩萨。bodhi含义为“觉”,sattva义为“之人”
     
    梵文 पंचस्कन्धाः ।
    拉丁转写 paṃcaskandhāḥ
    英译 five constituents
    玄奘译 五蘊
    鸠摩罗什译 五陰

        paṃca:五
        skandhāḥ:元素

     
    梵文 तांश्च स्वभावशून्यान्पश्यति स्म ।
    拉丁转写 tāṃś ca svabhāvaśūnyān paśyati sma
    英译 And he saw them as void of any existence on their own.
    玄奘译 皆空,[度一切苦厄]
    鸠摩罗什译
        sva:本身。
        bhāva:存在
        śūnyān:空。
        paśyati:单数第三人称的看。
        sma:表示完成事态的副词。此处玄奘译本有一句衍文“度一切苦厄”
     
    梵文 इह शारिपुत्र रूपं शून्यता शून्यतैव रूपं रूपान्न पृथक्शून्यता शून्यताया न पृथग्रूपं यद्रूपं सा शून्यता या शून्यता तद्रूपं ।
    拉丁转写 iha śāriputra rūpaṃ śūnyatā śūnyataiva rūpaṃ rūpān na pṛthak śūnyatā śūnyatāyā na pṛthag rūpaṃ yad rūpaṃ sā śūnyatā yā śūnyatā tad rūpaṃ
    英译 Here, Sariputra, the form is emptiness, emptiness is just the form. Emptiness is not different from the form and the form is not different from emptiness. What is the form, that is emptiness; what is emptiness, that is the form.
    玄奘译

    舍利子,色不異空,空不異色。色即是空,空即是色。

    鸠摩罗什译 舍利弗色空故無惱壞相。舍利弗非色異空。非空異色。色即是空。空即是色。

        iha:副词,此处。
        śāriputra:佛陀的弟子,舍利弗,号称智慧第一。
        rūpaṃ:外形,色。
        śūnyatā:空的状态。
        śūnyataiva:= śūnyatā + eva。eva是副词,含义为正是。
        na:副词,不是。
        pṛthak:介词,与之相异。

     
    梵文 एवमेव वेदनासंज्ञासंस्कारविज्ञानानि ।
    拉丁转写 evam eva vedanāsaṃjñāsaṃskāravijñānāni
    英译 And just so it is with feeling, perception, mental impulses and consciousness.
    玄奘译 受想行識,亦復如是。
    鸠摩罗什译

    受空故無受相;想空故無知相;行空故無作相;識空故無覺相。何以故?

     
    梵文 इह शारिपुत्र सर्वधर्माः शून्यतालक्षणा अनुत्पन्ना अनिरुद्धा अमला न विमला नोना न परिपूर्णाः ।
    拉丁转写 iha śāriputra sarvadharmāḥ śūnyatālakṣaṇā anutpannā aniruddhā amalā na vimalā nonā na paripūrṇāḥ
    英译 Here, Sariputra, all the phenomena have the emptiness as the characteristic. Not arisen, not destroyed, not defiled, not purified, not lacking, not complete.
    玄奘译 舍利子,是諸法空相,不生不滅,不垢不淨,不增不減。
    鸠摩罗什译 舍利弗是諸法空相。不生不滅。不垢不淨。不增不減。是空法。
        sarva-:一切,全部。
        a-:表否定的前缀。
        mala:污秽。
     
    梵文 तस्माच्छारिपुत्र शून्यतायां न रूपं न वेदना न संज्ञा न संस्कारा न विज्ञानानि ।
    拉丁转写 tasmāc chāriputra śūnyatāyāṃ na rūpaṃ na vedanā na saṃjñā na saṃskārā na vijñānāni
    英译 Therefore, Sariputra, in emptiness, there is no form, no feeling, no perception, no mental impulses, no consciousness.
    玄奘译 是故空中無色,無受想行識 。
    鸠摩罗什译 是故空中無色,無受想行識。
        tasmāc:因此。
     
    梵文 न चक्षुःश्रोत्रघ्राणजिह्वाकायमनांसी ।
    拉丁转写 na cakṣuḥśrotraghrāṇajihvākāyamanāṃsī
    英译 No eye, ear, nose, tongue, body, mind.
    玄奘译 無眼耳鼻舌身意
    鸠摩罗什译 無眼耳鼻舌身意
     
    梵文 न रूपशब्दगंधरसस्प्रष्टव्यधर्माः ।
    拉丁转写 na rūpaśabdagaṃdharasaspraṣṭavyadharmāḥ
    英译 No form, sound, scent, taste, touchable, mind-object.
    玄奘译 無色聲香味觸法
    鸠摩罗什译 無色聲香味觸法。
     
    梵文 न चक्षुर्धातुर्यावन्न मनोविज्ञानधातुः ।
    拉丁转写 na cakṣurdhātur yāvan na manovijñānadhātuḥ
    英译 No eye element..., until we come to: no consciousness-element
    玄奘译 無眼界,乃至無意識界
    鸠摩罗什译 無眼界,乃至無意識界。
        yāvan:甚至
     
    梵文 न विद्या नाविद्या न विद्याक्षयो नाविद्याक्षयो यावन्न जरामरणं न जरामरणक्षयो न दुःखसमुदयनिरोधमार्गा न ज्ञानं न प्राप्तिः ॥
    拉丁转写 na vidyā nāvidyā na vidyākṣayo nāvidyākṣayo yāvan na jarāmaraṇaṃ na jarāmaraṇakṣayo na duḥkhasamudayanirodhamārgā na jñānaṃ na prāptiḥ
    英译 No ignorance, no extinction of ignorance..., until we come to: no old age and death, no extinction of old age and death. No suffering, arising, cessation, way. No knowledge, no attainment, no non-attainment.
    玄奘译 無無明,亦無無明盡;乃至無老死,亦無老死盡;無苦集滅道;無智亦無得
    鸠摩罗什译 無無明,亦無無明盡;乃至無老死,無老死盡;無苦集滅道;無智亦無得
     
    梵文 तस्मादप्राप्तित्वाद्बोधिसत्त्वाणां प्रज्ञापारमितामाश्रित्य विहरत्यचित्तावरणः ।
    拉丁转写 tasmād aprāptitvād bodhisattvāṇāṃ prajñāpāramitām āśritya viharaty acittāvaraṇaḥ
    英译 Therefore, Sariputra, it is because of bodhisattva's non-attainment, that he dwells without the hindrances of the mind, having resorted to the perfection of wisdom.
    玄奘译 以無所得故,菩提薩埵,依般若波羅密多故
    鸠摩罗什译 以無所得故,菩薩,依般若波羅蜜故。
     
    梵文 चित्तावरणनास्तित्वादत्रस्तो विपर्यासातिक्रान्तो निष्ठनिर्वाणः ।।
    拉丁转写 cittāvaraṇanāstitvād atrasto viparyāsātikrānto niṣṭhanirvāṇaḥ
    英译

    Because of non-existence of the hindrances of the mind, he is not frightened, he has crossed over distortions, at the end he will attain Nirvana.

    玄奘译 心無罣礙,無罣礙故,無有恐怖,遠離顛倒夢想,究竟涅槃
    鸠摩罗什译 心無罣礙,無罣礙故,無有恐怖。離一切顛倒夢想苦惱,究竟涅槃。
     
    梵文 त्र्यध्वव्यवस्थिताः सर्वबुद्धाः प्रज्ञापारमितामाश्रित्यानुत्तरां सम्यक्सम्बोधिमभिसंबुद्धाः ।।
    拉丁转写 tryadhvavyavasthitāḥ sarvabuddhāḥ prajñāpāramitām āśrityānuttarāṃ samyaksambodhim abhisaṃbuddhāḥ
    英译 All the Buddhas existing in the three times, having resorted to the perfection of wisdom, have fully awakened to the highest and right awakenment.
    玄奘译 三世諸佛,依般若波羅密多故,得阿耨多羅三藐三菩提
    鸠摩罗什译 三世諸佛,依般若波羅蜜故,得阿耨多羅三藐三菩提。

        tryadhvavyavasthitāḥ:tri(三)+adhva(世代)+vyavasthitāḥ(停留)
        sarva-:一切,全部。
        ānuttarā:音译“阿耨多羅”,无上的,最高的。
        samyaksambodhim:samyak(正确的)+sambodhim(觉悟)

     
    梵文 तस्माज्ज्ञातव्यं प्रज्ञापारमिता महामन्त्रो महाविद्यामन्त्रो ऽनुत्तरमन्त्रो ऽसमसममन्त्रः सर्वदुःखप्रशमनः ।
    拉丁转写 tasmāj jñātavyaṃ prajñāpāramitā mahāmantro mahavidyāmantro 'nuttaramantro 'samasamamantraḥ sarvaduḥkhapraśamanaḥ
    英译

    Therefore one should know: the perfection of wisdom as the great mantra, the mantra of great knowledge, the highest mantra, the unequalled mantra, pacification of all suffering.

    玄奘译 故知般若波羅密多,是大神咒,是大明咒,是無上咒,是無等等咒,能除一切苦
    鸠摩罗什译 故知般若波羅蜜,是大明咒,無上明咒,無等等明咒,能除一切苦
        maha-:大的,伟大的。
        mantro:咒语
     
    梵文 सत्यममिथ्यत्वात् ।
    拉丁转写 satyam amithyatvāt
    英译

    It is a truth - because it could not be wrong.

    玄奘译 真實不虛
    鸠摩罗什译 真實不虛
     
    梵文 प्रज्ञपारमितायामुक्तो मन्त्रः ।
    拉丁转写 prajñapāramitāyām ukto mantraḥ
    英译 The mantra was proclaimed in the Perfection of Wisdom.
    玄奘译 故說般若波羅密多咒
    鸠摩罗什译 故說般若波羅蜜咒
     
    梵文 तद्यथा गते गते पारगते पारसंगते बोधि स्वाहा ।।
    拉丁转写 tadyathā gate gate pāragate pārasaṃgate bodhi svāhā
    英译

    [It sounds] as follows: [For him or her] who is gone, who is gone, who is gone to the other shore, who is completely gone to the other shore, there is an awakenment, hail!

    玄奘译 [即說咒曰] 揭諦揭諦,波羅揭諦,波羅僧揭諦,菩提薩婆訶
    鸠摩罗什译 [即說咒曰] 竭帝竭帝,波羅竭帝,波羅僧竭帝,菩提僧莎呵摩訶
        gate:到达。
        pāra:彼岸。
        saṃgate:saṃ(一起)+gate(到达)
        svāhā:欢呼,用于咒语结束。
    January 07

      这个字比较有意思,读作túshūguǎn。今天才知道居然有这么个有趣的汉字,《康熙字典》里是一定找不到的,因为那时候这个字还没造出来。转一篇讲述这个字的历史的文章过来。


    2004年7月27日《文汇读书周报》  王子舟

      《文汇读书周报》曾刊登了袁津琥、薛理勇的两篇谈“圕”字的短文,一曰“圕”字是个“极生僻”的字,不是近人新造;一曰“圕”只是个图书馆协会的标志而非汉字。实际上,“圕”不仅是一个汉字,且其发明人就是早年在上海图书馆界工作过的著名图书馆学家杜定友先生。

      杜定友(1898-1967)先生在我国图书馆学界,与刘国均先生有“南杜北刘”之称。他生在上海,少年时代在南洋公学读书,民国七年(1918)于南洋大学附属中学毕业前夕,正逢南洋大学新建图书馆而急需专业人才,校长唐文治派他到菲律宾大学学习图书馆学专业。因此,杜定友成为近现代上海留学海外攻读图书馆学的第一人。民国十年(1921)杜定友以优异成绩提前一年毕业回国,从此在上海、广州两地从事图书馆事业长达50年,先后担任过广东省立图书馆馆长、复旦大学图书馆主任、南洋大学图书馆主任、中山大学图书馆主任、上海市立图书馆筹备处副主任、广东省文献馆主任等职。

      民国十三年(1924),杜定友先生以“圖書館”三字笔画繁多(当时尚为繁体字)、书写不便,乃创“圕”(草体为“圕”)代之,读音仍依“tushuguan”。民国十五年(1926)7月,杜定友赴日旅行,曾与日本同仁语及此字,大受彼邦人士赞许。其时日本图书馆界正欲创办一份图书馆杂志,刊名即决定采用“圕”。不久,杜定友收到《圕》杂志第一期,他对该期所有文章中“圕”一字的使用情况加以统计,结论是:该刊40页,用“圕”字436次,如用旧例则须用1308字。看来,“圕”字的使用确有简便、经济之利。民国十八年(1929)1月28日,中华图书馆协会第一次年会在南京金陵大学召开,会议一共收到提案170余件,其中包括杜定友提出的“采用‘圕’新字案”,而且此议案在29日的行政组决议通过。7月30日,中华图书馆协会致函各图书馆,就“采访与流通”等诸事项发布指示,其中亦要求各地图书馆广泛使用“圕”字,称:“又‘圕’字为图书馆三字之缩写于图书馆界同人事务上至为经济便利已经大会议决通过亦望广为应用。”而且该公文已将“图书馆”三字由“圕”代替。不过,国内最早使用此字的报刊,当为上海的《申报》。《申报》于当年2月2日报道中华图协第一次年会消息时,文中已夹杂使用“圕”字。从此,“圕”在文化学术界开始流行。

      此外,值得一提的是,杜定友先生一生在中国图书馆事业上屡有创新与贡献,他编的图书分类法,在民国时期与王云五、刘国钧二人所编的分类法并行于世,为图书馆界最流行的三部分类法之一。他还发明过《汉字形位排检法》(1932年),并提出了“字根”的学说,把几千个汉字进行比照分析,抽出五百多个字根。遗憾的是,当人们在计算机时代用字根(又叫部件、字符)方法攻克了汉字信息处理难题的时候,很多计算机类的书籍都将这一贡献“封”给了计算机信息处理的研究者,而已无人再重提杜定友了。

    January 06

    英语中的汉语外来语

      英语中的外来语为数众多,但是来源于汉语的并不多,而且其中大部分也不常用。主要原因大概还是因为明朝锁国之后,中国的国际影响力一直比较低的原因。这些汉语借词主要还是集中在食品上,语源和借入年代来自于韦氏大词典

    B

      Bok choy:白菜。来源于粤语的“白菜(baahk-choi)”,1938年。

    C

      Cheong-sam:旗袍。来源于粤语的“长衫(cheuhng-saam)”,1952年。
      chop-chop:快点,赶快。来源于中国洋泾浜英语,粤语的“急(gup)”的叠音,1834年。
      chopstick:筷子。来源于中国洋泾浜英语,chop + stick,1699年。
      chop suey:杂烩菜。来源于粤语“杂碎(jaahp-seui)”,1888年。
      chowchow:腌什锦菜,蜜饯。来源于中国洋泾浜英语,可能是粤语的“炒”的叠音,1850年。
      chow mein:炒面。来源于粤方言台山话的“炒面(cháau-mihn)”,1898年。
      coolie:苦力。有些字典认为这个词来源于汉语的“苦力”,有些字典认为来源于印地语或者乌尔都语。1638年。
      cumshaw:赏钱,消费。来源于厦门话“感谢(kam siā)”,1839年。

    D

      dim sum:点心。来源于粤语的“点心(dímsām)”,1948年。

    F

      fan-tan:一种赌博游戏。来源于粤语的“番摊(fantan)”,1878年。
      feng shui:风水。来源于官话的“风水(fengshui)”,1797年。
      foo dog:佛犬,指佛像前的狮子。来源于普通话的“佛(fo)”+ dog,1953年。

    G

      ginseng:人参。来源于官话的“人参(renshen)”,1654年。
      gung ho:齐心协力的,强烈的。来源于汉语的“工合”,是“中国工业合作社”的简称,1942年。
      hoisin sause:海鲜酱。来源于粤语的“海鲜酱(hóisīn-jeung)”,1968年。

    K

      kowtow:磕头。来源于官话“叩头”,1804年。
      kumquat:金橘。来源于粤语的“柑橘(gām-gwāt)”,1699年。
      kung fu:中国功夫。来源于普通话的“功夫”,1966年。

    L

      lo mein:捞面。来源于粤语的“捞面(lòu-mihn)”,1970年。
      longan:龙眼,龙眼树。来源于官话的“龙眼”,1732年。
      loquat:枇杷,枇杷树。来源于粤语的“栌橘(làuh-gwāt)”,1820年。
      lychee:荔枝。来源于官话的“荔枝”,1588年。

    M

      mao-tai:茅台酒。来源于中国地名“茅台镇”,1943年。
      mahjong:麻将牌。1920年。

    O

      oolong:乌龙茶。来源于厦门方言“乌龙(oōlióng)”,1850年。

    P

      pekoe:白毫。来源于厦门方言“白毫(pek-ho)”,1712年。
      Pinyin:汉语拼音。来源于普通话“拼音”,1963年。

    Q

      Qi:维持生命的必须能量。来源于官话的“气”,1850年。

    S

      sampan:舢板,小船。来源于粤语的“舢板(sàambáan)”,1620年。
      Shar Pei:沙皮狗。来源于粤语的“沙皮(sàpéi)”,1975年。
      Shih Tzu:狮子狗。来源于官话的“狮子”,1921年。
      Souchong:小种红茶。来源于官话的“小种”,1760年。

    T

      Tai Chi:太极,太极拳。来源于普通话的“太极”,1954年。
      taipan:在中国经商的外国商人。来源于粤语的“大班(daaih-bāan)”,1834年。
      tangram:七巧板。来源于官话的“唐”+ gram,1861年。
      Tao:道家学说的道。来源于官话的“道”,1736年。
      Tea:茶。来源于厦门方言的“茶(dé)”,约1655年。
      tong:帮会。来源于粤语的“堂(tòhng)”,1883年。
      toumingdu:透明度。来源于20世纪80年代中英谈判用语。
      typhoon:台风。来源于粤语的“大风(daaih-fùng)”,1771年。一说是来源于阿拉伯语。

    W

      wok:炒锅。来源于粤语的“镬(wohk)”,1952年。
      wonton:馄饨。来源于粤语的“云吞(wàhn-tān)”,1934年。
      wushu:武术。来源于普通话的“武术”,1971年。

    Y

      yamen:衙门。来源于官话“衙门”。1747年。
      yin and yang:阴阳,对立的双方。1848年。
      yum cha:饮茶。来源于粤语“饮茶(yum cha)”,1989年前后。

    由其他语言转译的一些汉语词

      bonsai:盆栽。由汉语“盆栽”传入日本“盆栽(ぼんさい)”,1900年成为英语词汇。
      ginkgo:银杏。由楚方言“金果(ginkyo)”传入日本,再从日语到拉丁语Ginkgo。1773年成为英语词汇。
      Go:围棋。由汉语的“碁”到日语的“囲碁(いご)”。1890年成为英语词汇。
      kaolin:瓷土,高岭土。来源于中国地名“高岭”,由汉语到法语“kaolin”。1741年成为英语词汇。
      koan:佛教禅宗的以心传心。来源于汉语的“公案”,由汉语到日语“公案(こうあん)”。1945年成为英语词汇。
      nunchaku:双截棍。来源于闽方言,传入日本冲绳。1970年成为英语词汇。
      ramen:拉面,鸡蛋面。来源于汉语的“拉面”,到日语。1972年成为英语词汇。
      silk:丝绸。来源于汉语的“丝绸”,经由希腊语“sērikos”,在12世纪前成为英语词汇。
      shogun:将军。来源于汉语的“将军”,传入日本“将軍(しょうぐん)”,1727年成为英语词汇。
      tofu:豆腐。来源于汉语的“豆腐”,传入日本“豆腐(とうふ)”,1771年成为英语词汇。
      zen:禅,禅宗。来源于汉语的“禅”,传入日本转读为“禅(ぜん)”,1727年成为英语词汇。

    December 19

    说说脖子

      现代汉语使用的汉字个数远远少于古代汉语中的汉字。一方面是很多字现在都可以用词语来表示,比如《康熙字典》中上百个“马旁”的字现在统统用一个“马”来代替,只不过要加上各种定语,比如黑白花的马(駹),后边的右腿是白色的马(骧)等等。另一方面则是很多细微差别的字,现在已经合并到同一个字来代替了。

      譬如说脖子,现代汉语就这么一个“脖”字来代表身体的这个部位,古代汉语则要复杂一些。

      在古代汉语中,脖子的前面叫做颈,后边叫项。其实“巠”本身就有脖子的意思,所以加上表意的头(页)就是头部的脖子(颈),加上刀子(刂)就是抹脖子(刭)。

      观察一下现代汉语中仍然残留的这两个字的词语就不难比较出来其区别了。比如刎颈,显然是拿刀子割脖子的前边,要是割后边就只能叫砍头了。又比如交颈鸳鸯,自然是脖子前边相对,要是后边相对那就变成了Kappa了。

      强项令是脖子后边硬,誓不低头,要是反过来就热闹了,变成决不cj滴仰起45度角了。望其项背也是如此,如果一边看这个人的背,一边看脖子前边,那这个人只能是申公豹,否则绝对不可能出现这么神奇的人。

      《说文解字》里没有“脖”这个字,但是并不是说这个字古代就不使用,反而是相当早就有了。《黄帝内经·灵枢·九针十二原》有:“肓之原出于脖胦。”不过这里的“脖”可不是脖子,而是肚脐下边。至于这个字代表脖子则应该是来源于口语的晚起义项了。在元杂剧中,就经常看到这个含义了。如关汉卿的《单刀会》:“青龙偃月刀,九九八十斤,脖子裹着一下,哪里寻黄文?”。

      那么古代有泛指脖子,不分前后的字么?当然有,其实在不深究的场合,颈和项都可以泛指脖子,不过最佳答案应该是“领”。《国语·楚语下》“缅然引领南望曰”。这里的“引领”既不是“引领时代潮流”的引领,也不是拉拉领子的意思,就是抻脖子。

    September 16

    也说“破瓜”

      今天在网易上看到一篇文章,题目叫做《红楼傲骨:大观园中最具有反抗精神的姑娘》,里边有如下这么一句话:

        “袭人早已被宝玉破瓜

      看来作者是把破瓜理解成女子破处了,不晓得这个猥琐的理解是怎么来的。

      破瓜一语最早见于唐武德年间成书的《艺文类聚》卷43[1],晋·孙绰的《情人歌》:“碧玉破瓜时,郎为情颠倒。”宋郭茂倩的《乐府诗集》卷45[2]则载为《碧玉歌》,称为宋汝阳王所作。袁枚的《随园诗话》卷13[3]第48条解释的非常明白:

      “《古乐府》:‘碧玉破瓜时。’或解以为月事初来,如瓜破则见红潮者,非也。盖将瓜纵横破之,成二‘八’字,作十六岁解也。段成式诗:‘犹怜最小分瓜日。’李群玉诗:‘碧玉初分瓜字年。’此其证矣。

      由于“瓜”字破开变成了两个“八”字,所以有些情况下,破瓜也代表六十四岁。宋代江少虞所辑《事实类苑》卷43记载了不少吕洞宾的奇闻轶事,其中有这么一条:

      “张洎家居,忽外有一隐士通谒,乃洞宾名姓,洎倒屣见之。洞宾自言吕渭之后,渭四子,温、恭、俭、让。让终海州刺史,洞宾系出海州房,让所任官,唐书不载。 索纸笔,八分书七言四韵词一章,留与洎,颇言将佐鼎席之意。其末句云:‘功成当在破瓜年’,俗以破瓜字为二八,洎年六十四卒,乃其谶也。

      可见破瓜确指年龄是毫无疑问的,而且还是个名词,不是动词。望文生义还是要不得啊!

      忍住这个,接着往下看这篇文章,越看越汗,里边的句子越来越彪悍。比如“姨娘的女孩子一般都比较漂亮,因为妈妈漂亮嘛,不漂亮怎么当二奶?”,“在王夫人眼里,赵姨娘不是一个一般的姨娘,而是不共戴天的情敌。”......

      看到最后,发现这是一本书的节选。书名《红楼韵事》,作者张涛之。真不知道作者是从红楼评论文章拼凑而来还是怎么的,感觉上就好像是根本没读过《红楼梦》一样。嗯,这个人写的书可以列入我的黑名单了。

     

    [1] http://www.guoxue.com/zibu/ywlj/ywlj_043.htm

    [2] http://www.guoxue.com/jibu/yuefusj/yfsj_045.htm

    [3] http://www.cn0123.com/read.asp?bookid=813&id=19081

    March 13

    X为何成了软肋?

      在网易上看到这么一则文章,标题是“海外华人的尴尬 [X]是汉语拼音的软肋”,以为是什么高论,看了之后真是让人哭笑不得。

      作者用老外无法正确读出拼音中的X为立论,攻讦汉语拼音的设计缺欠。好笑的是,其实作者根本就没有搞明白他攻讦的是什么。汉语拼音是用来给汉字注音和拼写普通话语音的方案。老外看到的是汉字的拉丁字母(罗马字母)转写方案。只是恰好从1978年开始,中国开始使用汉语拼音作为人名地名的转写方案(《关于改用汉语拼音方案拼写中国人名地名作为罗马字母拼写法的实施说明》)。如果说X是软肋,也是转写方案的软肋,不是汉语拼音的软肋。

      其次,作者根本没有搞清楚汉语拼音与音标的区别。汉语拼音并不是一个严格的,精确的音标系统,只是用来帮助学习记忆汉字的发音。比如汉语拼音中的[i]在[zhi],[zi],[ri],[yi]中虽然是同一个写法,但是代表了四个完全不同的音位。作者声称“所以清华保留了Tsinghua的老式音标”,却不知这也是一种拼音方案(威妥玛式拼音),同样不是音标。

      其三,为什么要让老外精确地读出汉字的读音?即使是欧洲同样使用拉丁字母的语言,让英美人用英语读出来也十有八九和原来语言根本不相同。举个简单的例子,拉丁语系中好多语言中H根本不发音,只是表示送气(aspiration)与否,例如法语中很多H开头的单词。希腊语中的H压根就是个元音(利用前置'号标识是否送气,例如赫拉克勒斯英文写成了Heracles)。还有例如法语单词结尾的辅音字母很多不发音,若是按照英语的发音规则,那是自然要发出来的了。还有例如日语的罗马字,ら行转写为[r*],英美人自然会按照英语中的[r]发音了。是否这些都得算作非英语语言中的软肋呢?

      作者认为台湾的“通用拼音”不用x,是一种进步了,不妨列一个表格比较比较作者抱怨的这几个音节的拼法,看看哪种拼音方案更简洁,便于学习。

    汉语拼音方案 通用拼音 威妥玛式拼音
    zi zih tzu
    ci cih tz`u
    si sih ssu
    zhi jhih chih
    chi chih ch`ih
    shi shih shih
    ji ji chi
    qi ci ch`i
    xi si hsi

      作者最后指出有一位姓“习”的先生,因为名字的汉语拼音是XI,所以被称为Mr. Eleven,称为X悲剧。孰不知,这是一个拾人牙慧的老段子了。曾经有位台湾的女作家,说她的一个朋友叫“易轶”,护照上的名字是"II",在海关被老外看了半天,最后说了句,因为名字是Miss Two,所以拒绝此人进入美国海关。而这个II,恰好就是作者高度称道的“老式音标”,威妥玛式拼音。

      每种拼音系统都有其优点,有其缺点,哪个都不是完美的。但是最重要要看这个系统,对于学习汉语语音有多大作用。汉语拼音方案相比威妥玛式拼音更简洁,更容易记忆,这就是最大的好处。重申,汉语拼音是学习汉语发音用的,不是给老外精确读出中国人名用的。

    January 30

    《现代汉语词典》二则

      1. 前一阵子看到新闻说鲁健抱怨不知道“吐蕃”中的蕃字怎么发音,于是翻看《现代汉语词典》第五版,查了一下类似的字,结果如下:

        102页,般字条:[般若](bōrě) [名] 智慧(佛经用语)。[梵prajñā]

        809页,兰字条:[兰若](lánrě) [名] 寺庙。[阿兰若之省,梵araṇya 阿兰若:树林,寂静处]

        1382页,吐字条:[吐蕃](tǔbō) [名] 我国古代民族,在今青藏高原,唐时曾建立政权。

                 [吐谷浑](tǔyùhún) [名] 我国古代民族,在今甘肃、青海一带。隋唐时曾建立政权。

        1683页,月字条:[月氏](yuèzhī) [名] 汉朝西域国名。

      蕃字的读音写得很清楚,翻字典才是王道。

      2. 这个是从前边那条来的,关于吐字的读音。吐字是多音字,一个音读tǔ,一个音读tù。按照《现代汉语词典》的解释,区别在于前者是主动的,后者是被动的。所以诸如吐痰,吐气,吐字,吐穗之类的词语中吐都应该读作tǔ。只有在呕吐,吐血,上吐下泻这些词语中才读作tù。其它跟动作无关的词语也读作tǔ,比如吐绶鸡,吐司等等。这里边我一直读错的为数不少。:(

     

      相关新闻:http://ent.sina.com.cn/v/m/2007-01-24/00091423104....

    November 27

    说说成语

      《现代汉语词典》第5版对成语的定义如下:“人们长期以来习用的、简洁精辟的定型词组或短句。汉语的成语大多由四个字组成,一般都有出处。”显然这个定义是非常宽泛的,以致于很多情况下,我们很难界定一个短句究竟是不是成语。

      第一个问题:如何界定成语和俗语

      《现代汉语词典》第5版对俗语的定义如下:“通俗并广泛流行的定型的语句,简练而形象化,大多数是劳动人民创造出来的,反映人民的生活经验和愿望。”从这个解释可以看的出,《现代汉语词典》的编著者认为成语和词语的最大区别就是成语有出处,而俗语则没有出处,来自民间。然而成语和俗语的区别真的是这样么?

      我们不能忽视的一点是:有相当一部分的成语来源于俗语。例如指桑骂槐,就是一个无从考证出处的俗语,由于使用得广泛而变成了成语。又如:成也萧何,败也萧何。很多成语辞典说这句出于《容斋随笔》,可是《容斋随笔》里原文是:“信之为大将军,实萧将军所荐。今其死也,又出其谋,故俚语有‘成也萧何,败也萧何’之语。”显然在洪迈之前便有成也萧何,败也萧何之语,并不是洪迈的原创。这里的俚语就是现在的俗语之意。

      有些是很容易区分界定的,比如:贼头贼脑一看就是俗语,但是贼眉鼠目就不太好说究竟是成语还是俗语。特别是一些有出处的“俗语”,更是很难分清楚。比如“风马牛不相及”作为成语异议不大,但是“天下无难事,只怕有心人”也很难说究竟算不算成语。

      俗语可以分为三类:谚语、歇后语、惯用语。这三类都和成语有交叉。

      第一类:谚语。谚语的形式通常为完整的一句话,而不是一个词组。很多谚语和成语的界限并不明显,而事实上也有很多成语来自于谚语。《战国策·楚策》有“臣闻鄙语曰‘见兔而顾犬,未为晚也;亡羊而补牢,未为迟也。’”之语,也就是“亡羊补牢,未为迟也”本身是一个谚语,虽然现在我们常用前四个字,但是使用者都知道其含义是“未为迟也”。《史记·白起王翦列传》论赞:“鄙语云:‘尺有所短,寸有所长。’”,究其来源,《楚辞·卜居》中有“夫尺有所短,寸有所长;物有所不足,智有所不同。”。可见这应该是在战国时期就流传在楚国的谚语。

      还有一些在边缘地带游荡的谚语,比如“宁为玉碎,不为瓦全”,“坐山观虎斗”,“挂羊头卖狗肉”,“驴唇不对马嘴”这些谚语也是沿用数百年,但是很多成语辞典也会收入这些谚语。

      第二类:歇后语。歇后语的形式类似谜语,前半句出一个谜面,后半句作出解释,经常使用谐音谐意等形式。可以说歇后语和成语交叉不大,但是仍然有一小部分。例如“打破砂锅璺(问)到底”,这是一个标准的歇后语,但是也常常被作为成语对待。类似的还有“泥菩萨过江(-自身难保)”,“天下乌鸦一般黑”,“开门七件事,柴米油盐酱醋茶”等等。

      第三类是惯用语。这部分照理说是最不容易和成语混淆的,事实上却是十分混乱。一个很重要的原因是因为四字的惯用语特别多,例如:春夏秋冬,东西南北。个人感觉大部分的成语辞典对于这部分的处理也是众说纷纭。

      第二个问题:成语含义的变迁

      去年因为“七月流火”,人大的校长着实露了一把脸。成语误用滥用现在已经成为了一种社会现象,而现象后边必然存在着问题。语言的变迁是一个客观事实,无法否定。一个方面是读音的变迁,一个方面是含义的变迁。有些含义的变迁已经被广泛接受,而另外一些颇有争议。比如“素面朝天”,本出《杨太真外传》,说虢国夫人自恃容貌娇媚,不化妆就去朝见天子。现在则将朝天理解为“面对公众”,可以说也不算有什么错误。还有“望洋兴叹”是仰起头慨叹。现在理解为看到大海而产生渺小的感觉而慨叹。

      语言的从俗是一个普遍的现象,但是那些需要从,那些不能从,则是一个值得考虑的问题。例如“帧”原读zhèng,近年由于IT知识的普及发展,这个字被普遍误读成为zhēn,第5版的《现代汉语词典》已经将zhēn作为正音了。还有纪晓岚的“纪”,现在也是jǐ和jì都被视为正确读音了。

      有很多成语是古人故意曲解或者谐谑而改变了含义。比如“每下愈况”是说越到细微之处越能观察到事物的真相,而“每况愈下”就是一个因为宋人谐谑而形成的成语。

      对于我们来说,重要的是能够从我做起,在日常生活中正确使用成语。当然用谐音谐意来利用成语表示诙谐是一种修辞手法,我们不应该视为错误。

      第三个问题:成语的形式

      成语以四个字居多,但是并不是说只有四个字的才是成语。四个字的成语争议最少,其他字数的多少都有些争议。

      两个字的比较少,但是也有一些,例如:斧正,推敲。在古代汉语中,除了联绵词,以单音节词为多,双音节词比较少。所以这类有著名典故的双音节词通常也被视为成语。还有一种情况就是很多四字成语可以简化为二字词语,例如:蛇足,效颦等等。这种情况只是成语的简化,并不是二字的成语。

      三个字的例如:风马牛,东道主,执牛耳,莫须有等等。

      超过四个字的情况也不少见,比如:“五十步笑百步”,“小巫见大巫”,“冒天下之大不韪”,“是可忍,孰不可忍”,“桃李不言,下自成蹊”等等。

      一个很常见的问题是很多人喜欢随意的打乱四字成语的顺序,不知道是为了表示与众不同还是有才学。比如把“美轮美奂”说成“美奂美轮”,把“朝秦暮楚”说成“暮楚朝秦”。我们承认有一部分成语是两种说法都有,但是大部分成语还是有固有形态而不能生拉硬造的。有种极端的情况是为了保持平仄对仗或者押韵而把成语“倒装”,这种现象我是极度不赞成的,就是一种明显的“以文害辞”。例如《红楼梦》第89回回目:“人亡物在公子填词,蛇影杯弓颦卿绝粒”。这里人亡物在是“平平仄仄”,杯弓蛇影是“平平平仄”,为了做到偶数字平仄相对而将杯弓蛇影倒过来写成了“蛇影杯弓”。

      成语的问题一箩筐,而绝大部分都不知道如何解决。不知道这种混乱的状态何时才能结束。

    November 14

    如果我们遇到了不认识的字

      在BBS上,我们经常能看到有人问某某字的读音或者如何书写。虽然说常用汉字和次常用汉字的3500个字覆盖率达到99.48%,那么仍然有0.52%的坏分子逍遥法外。即使是一个编写字典的专家,也不能认识遇到的所有汉字。再庞大的字典也不能包含所有的汉字。

      由于工作性质,我现在也算是一个广义上的语言工作者。以我的经验来说说当遇到不认识的字的时候如何去处理。

      1. 计算机所支持的“汉字”真的都是汉字么?

      我们知道,在中文操作系统中,被最广泛支持的汉字编码标准是GBK,这个标准包含了20902个“汉字”。GBK除了支持常见的简体、繁体汉字之外,还部分地支持朝鲜和日本模仿汉字的造字法独创的“汉字”(朝鲜和日本把从中国学习的汉字称为“汉字”,自己创造的称为“国字”)。那么这部分字压根就不是汉字。我们可以利用工具去查找这些字的意义,但是试图去找出其汉语发音并没有实质的意义(这句话并不是绝对的,下面会解释)。

      1.1 和制汉字

      日本称汉字为Kanji,在日本的煌煌巨著13卷本的《大汉和辞典》,共收录了5万多个汉字以及100多个国字。不过仍然有学者抱怨这套辞典过于面向汉字,而使得国字收录不完整。

      对于我们中国人来说,日本的国字可以分为以下几个类型:

      a. 日语中生活用字。这类字我们不需要关心其读音。比如:峠,働,辻

      b. 人名和地名用字。这类字通常我们只关心读音,而读音大部分是根据汉字形声字的方式设定的。比如畑川,这是日本的一个比较大的姓氏,那我们不得不给“畑”字规定一个汉语的读音,按照形声字的规则,定为tián。

      c. 被汉语借用的国字。这类字比较少,但是好处是已经被视为汉字的一部分,从字典里既可以查到读音,也可以查到含义。比如“腺”,这是日本医生田川榛斋于1805年创造的一个国字,用来描述“象泉眼一样分泌液体的肉”,非常形象。现在这个字已经称为我们生活中非常常用的一个汉字了。还有“椪”,这个字也被汉语吸收了,先从日本传播到台湾,又从台湾传播到大陆。现在满大街都是卖椪柑的。

      d. 日本自行创造,但是与汉字字型恰好相同。这类字不在少数,比如屿,椿等字。

      1.2 朝鲜语自创汉字

      朝鲜语称汉字为Hanji,由于朝鲜语谚文是从左向右,从上向下的字母组合方式,所以朝鲜语中的自创汉字结构也是类似的把汉字组合起来,颇有叠床架屋的感觉。不过由于北朝鲜废除了汉字,而南朝鲜又在废与不废中摇摆不定,所以朝鲜语自创汉字对汉语的影响接近于零。朝鲜语自创汉字主要用在地名和事物名中,很少用于人名,所以其读音和含义对于我们来说基本上没有意义。

      朝鲜语的国字很大一部分是用一个既有汉字下边加上一个“乙”,而这个“乙”和谚文十分类似,在发音的时候,就在汉字的发音后边加上一个"l"。比如“加”,朝鲜语读做[ga],那么乫就读做[gal],类似的还有乭,乶,乷等等。巭也是一个朝鲜自造汉字。

      2. 如何检索我不认识的字

      最好的方式还是字典。单用来查生僻字的话,《康熙字典》,《中华大字典》,《汉语大字典》这几本都是非常有用的工具书,如果这几本上找不到的字,要么是新造的,比如元素名称;要么就是不必关心的字。

      可是更多人的情况是没有这几本工具书。那么我们就可以利用网络的便利来进行查找。

      2.1 查询读音和含义

      对于这个需求,推荐使用台湾教育部的《异体字字典》(http://140.111.1.40/main.htm)。这个网络字典提供了部首检字和笔划检字两种方式,使用起来比较便捷。而且这个字典提供了很多其他字典的书影,可以作为一个交叉索引的手段。

      当然这个字典也有不少缺点:

      a. 这个字典是繁体字(台湾称为正体字)字典,对于大陆用户来说,可能会有一定的不习惯。

      b. 台湾的汉字审音和大陆也有少许出入。

      c. 这个字典使用注音(Bopomofo)作为标音手段,而不是拼音(Pinyin),对于大陆用户来说也是一个小小的麻烦。

      d. 大部分汉字用图片表示,无法copy使用。

      如果字不是很生僻,或者可以copy,那么用金山词霸的中文字典也是一个可行的方案。不过金山词霸的校对非常不严谨,释义也多有讹误,个人不太推荐使用。如果只想知道读音,那么使用word也可以做到。把汉字copy到word 文档中,选中这个字,然后点击菜单中的“Format->Asian Layout->Phonetic Guide..."就可以看到选中字的拼音了。

      2.2 如何在计算机中打出不认识的汉字

      如果我们希望在文档中使用某个不知道读音的汉字(或者知道读音,输入法又无法打出),那么上述的那个字典作用就不是很大了。这种情况下同样也有多种解决方案。

      a. 使用Windows的造字程序。这不是一个好的解决方案,而且也不具有通用性。

      b. 使用word的插入字符功能。操作系统中所有的字型(有的时候因为字体的原因,有些字型会看不到)都能够找到,但是缺点是检索太麻烦,只能一个一个找。

      c. 使用五笔输入法,现在不少五笔输入法都支持GBK,甚至GB18030的字型输入。缺点是五笔字根需要记忆,而且长时间不使用很容易遗忘。

      d. 使用Unihan数据库查询。Unihan是Unicode委员会为中日韩兼容字符做的一个数据库(http://www.unicode.org/charts/unihanrsindex.html),包含了Unicode 4.1中所有的CJK兼容字符(CJK, CJK extension A, CJK extension B)。但是由于字体的原因,CJK extension A & B部分的字符很有可能看不到。另外由于CJK extension B长度超过两个字节,所以在BBS上是一定看不到的。在这里查到的字符,如果可以看到,就可以直接copy出来使用,如果看不到,则可以在word中敲入查询出来的Unicode编码。比如从unihan中检索出来“巭”字的Unicode编码为5DED,在word中输入5DED后,按下alt+x就可以将Unicode转换为对应的字符。这个功能对CJK extension B部分的字符是非常有用的。

      3. 其他问题

      其实关于汉字的问题真的是一把又一把,说也说不完。这里我只是把能想到的先写出来。比如字型的问题就是一个值得连篇累牍讨论的问题。有些情况下同一个字的不同字型容易辨认,但是有些情况下是很复杂的。比如“辶”可以写成一个点,也有写成两个点的,这个大家都一眼就能看出来。但是有些情况下,就很难说了。再完整的字典也不可能收录所有的异体字。而且不同字典的处理方法也不尽相同。

      同形异义和同义异形的部首也是一个问题。以《康熙字典》为例,“肉”部和“月”部是两个不同的部首。朋属于月部,腰属于肉部。“攴”和“攵”则是同一个部首的两种形式。这种情况也会给一些人造成相当的困惑。

      还有就是俗字和艺术字的问题。各地方都有一些地方特有的俗字,最为显著的就是广东,比如“叻”,“冇”之类的字。还有些地方的字因为使用率低下,压根就不会进入字典,不被承认。比如西安著名的“biangbiang面”,那个字号称是最复杂的汉字,甚至需要一个歌诀去记忆,据我所知没有什么著名的字典收录这个字。类似的情况在国内肯定不少。

      春节的时候挂的吊钱或者窗花,经常有将“招财进宝”或者类似的吉祥话组成一个“字”的情况,有些书法作品也经常这么做,这种同样也不能称为是汉字。还有一些书法作品,生拉硬套的把一些字叠起来,也只能看成是书法作品,而不是汉字。

      先写这么多,想起来别的再添。

    August 31

    射矮之辩

      射和矮两个字之争,最早是出自清人沈起凤的笔记《谐铎》第七卷,虫书条:“锦屏女子叶佩纕,有夙慧,七岁就傅读书,通妙解。尝谓师曰:‘古人造字,会意象形,而有时亦多误处。’师询其指。曰:‘矮字明系委矢,宜读如射。射字明系寸身,宜读如矮。今颠倒字义,岂非古人之误欤?’”这个故事后来被附会开来,安到纪晓岚身上的也有,安到孔夫子身上的也有。

      小姑娘七岁的时候就知道了象形和会意,并且能应用到具体的汉字上,的确难得。然而一个很重要的问题是,象形和会意能不能照猫画虎,见字拆字,如算命先生测字一样去理解呢?

      先说射字。在甲骨文中,射是一个象形字,画成一张拉开的弓,上边搭着一枚箭。在金文中则在弓的右侧又加了一只手,使得射箭的动作更形象起来。在甲骨文和金文中,又、手、寸三个字都是画成一只手的形状。寸有时会在手掌下加一个点,这是因为寸最初的含义是一个部位,就是中医切脉的寸关尺中的寸,也就是手腕横纹脉口的地方。身在甲骨文中与弓形状十分相似,是一个面朝左站立的孕妇,中间是隆起的腹部。在小篆中,射字左边的弓讹写成了身,手是可以认为是寸字的,这样就有了射字。不过在小篆时代,人们已经认识到射字说的不太通,于是又创造了射的另一种写法,左身右矢的䠶(Unicode值为U+4836)字。还有个很罕见的写法,左边是正确的弓字,右边是个又(又也是手,没有错误)的𢎤(Unicode值为U+223A4)字,可以说,这个字才是最正确的射字。到了《说文解字》中,五经皆通的许慎已经不知道射字中“身”的来源,而是强词夺理说成:“弓弩发于身而中于远也”。但是《说文解字》也不得不说:“篆文射,从身从寸。寸,法度也,亦手也。”

      矮则是个标准的形声字,根本就不是个会意字。矢本意是箭,由于矢必须是非常直,古时常常使用矢作为衡量长短或者器具是否直的标尺,因此矢作为形旁常常引申为“标尺,尺度”。

      常见的矢作为原意使用的形声字:

      1. 矪:舟声,读作zhōu,射鸟的箭。

      2. 矫:乔声,读作jiǎo,原义是把箭揉直的工具,引申为使变直。

      3. 矰,曾声,读作zēng,系有丝绳的箭。

      常见的矢作为“标尺,尺度”使用的形声字:

      1. 矨:夭声,读作yǐng。短:豆声,读作duǎn。矬:坐声,读作cuó。矮:委声,读作ǎi。矲:罢声,读作bà。这几个字都是短小,矮小的意思。

      2. 矩:巨声,读作jǔ,含义为画直角的工具。

      3. 矱:蒦声,读作yuē,含义为尺度,法度。

      知字中的矢也表示箭,但是知不是形声字。由于古今字音的变迁,所以矮和委的读音也变得不一致了。但是把矮理解成为会意字,就和把驴理解成“上了户口的马”一样的荒谬可笑。

      唐兰先生在他的《中国文字学》中曾经明确指出文字在演变过程中字型的讹变,比如“贝”和“目”的互讹等。那么射字就是这种现象的一个明证,从甲骨文和金文可以明确的看出射字和身没有任何关系。然而甲骨文发现到现在才是百余年的事儿,我们能够非常幸运的得到这种宝贵的文献资料。但是对于汉朝到清朝两千年间没见过甲骨文的学者们,就只能靠臆测了。

    July 26

    古希腊语真优美

      最近在看《凯若斯》,这本书虽然号称是“古希腊语文教程”,但是若是指望用这本书学习古希腊语是肯定不可行的。但是从这本书还是能够管中窥豹,欣赏到古希腊语优美的风姿。
      古希腊语与拉丁语同属于印-欧语系,而且拉丁语收古希腊语影响颇深,但是相比起来,拉丁语显得刻板而少变化,古希腊语则灵活而丰富。让我最着迷的是古希腊语的重音,有昂音,抑音和昂抑音三种,读起来就像唱歌一样动听,难怪都说古希腊语不是说出来的,而是唱出来的。
      不过古希腊语的语法还真是复杂,虽然格的变化与拉丁语相近,但是动词的变化不胜其烦,说之前还要计算计算。而各种方言的差异也够让人喝一壶的了。
    April 14

    汉字有多少

      在甲骨文中,现在分离出来的字形有4600个,能够辨识出来,没有争议的单字只有1/3。
      成书于公元121年,东汉·许慎的《说文解字》共收单字9353个。
      成书于公元514年,晋·吕忱的《字林》共收单字12824个。
      成书于公元543年,梁·顾野王德《玉篇》共收单字16917个。
      成书于公元997年,辽·僧行均《龙龛手鉴》共收单字26430个。
      成书于公元1008年,北宋·陈彭年《广韵》共收单字26194个。
      成书于公元1066年,北宋·司马光等《类篇》共收单字31319个。
      成书于公元1615年,明·梅膺祚《字汇》共收单字33179个。
      成书于崇祯末年,明·张自烈《正字通》共收单字33440个。
      成书于公元1716年,清·张玉书等《康熙字典》共收单字47035个。
      成书于公元1915年的《中华大字典》共收单字48000余个。
      成书于公元1990年的《汉语大字典》共收单字54678个。
      成书于公元1994年的《中华字海》共收单字87019个。
      成书于公元2001年的台湾版《异体字字典》共收单字106002个。
      日本发表于公元2002年的软件《今昔文字镜》共收汉字116303个。
     
      《辞源》1983年版共收单字12890个。
      《辞海》1999年版共收单字19485个。
      《新华字典》2004年版共收单字10000余个。
      《现代汉语词典》2005年版共收单字12000个左右。
     
      1988年公布的《现代汉语常用字表》中,常用汉字2500字,次常用字1000字。据统计,常用汉字在日常使用的覆盖率达到了97.97%,加上次常用汉字后,这3500个汉字可以覆盖到99.48%,总数量还没有超过甲骨文单字的个数。
     
    March 24

    被误解和误用的成语

      在nkbbs上看到的这个话题,仔细想想,平时遇到的被误用和误解的成语还真多……。写几个经常看到的吧。例句都是我用google搜出来di。
    1. 不胫而走
        正确义:事情、消息未经刻意传播,但迅速散布出去。
        错误义:某事物不翼而飞。
        错用例句:病毒从实验室不胫而走(《新闻晚报》2004-7-2要闻的标题)
    2. 七月流火
        正确义:七月大火星向天空西边滑过,天气马上要转凉了。
        错误义:七月天气很炎热。
        错用例句:“七月流火,但充满热情的岂止是天气?”(人大校长纪宝成对台湾新党主席郁慕明的欢迎词)
    3. 空谷足音
        正确义:在空旷的山谷中听到人的脚步声,比喻极为难得的消息,言论,音信等。
        错误义:歌声,音乐声很空灵,悠扬。
        错用例句:为爱而歌的队伍不断壮大,爱的歌声一如空谷足音,响遏行云。(南昌市1168工程报导)
    4. 空穴来风
        正确义:因为有空洞,所以会吹出风,比喻事出有因。
        错误义:事出无因,纯属造谣。
        错用例句:北京国土局:北京买房获土地证纯属空穴来风(新华网,地产新闻标题)
    5. 望洋兴叹
        正确理解:望洋是个连绵词,抬头的意思。望洋也可以写作望阳(《论衡·骨相》:“文王四乳,武王望阳.”),望羊(《史记·孔子世家》:“眼如望羊”)。
        错误理解:望洋是看着大洋。洋在宋之后才有海的意思,庄子那个时候还没这个含义呢。
    6. 每下愈况
        正确义:越是从细微(低微)的角度看,越是能看到事物的真实情况。
        错误义:和“每况愈下”混淆。
        错用例句:治安状况每下愈况台媒吁当局从恶龙落网中警醒(新浪新闻标题)
    7. 曾几何时
        正确义:时间刚过去不久,不久之前。
        错误义:不知道什么时候。
        正确例句:曾几何时,丰厚的石油收入加速了伊拉克的经济建设,使人民生活富裕安康。(《中国青年报》2003年3月21日)
        错用例句:曾几何时,小羊因山羊绒而贵,身价倍增。(《光明日报》2000年10月10日)
    8. 不以为然
        正确义:不认为是对的。
        错误义:不放在心上,不屑一顾。
        错用例句:海信欲打造白电帝国 海尔不以为然(《每日经济新闻》2005年10月13日)
    9. 不忍卒读
        正确义:文章悲惨感人,不忍心读完。
        错误义:文章写得太差劲,根本没法读。
        正确例句:在这4封信中,河北建筑科技学院常建林的信,让人不忍卒读。在信中,常说今年清明前,派出所所长之子,拉着派出所的人开车翻到他家菜地里,辗坏了出苗的蔬菜,常的父兄就要了200元赔偿费。哪想几天之后,派出所的人以私藏枪支把其兄扣走,在凑足罚款后才赎出人来。(《中国青年报》1998年11月16日)
        错用例句:近年致力于诗歌以及海子的研究”的同学,提供给我们的只是一堆不忍卒读的五号汉字。在数百页纸上,余同学展示了他急功近利而且浅薄苍白的叙述语言,飘忽不定而又刚愎自用的叙述视角。(《新京报》2004年4月30日)
    10. 感同身受
        正确义:心中充满感激,好像亲身受到了恩惠一样。
        错误义:1)自己的感受
                    2)引起的共鸣
        错用例句:一个女童,未吃梨子何以知梨子的味道,竟对“伟哥”神往起来?不要说一般影响,就是专门施教,也不知用何手段,方能使她心领神会感同身受。(《中国青年报》2001年8月20日)
    11.耿耿于怀
        正确义:对某事挂念在心,不能忘怀。
        错误义:非常不满
        错用例句:尼姆达“元凶”对病毒命名耿耿于怀。(金山毒霸安全资讯网)
    12.对簿公堂
        正确义:在法庭(公堂)上接受审问。“对”,并不是指双方对讼。
        错用义:双方打官司
        错用例句:美政府与Google将对簿公堂搜索记录成焦点(新浪新闻标题)
    13.望其项背
        正确义:可以赶上,可以比肩。一般用在否定句里,比如“难以望其项背”。
        错用义:赶不上。
        错用例句:马龙在追逐戒指中登上顶峰后辈望其项背留一声叹息(新浪新闻标题)
    14.诚惶诚恐
        正确义:内心又感到尊敬,又恐惧不安。
        错用义:忽视了尊敬的意味。
        错用例句:不堪政治压力整天诚惶诚恐,六成台湾记者想改行(华夏网新闻标题)
    15.叹为观止
        正确义:赞叹看到的事物美妙到了极点。主语是人,而不是物。物作主语应该说“令人叹为观止”或“让人叹为观止”。
        错用义:以物作为主语。
        错用例句:科比空中接力扣篮叹为观止(体育网新闻标题)
    16.万人空巷
        正确义:人人都涌出家门,参加某个活动,比喻活动盛况空前。巷的含义是“住宅”(《礼记·祭义》郑玄注:“巷犹闾也。”)。
        错用义:人人都呆在家里,巷子里没有任何人。
        错用例句:休闲:10部电视剧引万人空巷(搜狐新闻标题)
     
      另外还有一些,比如不刊之论,罪不容诛等等,大概中小学生误用的多,正式的报刊上还是比较少见的。
     
    February 27

    测试你的英语单词量

    真伤心,我测出来才4000多,看来真的得下功夫背单词了。:(