2006-05-12

一個下午的文字學

香港獨立媒體一篇報導得知國家地理雜誌IBM合作進行Genographic Project﹐一項從人類基因追查人類歷史的計劃。我也由此開始了這個下午的在職研究文字學工作……

見到一種文字﹐想知道是甚麼文﹐怎辦﹖


不會打字又抄不到(想想要你怎麼抄阿拉伯文)﹐怎辦﹖www.omniglot.com幫到你。頁頂「Writing systems」旁列出的幾個連結列出很多文字的樣本。我在這裡解開了一個半年前的謎﹕在新加坡見到告示用很多種文字來寫﹐有中文(簡體)﹐英文﹐馬來文和甚麼文字﹖那種文字有點像泰文﹐但肯定不是。是不是印度(興都)文﹖反正新加坡有很多南亞裔人。但印度文看上去是平頂的﹐像π字﹐那種文字平正之中卻帶有很多圈圈。它的樣子我大概還記得。如今在這個網站找到了!是泰米爾文。網上搜尋一下﹐很多網頁也指泰米爾文是主要語言﹐卻找不到官方網頁寫明有哪幾種官方語言。維基也指是這四種。

印度有多少種官方語言﹖


維基說英語和印度語兩種﹐加上22種認可語言。我以前看過文章說印度的告示會寫上16種語文。

最多筆劃的中文字是哪個﹖


有可能是「四個龍字」。omniglot中文一頁列出由1至64劃的中文字的一些例子。小箝指最多筆劃的漢字是日本漢字﹐有84劃!

哪個是現存最古老的語言﹖


其中一種最古老的語言是巴斯克語﹐英文是Basque﹐用巴斯克文寫則是Euskara。留意現代巴斯克文是用羅馬∕拉丁字母書寫的。Genographic Project網頁說巴斯克語在三萬五千年前已經出現了。巴斯克語是在歐洲唯一不是印歐語系的語言。

中文書寫拉丁化好不好﹖


關於這個問題﹐在二十世紀初討論得熱烈。趙元任只寫一篇小文章﹐才九十來字﹐之後沒有誰再提出這個話題了。九十來字能有甚麼威力﹖見維基施氏食狮史。這個故事我最近才讀過﹐卻想不起在哪兒讀過﹐(好像是萬象雜誌)正苦惱不知怎樣找回這篇奇文﹐今天給我碰到了。

如何分辨波斯文和阿拉伯文﹖


也是最近﹐在排隊等付款時看見某包裝紙﹐上面的說明有波斯文阿拉伯文﹐在我眼裏看來頗像﹐但總覺得有點分別。從包裝紙上那兩小句看來﹐波斯文的下面較平﹐即是不太會有腳﹐像「thoad fdngoluoe abnmwp」裏面便只有g和p有腳。而阿拉伯文則好像凌空飛起﹐沒有重心。但omniglot上的例子卻正正相反。BBC的國際視野這時正派用場。它的波斯文網站阿拉伯文網站告訴我包裝紙是搞錯了。總不會這兩個知名網站都全搞錯吧﹖忍不住要賣廣告﹕BBC網站有很多種文字版本﹐也有很多種語言的廣播。學語言也可以試聽它的廣播呢。其實阿拉伯文很重要呢﹐最好還是去學學。

Technorati tags: , ,

4 comments:

So B said...

真的是很詳細的研究...

Haem said...

關於巴斯克語:
1. 歐洲除印歐語系及巴斯克語外,最少還有烏拉語系。
2. 有點懷疑「巴斯克語在三萬五千年前已經出現」的說法:現代比較語言學最多亦只能追溯一個語系的歷史至大約五六千年前,如何能得知三萬五千年前--舊石器時代--巴斯克(甚或人類)已有語言呢?

kafailo said...

haem﹕1.上網查查﹐見到有人提出印歐和烏拉同源(Indo-Uralic)﹐也有人說兩者的差距遠得不會是同源。看你的profile﹐你是研究語言學的。你認為怎樣﹖
2.說的也是。其實聲音沒有記錄﹐我們是怎樣知道以前的語音的﹖我只想到可以從詩詞的韻知道某幾個字的發音近似。

Haem said...

1. Indo-Uralic? 唔太清楚,亦只有時間速讀wikipedia,但似乎未夠cognatesound correspondence證明兩者有關。會唔會係借字呢?雖然代名詞或case marking都一般不會被借,但有過Aleut方言因長時間與俄人接觸,而借盡俄文case marking的例子。
2. 以前語音,可用上述的比較方法,當然,如果研究古漢語,韻書亦不可或缺。