2009-11-26

也不只是Byte Order Mark

用不支援UTF-8的軟件開UTF-8的文字檔,會有個「嚜」字在最前頭。用「嚜 utf-8」來搜尋可找到很多討論。「嚜」字原文是沒有的,給顯示出來是因為UTF-8文字檔都有特定的三個byte「EF BB BF」來標示「我是個UTF-8文字檔」。這三個byte叫Byte Order Mark(BOM)。如果不按UTF-8格式來讀這個檔,改用Big5,便會見到「嚜」字,因為BOM的前兩個byte「EF BB」正是「嚜」的Big5 編碼。

本以為它只是個怪獸字。今天讀<小團圓>見到它:
「明明美嚜,怎麼說不美?」

博客來有三網頁的節錄,該是獲授權的吧?

2009-11-25

沒甚堪記

而這是可怕的。腦袋鈍了?人麻木了?

想滑雪。沒假期!

2009-11-18

音樂廰

一生人第二次進香港大會堂音樂廰。

2009-11-09

herbata

茶來自中國,在全世界各地的叫法大多數是「cha」或「te」的變奏--即是「茶」字的廣東話或福建話發音。我以為無論哪兒總是非此即彼吧,我就不知道咖啡有來自別個源頭的讀音。直到在波蘭見到herbata一字,我真的給打敗了,波蘭文選擇不用音譯!一直信以為真的、即使理據薄弱的信念迎著面、大剌剌地給篤破,帶給我一秒的震撼,和之後的愉快:被推翻了真好,讓我學到新東西。
http://www.answers.com/tea#The_derivatives_from_t.C3.AA
http://www.answers.com/tea#Derivatives_from_cha_or_chai

土豆网

第一次看土豆网,是為記。看<秒速5厘米>,在電腦上是沒法靜心把片看完的。