2009-11-26

也不只是Byte Order Mark

用不支援UTF-8的軟件開UTF-8的文字檔,會有個「嚜」字在最前頭。用「嚜 utf-8」來搜尋可找到很多討論。「嚜」字原文是沒有的,給顯示出來是因為UTF-8文字檔都有特定的三個byte「EF BB BF」來標示「我是個UTF-8文字檔」。這三個byte叫Byte Order Mark(BOM)。如果不按UTF-8格式來讀這個檔,改用Big5,便會見到「嚜」字,因為BOM的前兩個byte「EF BB」正是「嚜」的Big5 編碼。

本以為它只是個怪獸字。今天讀<小團圓>見到它:
「明明美嚜,怎麼說不美?」

博客來有三網頁的節錄,該是獲授權的吧?

5 comments:

Nicole_Luo said...

上海话吗?怎么读?

kafailo said...

不知怎麼讀,不是上海話。這個字全文應出現了三次,都是對話之中的問句。讀舊時的小說讀到想起電腦,實在很突兀,沒法記不起。

kafailo said...

應該是:沒法不記得。

Nicole_Luo said...

据说,这是上海话的语气词,读mo或者me,意思和啊差不多

kafailo said...

好,我話說得太盡了。謝謝。

「明明美嚜,怎麼說不美?」是邵之雍說的,我印象中他原本不懂上海話的?