台語羅馬字 unicode 正規化
台語羅馬字 unicode 正規化
From: chenggi.kan
Date: 2015-07-22 21:01:20
各位先進,平安:
最近 ti 使用 FHL 輸入法,goa 看 tioh 一 e 問題:
oo2, oo3, oo5, oo7 e 羅馬字 unicode,順序需要調整。
以 oo2 為例,請參考 下圖: 黑色 e 字,是 FHL 打出來 e,紫色 e 字,是用別種方法打出來 e。
o 正手邊頂面 e 點,siun kuan (黑字),紫色 e 字 e 點,tu 好。 這是因為: (a) 黑字 e 順序,是 kah 點,打 ti o2 e 正邊。 (b) 紫色字 e 順序,是 kah 第 2 調號,打 ti oo e 頂面。
(a) e 打法,並無將 oo 當做 chit 字。反倒是將 o2 當做 chit 字,即將 chit 點 打 ti 正邊。 (b) e 打法,是將 oo 當作 chit 字,即將 第 2 調號,打 ti 頂面。
(a) e 方法,無符合羅馬字字母 e 定義。
E 造成 chit e 問題 e 原因是,ti 2004 年 unicode 接納了 台語羅馬字 e 時,因為 unicode 政策 e 原因,無為 oo 加 做 chit e code。 oo 需要用 nng e codes: U+006F U+0358 來顯示 kah 儲存。
(附圖用 e 字體是 Microsoft e Calibri,chit e 字體,有 support 台語客語羅馬字 e unicode)
毋知,各位 e 見解如何? 敬請指教。
簡正義
Re: Re: [tgb] 台語羅馬字 unicode 正規化
From: Lim Jukhai
Date: 2015-07-22 21:23:39
very good khai
2015-07-22 21:01 GMT+08:00 chenggi.kan :
各位先進,平安:
最近 ti 使用 FHL 輸入法,goa 看 tioh 一 e 問題:
oo2, oo3, oo5, oo7 e 羅馬字 unicode,順序需要調整。
以 oo2 為例,請參考 下圖: 黑色 e 字,是 FHL 打出來 e,紫色 e 字,是用別種方法打出來 e。
o 正手邊頂面 e 點,siun kuan (黑字),紫色 e 字 e 點,tu 好。 這是因為: (a) 黑字 e 順序,是 kah 點,打 ti o2 e 正邊。 (b) 紫色字 e 順序,是 kah 第 2 調號,打 ti oo e 頂面。
(a) e 打法,並無將 oo 當做 chit 字。反倒是將 o2 當做 chit 字,即將 chit 點 打 ti 正邊。 (b) e 打法,是將 oo 當作 chit 字,即將 第 2 調號,打 ti 頂面。
(a) e 方法,無符合羅馬字字母 e 定義。
E 造成 chit e 問題 e 原因是,ti 2004 年 unicode 接納了 台語羅馬字 e 時,因為 unicode 政策 e 原因,無為 oo 加 做 chit e code。 oo 需要用 nng e codes: U+006F U+0358 來顯示 kah 儲存。
(附圖用 e 字體是 Microsoft e Calibri,chit e 字體,有 support 台語客語羅馬字 e unicode)
毋知,各位 e 見解如何? 敬請指教。
簡正義
--
這是 Google 網上論壇針對「Tai-gu-bang」群組發送的訂閱通知郵件。
如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到 。
如要在這個群組張貼留言,請傳送電子郵件到 。
請前往以下網址造訪這個群組:http://groups.google.com/group/taigu。
如需更多選項,請前往:https://groups.google.com/d/optout。
--
Lîm jū-khái, E-mail add: 台語幸福山茶園:http://jukhai.blogspot.com/ 阿凱教學網站http:://khai.mtwww.mt.au.edu.tw/
Re: Re: [tgb] 台語羅馬字 unicode 正規化
From: Pochung Chen
Date: 2015-07-22 21:58:15
簡先生,平安:
我个看法是按呢
1: Unicode 佇未來猶原無啥可能增加獨立个碼位 (code point) hō͘ “ou=oo”,所以 ou/oo 猶原愛用 U+006F U+0358 來表示。 2: Unicode 編碼毋是用「字母」做中心,伊是用「字符 (glyph)」做中心,只要最後顯示出來个「符號」是正確 tio̍h 好。 3: 「理論上」若根據 Unicode 標準,nn̄g種 unicode 順序 "U+00F3 U+0358" kap "U+006F U+0358 U+0301" 顯示出來應該「原全仝款」, 3-1: 毋過「現實上」顯示出來有可能無仝,tio̍h 親像簡先生kah个圖按呢。 3-2: 為怎樣佇現實上ē無仝?Che 是因為真濟个字型个支援猶無 tsiâu-tsn̂g,咱會使kā分三類:
1) 完全無 U+0358,這款會看無 ou 个彼个葫蘆點。 2) 有 U+0358,毋過無「正確設定」U+0358 个頭前是 o, ó, ò, ô, ō 个時,葫蘆點愛卦佇啥物所在。 Calibri 屬這款。這款字型 "U+00F3 U+0358" kap "U+006F U+0358 U+0301" 顯示出來个「無仝」。 3) 有 U+0358,嘛有「正確設定」U+0358 愛卦佇佗位。SIL Gentium/Charis 屬這款。這款字型 "U+00F3 U+0358" kap "U+006F U+0358 U+0301" 顯示出來个「原全仝款」。 3-1) 毋過這款字型 o, ó, ò, ô, ō kap U+0358 相對位置,無一定媠氣(無 Taigi Unicode hiah 媠)。Che 算是字型設計「美感」个問題。
就「現實」个角度來看,若是改用 U+006F U+0358 U+0301
1) 完全無 U+0358 个字型一般來講嘛無法度正確 kā U+006F U+0301 佮做 ó,有可能會變做較sîng oo̍͘ 2) 有 U+0358,毋過無「正確設定」U+0358 相對位置个字型,U+006F U+0358 嘛無法度控制,無仝字型,軟體,有可能差真濟。
所以我个看法是改做 U+006F U+0358 U+0301 个優點並無遐濟。認真增加 3, 3-1 這款字型可能是較好,較久長个做法。
pektiong
On Jul 22, 2015, at 9:01 PM, chenggi.kan wrote:
各位先進,平安:
最近 ti 使用 FHL 輸入法,goa 看 tioh 一 e 問題:
oo2, oo3, oo5, oo7 e 羅馬字 unicode,順序需要調整。
以 oo2 為例,請參考 下圖: 黑色 e 字,是 FHL 打出來 e,紫色 e 字,是用別種方法打出來 e。
o 正手邊頂面 e 點,siun kuan (黑字),紫色 e 字 e 點,tu 好。 這是因為: (a) 黑字 e 順序,是 kah 點,打 ti o2 e 正邊。 (b) 紫色字 e 順序,是 kah 第 2 調號,打 ti oo e 頂面。
(a) e 打法,並無將 oo 當做 chit 字。反倒是將 o2 當做 chit 字,即將 chit 點 打 ti 正邊。 (b) e 打法,是將 oo 當作 chit 字,即將 第 2 調號,打 ti 頂面。
(a) e 方法,無符合羅馬字字母 e 定義。
E 造成 chit e 問題 e 原因是,ti 2004 年 unicode 接納了 台語羅馬字 e 時,因為 unicode 政策 e 原因,無為 oo 加 做 chit e code。 oo 需要用 nng e codes: U+006F U+0358 來顯示 kah 儲存。
(附圖用 e 字體是 Microsoft e Calibri,chit e 字體,有 support 台語客語羅馬字 e unicode)
毋知,各位 e 見解如何? 敬請指教。
簡正義
--
這是 Google 網上論壇針對「Tai-gu-bang」群組發送的訂閱通知郵件。
如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到 。
如要在這個群組張貼留言,請傳送電子郵件到 。
請前往以下網址造訪這個群組:http://groups.google.com/group/taigu。
如需更多選項,請前往:https://groups.google.com/d/optout。
Pochung Chen Professor Department of Physics National Tsing Hua University EMail: URL:http://qubit.phys.nthu.edu.tw/~pcchen/
Re: Re: [tgb] 台語羅馬字 unicode 正規化
From: Lim Jukhai
Date: 2015-07-24 00:01:58
Pektiong,
excellent! khai
2015-07-22 21:58 GMT+08:00 Pochung Chen : 簡先生,平安:
我个看法是按呢
1: Unicode 佇未來猶原無啥可能增加獨立个碼位 (code point) hō͘ “ou=oo”,所以 ou/oo 猶原愛用 U+006F U+0358 來表示。 2: Unicode 編碼毋是用「字母」做中心,伊是用「字符 (glyph)」做中心,只要最後顯示出來个「符號」是正確 tio̍h 好。 3: 「理論上」若根據 Unicode 標準,nn̄g種 unicode 順序 "U+00F3 U+0358" kap "U+006F U+0358 U+0301" 顯示出來應該「原全仝款」, 3-1: 毋過「現實上」顯示出來有可能無仝,tio̍h 親像簡先生kah个圖按呢。 3-2: 為怎樣佇現實上ē無仝?Che 是因為真濟个字型个支援猶無 tsiâu-tsn̂g,咱會使kā分三類:
1) 完全無 U+0358,這款會看無 ou 个彼个葫蘆點。 2) 有 U+0358,毋過無「正確設定」U+0358 个頭前是 o, ó, ò, ô, ō 个時,葫蘆點愛卦佇啥物所在。 Calibri 屬這款。這款字型 "U+00F3 U+0358" kap "U+006F U+0358 U+0301" 顯示出來个「無仝」。 3) 有 U+0358,嘛有「正確設定」U+0358 愛卦佇佗位。SIL Gentium/Charis 屬這款。這款字型 "U+00F3 U+0358" kap "U+006F U+0358 U+0301" 顯示出來个「原全仝款」。 3-1) 毋過這款字型 o, ó, ò, ô, ō kap U+0358 相對位置,無一定媠氣(無 Taigi Unicode hiah 媠)。Che 算是字型設計「美感」个問題。
就「現實」个角度來看,若是改用 U+006F U+0358 U+0301
1) 完全無 U+0358 个字型一般來講嘛無法度正確 kā U+006F U+0301 佮做 ó,有可能會變做較sîng oo̍͘ 2) 有 U+0358,毋過無「正確設定」U+0358 相對位置个字型,U+006F U+0358 嘛無法度控制,無仝字型,軟體,有可能差真濟。
所以我个看法是改做 U+006F U+0358 U+0301 个優點並無遐濟。認真增加 3, 3-1 這款字型可能是較好,較久長个做法。
pektiong
On Jul 22, 2015, at 9:01 PM, chenggi.kan wrote:
各位先進,平安:
最近 ti 使用 FHL 輸入法,goa 看 tioh 一 e 問題:
oo2, oo3, oo5, oo7 e 羅馬字 unicode,順序需要調整。
以 oo2 為例,請參考 下圖: 黑色 e 字,是 FHL 打出來 e,紫色 e 字,是用別種方法打出來 e。
o 正手邊頂面 e 點,siun kuan (黑字),紫色 e 字 e 點,tu 好。 這是因為: (a) 黑字 e 順序,是 kah 點,打 ti o2 e 正邊。 (b) 紫色字 e 順序,是 kah 第 2 調號,打 ti oo e 頂面。
(a) e 打法,並無將 oo 當做 chit 字。反倒是將 o2 當做 chit 字,即將 chit 點 打 ti 正邊。 (b) e 打法,是將 oo 當作 chit 字,即將 第 2 調號,打 ti 頂面。
(a) e 方法,無符合羅馬字字母 e 定義。
E 造成 chit e 問題 e 原因是,ti 2004 年 unicode 接納了 台語羅馬字 e 時,因為 unicode 政策 e 原因,無為 oo 加 做 chit e code。 oo 需要用 nng e codes: U+006F U+0358 來顯示 kah 儲存。
(附圖用 e 字體是 Microsoft e Calibri,chit e 字體,有 support 台語客語羅馬字 e unicode)
毋知,各位 e 見解如何? 敬請指教。
簡正義
--
這是 Google 網上論壇針對「Tai-gu-bang」群組發送的訂閱通知郵件。
如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到 。
如要在這個群組張貼留言,請傳送電子郵件到 。
請前往以下網址造訪這個群組:http://groups.google.com/group/taigu。
如需更多選項,請前往:https://groups.google.com/d/optout。
Pochung Chen Professor Department of Physics National Tsing Hua University EMail: URL:http://qubit.phys.nthu.edu.tw/~pcchen/
--
這是 Google 網上論壇針對「Tai-gu-bang」群組發送的訂閱通知郵件。
如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到 。
如要在這個群組張貼留言,請傳送電子郵件到 。
請前往以下網址造訪這個群組:http://groups.google.com/group/taigu。
如需更多選項,請前往:https://groups.google.com/d/optout。
--
Lîm jū-khái, E-mail add: 台語幸福山茶園:http://jukhai.blogspot.com/ 阿凱教學網站http:://khai.mtwww.mt.au.edu.tw/
Re: Re: [tgb] 台語羅馬字 unicode 正規化
From: Babuza
Date: 2015-07-24 08:17:05
Pektiong hiaⁿ,Chhiú-ki-á pán ê su-ji̍p-hoat, iOS kap Android, kiám ū khó-lêng chò? Nā-sī su-iàu keng-hùi, lán ē-tàng chio tāi-ke lâi bō͘-khoán. Babuza
台灣南社台灣羅馬字協會 李江却台語文教基金會高雄醫學大學台語文講師 Tiuⁿ, Ho̍k Chû (張, 復聚) 醫生 Email:
備註︰轉寄本電子郵件給他人時, 請用密件(BCC)寄送, 同時請刪除本人的郵址(email address)
2015-07-22 21:58 GMT+08:00 Pochung Chen :
簡先生,平安:
我个看法是按呢
1: Unicode 佇未來猶原無啥可能增加獨立个碼位 (code point) hō͘ “ou=oo”,所以 ou/oo 猶原愛用 U+006F U+0358 來表示。 2: Unicode 編碼毋是用「字母」做中心,伊是用「字符 (glyph)」做中心,只要最後顯示出來个「符號」是正確 tio̍h 好。 3: 「理論上」若根據 Unicode 標準,nn̄g種 unicode 順序 "U+00F3 U+0358" kap "U+006F U+0358 U+0301" 顯示出來應該「原全仝款」, 3-1: 毋過「現實上」顯示出來有可能無仝,tio̍h 親像簡先生kah个圖按呢。 3-2: 為怎樣佇現實上ē無仝?Che 是因為真濟个字型个支援猶無 tsiâu-tsn̂g,咱會使kā分三類:
1) 完全無 U+0358,這款會看無 ou 个彼个葫蘆點。 2) 有 U+0358,毋過無「正確設定」U+0358 个頭前是 o, ó, ò, ô, ō 个時,葫蘆點愛卦佇啥物所在。 Calibri 屬這款。這款字型 "U+00F3 U+0358" kap "U+006F U+0358 U+0301" 顯示出來个「無仝」。 3) 有 U+0358,嘛有「正確設定」U+0358 愛卦佇佗位。SIL Gentium/Charis 屬這款。這款字型 "U+00F3 U+0358" kap "U+006F U+0358 U+0301" 顯示出來个「原全仝款」。 3-1) 毋過這款字型 o, ó, ò, ô, ō kap U+0358 相對位置,無一定媠氣(無 Taigi Unicode hiah 媠)。Che 算是字型設計「美感」个問題。
就「現實」个角度來看,若是改用 U+006F U+0358 U+0301
1) 完全無 U+0358 个字型一般來講嘛無法度正確 kā U+006F U+0301 佮做 ó,有可能會變做較sîng oo̍͘ 2) 有 U+0358,毋過無「正確設定」U+0358 相對位置个字型,U+006F U+0358 嘛無法度控制,無仝字型,軟體,有可能差真濟。
所以我个看法是改做 U+006F U+0358 U+0301 个優點並無遐濟。認真增加 3, 3-1 這款字型可能是較好,較久長个做法。
pektiong
On Jul 22, 2015, at 9:01 PM, chenggi.kan wrote:
各位先進,平安:
最近 ti 使用 FHL 輸入法,goa 看 tioh 一 e 問題:
oo2, oo3, oo5, oo7 e 羅馬字 unicode,順序需要調整。
以 oo2 為例,請參考 下圖: 黑色 e 字,是 FHL 打出來 e,紫色 e 字,是用別種方法打出來 e。
o 正手邊頂面 e 點,siun kuan (黑字),紫色 e 字 e 點,tu 好。 這是因為: (a) 黑字 e 順序,是 kah 點,打 ti o2 e 正邊。 (b) 紫色字 e 順序,是 kah 第 2 調號,打 ti oo e 頂面。
(a) e 打法,並無將 oo 當做 chit 字。反倒是將 o2 當做 chit 字,即將 chit 點 打 ti 正邊。 (b) e 打法,是將 oo 當作 chit 字,即將 第 2 調號,打 ti 頂面。
(a) e 方法,無符合羅馬字字母 e 定義。
E 造成 chit e 問題 e 原因是,ti 2004 年 unicode 接納了 台語羅馬字 e 時,因為 unicode 政策 e 原因,無為 oo 加 做 chit e code。 oo 需要用 nng e codes: U+006F U+0358 來顯示 kah 儲存。
(附圖用 e 字體是 Microsoft e Calibri,chit e 字體,有 support 台語客語羅馬字 e unicode)
毋知,各位 e 見解如何? 敬請指教。
簡正義
--
這是 Google 網上論壇針對「Tai-gu-bang」群組發送的訂閱通知郵件。
如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到 。
如要在這個群組張貼留言,請傳送電子郵件到 。
請前往以下網址造訪這個群組:http://groups.google.com/group/taigu。
如需更多選項,請前往:https://groups.google.com/d/optout。
Pochung Chen Professor Department of Physics National Tsing Hua University EMail: URL:http://qubit.phys.nthu.edu.tw/~pcchen/
--
這是 Google 網上論壇針對「Tai-gu-bang」群組發送的訂閱通知郵件。
如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到 。
如要在這個群組張貼留言,請傳送電子郵件到 。
請前往以下網址造訪這個群組:http://groups.google.com/group/taigu。
如需更多選項,請前往:https://groups.google.com/d/optout。
Re: Re: 台語羅馬字 unicode 正規化
From: chenggi.kan
Date: 2015-07-24 21:40:57
陳老師平安: 感謝你 e 回應。 你 e 第一點 1: ,這是事實,所以咱是 kia ti 這 e 基礎來發展。 第二點 2: ,是名詞 e 說明,了解。 第三點 3:、3-1:、3-2: ,我嘛攏同意。
(A.) 由你 3: e 說明,「 "U+00F3 U+0358" kap "U+006F U+0358 U+0301" 顯示出來應該『原全仝款』」 其實是有三種: (1) "U+00F3 U+0358", (3) "U+006F U+0358 U+0301" kap (2) "U+006F U+0301 U+0358 "。(1, 3, 2 e 順序,我 thiau-kang 按呢寫) 這三種順序,應該攏打出仝 chit e "字"。
(A.1) 我 ti 標題所寫 e "正規化",是欲請教大家,未來,ti 網路中,a 是 ti 所收著 e 文件中,chit 三種打法,摻摻做 chit 夥,是 m 是 e 引起麻煩?
(A.2) Ti (A.) 內底 e 三種打法,in e "Unicode Normalization Form" 嘛是攏仝款: "U+006F U+0301 U+0358" M 拘,"Unicode Normalization Form" 是 Unicode 比較兩 e "字" e 標準拆法。 文書打法,無一定愛 sio 仝 (A-*)。 例:FHL 輸入法:oo2 是 "U+00F3 U+0358" (若是,未來有一日,Unicode 呼 "oo" chit e "碼位",到時用 chit e "碼位" 打出來 e oo2 ,伊 e "Unicode Normalization Form" 嘛攏仝款。)
(B.) 來看字型 字型設計師,ti 設計字型時,若是對文化無了解,就需要遵照 spec. 來做字。 咱來看附圖:
頂面是 Charis SIL,下面是 calibri。
咱 ko 看 Unicode 內面,U+0358 e 說明: COMBINING DOT ABOVE RIGHT ḿ Latin transliterations of the Southern Min dialects of Chinese (http://www.unicode.org/charts/PDF/U0300.pdf) 所以,U+0358 是乎台語用 e。
calibri 是 Microsoft 目前有 support 台灣羅馬字 (台客) e 字體。 M 拘,因為字型設計師,無 spec,嘛無了解台語羅馬字,所以 chit 點 (U+0358) e koan 度,攏無仝。 SIL 是 chit e 了解語言 e 機構,所以 U+0358 e koan 度,一致。
因為這 e 原因:字型設計師,對文化無了解。 所以咱需要製作 造字 e spec 乎 in 用。(B-*)
(C.) 由文字 e 角度: 我傾向 ou2/oo2 打出來 e unicode 是: "U+006F U+0358 U+0301" 我是按呢想: 咱先將 ou/oo 當做文字看 (對照 U+006F U+0358), 加註第 2 音變做:ou2/oo2;按呢,大家攏 e hiau 讀。 若是寫做:o2u/o2o;按呢,著 m 對啦,變作 o 第 2 音,後壁 toe u/o。
所以,我認為 U+006F U+0358 是 ou/oo e 第 1 音,是 chit e 字母。 若是愛標調號,是標 ti chit e 字母 e 後面,順序是: U+006F U+0358 U+030X (X = 1, 0, 2, 4, D)
(D.) Text Processing: (D.1) Ti 遮,先用 "U+00F3 U+0358" 抑是 "U+006F U+0301 U+0358" 來代表 ou/oo。 咱 ti 做 text e searching,若用 U+00F3, 啊是 U+006F U+0301 來 search, e 尋著 o2 kap ou2/oo2,這 ou2/oo2 是 ke 尋 e。(我用 UltraEdit 試 e) (kha 先進 e 軟體,e ka "U+006F U+0301 U+0358" kap "U+006F U+0301" 當做無仝)
(D.2) 雖然講,ou2/oo2 三種打法,應該 sio 仝,m 拘,我 ti Microsoft Word 2010 內底,用某 chit e,無法度尋出另外 nng e!
(D.3) Programmer ti 處理 jia e text,以 oo2 來講,就愛處理三種打法。 咱 e 使將 chit 三種攏訂 ti spec,乎 programmer chit 開始就知影愛處理三種。 若是 kan-na 定 chit e ti spec,programmer 嘛是愛處理三種,一種符合 spec,兩種是例外。
三種攏訂,programmer 做 search 時,就愛處理 三種 key kap 三種 text e 排列組合啦! Ui (D.2) 知影,目前 Microsoft Word 2010 ti search e 時,將三種,攏當作 bo sio 仝!
================= 整理: 陳老師,你是 m 是有收著 Luknos 先生,轉乎你,我寫 e 批? Hit 張批 kap chit e 討論主題,我主要是想講,現在時間 tu tu 好, 需要為著台灣羅馬字 (台客) 訂 chit 括標準 (spec), 來乎 (a) 字型設計師,(b) 輸入法開發者,(c) programmers 成做開發 e 根據。
因為,網路技術 e 發達,乎資料、文件 e 交流,傳播 ku ka 緊。 咱先 ka 標準 (spec) 訂好,明年 tu 好推!
以上
敬請指教
正義 (真歹勢,平常 bo ti 打台文。打 chit 篇用真 choe 時間,用字嘛無標準)
Re: Re: [tgb] Re: 台語羅馬字 unicode 正規化
From: Lim Chun-iok
Date: 2015-07-24 23:12:02
簡正義博士, 平安
真歡喜你加入台語網(2015.7.20), 做伙來為台語文phah拚。
願上帝記念每一個人所做ê工,加添賜福! Goān Siōng-tè kì-liām múi chi̍t-ê lâng só͘ chò ê kang, ke-thiⁿ sù-hok!
2015-07-24 21:40 GMT+08:00 chenggi.kan :
陳老師平安: 感謝你 e 回應。 你 e 第一點 1: ,這是事實,所以咱是 kia ti 這 e 基礎來發展。 第二點 2: ,是名詞 e 說明,了解。 第三點 3:、3-1:、3-2: ,我嘛攏同意。
(A.) 由你 3: e 說明,「 "U+00F3 U+0358" kap "U+006F U+0358 U+0301" 顯示出來應該『原全仝款』」 其實是有三種: (1) "U+00F3 U+0358", (3) "U+006F U+0358 U+0301" kap (2) "U+006F U+0301 U+0358 "。(1, 3, 2 e 順序,我 thiau-kang 按呢寫) 這三種順序,應該攏打出仝 chit e "字"。
(A.1) 我 ti 標題所寫 e "正規化",是欲請教大家,未來,ti 網路中,a 是 ti 所收著 e 文件中,chit 三種打法,摻摻做 chit 夥,是 m 是 e 引起麻煩?
(A.2) Ti (A.) 內底 e 三種打法,in e "Unicode Normalization Form" 嘛是攏仝款: "U+006F U+0301 U+0358" M 拘,"Unicode Normalization Form" 是 Unicode 比較兩 e "字" e 標準拆法。 文書打法,無一定愛 sio 仝 (A-*)。 例:FHL 輸入法:oo2 是 "U+00F3 U+0358" (若是,未來有一日,Unicode 呼 "oo" chit e "碼位",到時用 chit e "碼位" 打出來 e oo2 ,伊 e "Unicode Normalization Form" 嘛攏仝款。)
(B.) 來看字型 字型設計師,ti 設計字型時,若是對文化無了解,就需要遵照 spec. 來做字。 咱來看附圖:
頂面是 Charis SIL,下面是 calibri。
咱 ko 看 Unicode 內面,U+0358 e 說明: COMBINING DOT ABOVE RIGHT ḿ Latin transliterations of the Southern Min dialects of Chinese (http://www.unicode.org/charts/PDF/U0300.pdf) 所以,U+0358 是乎台語用 e。
calibri 是 Microsoft 目前有 support 台灣羅馬字 (台客) e 字體。 M 拘,因為字型設計師,無 spec,嘛無了解台語羅馬字,所以 chit 點 (U+0358) e koan 度,攏無仝。 SIL 是 chit e 了解語言 e 機構,所以 U+0358 e koan 度,一致。
因為這 e 原因:字型設計師,對文化無了解。 所以咱需要製作 造字 e spec 乎 in 用。(B-*)
(C.) 由文字 e 角度: 我傾向 ou2/oo2 打出來 e unicode 是: "U+006F U+0358 U+0301" 我是按呢想: 咱先將 ou/oo 當做文字看 (對照 U+006F U+0358), 加註第 2 音變做:ou2/oo2;按呢,大家攏 e hiau 讀。 若是寫做:o2u/o2o;按呢,著 m 對啦,變作 o 第 2 音,後壁 toe u/o。
所以,我認為 U+006F U+0358 是 ou/oo e 第 1 音,是 chit e 字母。 若是愛標調號,是標 ti chit e 字母 e 後面,順序是: U+006F U+0358 U+030X (X = 1, 0, 2, 4, D)
(D.) Text Processing: (D.1) Ti 遮,先用 "U+00F3 U+0358" 抑是 "U+006F U+0301 U+0358" 來代表 ou/oo。 咱 ti 做 text e searching,若用 U+00F3, 啊是 U+006F U+0301 來 search, e 尋著 o2 kap ou2/oo2,這 ou2/oo2 是 ke 尋 e。(我用 UltraEdit 試 e) (kha 先進 e 軟體,e ka "U+006F U+0301 U+0358" kap "U+006F U+0301" 當做無仝)
(D.2) 雖然講,ou2/oo2 三種打法,應該 sio 仝,m 拘,我 ti Microsoft Word 2010 內底,用某 chit e,無法度尋出另外 nng e!
(D.3) Programmer ti 處理 jia e text,以 oo2 來講,就愛處理三種打法。 咱 e 使將 chit 三種攏訂 ti spec,乎 programmer chit 開始就知影愛處理三種。 若是 kan-na 定 chit e ti spec,programmer 嘛是愛處理三種,一種符合 spec,兩種是例外。
三種攏訂,programmer 做 search 時,就愛處理 三種 key kap 三種 text e 排列組合啦! Ui (D.2) 知影,目前 Microsoft Word 2010 ti search e 時,將三種,攏當作 bo sio 仝!
================= 整理: 陳老師,你是 m 是有收著 Luknos 先生,轉乎你,我寫 e 批? Hit 張批 kap chit e 討論主題,我主要是想講,現在時間 tu tu 好, 需要為著台灣羅馬字 (台客) 訂 chit 括標準 (spec), 來乎 (a) 字型設計師,(b) 輸入法開發者,(c) programmers 成做開發 e 根據。
因為,網路技術 e 發達,乎資料、文件 e 交流,傳播 ku ka 緊。 咱先 ka 標準 (spec) 訂好,明年 tu 好推!
以上
敬請指教
正義 (真歹勢,平常 bo ti 打台文。打 chit 篇用真 choe 時間,用字嘛無標準)
--
這是 Google 網上論壇針對「Tai-gu-bang」群組發送的訂閱通知郵件。
如要取消訂閱這個群組並停止接收來自這個群組的郵件,請傳送電子郵件到 。
如要在這個群組張貼留言,請傳送電子郵件到 。
請前往以下網址造訪這個群組:http://groups.google.com/group/taigu。
如需更多選項,請前往:https://groups.google.com/d/optout。
-- 基本人權:使用母語活出台灣人ê尊嚴! Lîm Chùn-io̍k 林俊育 http://ctb.fhl.net 全民台語聖經 http://sloan.fhl.net(台語點字) http://hakka.fhl.net http://taigi.fhl.net
Re: Re: 台語羅馬字 unicode 正規化
From: chenggi.kan
Date: 2015-07-24 23:15:51
我 e 學位是碩士,請 m 通錯用。