「ProgProject:Pakkau」修訂間的差異

出自Tan Kian-ting的維基
跳至導覽 跳至搜尋
(建立內容為「 {{Project|name=Pakkau|desc=pa lomaji to hanji Taiwanese (Hokkien) converter |reponame=pakkau |lang=Python |license=[https://opensource.org/license/mit/ MIT]、Co…」的新頁面)
 
行 20: 行 20:


毋過有無準ê所在:
毋過有無準ê所在:
<pre>
INPUT: Iâ-soo kóng, Siōng-tè thiànn-thàng sè-kan-lâng
INPUT: Iâ-soo kóng, Siōng-tè thiànn-thàng sè-kan-lâng
OUTPUT: 耶穌講,上帝疼痛世間人 --> OK
OUTPUT: 耶穌講,上帝疼痛世間人 --> OK
行 28: 行 29:
INPUT: koo iā bô phuānn tsiú ting-ē, tshun-hong tuì-bīn tshue
INPUT: koo iā bô phuānn tsiú ting-ē, tshun-hong tuì-bīn tshue
OUTPUT: 孤也無伴守燈下,春風對面初 --> XX
OUTPUT: 孤也無伴守燈下,春風對面初 --> XX
 
</pre>
凡勢kap預測干焦考慮頂一字有關聯,可能語料傷過少。
凡勢kap預測干焦考慮頂一字有關聯,可能語料傷過少。



於 2024年3月22日 (五) 21:34 的修訂

It's a project in my self hosted git repositories. 個人的程式碼儲藏庫內的專案

Pakkau pa lomaji to hanji Taiwanese (Hokkien) converter

Source

Issues

See ProgProject:Pakkau/issues for details

ProgProject:Pakkau/issues

Discussion

Unavailable, please send an email to me.

說明

Hô-ló話

一个用隱密êMarkov鍊做ê羅馬字到臺語漢字ê converter

提教育部ê辭典資料,轉做(TL-漢字)ê平行語料,然後算出來文字轉移ê頻率,寫做一个Script:pakkau(tuì北溝號ê),用Python,會當將教育部臺羅拼音轉做漢字。

毋過有無準ê所在:

INPUT: Iâ-soo kóng, Siōng-tè thiànn-thàng sè-kan-lâng
OUTPUT: 耶穌講,上帝疼痛世間人 --> OK

INPUT:  "\"Tsì-bîng kah Tshun-kiau\" sī tsit tiâu kua\"
OUTPUT: "志明佮春嬌"是一條歌 --> OK

INPUT: koo iā bô phuānn tsiú ting-ē, tshun-hong tuì-bīn tshue
OUTPUT: 孤也無伴守燈下,春風對面初 --> XX

凡勢kap預測干焦考慮頂一字有關聯,可能語料傷過少。

目前干焦支援教育部羅馬字到教育部漢字。

Mandarin摘要

原理和輸入法常用的隱式馬克夫鍊類似,所以就用這個原理,利用教育部的詞典語料 修改成漢字—教育部台羅的平行語料,算文字轉移機率,寫一個Script,從教育部拼音 轉成漢字

可能因為僅考慮前一字,加上語料不多,所以正確率不是很高。

目前僅支援調符教育部拼音轉教育部建議漢字。