「ProgProject:Pakkau」修訂間的差異
跳至導覽
跳至搜尋
Tankianting(討論 | 貢獻) (→Hô-ló話) |
Tankianting(討論 | 貢獻) |
||
(未顯示同一使用者於中間所作的 3 次修訂) | |||
行 1: | 行 1: | ||
{{Project|name=Pakkau|desc= | {{Project|name=Pakkau|desc=converter from lomaji to hanji in Taiwanese (Hokkien) | ||
|reponame=pakkau | |reponame=pakkau | ||
|lang=Python | |lang=Python | ||
行 10: | 行 10: | ||
|docs=[https://git.kianting.info/?p=pakkau;a=blob;f=README.md README.md] | |docs=[https://git.kianting.info/?p=pakkau;a=blob;f=README.md README.md] | ||
}} | }} | ||
==Usage== | |||
<pre> | |||
usage: pakkau.py [-h] [--genmod] [--form FORM] [SENTENCE] | |||
positional arguments: | |||
SENTENCE the sentence to be converted | |||
options: | |||
-h, --help show this help message and exit | |||
--genmod generate the model | |||
--form FORM the orthography to be used (poj or tl). Default is poj. (not opened) | |||
</pre> | |||
==說明== | ==說明== | ||
行 43: | 行 57: | ||
目前僅支援調符教育部拼音轉教育部建議漢字。 | 目前僅支援調符教育部拼音轉教育部建議漢字。 | ||
==See also== | |||
[[ProgProject:Pakkau-webapp]] |
於 2024年4月9日 (二) 01:14 的最新修訂
Pakkau converter from lomaji to hanji in Taiwanese (Hokkien)
Source
- View code
- Clone:
git clone https://git.kianting.info/src/pakkau
- Licence: MIT、Corpus:CC BY-NC-SA TW 3.0
- Main languages: Python
- README
- Docs: README.md
Issues
- See ProgProject:Pakkau/issues for details
Discussion
Unavailable, please send an email to me.
Usage
usage: pakkau.py [-h] [--genmod] [--form FORM] [SENTENCE] positional arguments: SENTENCE the sentence to be converted options: -h, --help show this help message and exit --genmod generate the model --form FORM the orthography to be used (poj or tl). Default is poj. (not opened)
說明
Hô-ló話
一个用隱密êMarkov鍊做ê羅馬字到臺語漢字ê converter
提教育部ê辭典資料,轉做(TL-漢字)ê平行語料,然後算出來文字轉移ê頻率,寫做一个Script:pakkau(tuì北溝號ê),用Python,會當將教育部臺羅拼音轉做漢字。
毋過有無準ê所在:
INPUT: Iâ-soo kóng, Siōng-tè thiànn-thàng sè-kan-lâng OUTPUT: 耶穌講,上帝疼痛世間人 --> OK INPUT: "\"Tsì-bîng kah Tshun-kiau\" sī tsit tiâu kua\" OUTPUT: "志明佮春嬌"是一條歌 --> OK INPUT: koo iā bô phuānn tsiú ting-ē, tshun-hong tuì-bīn tshue OUTPUT: 孤也無伴守燈下,春風對面初 --> XX
凡勢kap預測干焦考慮頂一字有關聯,可能語料傷過少。
目前干焦支援教育部羅馬字到教育部漢字。
Mandarin摘要
原理和輸入法常用的隱式馬克夫鍊類似,所以就用這個原理,利用教育部的詞典語料 修改成漢字—教育部台羅的平行語料,算文字轉移機率,寫一個Script,從教育部拼音 轉成漢字
可能因為僅考慮前一字,加上語料不多,所以正確率不是很高。
目前僅支援調符教育部拼音轉教育部建議漢字。