檢視 Brill Tagger 的原始碼
←
Brill Tagger
跳至導覽
跳至搜尋
由於下列原因,您沒有權限進行編輯此頁面的動作:
您請求的操作只有這個群組的使用者能使用:
使用者
您可以檢視並複製此頁面的原始碼。
{{Nav|自然語言處理}} 以下是 ''[https://aclanthology.org/A92-1021/ A Simple Rule-Based Part of Speech Tagger]''(Eric Brill, 1992; DOI:10.3115/974499.974526)的摘要 # 主要是說明「機率式標記詞性」不一定勝過「規則式的標記詞性」。 # Brill tagger(Brill 標記器)是一種標記詞性的方式,主要做法: ## 先用語料庫的單字出現機率比較高的詞彙,而不用目標文之前後文,來指派目標文的各詞詞性。若是語料庫意外的詞,則用詞彙形式的分析推測來決定詞性(比如字首是否大寫決定專有名詞,字尾決定詞性)。 ## 然後再找出目標文中各{應有詞性,實際詞性,頻率}的資料。 ## 然後再找出某個詞性前面與後面2~3字的詞性分佈狀況(比如說前面2個詞其中一個是動詞、或是後面2個詞都是名詞),則應該要把這個詞變成詞性y的規則,如果能夠降低錯誤率,則加入規則。 ## 如此循序套用、測試、採納,直到將詞性標註越來越精確,錯誤越來越低。 [[category:資訊]]
此頁面使用了以下模板:
模板:Nav
(
檢視原始碼
)
返回到「
Brill Tagger
」。
導覽選單
個人工具
登入
命名空間
頁面
討論
變體
視圖
閱讀
檢視原始碼
檢視歷史
更多
搜尋
導覽
首頁
愛爾蘭語辭典
近期變更
隨機頁面
有關 MediaWiki 的說明
相關網站
總首頁
Blog
舊 blog
現用 blog 備份
工具
連結至此的頁面
相關變更
特殊頁面
頁面資訊