知識ベースに基づく点字翻訳のための日本語文書分かち書き手法
日本語を点字に翻訳する際の分かち書きは複雑で曖昧なルールに基づいており、計算機
で自動的に処理を行なうのが難しい。従来の手法は形態素解析に、大規模な辞書と文法ル
ールが必要とされるため、解析率を上げるにはユーザ辞書の項目追加が一般的であった。
本手法は、点字の分かち書きに必要な、助詞、ひらがな書きの自立語、混ぜ書き語、漢字
熟語といった、小規模なテーブルを用いて表層解析を行なうことで、大規模な辞書を引く
手間を省き、時間の短縮を図った。また、分かち書きに必要な知識を知識ベース化するこ
とで、知識の追加、削除、更新を容易なものとした。
Go to hiraoka's homepage