知識ベースに基づく点字翻訳のための日本語文書分かち書き手法


 日本語を点字に翻訳する際の分かち書きは複雑で曖昧なルールに基づいており、計算機 で自動的に処理を行なうのが難しい。従来の手法は形態素解析に、大規模な辞書と文法ル ールが必要とされるため、解析率を上げるにはユーザ辞書の項目追加が一般的であった。 本手法は、点字の分かち書きに必要な、助詞、ひらがな書きの自立語、混ぜ書き語、漢字 熟語といった、小規模なテーブルを用いて表層解析を行なうことで、大規模な辞書を引く 手間を省き、時間の短縮を図った。また、分かち書きに必要な知識を知識ベース化するこ とで、知識の追加、削除、更新を容易なものとした。

Go to hiraoka's homepage