|
パターンベース翻訳技術
パターンベース翻訳では、ソース側の文脈自由文法規則とそれに対応するターゲット側の
文脈自由文法規則のペアを翻訳パターンと呼び、それらを大量に用意して入力との
マッチングを取り翻訳するというものです。以下に翻訳パターンの例を示します。
(a) NOUN NOUN:1 -> NP:1 NP:1 <- NOUN NOUN:1
(b) have:VERB:1 to do with NOUN:2 -> VP:1 VP:1 <- NOUN:2 と 関係 が ある:1
最初のパターンは隣り合う二つの名詞から名詞句を作る文法的なパターンであり、
二つ目のパターンは慣用的表現のパターンです。セミコロン(;)の後の数字は、
それぞれのルール項の間の対応関係を示します。
パターンベース翻訳では、このように、文法的な翻訳知識も慣用的な翻訳知識も
同じ翻訳パターンとして表現し、同じ枠組みで扱っています。
翻訳処理は、翻訳パターンのソース側文脈自由文法規則を用いて入力文を解析し、
解析結果で使われた規則の対応するターゲット側規則からターゲット構造を
同期導出により構築することで行われます。
本手法の特徴は、翻訳知識の大部分を翻訳パターンとして表現することにより、
翻訳知識のシステムへの追加が非常に容易になることにあります。これにより、
システムのカスタマイゼーションにかかるコストをかなり低減させることが可能となりました。
|