図面 (/)

技術 機械翻訳装置

出願人 ブラザー工業株式会社
発明者 吉山盛子
出願日 1994年5月18日 (26年7ヶ月経過) 出願番号 1994-104034
公開日 1995年11月28日 (25年0ヶ月経過) 公開番号 1995-311770
状態 特許登録済
技術分野 機械翻訳
主要キーワード 不規則変化 翻訳キー 語形変化 日本文 前編集 CRTディスプレイ 後編集 ユーザー辞書
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1995年11月28日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (9)

目的

翻訳の際に、ユーザー辞書に記憶された訳語の形態に応じて語尾変化を行なうことで、翻訳後の操作者による後編集の負担を軽減できる機械翻訳装置を提供すること。

構成

形態素生成辞書51eを参照して、英語の各単語のすべてに語形変化形式に関する情報が付与され(S11)、その語形変化の形式に関する情報によって、規則変化する単語かどうか判断される(S12)。規則変化する単語であれば(S12:yes)、単語の末尾文字大文字であるかどうかが判断され(S14)、単語の末尾文字が大文字であれば(S14:yes)大文字の語尾変化処理を行い(S15)、大文字でなければ(小文字であれば)(S14:no)小文字の語尾変化処理を行う(S16)。

概要

背景

最近、キーボードディスプレイを備え、日本語文章英語の文章に翻訳したり、英語の文章を日本語の文章に翻訳する翻訳装置など、種々の翻訳装置が実用に強されている。

日本語の原文を英語の訳文に翻訳する機械翻訳装置においては、操作者特有の翻訳を可能とするため、機械翻訳装置が予め用意した原語に対する訳語を記憶した基本辞書の他に、操作者により登録された原語に対する訳語を記憶したユーザー辞書を備えている。

ところで、「システムが自動的にファイルクローズしました。」という日本語の原文の「システム」の部分を大文字で強調して翻訳したい場合には、「Thesystem closed the file automatically.」とまず翻訳し、その後に「system」の部分を大文字で「SYSTEM」と後編集することによって「The SYSTEM closed the file automatically.」と翻訳するようにしていた。しかし、この方式では、翻訳後の操作者による後編集作業が非常に煩雑なものとなってしまっていた。

よって、このような場合には、ユーザー辞書に日本語の「システム」という原語に対して英語の訳語を大文字で「SYSTEM」と登録し、翻訳することにより、「The SYSTEM closed the file automatically.」と、ユーザー辞書を使用し後編集をしないで所望の翻訳文を得るようにしていた。

概要

翻訳の際に、ユーザー辞書に記憶された訳語の形態に応じて語尾変化を行なうことで、翻訳後の操作者による後編集の負担を軽減できる機械翻訳装置を提供すること。

形態素生成辞書51eを参照して、英語の各単語のすべてに語形変化形式に関する情報が付与され(S11)、その語形変化の形式に関する情報によって、規則変化する単語かどうか判断される(S12)。規則変化する単語であれば(S12:yes)、単語の末尾文字が大文字であるかどうかが判断され(S14)、単語の末尾文字が大文字であれば(S14:yes)大文字の語尾変化処理を行い(S15)、大文字でなければ(小文字であれば)(S14:no)小文字の語尾変化処理を行う(S16)。

目的

本発明は上述した問題点を解決するためになされたものであり、翻訳の際に、ユーザー辞書に記憶された訳語の形態に応じて語形変化を行なうことで、翻訳後の操作者による後編集の負担を軽減することができる機械翻訳装置を提供することを目的としている。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

入力手段又は外部から入力された第1言語の原文を第2言語の訳文翻訳する翻訳手段と、前記翻訳手段による翻訳処理の際に参照される原語に対する訳語を記憶した基本辞書と、前記翻訳手段による翻訳処理の際に参照される操作者により登録された原語に対する訳語を記憶したユーザー辞書とを備えた機械翻訳装置において、前記ユーザー辞書に記憶された訳語に基づいて前記翻訳手段による翻訳処理がなされる場合に、前記ユーザー辞書に記憶された訳語の形態に応じて語形変化させる語形変化手段とを備えたことを特徴とする機械翻訳装置。

請求項2

前記語形変化手段は、前記ユーザー辞書に大文字で記憶された訳語については大文字で語尾変化を行ない、小文字で記憶された訳語については小文字で語尾変化を行なうことを特徴とする請求項1記載の機械翻訳装置。

請求項3

前記語形変化手段は、前記ユーザー辞書に記憶された訳語の末尾文字が大文字である場合には大文字で語尾変化を行ない、訳語の末尾文字が小文字である場合には小文字で語尾変化を行なうことを特徴とする請求項1記載の機械翻訳装置。

技術分野

0001

本発明は機械翻訳装置に関し、特に、翻訳の際に、ユーザー辞書に記憶された訳語の形態に応じて語形変化を行なうことで、翻訳後の操作者による後編集の負担を軽減することができる機械翻訳装置に関するものである。

背景技術

0002

最近、キーボードディスプレイを備え、日本語文章英語の文章に翻訳したり、英語の文章を日本語の文章に翻訳する翻訳装置など、種々の翻訳装置が実用に強されている。

0003

日本語の原文を英語の訳文に翻訳する機械翻訳装置においては、操作者特有の翻訳を可能とするため、機械翻訳装置が予め用意した原語に対する訳語を記憶した基本辞書の他に、操作者により登録された原語に対する訳語を記憶したユーザー辞書を備えている。

0004

ところで、「システムが自動的にファイルクローズしました。」という日本語の原文の「システム」の部分を大文字で強調して翻訳したい場合には、「Thesystem closed the file automatically.」とまず翻訳し、その後に「system」の部分を大文字で「SYSTEM」と後編集することによって「The SYSTEM closed the file automatically.」と翻訳するようにしていた。しかし、この方式では、翻訳後の操作者による後編集作業が非常に煩雑なものとなってしまっていた。

0005

よって、このような場合には、ユーザー辞書に日本語の「システム」という原語に対して英語の訳語を大文字で「SYSTEM」と登録し、翻訳することにより、「The SYSTEM closed the file automatically.」と、ユーザー辞書を使用し後編集をしないで所望の翻訳文を得るようにしていた。

発明が解決しようとする課題

0006

しかしながら、英単語には、名詞形容詞副詞及び動詞などのように、使用される状態により語尾変化がなされるものがある。かかる語尾変化のなされる英単語を大文字でユーザー辞書に記憶していても、翻訳処理の際にはその語尾変化は小文字でなされるので、語尾変化された部分について小文字から大文字に変換するための操作者による後編集作業が必要になってしまうという問題点があった。

0007

例えば、上記の原文において、「クローズしました」の部分を大文字で翻訳するために、ユーザー辞書に日本語の「クローズする」に対して英語の「CLOSE」を大文字で記憶していても、「The system CLOSed the file automatically.」のように翻訳されてしまっていた。このため、操作者は、語尾変化された部分について「The system CLOSED the file automatically.」と後編集することが必要になるという問題点があった。

0008

本発明は上述した問題点を解決するためになされたものであり、翻訳の際に、ユーザー辞書に記憶された訳語の形態に応じて語形変化を行なうことで、翻訳後の操作者による後編集の負担を軽減することができる機械翻訳装置を提供することを目的としている。

課題を解決するための手段

0009

この目的を達成するために、請求項1の機械翻訳装置は、入力手段又は外部から入力された第1言語の原文を第2言語の訳文に翻訳する翻訳手段と、前記翻訳手段による翻訳処理の際に参照される原語に対する訳語を記憶した基本辞書と、前記翻訳手段による翻訳処理の際に参照される操作者により登録された原語に対する訳語を記憶したユーザー辞書とを備え、更に、前記ユーザー辞書に記憶された訳語に基づいて前記翻訳手段による翻訳処理がなされる場合に、前記ユーザー辞書に記憶された訳語の形態に応じて語形変化させる語形変化手段とを備えている。

0010

また、請求項2の機械翻訳装置は、請求項1の機械翻訳装置において、前記語形変化手段は、前記ユーザー辞書に大文字で記憶された訳語については大文字で語尾変化を行ない、小文字で記憶された訳語については小文字で語尾変化を行なうように構成されている。

0011

請求項3の機械翻訳装置は、請求項1の機械翻訳装置において、前記語形変化手段は、前記ユーザー辞書に記憶された訳語の末尾文字が大文字である場合には大文字で語尾変化を行ない、訳語の末尾文字が小文字である場合には小文字で語尾変化を行なうように構成されている。

0012

上記の構成を有する本発明の機械翻訳装置の翻訳手段は、基本辞書及びユーザー辞書を参照して、入力手段又は外部から入力された第1言語の原文を第2言語の訳文に翻訳する。語形変化手段は、かかる翻訳の際に、ユーザー辞書に記憶された訳語の形態に応じて語形変化を行なう。

0013

また、請求項2の機械翻訳装置の語形変化手段は、その翻訳の際に、ユーザー辞書に大文字で記憶された訳語については大文字で語尾変化を行ない、小文字で記憶された訳語については小文字で語尾変化を行なう。

0014

請求項3の機械翻訳装置の語形変化手段は、その翻訳の際に、ユーザー辞書に記憶された訳語の末尾文字が大文字である場合には大文字で語尾変化を行ない、訳語の末尾文字が小文字である場合には小文字で語尾変化を行なう。

0015

以下、本発明の実施例について図面を参照して説明する。

0016

本実施例は、キーボードやフロッピディスクから入力された日本語の原文を英語の訳文に翻訳する機械翻訳装置に本発明を適用した場合のものである。

0017

図1は、本実施例の機械翻訳装置1の構成を示す制御系ブロック図である。同図に基づいて、先ず、この機械翻訳装置1の構成を説明する。

0018

この機械翻訳装置1は、基本的に、入力手段としてのキーボード2および外部記憶装置Mと、表示装置D、印字装置Pと、翻訳手段としての制御装置Cとから構成されている。

0019

キーボード2は、日本語や英語の文の入力が可能であり、アルファベットキー数字キー記号キーなどの文字キー、入力したアルファベット文字からなるローマ字入力ひらがなや漢字に変換するための変換キーリターンキースペースキー、翻訳処理を開始する翻訳キーなど、その他翻訳処理に必要な機能キーが設けられている。

0020

外部記憶装置Mは、日本語の原文や基本辞書及びユーザー辞書を記憶したフロッピーディスクFD)5からデータを読みだしたり、書き込んだりするフロッピーディスクドライブ(FDD)4と、これを駆動制御するフロッピーディスクドライブ(FDD)コントローラ3とから構成される。なお、基本辞書及びユーザー辞書の説明については後述する。

0021

表示装置Dは、キーボード2やフロッピーディスク5から入力された日本語の原文やその原文を英語に翻訳して得られた訳文等を複数行表示可能なCRTディスプレイ7と、これを表示制御するCRTコントローラ6とから構成されている。また、印字装置Pは、用紙に印字を行なうためのプリンタ9と、これを駆動制御するプリンタ駆動回路8とから構成されている。

0022

そして、キーボード2と、FDDコントローラ3と、CRTコントローラ6と、プリンタ駆動回路8とが、制御装置Cの入出力インターフェイス10にそれぞれ接続されている。

0023

制御装置Cは、CPU12と、このCPU12にデータバスアドレスバスなどのバス11を介して接続された入出力インターフェイス10、ROM13及びRAM14とから構成されている。そして、ROM13には、翻訳処理のための各種のプログラムが記憶されている。

0024

次に、図2を参照して、フロッピーディスク5に記憶される基本辞書51及びユーザー辞書52の構成について説明する。基本辞書51は機械翻訳装置1にて予め用意された辞書であり、ユーザー辞書52は操作者によって任意に登録されたデータから構成される辞書である。基本辞書51とユーザー辞書52のデータが重複する場合には、ユーザー辞書52のデータが優先して使用される。

0025

基本辞書51は、形態素解析時に使用する形態素解析辞書51aと、構文解析時に使用する解析辞書51bと、構文変換時に使用する変換辞書51cと、構文生成時に使用する生成辞書51dと、形態素生成時に使用する形態素生成辞書51eとから構成されている。

0026

ユーザー辞書52には、操作者によって登録されたデータが記憶される。ユーザー辞書52は基本辞書51と異なり、その内部が、形態素解析辞書、解析辞書、変換辞書、生成辞書、形態素生成辞書といった各辞書には分かれておらず、一つの辞書としてデータを記憶している。

0027

例えば、図3は、「クローズする」52aという日本語の原語に対して「CLOSE」52cという英語の訳語が記憶されている場合の例である。図中、「V.92」52bの「V」は動詞であることを示している。また、「92」はユーザー辞書52に記憶されていることを示している。更に、「regular」52dは、「CLOSE」52cという訳語が規則変化するものであることを示している。ユーザー辞書52には、一つの原語52aに対してこれらのデータ52a〜dが組になって登録され、記憶される。

0028

ここで、基本辞書51及びユーザー辞書52に記憶される各情報について説明する。辞書の識別番号は、ユーザー辞書52が「92」で示されるのに対して、基本辞書51は「1」で示される。また、語形変化の形式については、規則変化する単語が「regular」で示されるのに対して、不規則変化する単語は「irregular」で示され、全く語形変化しない単語については「no」で示される。更に、形容詞及び副詞に関して、その比較級及び最上級が「more」「most」により表現されるものについては、「more」として語形変化の形式が示される。品詞の種類については、名詞は「N」、動詞は「V」、助詞は「PREP」、形容動詞は「ADJV」、助動詞は「AUX」、記号は「SYM」で示される。これらの辞書の識別番号、語形変化の形式、並びに、品詞の種類は、基本辞書51及びユーザー辞書52に各単語毎にそれぞれ記憶されている。

0029

次に、このように構成された機械翻訳装置1における翻訳処理の概略を図4を参照して説明する。

0030

まず、原文である日本文がキーボード2から入力され翻訳キーが操作されると(S1)、その日本文は必要に応じて適切な形に前編集された後、翻訳処理が行なわれる(S2)。前編集された日本文は、形態素解析辞書51aを参照しながら単語単位に分割されてそれぞれの単語に単語情報等が付加される(S3)。例えば、「システムが自動的にファイルをクローズしました。」という日本文が入力された場合には、図5に示すように、形態素解析処理が行なわれる。なお、図5中の「/」は、形態素解析処理の理解を容易にするために便宜的に表わした単語間分割位置を示す記号であり、翻訳処理とは何等関係のない記号である。

0031

形態素解析処理が行なわれると(S3)、次に、図6に示すように、各単語をへとまとめあげるためのかかり受け解析等を行なう構文解析処理が行われる(S4)。「システムが自動的にファイルをクローズしました。」という入力文の場合、構文解析処理で主語に解析された「システム」には主語を、目的語に解析された「ファイル」には目的語を対応づけている。

0032

次いで、図7に示すように、変換辞書51cを検索して各日本語の単語を英語の訳語に置き換え、構文解析処理の結果に基づいて日本語を英語の構造へ変換する構文変換処理が行なわれる(S5)。つまり、この構文変換処理において、日本語の各々の各要素に対して英語の各要素を対応づけ、適切な英語の構造に変換する。

0033

構文変換処理(S5)において英語の構造に変換された文は、構文生成処理によって、それぞれの単語に対して生成辞書51dを参照し、訳語生成規則に基づいて英語として正しい構文に生成される(S6)。続いて、形態素生成辞書51eを参照し、語形変化などの形態素生成処理を行い英語の訳文が生成される(S7)。

0034

このようにして生成された英語の訳文は、操作者により後編集が行なわれ(S8)、CRTディスプレイ7に表示されたり、プリンタ9によって用紙に印字されたりする(S9)。

0035

次に、上記のように構成された機械翻訳装置1における形態素生成処理について、図8を参照して説明する。図8は、本発明の形態素生成処理を示したフローチャートである。

0036

図4に示すフローチャートにおいて、日本文の入力から(S1)構文生成処理まで行なわれると(S6)、図8に示されるフローチャートの形態素生成処理が開始され、語尾変化などの語形変化の形態素生成が行なわれる。

0037

まず、形態素生成辞書51eを参照して、英語の各単語のすべてに語形変化の形式に関する情報が付与される(S11)。なお、ユーザー辞書52を参照して使用される単語については、形態素解析処理(S3)にて、すでに語形変化の形式に関する情報が付与されている。

0038

次に、その語形変化の形式に関する情報によって、規則変化する単語かどうか判断される(S12)。語形変化の形式が「regular」の場合は、規則変化する単語である。規則変化しない単語であれば、即ち、語形変化の形式が「irregular」「no」「more」などであれば(S12:no)、形態素生成辞書51eあるいはユーザー辞書52にその単語の不規則変化形が記憶されているので、その不規則変化形に単語が置き換えられ、その単語の語形変化を終了する(S13)。

0039

一方、規則変化する単語であれば(S12:yes)、単語の末尾文字が大文字であるかどうかを判断する(S14)。大文字であるかどうかの判断は、末尾文字の文字コードの値により行なわれる。即ち、文字コードが、「41H(Hは、16進数を示すための符号である)」から「5AH」であれば大文字と判断され、「61H」から「7AH」であれば小文字と判断される。判断の結果、単語の末尾文字が大文字であれば(S14:yes)大文字の語尾変化処理を行い(S15)、大文字でなければ(小文字であれば)(S14:no)小文字の語尾変化処理を行う(S16)。

0040

例えば、英語の動詞が規則変化する場合の語尾変化は、次のようになされる。現在形の動詞を過去形もしくは過去分詞形に変化させる場合は、現在形のまま又は語尾の「e」を削除して「ed」を付けて語尾変化させる。現在分詞形に変化させる場合は、現在形のまま又は語尾の「e」を削除して「ing」を付けて語尾変化させる。

0041

この語尾変化処理においては、単語の末尾文字が大文字の「E」であっても小文字の「e」と同じであると認識させて語尾変化をさせる。これと共に、その場合は「ed」「ing」等の活用語尾も末尾文字の大文字に合わせて大文字で出力する。即ち、単語の末尾文字が大文字であれば大文字で語尾変化を行ない、単語の末尾文字が小文字であれば小文字で語尾変化を行なう。

0042

このようにしてすべての単語の語形変化処理を行い(S17)、その後、ハイフンピリオドコンマの生成等の他の処理を行って(S18)すべての形態素生成処理を終了する。

0043

ここで具体的に「システムが自動的にファイルをクローズしました。」という日本文の「クローズしました」を、図8の形態素生成処理(S7)を用いて英文に翻訳する場合について説明する。

0044

図7に示されるように形態素生成処理までに、「クローズする」という単語が、ユーザー辞書52に登録されており、その訳語が「CLOSE」で、語尾変化の形式は規則変化であることがわかる。よって、この「CLOSE」を過去形に変化させるために、末尾文字の「E」を削除して「ED」を付けて語尾変化させる。この際、末尾文字の「E」は大文字であるので、「ED」も大文字で付される。

0045

この結果、「システムが自動的にファイルをクローズしました。」という日本文は、「The system CLOSED the file automatically.」という「CLOSED」の単語が大文字で強調された英文に翻訳される。

0046

以上詳述したことから明かなように、本実施例の機械翻訳装置1によれば、翻訳の際に、ユーザー辞書52に記憶された訳語の大文字小文字の形態に応じて語形変化を行なうので、翻訳後の操作者による後編集の負担を軽減することができる。

0047

また、語尾変化が大文字でなされるか小文字でなされるかは、単語の末尾文字が大文字であるか小文字であるかにより決定される。よって、固有名詞のように先頭文字のみが大文字で2文字目以降は小文字である単語に対しても、適切な語尾変化を行なうことができる。例えば、「クローズする」という単語が、ユーザー辞書52に「Close」と末尾文字が小文字で登録されていれば「Closed」と小文字で語尾変化を行い、「CLOSE」と末尾文字が大文字で登録されていれば「CLOSED」と大文字で語尾変化を行なうことができる。

0048

なお、本実施例における語形変化手段は、図8に示されるS12からS16の処理である。

0049

以上、実施例に基づき本発明を説明したが、本発明は上記実施例に何ら限定されるものでなく、本発明の趣旨を逸脱しない範囲で種々の変更改良が可能であることは容易に推察できるものである。

0050

例えば、実施例では日本語から英語に翻訳する場合を例に記述したが、他の言語に翻訳する場合にも適用できる。

0051

また、動詞の語尾変化のみならず、名詞、形容詞、副詞などの他の品詞の語尾変化についても同様に本発明を適用することができる。例えば、「DIRECTORY」という規則変化する名詞が大文字で登録されている場合、その複数形は「DIRECTORIES」と大文字で語尾変化させて翻訳することができる。また、「EASY」という規則変化する形容詞が大文字で登録されている場合、その比較級は「EASIER」、最上級は「EASIEST」と大文字で語尾変化させて翻訳することができる。

0052

本発明は、大文字小文字の語尾変化に限られるものではなく、文字の種類に応じた語尾変化に適用することも可能である。例えば、イタリック文字(斜文字)、ボールド文字(太文字)、アンダーライン付文字などにより、単語がユーザー辞書に登録されている場合には、登録されている文字と同じ種類の文字により語尾変化が行なわれる。

0053

なお、本発明の語形変化は、語尾変化に限られるものではない。例えば、「more」「most」のように、他の単語が付加されて語形変化されるようなものについても同様に本発明を適用することができる。

発明の効果

0054

以上詳述したことから明かなように、本発明の機械翻訳装置によれば、翻訳の際に、ユーザー辞書に記憶された訳語の形態に応じて語形変化を行なうので、翻訳後の操作者による後編集の負担を軽減することができるという効果がある。

図面の簡単な説明

0055

図1本発明の実施例の機械翻訳装置の構成を示す制御系のブロック図である。
図2基本辞書及びユーザー辞書が記憶されたフロッピーディスクの構造を示す図である。
図3ユーザー辞書の構造を模式的に表わした図である。
図4翻訳処理の制御を示すフローチャートである。
図5形態素解析の様子を模式的に表わした図である。
図6構文解析の様子を模式的に表わした図である。
図7構文変換の様子を模式的に表わした図である。
図8形態素生成処理を示すフローチャートである。

--

0056

1機械翻訳装置
2入力手段としてのキーボード
5フロッピーディスク
51基本辞書
52ユーザー辞書
C翻訳手段としての制御装置

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ