図面 (/)

技術 翻訳制御装置、翻訳システム、翻訳制御方法、およびプログラム

出願人 日本電気株式会社
発明者 三浦貢
出願日 2016年9月29日 (4年8ヶ月経過) 出願番号 2016-190563
公開日 2018年4月5日 (3年2ヶ月経過) 公開番号 2018-055396
状態 特許登録済
技術分野 文書処理装置 機械翻訳 計算機間の情報転送
主要キーワード 復元領域 復元コード 水平タブ 各制御コード 定型表現 返信文 翻訳済み 返信者
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2018年4月5日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

翻訳の繰り返しによって文章可読性が低下することを防ぐ。

解決手段

翻訳制御装置は、テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出する検出手段と、前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、翻訳制御手段と、を備える。

概要

背景

電子メールの機能に、電子メールに含まれる文章翻訳する機能を組み合わせた装置に関する技術が、いくつか知られている。

特許文献1および2は、英文が書かれたメールの受信時に英文を日本文に変換し、そのメールの返信時に日本文を英文に変換するメール翻訳装置を開示している。

特許文献3は、翻訳の対象となる文を一文ごとに翻訳し、翻訳文原文に付加した形式である対訳形式の文書を作成して、電子受信部に送信する機械翻訳電子メール装置を開示している。

特許文献4は、電子メール等の文書の中で、翻訳が必要であると判断された領域に対してのみ翻訳処理を実行する翻訳装置を開示している。

概要

翻訳の繰り返しによって文章の可読性が低下することを防ぐ。翻訳制御装置は、テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出する検出手段と、前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、翻訳制御手段と、を備える。

目的

本発明は、翻訳の繰り返しによってテキストの可読性が低下することを防ぐことができる装置等を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出する検出手段と、前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、翻訳制御手段と、を備える翻訳制御装置

請求項2

少なくとも1つの前記制御コードは、複数の種類の空白文字のうちのいずれか、または、当該テキストを表示させる表示制御手段が表示させない文字列として設定されている文字列、の少なくともいずれかを1つ以上含む、請求項1に記載の翻訳制御装置。

請求項3

少なくとも1つの前記制御コードは、翻訳済みの文言が何の言語に翻訳済みであるかを示す情報を含む、請求項1または2に記載の翻訳制御装置。

請求項4

翻訳が実行されることで生成された翻訳文を含むテキストに、前記制御コードを生成して埋め込むコード生成手段をさらに含む、請求項1から3のいずれか一項に記載の翻訳制御装置。

請求項5

前記コード生成手段は、前記制御コードが埋め込まれたテキストに、埋め込まれた前記制御コードを示す復元情報を埋め込み、前記検出手段は、前記復元情報を検出し、前記翻訳制御手段は、前記復元情報に基づいて当該テキスト中の前記制御コードを補正する、請求項4に記載の翻訳制御装置。

請求項6

特定のメールアドレスを宛先とする電子メールを受け取り、受け取った電子メールに含まれる本文を前記テキストとして前記検出手段に送出し、受けとった電子メールの宛先のメールアドレスに基づいて翻訳前の言語と翻訳後の言語との組である翻訳方向を決定し、前記決定された翻訳方向を前記翻訳制御手段に送出する制御手段と、第一の言語から第二の言語へと翻訳された前記電子メールの返信先として、電子メールが前記第二の言語から前記第一の言語へと翻訳されるためのメールアドレスを設定する宛先設定手段と、をさらに備える、請求項1から5のいずれか一項に記載の翻訳制御装置。

請求項7

テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出する検出手段と、前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、翻訳制御手段と、前記テキストを翻訳する手段であって、前記特定された翻訳が不要な文言の翻訳をスキップする翻訳手段と、を含む翻訳システム

請求項8

テキスト中の少なくとも1つの文言につき、少なくとも、当該文言が翻訳により生成した翻訳文であるか否かまたは翻訳が実行された元の文言であるか否か、を判別する判別手段と、判別された文言について、判別結果に基づいた、当該文言が翻訳が不要である文言であるか否かを特定可能な制御コードを、前記テキスト中に埋め込む埋め込み手段と、を備える翻訳制御装置。

請求項9

テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出し、前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、翻訳制御方法

請求項10

コンピュータに、テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出する検出処理と、前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、翻訳制御処理と、を実行させるプログラム

技術分野

0001

本開示は、テキスト翻訳に関する。

背景技術

0002

電子メールの機能に、電子メールに含まれる文章を翻訳する機能を組み合わせた装置に関する技術が、いくつか知られている。

0003

特許文献1および2は、英文が書かれたメールの受信時に英文を日本文に変換し、そのメールの返信時に日本文を英文に変換するメール翻訳装置を開示している。

0004

特許文献3は、翻訳の対象となる文を一文ごとに翻訳し、翻訳文原文に付加した形式である対訳形式の文書を作成して、電子受信部に送信する機械翻訳電子メール装置を開示している。

0005

特許文献4は、電子メール等の文書の中で、翻訳が必要であると判断された領域に対してのみ翻訳処理を実行する翻訳装置を開示している。

先行技術

0006

特開2000−3365号公報
特開平11−85757号公報
特開平3−211670号公報
特開2002−278961号公報

発明が解決しようとする課題

0007

電子メールに対する翻訳の機能が適用されたシステムにおいて、電子メールをやりとりする二者間で返信が繰り返し行われる場合に、翻訳の必要がない文が存在しうる。翻訳の必要がない文としては、特許文献4で挙げられる冒頭挨拶末尾署名の他、たとえば、既に翻訳された原文や、翻訳によって生成した翻訳文が挙げられる。

0008

例えば、ある電子メールのやりとりにおいて、日本語の文が書かれた電子メールに対し日英翻訳が実行され、日本語の原文とその翻訳文とが含まれる電子メールが相手方に送信されたとする。この電子メールに対する返信メールには、返信者が返信として入力した返信文に加え、送信されてきた文章、すなわち、日本語の原文とその翻訳文も含まれるのが一般的である。この場合、この返信メールに対して翻訳装置が英日翻訳を実施すると、返信文だけでなく、初めに送信された翻訳文が再翻訳される。また、この返信メールに対してさらに返信がされる場合、その返信に対する日英翻訳においては、新たに入力された文章のみならず、最初に送られた日本文、および、この返信メールの翻訳文(再翻訳された文および返信文の翻訳文)もが翻訳の対象となる。

0009

特に、上記の例のように翻訳装置が翻訳文を原文に付加する態様では、返信が行われるたびに、翻訳対象文が急激に増加する。

0010

このように、翻訳の必要がない文が翻訳されると、処理量が多くなるという問題がある。また、電子メールの可読性(すなわち、読みやすさ)も低下する。

0011

上記の問題を解決する方法は特許文献2,3,4には開示されていない。特許文献4に記載の翻訳装置は、翻訳不要な領域を判断する処理を行うが、この判断は、翻訳不要とされる定型表現特有文字列が存在するかどうかに基づいて行われる。ゆえに、既に翻訳済みの文章はこの翻訳装置によっては翻訳不要な領域として検出されない。

0012

なお、特許文献1に、返信メールの翻訳において、引用文については翻訳を行わずに原文を用いることで、翻訳された文の再翻訳を回避する方法の開示がある(特許文献1の段落[0049]等)。しかし、この方法は、返信メールの文書データと、原文メールの翻訳結果である対訳データとを比較する工程を含むので、処理量は多く、また、対訳データを保持可能な構成を含む実施態様にしか適用できない。また、引用文に、未だ翻訳されていない文が含まれる場合もありうる。

0013

上記の問題は、メールの返信が繰り返されるシステムの他、テキストを何度も翻訳するケース等においても、同様に存在し得る。

0014

本発明は、翻訳の繰り返しによってテキストの可読性が低下することを防ぐことができる装置等を提供することを目的の1つとする。

課題を解決するための手段

0015

本発明の一態様に係る翻訳制御装置は、テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出する検出手段と、前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、翻訳制御手段と、を備える。

0016

本発明の一態様に係る翻訳システムは、テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出する検出手段と、前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、翻訳制御手段と、前記テキストを翻訳する手段であって、前記特定された翻訳が不要な文言の翻訳をスキップする翻訳手段と、を含む。

0017

本発明の一態様に係る翻訳制御装置は、テキスト中の少なくとも1つの文言につき、少なくとも、当該文言が翻訳により生成した翻訳文であるか否かまたは翻訳が実行された元の文言であるか否か、を判別する判別手段と、判別された文言について、判別結果に基づいた、当該文言が翻訳が不要である文言であるか否かを特定可能な制御コードを、前記テキスト中に埋め込む埋め込み手段と、を備える。

0018

本発明の一態様に係る翻訳制御方法は、テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出し、前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する。

0019

本発明の一態様に係るプログラムは、コンピュータに、テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出する検出処理と、前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、翻訳制御処理と、を実行させる。

発明の効果

0020

本発明によれば、翻訳の繰り返しによってテキストの可読性が低下することを防ぐことができる。

図面の簡単な説明

0021

本発明の第1の実施形態に係る情報処理システムの構成を示すブロック図である。
本発明の第1の実施形態に係る翻訳システムの構成を示すブロック図である。
文章中の制御コードが記載される位置の一例を表す図である。
制御コードの種類の一例を示す表である。
制御コードに用いられうる空白文字の例の一覧を示す表である。
構造化された文章の一例を示す図である。
翻訳文が付与された文章の例を示す図である。
第二変換が行われた後の文章の例を示す図である。
第1の実施形態に係る翻訳制御装置の各部の処理の流れの例を示すシーケンス図である。
別の形態の翻訳システムの構成を示すブロック図である。
さらに別の形態の翻訳システムの構成を示すブロック図である。
本発明の第2の実施形態に係る情報処理システムの構成を示すブロック図である。
本発明の一実施形態における、検出部および翻訳制御部の処理手順の例である。
本発明の実施形態の主要構成を含む翻訳制御装置の構成を示すブロック図である。
主要構成を含む翻訳制御装置の処理の流れを示すフローチャートである。
本発明の実施形態の第2の主要構成を含む翻訳制御装置の構成を示すブロック図である。
第2の主要構成を含む翻訳制御装置の処理の流れを示すフローチャートである。
主要構成を含む翻訳システムの構成を示すブロック図である。
本発明の各実施形態の各部を構成するハードウェアの例を示すブロック図である。

実施例

0022

以下、図面を参照しながら、本発明の実施形態を詳細に説明する。

0023

なお、以下の説明において、「文」(または「文言」)とは、言語に基づいて解釈可能な文字列であればよく、読点で終わる一文に限定されない。すなわち、節、、語のいずれも「文」という語が指す対象となりうる。見出しや標語改行されて分離した文の一部等々も「文」とみなされてよい。また、「文章」(またはテキスト)は、少なくとも1つの文を含んでいればよい。

0024

<<第1の実施形態>>
まず、本発明の第1の実施形態について説明する。第1の実施形態は、翻訳システム20が、情報処理システム1に適用される形態である。

0025

<構成>
<情報処理システム1の構成例>
まず、本実施形態の翻訳システム20が適用される情報処理システム1の一態様の概要を説明する。

0026

図1は、第1の実施形態に係る情報処理システム1の構成を示すブロック図である。

0027

情報処理システム1は、1つ以上の送受信装置10と、翻訳システム20とを含む。図1では、送受信装置10として、2つの送受信装置10−1、10−2が記載されている。以下、送受信装置10−1、10−2については、個々を区別する場合には符号「10−1」または「10−2」を用い、個々を特定しない場合および総称する場合には符号「10」を用いる。

0028

送受信装置10と翻訳システム20とは、それぞれ、有線または無線通信ネットワーク5を介して通信可能に接続されている。通信ネットワーク5には、メールサーバが含まれていてもよい。

0029

送受信装置10は、電子メールを送受信する装置である。たとえば、送受信装置10は、メーラ等のソフトウェア起動して、電子メールを作成し、他の送受信装置10に電子メールを送信する。送受信装置10は、それぞれ特定のメールアドレスを宛先とする電子メールを受信する。電子メールの送受信は、メールサーバを介して行われてもよい。

0030

翻訳システム20は、受信した電子メール中の文の翻訳文を、その電子メールに付加する制御を行うシステムである。翻訳システム20は、特定のメールアドレスを宛先とする電子メールを受信する。また、翻訳システム20は、翻訳文が付加された電子メールを、送受信装置10に送信する。電子メールの送受信は、メールサーバを介して行われてもよい。

0031

いま、送受信装置10−1が、送受信装置10−2宛に、電子メールを送信するとする。送受信装置10−1は、たとえば、宛先として、送受信装置10−2のメールアドレスを指定する。この時、送受信装置10−1は、他の宛先(たとえば、「To」の他、「Cc(Carbon Copy)」や「Bcc(Blind Carbon Copy)」等でもよい)として、翻訳システム20が受信するメールアドレスをさらに指定してもよい。翻訳システム20が受信するメールアドレスを宛先として指定することで、この電子メールに対して翻訳システム20によるサービスが提供される。

0032

図1に示される破線の矢印は、上記の例における電子メールの流れを表す。送受信装置10−1が送信する電子メールは、通信ネットワーク5を介して、送受信装置10−2と、翻訳システム20とに送信される。たとえば1つの実施態様として、送受信装置10−1が送信した電子メールは、通信ネットワーク5に含まれるメールサーバを経由して、送受信装置10−2と、翻訳システム20とに送達される。翻訳システム20は、受信した電子メールに含まれる文の翻訳文を、その電子メールに付加する。そして翻訳システム20は、翻訳文が付加された電子メールを、その電子メールの宛先であった送受信装置10−2に送信する。

0033

このようなシステムにより、電子メールの受け手である送受信装置10−2は、送受信装置10−1によるメールだけでなく、翻訳システム20によって翻訳文が付加された電子メールをも受け取ることができる。

0034

なお、上記の電子メールの流れは一例であり、この説明に限定されるものではない。たとえば、送受信装置10−1は、宛先として複数の送受信装置10を指定してよい。翻訳システム20は通信ネットワーク5上に2つ以上あってもよい。送受信装置10−1と送受信装置10−2とが、同一の装置である場合があってもよい。

0035

<翻訳システム20の構成>
翻訳システム20の構成について説明する。図2は、翻訳システム20の一例である翻訳システム21の構成を示すブロック図である。翻訳システム21は、翻訳制御装置31を含む。

0036

翻訳制御装置31は、受信部200、制御部210、第一変換部220、翻訳部230、第二変換部240、宛先設定部250、および送信部260を備える。

0037

受信部200は、電子メールを受信する。具体的には、受信部200は、翻訳制御装置31に宛てられた電子メールを受信する。受信部200は、たとえば、メーラを実行するプロセッサである。

0038

例として、翻訳制御装置31が電子メールを受信する基となるメールアドレスとして、2つのメールアドレスTrans_JE@aaaaa.com、 Trans_EJ@aaaaa.comがあるとする。すなわち、受信部200は、宛先がTrans_JE@aaaaa.comである電子メール、および、宛先がTrans_EJ@aaaaa.comである電子メールを、受信するとする。

0039

このメールアドレスは、後述する翻訳方向の決定において用いられる。たとえば、宛先がTrans_JE@aaaaa.comである電子メールについては、日本語の文が英語に翻訳される、と予め規定される。宛先がTrans_EJ@aaaaa.comである電子メールについては、英語の文が日本語に翻訳される、と予め規定される。電子メールの翻訳を希望する電子メールの送信者は、その電子メール中のどの言語の文がどの言語に翻訳されることを望むか、に基づいて、宛先に含める翻訳制御装置31のメールアドレスを決定すればよい。

0040

翻訳制御装置31が電子メールを受信する基となるメールアドレスの数は、2つに限られない。メールアドレスは、翻訳可能な言語の数に応じて、用意されてよい。

0041

受信部200は、電子メールを受信すると、受信した電子メールを制御部210に送出する。

0042

制御部210は、受信された電子メールに、翻訳文を付加する処理の流れを制御する。制御部210は、受信された電子メールに関して、たとえば第一変換部220、翻訳部230、第二変換部240、宛先設定部250の順に処理させる。制御部210は、これらの処理が完了したら、その電子メールを送信部260に送出する。

0043

本実施形態では、制御部210は、各部(第一変換部220、翻訳部230、第二変換部240、および宛先設定部250等)に処理に必要なデータを送信し、処理の結果生成したデータを各部から受信する、という処理を順に実行する。

0044

また、制御部210は、電子メールを受信すると、受信した電子メールの翻訳方向を特定する。翻訳方向とは、その電子メールに含まれる文章を、どの言語からどの言語へと翻訳させるか、に関する事項である。制御部210は、たとえば、その電子メールの宛先に含まれるメールアドレス(すなわち、その電子メールが翻訳制御装置31に受信される理由となったメールアドレス)から、翻訳方向を特定する。たとえば、その電子メールが、「Trans_JE@aaaaa.com」を宛先として指定していた場合は、翻訳方向は日本語から英語の方向である、と特定する。たとえば、その電子メールが、「Trans_EJ@aaaaa.com」を宛先として指定していた場合は、翻訳方向は英語から日本語の方向である、と特定する。

0045

なお、翻訳制御装置31が受信する全ての電子メールについて翻訳方向が予め1種類と決まっている場合は、上記の翻訳方向を特定する工程は不要である。

0046

また、別の態様では、制御部210が、翻訳方向をメールアドレス以外から特定する方法以外の方法で特定してもよい。たとえば、制御部210は、電子メールとともに翻訳方向の指定を表す情報を受け取ってもよい。たとえば、送受信装置10が電子メールのヘッダに翻訳方向の指定を含め、制御部210は、ヘッダからその指定を読み取ることで翻訳方向を特定してもよい。あるいは、たとえば、制御部210は、電子メールの文章に用いられている言語を解析し、引用文でない文に用いられている言語を翻訳対象の言語であると特定し、引用文に用いられている言語を翻訳文の言語であると特定してもよい。

0047

制御部210は、第一変換部220に、少なくとも受け取った電子メールの内容である文章(いわゆる、本文)を送出する。制御部210は、第一変換部220に、受け取った電子メールをそのまま送出してもよい。

0048

第一変換部220は、少なくとも文章を、制御部210から受け取る。第一変換部220は、制御部210から受け取った文章に含まれる制御コードを検出し、検出した制御コードに基づき、文章を加工する。

0049

制御コードとは、文章に含まれ、その文章の、翻訳に関わる情報を示す文字列(1つ以上の文字コード)である(具体例は後述する)。制御コードは、所定のルールに基づいて生成される。(制御コードの生成はたとえば第二変換部240によって行われるが、これについては後述する。)

0050

制御コードは、たとえば、「処理済」の文を示す。「処理済」の文とは、既に翻訳が実施された原文、および、翻訳により生成した翻訳文である。制御コードは、各文の先頭およびまたは末尾に添えられ、その直後又直前の文が処理済の文であるかを示してもよい。または、制御コードは、複数の文を含む範囲について、その範囲に含まれる文が処理済の文であることを示してもよい。

0051

なお、既に述べたように、「文」とは必ずしも読点までを区切りとするひとまとまりの文字列でなくともよい。「文」をどのようなまとまりで捉えるかは、各実施の形態のそれぞれで自由に設計されてよい。

0052

第一変換部220は、まず、受け取った文章から制御コードを検出する。制御コードが検出されたら、その制御コードが意味する情報(たとえば、その文が処理済であること)を特定する。別の言い方では、第一変換部220は、制御コードを解釈する。

0053

図3は、文章中の、制御コードが記載される位置の一例を表す図である。図3において、網掛け矩形が示されている位置が、制御コードが記載される位置である。すなわち、図3の例では、制御コードは、各文の末尾に記載される。この場合、第一変換部220は、この制御コードを解釈することで、この制御コードの直前に記載された文の翻訳に関わる情報を得る。

0054

「処理済」の文を示す制御コードは、複数の種類があってよい。図4に、制御コードの種類の一例を示す。図4の表は、左欄に示される文字コードの組み合わせ(制御コード)が検出された場合には、第一変換部220が、その組み合わせが検出された直前の文を右欄に記載される種類の文であると解釈する、というルールを表している。たとえば、制御コードが「09 2008 3000」である場合、すなわち、制御コードが「09」である文字、「2008」である文字および「3000」である文字の並びであった場合は、その制御コードが付与された文は、「日本語の原文で、英語に翻訳済である」と解釈される。なお、「09」、「2008」、「3000」は、それぞれ、水平タブ、PUNCUATION SPACE、和字間隔、を表す文字コードである。

0055

制御コードは、その制御コードが情報を与える文の範囲に関する情報を含んでいてもよい。たとえば、制御コードは、その制御コードが情報を与える文の文字数単語数、特定の文字が含まれる数、または、文の最初と最後の文字とその距離、などを含んでいてもよい。

0056

制御コードの組み合わせに用いられる文字コードは、その表示がメールの可読性を損ないにくい文字コードであるのが望ましい。たとえば、制御コードに用いられる文字コードがすべて空白文字であれば、メールの可読性は損なわれにくい。空白文字であれば、ユーザが視認しにくいため、ユーザの手によって削除されるおそれが低い。なお、使用される空白文字には、THIN SPACEやPUNCTUATION SPACEなどの「スペース」の他、いわゆる「タブ」(水平タブなど)が含まれていてもよい。

0057

参考として、図5に、制御コードに用いられうる空白文字の例の一覧を示す。図5において、左欄は空白文字の名称、右欄はその文字コードが示される。

0058

また、制御コードは、文章を表示する装置やソフトウェアの仕様上、表示する対象から除かれる文字列(たとえばhtml形式で表示される文章中の、「<!−−」で始まり「−−>」で終わる文字列など)でもよい。換言すれば、制御コードは、文書を閲覧する閲覧者には明示的に表示されない文字であるのが好ましい。

0059

なお、本実施形態では、「処理済の文」に対し、未だ翻訳されていない、かつ翻訳文ではない文を「未処理の文」と呼ぶ。図3の例においては、末尾に制御コードが付加されていない文が、未処理の文である。すなわち、図3の例のように、制御コードが一文(sentence)ごとに付加される実施態様では、制御コードがピリオド等の読点の直後に付加されていない一文が、未処理の文である。また、たとえば、制御コードが行ごとに付加される実施態様では、制御コードがない行の文が、未処理の文である。また、たとえば、制御コードが、処理済の文の範囲の情報を含んでいる場合は、その範囲の外にある文が、未処理の文である。このようにして、未処理の文は、特定可能である。

0060

第一変換部220は、以上のようなルールに従い、受け取った文章に含まれる制御コードに基づいて、少なくとも処理済の文を特定する。たとえば、翻訳制御装置31が、以上のようなルールを示すテーブルを保持していてもよい。第一変換部220は、そのテーブルを参照して、制御コードを解釈してもよい。

0061

第一変換部220は、検出した制御コードに基づき、文章を加工する。具体的には、第一変換部220は、制御コードを、各文の翻訳に関わる情報を明示的に示す文字列(以下、「翻訳情報」)に変換する。本実施形態では、この処理を、「文章を構造化する」と称することもある。

0062

図6は、構造化された文章の一例を示す図である。図6のように、たとえば、構造化された文章では、「<訳文英語>」「<原文日本語翻訳済>」などの文字列により表される、翻訳情報が、それぞれの文の先頭に付加されている。たとえば、「<訳文 英語>」との文字列は、その文字列が付加された文が、英語による翻訳文であることを意味する。たとえば、「<原文 日本語 翻訳済>」との文字列は、その文字列が付与された文が、日本語による原文であり、翻訳が実行されたことがあることを意味する。図示されないが、翻訳情報は、「<原文 日本語 翻訳済(英語)>」のように、翻訳済みの文がどの言語に翻訳済みであるかを示す情報を含んでもよい。図6に示されるように、第一変換部220は、それぞれの文の終わりに、翻訳情報の終わりを示す文字列(「</原文 日本語 翻訳済>」等)を付与してもよい。これにより、文が、翻訳情報の始まりを示す文字列と翻訳情報の終わりを示す文字列で、いわゆるタグのように挟まれることにより、それぞれの文の翻訳情報を把握することが容易になる。

0063

第一変換部220は、制御コードが付与されていなかった文に対して「未処理」の文であることを示す翻訳情報を付与してもよい。未処理の文を特定する方法の例は、上述した通りである。たとえば、図3の例において、“I’ll answer your questions by tomorrow.”という一文には制御コードが付与されていないため、第一変換部220は、その文を未処理の文であると特定してもよい。そして、第一変換部220は、図6に示されるように、上記の文に対して、「<原文英語未翻訳>」という翻訳情報を付与してもよい。このようにして、第一変換部220は、処理済の文だけでなく未処理の文にも翻訳情報を付与してもよい。この際、第一変換部220は、未処理の文の言語を特定してもよい。言語を特定する方法は、一般に知られている方法でよい。

0064

上記のように第一変換部220が制御コードに代えて文に翻訳情報を付与する(構造化する)ことを、本実施形態では第一変換とも呼ぶ。第一変換部220は、解釈が済んだ制御コードを削除してもよい。

0065

翻訳情報は、制御部210が翻訳の対象の文の抽出を行う際に参照される。制御部210は、構造化された文章から、翻訳の対象となる文を抽出して、翻訳部230に送信する。翻訳の対象となる文(以下、「翻訳対象」)は、たとえば、未だ翻訳方向の先の言語(以下、翻訳言語)へと翻訳されていない、翻訳文ではない文である。たとえば、制御部210は、未処理の文をすべて翻訳対象として抽出する。ただし、制御部210は、未処理の文のうち、翻訳言語で記述された文を特定し、その文を抽出する文から除外してもよい。制御部210は、また、翻訳済の文のうち、翻訳言語へは翻訳されたことがない原文についても、翻訳対象として抽出してよい。

0066

たとえば、図6の例で、翻訳方向が英語から日本語の方向である場合、翻訳対象は「<原文英語 未翻訳>」のタグにより挟まれた文「I’ll answer your questions by tomorrow.」である。このように、制御部210は、翻訳対象を翻訳情報に基づいて特定し、抽出する。

0067

なお、第一変換部220が未処理の文については翻訳情報を付与しない実施形態もあってもよい。その場合、制御部210は、翻訳情報が付与されていない文を、未処理の文として特定すればよい。また、制御部210は、特定した未処理の文に翻訳情報を付与してもよい。このとき、制御部210は、未処理の文の言語を特定してもよい。

0068

翻訳部230は、翻訳方向の指定に基づき、受け取った文の翻訳文を生成する。すなわち、翻訳部230は、文と翻訳方向の指定とを(たとえば制御部210から)受け取り、受け取った文を指定された翻訳方向に翻訳する。文を翻訳する機能を有する装置やプログラムは一般によく知られているため、翻訳部230の具体的な処理やアルゴリズムの説明は省略する。翻訳部230は、翻訳によって生成した文、すなわち翻訳文を、制御部210に送出する。

0069

制御部210は、翻訳部230から受け取った翻訳文を、構造化された文章に挿入する。図7は、翻訳文が付与された文章の例を示す図である。制御部210は、翻訳文に対して、「処理済」の文であることを表す翻訳情報を付与する。図7の例においては、新たに生成された翻訳文である「あなたの質問には明日までにお答えしたいと思います。」という文に、翻訳情報として文字列「<訳文日本語>」が付加されている。また、制御部210は、翻訳対象であった文の翻訳情報を、「処理済」の文であることを表す翻訳情報に更新する。たとえば、図6に示す翻訳対象であった文のタグ「<原文英語未翻訳>」が、図7の例において「<原文 英語 翻訳済>」へと変更されている。制御部210は、このような翻訳情報の更新の後、構造化された文章を第二変換部240に送出する。

0070

第二変換部240は、(たとえば制御部210から)受け取った文章に含まれる、翻訳情報を制御コードに変換する。すなわち、第二変換部240は、いわば、第一変換部220とは逆の加工を、受け取った文章に対して行う。第二変換部240による文章に対する加工処理は、本実施形態では第二変換とも呼ばれる。

0071

たとえば、第二変換部240は、翻訳情報を、第一変換部220が変換時に用いるルールと同じルールに基づいて「制御コード」に変換する。

0072

図7の例に基づけば、第二変換部240は、「<原文英語翻訳済>」のタグに挟まれた文の末尾に、水平タブと、PUNCTUATION SPACEと、スペースとの3つを制御コードとして付加する。制御コードを付加したら、第二変換部240は、制御コードを付加した文を囲っている「<原文 英語 翻訳済>」の文字列および「</原文 英語 翻訳済>」の文字列を、文章から削除してよい。

0073

第二変換によって、構造化されていた文章は、構造化されていない、制御コードが付加された文章となる。図8は、第二変換が行われたあとの文章の例を示す図である。制御コードが空白文字から成る場合は、図8のように制御コードが明示的に表示されないため、制御コードにより可読性は損なわれない。

0074

第二変換部240は、第二変換が完了した文章を制御部210に送出する。

0075

宛先設定部250は、受信した電子メールの宛先、および返信先等を設定する。より具体的には、例えば、次のように返信先を設定する。

0076

例として、受け取った電子メールの「From」にYamada@aaaaa.comが、「To」にTom@aaaaa.comおよびTrans_JE@aaaaa.comが、「Cc」にxyz@aaaaa.comが、それぞれ記載されていたとする。すると、宛先設定部250は、「From」にTrans_JE@aaaaa.comを、「To」にTom@aaaaa.comを、「Cc」にxyz@aaaaa.comを、そして「Reply to」にYamada@aaaaa.comおよびTrans_EJ@aaaaa.comを、設定する。「Reply to」は、電子メールの受信者がこの電子メールに返信する場合に、自動的に宛先として設定されるメールアドレスが記載される部分である。

0077

このように、宛先設定部250は、「Reply to」に、送信者が指定した翻訳方向の逆向きの翻訳を行うためのメールアドレス(Trans_EJ@aaaaa.com)を設定する。こうすることで、この電子メールの受信者(Tom@aaaaa.com)が返信を行う場合に、宛先を編集しなくとも、返信者側の使用言語が元の送信者側の使用言語に変換されるような翻訳を、翻訳制御装置31がその返信のメールに対して行うことが可能になる。

0078

宛先設定部250は、宛先および返信先の変更を、ヘッダの書き換えによって行ってもよい。あるいは、宛先設定部250が宛先および返信先を決定し、制御部210がその特定された情報に基づいてヘッダを変更してもよい。

0079

送信部260は、翻訳文が付加された電子メールを送信する。送信部260は、たとえば、制御部210から電子メールを受け取る。送信部260は、その電子メールの宛先に書かれたメールアドレスに基づき、電子メールを送信する。送信部260は、たとえば、メーラ等を実行するプロセッサである。受信部200と送信部260とは、全部または一部が一つの構成により実現されていてもよい。

0080

<動作>
図9のシーケンス図に基づき、翻訳制御装置31の各部の処理の流れを説明する。ただし、説明される処理の順番は一例である。処理の順番は、最終的に出力される結果に影響を与えない限り適宜変更されてよい。

0081

送受信装置10−1によって、「Trans_JE@aaaaa.com」を宛先に含む電子メールが送信されたとする。受信部200は、この電子メールを受信する。制御部210は、受信部200から、この電子メールを受け取る(ステップS91)。

0082

制御部210は、受け取った電子メールの宛先から、翻訳方向を決定する(ステップS92)。この例においては、宛先に含まれるメールアドレスが、日本語から英語への翻訳を指定するメールアドレスとして定められているメールアドレスであるので、制御部210は、翻訳方向を日本語から英語への方向であると決定する。制御部210は、電子メールの内容である文章を第一変換部220に送出する。

0083

第一変換部220は、受け取った文章に対して第一変換を行う。具体的には、第一変換部220は、文章に含まれる制御コードを検出する。そして、第一変換部220は、制御コードに基づき、翻訳情報を表す文字列を、制御コードに代えて文章に付与する(ステップS93)。すなわち、第一変換部220は、文章を構造化する。第一変換部220は、構造化された文章を制御部210に送出する。

0084

制御部210は、構造化された文章から、翻訳情報に基づき、翻訳対象の文を抽出する(ステップS94)。制御部210は、抽出した文を翻訳部230に送出する。

0085

翻訳部230は、受けとった文を翻訳し、その結果生成する翻訳文を生成する(ステップS95)。翻訳部230は、翻訳文を制御部210に送出する。

0086

制御部210は、翻訳部230から受け取った翻訳文を、文章に付加する(ステップS96)。また、制御部210は、文章中の翻訳情報の内容を更新する(ステップS97)。たとえば、制御部210は、翻訳対象として抽出された未翻訳の文の翻訳情報を、「処理済」を示す翻訳情報に変更する。

0087

制御部210は、次に、翻訳情報が更新された文章を第二変換部240に送出する。

0088

第二変換部240は、受け取った文章に対し第二変換を行う(ステップS98)。具体的には、第二変換部240は、文章中の翻訳情報に基づき、翻訳情報に代えて、制御コードを文章に付与する。これにより、構造化されていた文章は、構造化されていない(ただし制御コードによって翻訳に関する情報が記録された)文章となる。

0089

宛先設定部250は、この電子メールの宛先を設定する(ステップS99)。この処理は上記された他の処理の前に行われてもよい。宛先設定部250は、宛先に元の電子メールの宛先に含まれていたメールアドレス(翻訳制御装置31のメールアドレスを除く)を設定する。また、宛先設定部250は、返信先として元の電子メールの送信者と、「Trans_EJ@aaaaa.com」とを設定する。

0090

制御部210は、上記ステップS93からステップS99の処理が施された電子メールを、送信部260に送出する(ステップS100)。送信部260は、制御部210から受け取った電子メールを、設定されている宛先へ送信する。

0091

以上の処理により、翻訳文と、翻訳情報が符号化された制御コードとが付与された電子メールが、電子メールの宛先である送受信装置(10−2)に送信される。

0092

<効果>
第1の実施形態に係る翻訳システム21(翻訳制御装置31)によれば、翻訳が不要な文が翻訳されず、翻訳が必要な文が翻訳された電子メールが、宛先に送られる。第一変換部220が制御コードの変換により翻訳の不要な文(たとえば翻訳済の原文や翻訳文)を明らかにし、翻訳部230が翻訳の不要な文については翻訳しないからである。

0093

また、制御コードが、空白文字のようにユーザに感知されにくい文字によって構成されることにより、メールの可読性を損なわずに上記の制御が達成されることができる。

0094

以上のように、このような構成により、特に電子メールのやりとりを繰り返した場合に、翻訳の繰り返しによってメールの可読性が低下することを防ぐことができる。

0095

<<変形例1>>
第1の実施形態の例として説明された図2の構成は一例である。たとえば、1つの装置(翻訳制御装置31)が図2に示される全ての構成を備える必要はない。例として、図10に、翻訳システム20の別の一例である翻訳システム22の構成を示す。翻訳システム22では、翻訳制御装置32が第一変換部220および第二変換部240を備え、翻訳制御装置32の外部に、第1の実施形態と同様の受信部200と制御部210と送信部260と翻訳部230と宛先設定部250とが構成される。受信部200、制御部210、送信部260、翻訳部230、および宛先設定部250は、それぞれ別々の装置によって構成されてもよいし、一部または全部が同一の装置によって構成されてもよい。

0096

このような構成であっても、第1の実施形態で説明された機能および動作は実現される。

0097

<<変形例2>>
図11は、翻訳システム20のさらに別の一例である翻訳システム23の構成を示すブロック図である。この実施形態では、翻訳制御装置33が、制御部210に通信可能に接続される。

0098

この実施形態の場合、制御部210は、受け取った電子メールの文章と翻訳方向とを翻訳制御装置33に送出する。翻訳制御装置33は、制御部210から受け取った文章について翻訳を行う機能を提供する。翻訳制御装置33は、第1の実施形態における第一変換部220、翻訳部230、および第二変換部240による処理と同等の工程を、制御部210による制御処理を介さずに行ってもよい。ただし、本翻訳システム23では、文章を構造化する工程および構造化された文章を元に戻す工程は省略されてよい。翻訳制御装置33の具体的な構成は、以下の通りである。

0099

図11の通り、翻訳制御装置33は、検出部2201と翻訳制御部2202と翻訳部230とコード生成部241とを備える。

0100

検出部2201および翻訳制御部2202は、いわば、第1の実施形態の第一変換部220の代わりとなる部である。検出部2201は、受け取った文章に含まれる制御コードを検出する。翻訳制御部2202は、検出された制御コードに基づいて、翻訳部230に翻訳させる文を決定する。具体的には、たとえば、翻訳制御部2202は、制御コードによって「処理済」であると示されていない文を、翻訳させる文として決定する。翻訳制御部2202は、翻訳させる文を翻訳部230に送出する。

0101

翻訳部230は、第1の実施形態の翻訳部230と同様、受け取った文の翻訳文を生成する。翻訳部230は、翻訳文をコード生成部241に送出する。

0102

コード生成部241は、第1の実施形態の第二変換部240の代わりとなる部である。コード生成部241は、翻訳文を含む文章に制御コードを(生成して)挿入する。コード生成部241は、たとえば、翻訳部230から翻訳文を受け取る。そしてコード生成部241は、翻訳文に、少なくとも処理済であることを示す制御コードを付与する。コード生成部241は、翻訳制御部2202などから翻訳前の文章を受け取り、受け取った文章と翻訳文とを合わせてもよい。

0103

翻訳制御部2202またはコード生成部241は、翻訳された元の文の制御コードを、処理済を示す制御コードに変換してもよい。

0104

コード生成部241は、制御コードが付与された文章を、制御部210に送出する。

0105

なお、第1の実施形態で説明した宛先設定部250は、翻訳制御装置33の内部にあっても、外部にあってもよい。制御部210が宛先設定部250と同様の機能を備えていてもよい。

0106

本構成によっても、第1の実施形態と同様の効果を得ることができる。

0107

<<情報処理システムの変形例>>
情報処理システム1においてやりとりされるデータの一部または全部は、必ずしもメール形式のデータでなくともよい。以下に情報処理システム1の変形例を記載する。

0108

(1)送受信装置10−1が翻訳システム20にデータを直接送信可能であるならば、送受信装置10−1が翻訳システム20に対し送信するデータは、メール形式のデータでなくともよい。たとえば、送受信装置10−1は、翻訳システム20に対し、文章と、翻訳方向の指示と、翻訳文の受け取り先の指示を送信する。翻訳システム20は、受け取った文章と、翻訳方向の指示とに基づき、翻訳制御を行った上で文章を翻訳文を生成し、文章に翻訳文と制御コードとを付与する。翻訳システム20は、翻訳文と制御コードとが付与された文章を、指示されている受け取り先に向け送信する。

0109

(2)翻訳システム20が送受信装置10−2にデータを直接送信可能であるならば、翻訳システム20が送受信装置10−2に対し送信するデータは、メール形式のデータでなくともよい。たとえば、翻訳システム20が宛先から送受信装置10−2の識別子(IP(Internet Protocol)アドレス等)を特定したり、送受信装置10−1が受け取り先の指示として送受信装置10−2の識別子を指示したりすれば、翻訳システム20は文章を電子メール形式で送信する必要はない。

0110

(3)翻訳システム20が受信する文章が必ず送受信装置10−2宛であるような構成では、送受信装置10−1は宛先に送受信装置10−2のメールアドレスを設定したり、受け取り先の指示を行ったりする必要がない。このようなケースは、たとえば、翻訳システム20が、送受信装置10−2が受け取る文章を翻訳するために情報処理システム1に組み込まれているケースである。送受信装置10−1が翻訳システム20に対して文章(と、必要ならば翻訳方向と)を送信するだけで、送受信装置10−2は翻訳システム20による処理結果を受け取ることができる。

0111

<<第2の実施形態>>
上述の情報処理システムの変形例で説明した事項を加味した上で想定されうる、本発明の実施形態の1つの例を、第2の実施形態として説明する。第2の実施形態では、文書を作成する文書作成部11に対し、翻訳システム24による翻訳のサービスが提供される。

0112

図12は、翻訳システム24が適用される情報処理システム2の構成例を示すブロック図である。本実施形態では、文書作成部11が、翻訳システム24に、通信可能に接続される。具体的には、たとえば、文書作成部11の送信部111と翻訳システム24の受信部200とが接続され、文書作成部11の受信部113と、翻訳システム24の送信部260とが接続される。文書作成部11と翻訳システム24との間の通信は、有線通信でも無線通信でもよい。文書作成部11と翻訳システム24とは、1つの装置の内部で、回路によって接続されていてもよい。

0113

文書作成部11は、文書を作成する。作成される文書は、電子的なデータである。文書作成部11は、文書を作成する1つの装置であってもよい。文書作成部11は、たとえば、メーラや文書作成ソフトを実行するプロセッサである。

0114

文書作成部11は、送信部111と、編集部112と、受信部113とを備える。

0115

編集部112は、文書を編集する。編集部112は、たとえば人による文字入力の指示等に従い、文書中の文章に新たに文を追加したり、消去したりする。なお、文書作成部11は、文書をユーザに表示する制御を行う表示制御部を有していてもよい。

0116

送信部111は、作成した文書に含まれる文章の一部または全部を、翻訳システム24に送信する。

0117

翻訳システム24は、受信部200、制御部210、検出部2201、翻訳制御部2202、翻訳部230、コード生成部241、および送信部260を含む。

0118

翻訳システム24の受信部200は、少なくとも、文書作成部11により作成された文書中の文章を、受信する。

0119

翻訳システム24は、第1の実施形態の変形例2で説明された(図2に示される)翻訳制御装置31のような、1つの装置でもよい。翻訳システム24中の構成の全部または一部が、1つの装置やモジュールによって構成されていてもよい。

0120

検出部2201、翻訳制御部2202、翻訳部230およびコード生成部241は、それぞれ第1の実施形態の変形例2の検出部2201、翻訳制御部2202、翻訳部230およびコード生成部241の機能と同等の機能を有する。すなわち、検出部2201は、文章に含まれる制御コードを検出する。翻訳制御部2202は、制御コードに基づき、翻訳不要な文を特定する。そして、翻訳制御部2202は、翻訳部230に翻訳させる文を決定する。または、翻訳制御部2202は、翻訳情報を制御部210に送信し、制御部210が、翻訳部230に翻訳させる文を決定してもよい。また、翻訳制御部2202または制御部210は、翻訳される文として決定された文に係る制御コードを更新する。翻訳部230は、翻訳される文として決定された文を翻訳し、翻訳文を生成する。コード生成部241は、少なくとも翻訳文を含む文章に対して、制御コードを付与する。

0121

送信部260は、上記の処理を経て生成された文章を、文書作成部11に送信する。生成される文章は、たとえば、受信部200が受信した文章に翻訳文が付加された上で、制御コードの更新および付与が施された文章である。

0122

文書作成部11の受信部113は、文を翻訳システム24から受信する。編集部112は、受信部113が受信した文章を再び編集してもよい。

0123

本構成により、翻訳システム24は、文書作成部11から受信した文章から、翻訳が不要な文を特定し、翻訳される文を決定し、決定された文の翻訳文を文書作成部11に送信する。また、翻訳システム24により送信される文章には、すなわち翻訳情報を意味する制御コードが含まれる。これにより、次に制御コードの意味を解釈する機能を有するシステム(無論、当該翻訳システム24でもよい)が当該文章の翻訳を行う場合に、翻訳されなくともよい文が翻訳されない。

0124

したがって、本翻訳システム24は、翻訳の繰り返しによって文章の可読性が低下することを防ぐことができる。

0125

<<第3の実施形態>>
制御コードを含む文章がユーザによって利用され、または編集される際に、制御コードが誤って削除されたり、書き換えられたりする可能性がある。そのような場合に備えるための処理を行う実施形態として、本発明の第3の実施形態を説明する。

0126

第3の実施形態は、第1の実施形態の翻訳制御装置31の第一変換部220および第二変換部240の処理に更なる処理が追加される態様である。第3の実施形態の構成は第1の実施形態と同様である。各部の機能および動作も、以下記載される点以外については第1の実施形態と同様でよい。

0127

第3の実施形態の第二変換部240の処理について説明する。

0128

第二変換部240は、第二変換において、文章に制御コードを付与する処理に加え、「復元情報」を生成し付与する処理を行う。

0129

復元情報は、制御コードが示す情報を保証する情報である。復元情報は、たとえば、翻訳情報が(たとえばユーザの編集操作によって)変化したり消去されたりした場合に、翻訳情報を復元するための情報である。

0130

復元情報の例は、次の通りである。たとえば、復元情報は、文章に付与された制御コードを順番に並べて記載した文字列である。たとえば、復元情報は、文章に付与された制御コードの種類とそれぞれの種類の数とを記載した文字列である。復元情報は、制御コードそれぞれの、位置を示す情報(以下、「位置情報」)を含んでもよい。位置情報は、たとえば、文章中の特定の位置からその制御コードまでの、行数、文字数、単語数、句点の数、または特定の文字の数、等である。特定の位置は、文頭文末の他、特定の文字列がある位置や、直前直後の制御コードがある位置等でもよい。復元情報は、制御コードの種類とその位置情報との組を示す文字列として予め定められる、「復元コード」を用いて表されてもよい。

0131

たとえば、第二変換部240は、復元情報として、文章に付与された制御コードとその位置情報との組を表す復元コードを、文章の最後に記載する。

0132

復元コードの例は、次の通りである。たとえば、制御コードが「水平タブ」+「THIN SPACE」+「SPACE」であり、その位置情報が「20」であった場合、復元コードは「ENSPACE」+「SPACE」であると定められる。たとえば、制御コードが「水平タブ」+「THIN SPACE」+「SPACE」であり、その位置情報が「21」であった場合、復元コードは「ENSPACE」+「NO−BREAK SPACE」であると定められる。このように、制御コードの種類と位置情報を表す値との組み合わせのそれぞれについて、復元コードが定められていれば、復元コードから、各制御コードの種類と位置とが特定される。ただし、必ずしも組み合わせと復元コードの種類との関係は一意でなくともよい。なお、上記のように、復元コードも制御コード同様、空白文字等、閲覧者に明示的に表示されない文字列から成ることにより、復元コードが文章の可読性を低下させるおそれや、閲覧者に復元コードが消去されるおそれを抑えることができる。

0133

第二変換部240の処理の流れの一例を次に示す。この例では、受け取った文章が構造化されているとする。第二変換部240は、受け取った文章に含まれる翻訳情報を示す文字列を制御コードに変換し、翻訳情報を示す文字列を消去する。次に、第二変換部240は、変換によって生成された制御コードの各々の位置情報を取得する。そして、第二変換部240は、制御コードの種類およびその位置情報の組を示す復元コードを生成し、文章の最後に、その復元コードを順に追加する。第二変換部240は、復元コードを追加する際、適当な、予め定められた空白文字等によって、復元コードの1つ1つを切り離してもよい。

0134

第一変換部220は、第一変換において、文章の構造化の処理の前に、復元情報に基づき、制御コードが編集されたことや欠落していることを検出する。具体的には、第一変換部220は、文章中の検出された制御コードと、復元情報が示す情報とが整合するかを調べる。たとえば、復元情報が復元コードの羅列である場合、第一変換部220は、復元コードが示す情報と現に存在する制御コードの種類および位置とが整合するかをチェックする。この時、文章に追加された未処理の文によって制御コードの絶対的な位置は変化している可能性がある。したがって、第一変換部220は、未処理の文を特定し、考慮した上で、制御コードの位置と復元情報が示す情報とが整合するかをチェックする。一方、たとえば、復元情報が文章中の制御コードの羅列である場合、第一変換部220は、文章中の制御コードがその羅列された順に存在しているかを調べればよい。

0135

制御コードと復元情報との間の整合性が取れなかった場合、第一変換部220は、復元情報に基づいて制御コードを補正(変更、または追加、または削除)する。

0136

第一変換部220は、復元情報に基づくチェックが完了したら、復元情報を消去してもよい。

0137

第一変換部220は、実施の態様によっては、復元情報を消去しなくてもよい。この場合、第二変換部240は、新たに追加された制御コードおよび更新された制御コードについてのみ復元情報を生成しまたは更新すればよい。

0138

以上のような構成により、翻訳制御装置31は、より安定的に、翻訳の制御を行うことができる。

0139

なお、本実施形態で説明される第一変換部220の機能が、他の実施形態で説明された翻訳制御部2202に実装されてもよい。本実施形態で説明される第二変換部240の機能が、他の実施形態で説明されたコード生成部241に実装されてもよい(次の変形例を参照)。

0140

<補正の処理の例>
上記第3の実施形態で説明された第一変換部220の機能および動作が、図11または図12に示される(上記第1の実施形態の変形例2、または上記第2の実施形態の)検出部2201および翻訳制御部2202により実装される場合の、検出部2201および翻訳制御部2202の処理の流れの一例を説明する。この例では、復元情報が復元コードの羅列で表されているとする。

0141

図13は、上記のような場合における、検出部2201および翻訳制御部2202による制御コードの補正の処理手順の例である。

0142

まず、検出部2201が、文章に含まれる復元情報(この例では、復元コードの並び)を検出する(ステップS131)。翻訳制御部2202は、この復元情報が示す、制御コードの種類とその位置情報との組を取得する(ステップS132)。

0143

次に、検出部2201は、文章中の制御コードを検出する(ステップS133)。そして、検出部2201は、制御コードが付されている文を特定する。そして、検出部2201は、制御コードの位置情報も特定する。このとき特定される位置情報は、たとえば、未処理の文(すなわち制御コードが検出されなかった文)を無視して特定される位置情報である。こうして、検出部2201は、文書中の制御コードと、その位置情報をすべて検出する。

0144

そして、翻訳制御部2202は、復元情報と、検出された制御コードとが整合しているかを調べる(ステップS134)。すなわち、翻訳制御部2202は、復元情報から取得された制御コードの種類とその位置情報との組と、現に文章中から検出された制御コードの種類とその位置情報との組とが、すべて一致しているかを調べる。そして、制御コードが復元情報に整合しない場合、制御コードを補正する(ステップS135)。

0145

たとえば、検出された制御コードの数が、復元情報が示す制御コードの数よりも少ない場合、制御コードは欠落している可能性がある。この場合、検出部2201は、検出された制御コードと復元情報とに基づき、欠落した制御コードの種類と位置とを特定する。そして、検出部2201は、特定した制御コードを文章中の特定した位置に挿入する。

0146

たとえば、検出された制御コードの数が、復元情報が示す制御コードの数よりも多い場合、制御コードが編集によって挿入されている可能性がある。この場合、検出部2201は、文章中の余分な制御コードを特定し、特定した制御コードを削除する。余分な制御コードがない場合は、復元領域が途中までで欠損している可能性がある。その場合は、翻訳制御部2202は、復元領域を、検出された制御コードに基づいて補正してもよい。

0147

たとえば、制御コードの個数は整合しているが、制御コードの種類が異なる場合、制御コードが編集された可能性がある。この場合、検出部2201は、検出された制御コードを、復元情報に基づく制御コードに変更する。

0148

上記の補正の例は一例である。補正の判定および方法は様々に設計されてよい。上記で説明されなかったケースについても、適宜設計されてよい。

0149

ステップS135における補正が終わると、補正の処理は終了する。

0150

その後、翻訳制御部2202が、文章中の翻訳が不要な文を特定する。すなわち、たとえば、翻訳制御部2202は、補正の処理の後の文章中の制御コードによって、翻訳が不要であると示された文を特定する。そして、翻訳制御部2202は、たとえば、翻訳が不要でない文を抽出し、翻訳部230にその文を送出する。

0151

以上のような処理の流れにより、より安定的な翻訳の制御を実現することができる。

0152

<<第1主要構成>>
図14は、本発明の一実施形態に係る翻訳制御装置の主要な構成を示すブロック図である。翻訳制御装置30は、主要な構成として、検出部2201および翻訳制御部2202を備える。

0153

検出部2201は、テキストに埋め込まれた制御コードを検出する。本開示において、テキストとは、少なくとも1つの文言を含む文字列である。本開示において、文言とは、言語で記述された、意味のある文字のまとまりである。すなわち、文言とは1つ以上の語句のまとまりである。文言は、語、句、節、一文(sentence)、段落、およびそれらの一部分のいずれをも指し得る。上記の各実施形態で言及されていた「文」は、文言の一例である。テキスト中の文言をどのような単位で捉えるかは、翻訳制御装置30の設計においてそれぞれで定められてよい。

0154

制御コードは、そのテキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な情報を表すコードである。制御コードは、たとえば、複数の種類の空白文字のいずれか1つ以上の組み合わせである。または、制御コードは、たとえば、テキストを閲覧する閲覧者には明示的に表示されない文字または文字列から成っていてもよい。制御コードは、テキストを表示させる表示制御部やプログラムが表示させない文字列として設定されている文字列(たとえばhtml形式で表示されるテキスト中の「<!−−」で始まり「−−>」で終わる文字列など)でもよい。なお、上記の表示制御部は、テキストを所定のルールにしたがって読み込み、テキストの内容を表示する機能を提供する部である。表示制御部の一例は、上記各実施形態の送受信装置10、文書作成部11等である。

0155

制御コードは、空白文字と、表示されない文字列として設定されている文字列との組み合わせでもよい。

0156

翻訳制御部2202は、制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する。既に説明された実施形態における第一変換部220は、翻訳制御部2202の一例である。

0157

図15は、翻訳制御装置30の処理の流れを示すフローチャートである。まず検出部2201が、テキストに埋め込まれた制御コードを検出する(ステップS151)。そして、翻訳制御部2202が、制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する(ステップS152)。翻訳制御部2202は、その後、当該テキスト中の翻訳される文言を決定してもよい。

0158

本構成によれば、翻訳の繰り返しによってテキストの可読性が低下するのを防ぐことができる。その理由は、制御コードによって、翻訳が不要な文言が特定可能であることにより、翻訳が不要な文言を翻訳することを回避することができるからである。また、制御コードが、空白文字や、テキストを表示させる表示制御装置やプログラムが表示させない文字列として設定されている文字列から成る場合、テキストの可読性を損なうことなく、上記の制御を達成することができる。

0159

<<第2主要構成>>
上述の翻訳制御装置30と、次に説明する翻訳制御装置30−2とは、相補的な関係にある。図16は、翻訳制御装置30−2の主要な構成を示すブロック図である。

0160

翻訳制御装置30−2は、判別部2401と埋め込み部2402とを備える。

0161

判別部2401および埋め込み部2402の主な動作を、図17のフローチャートを参照しながら説明する。

0162

判別部2401は、テキスト中の少なくとも1つの文言につき、少なくとも、当該文言が翻訳により生成した翻訳文であるか否かまたは翻訳が実行された元の文言であるか否か、を判別する(ステップS171)。たとえば、判別部2401は、翻訳部(不図示)から受け取った文言を、翻訳文であると判別すればよい。たとえば、判別部2401は、翻訳制御部2202の処理を経て翻訳されるべき文言であると決定された文言を受け取った場合に、その文言を翻訳が実行された元の文言であると判別すればよい。判別部2401は、当該文言が翻訳により生成した翻訳文であるか否かだけを判別してもよい。

0163

埋め込み部2402は、判別された文言について、判別結果に基づいた制御コードをテキスト中に埋め込む(ステップS172)。つまり、埋め込み部2402は、たとえば、翻訳により生成した翻訳文であると判別された文言に対して、翻訳不要である文言であることが特定可能な制御コードを付加する。埋め込み部2402は、たとえば、翻訳が実行された元の文言であると判別された文言に対して、翻訳不要である文言であることが特定可能な制御コードを付加する。

0164

既に説明された実施形態における第二変換部240およびコード生成部241は、判別部2401の機能および埋め込み部2402の機能を備える構成の一例である。

0165

たとえば、判別部2401の機能および埋め込み部2402の機能を有する構成として、コード生成部が、上記翻訳制御装置30に備わっていてもよい。

0166

<<第3主要構成>>
本発明の一実施形態に係る翻訳システムは、主要な構成として、検出部2201と翻訳制御部2202と翻訳部2203とを含む。図17は、翻訳システム20の主要な構成を示すブロック図である。

0167

翻訳部2203は、テキストを翻訳する。ただし、翻訳部2203は、翻訳制御部2202によって翻訳が不要な文言であると特定された文言の翻訳をスキップする。

0168

本構成によれば、翻訳の繰り返しによってテキストの可読性が低下するのを防ぐことができる。

0169

(各部を実現させる構成について)
以上、説明した本発明の各実施形態において、各装置の各構成要素は、機能単位のブロックを示している。各装置の各構成要素の一部または全部は、例えば図19に示すようなコンピュータ1900とプログラムとの可能な組み合わせにより実現される。コンピュータ1900は、一例として、以下のような構成を含む。

0170

・CPU(Central Processing Unit)1901
・ROM(Read Only Memory)1902
・RAM(Random Access Memory)1903
・RAM1903にロードされるプログラム1904Aおよび記憶情報1904B
・プログラム1904Aおよび記憶情報1904Bを格納する記憶装置1905
記録媒体1906の読み書きを行うドライブ装置1907
・通信ネットワーク1909と接続する通信インタフェース1908
・データの入出力を行う入出力インタフェース1910
・各構成要素を接続するバス1911
各実施形態における各装置の各構成要素は、これらの機能を実現するプログラム1904AをCPU1901がRAM1903にロードして実行することで実現される。各装置の各構成要素の機能を実現するプログラム1904Aは、例えば、予め記憶装置1905やROM1902に格納されており、必要に応じてCPU1901が読み出す。なお、プログラム1904Aは、通信ネットワーク1909を介してCPU1901に供給されてもよいし、予め記録媒体1906に格納されており、ドライブ装置1907が当該プログラムを読み出してCPU1901に供給してもよい。

0171

各装置の実現方法には、様々な変形例がある。例えば、各装置は、構成要素毎にそれぞれ別個のコンピュータ1900とプログラムとの可能な組み合わせにより実現されてもよい。また、各装置が備える複数の構成要素が、一つのコンピュータ1900とプログラムとの可能な組み合わせにより実現されてもよい。

0172

また、各装置の各構成要素の一部または全部は、その他の汎用または専用の回路、コンピュータ等やこれらの組み合わせによって実現される。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。

0173

各装置の各構成要素の一部または全部が複数のコンピュータや回路等により実現される場合には、複数のコンピュータや回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、コンピュータや回路等は、クライアントアンドサーバシステムクラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。

0174

本願発明は以上に説明した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

0175

上記実施形態の一部または全部は以下の付記のようにも記載され得るが、以下には限られない。

0176

<<付記>>
[付記1]
テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出する検出手段と、
前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、翻訳制御手段と、
を備える翻訳制御装置。
[付記2]
テキスト中の少なくとも1つの文言につき、少なくとも、当該文言が翻訳により生成した翻訳文であるか否かまたは翻訳が実行された元の文言であるか否か、を判別する判別手段と、
判別された文言について、判別結果に基づいた、当該文言が翻訳が不要である文言であるか否かを特定可能な制御コードを、前記テキスト中に埋め込む埋め込み手段と、
を備える翻訳制御装置。
[付記3]
少なくとも1つの前記制御コードは、複数の種類の空白文字のうちのいずれか、または、当該テキストを表示させる表示制御手段が表示させない文字列として設定されている文字列、の少なくともいずれかを1つ以上含む、
付記1または2に記載の翻訳制御装置。
[付記4]
少なくとも1つの前記制御コードは、複数の種類の空白文字の1つ以上の組み合わせから成る、
付記1または2に記載の翻訳制御装置。
[付記5]
少なくとも1つの前記制御コードは、翻訳済みの文言が何の言語に翻訳済みであるかを示す情報を含む、付記1から4のいずれか一項に記載の翻訳制御装置。
[付記6]
翻訳が実行されることで生成された翻訳文を含むテキストに、前記制御コードを生成して埋め込むコード生成手段をさらに含む、付記1に記載の翻訳制御装置。
[付記7]
前記コード生成手段は、前記制御コードが埋め込まれたテキストに、埋め込まれた前記制御コードを示す復元情報を埋め込み、
前記検出手段は、前記復元情報を検出し、
前記翻訳制御手段は、前記復元情報に基づいて当該テキスト中の前記制御コードを補正する、
付記6に記載の翻訳制御装置。
[付記8]
特定のメールアドレスを宛先とする電子メールを受け取り、受け取った電子メールに含まれる本文を前記テキストとして前記検出手段に送出し、受けとった電子メールの宛先のメールアドレスに基づいて翻訳前の言語と翻訳後の言語との組である翻訳方向を決定し、前記決定された翻訳方向を前記翻訳制御手段に送出する制御手段と、
第一の言語から第二の言語へと翻訳された前記電子メールの返信先として、電子メールが前記第二の言語から前記第一の言語へと翻訳されるためのメールアドレスを設定する宛先設定手段と、
をさらに備える、付記1に記載の翻訳制御装置。
[付記9]
テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出する検出手段と、
前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、翻訳制御手段と、
前記テキストを翻訳する手段であって、前記特定された翻訳が不要な文言の翻訳をスキップする翻訳手段と、
を含む翻訳システム。
[付記10]
テキストに含まれる文言の翻訳を行い、翻訳文を生成する翻訳手段と、
少なくとも前記翻訳が実行された前記文言または前記翻訳文のいずれかについて、翻訳が不要である文言であることを示す制御コードを、前記テキスト中に埋め込む埋め込み手段と、
を含む翻訳システム。
[付記11]
テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出し、
前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、
翻訳制御方法。
[付記12]
テキスト中の少なくとも1つの文言につき、少なくとも、当該文言が翻訳により生成した翻訳文であるか否かまたは翻訳が実行された元の文言であるか否か、を判別し、
判別された文言について、判別結果に基づいた、当該文言が翻訳が不要である文言であるか否かを特定可能な制御コードを、前記テキスト中に埋め込む、
翻訳制御方法。
[付記13]
少なくとも1つの前記制御コードは、複数の種類の空白文字のうちのいずれか、または、当該テキストを表示させる表示制御手段が表示させない文字列として設定されている文字列、の少なくともいずれかを1つ以上含む、
付記11または12に記載の翻訳制御方法。
[付記14]
少なくとも1つの前記制御コードは、複数の種類の空白文字の1つ以上の組み合わせから成る、
付記11または12に記載の翻訳制御方法。
[付記15]
少なくとも1つの前記制御コードは、翻訳済みの文言が何の言語に翻訳済みであるかを示す情報を含む、付記11から14のいずれか一項に記載の翻訳制御方法。
[付記16]
翻訳が実行されることで生成された翻訳文を含むテキストに、前記制御コードを生成して埋め込む、付記11に記載の翻訳制御方法。
[付記17]
前記制御コードが埋め込まれたテキストに、埋め込まれた前記制御コードを示す復元情報を埋め込み、
前記復元情報を検出し、
前記復元情報に基づいて当該テキスト中の前記制御コードを補正する、
付記16に記載の翻訳制御方法。
[付記18]
特定のメールアドレスを宛先とする電子メールを受け取り、受け取った電子メールに含まれる本文を前記テキストとして扱い、受けとった電子メールの宛先のメールアドレスに基づいて翻訳前の言語と翻訳後の言語との組である翻訳方向を決定し、
第一の言語から第二の言語へと翻訳された前記電子メールの返信先として、電子メールが前記第二の言語から前記第一の言語へと翻訳されるためのメールアドレスを設定する、
付記11に記載の翻訳制御方法。
[付記19]
テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出し、
前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定し、
前記テキストを、前記特定された翻訳が不要な文言の翻訳をスキップしつつ翻訳する、
を含む翻訳方法
[付記20]
テキストに含まれる文言の翻訳を行い、翻訳文を生成し、
少なくとも前記翻訳が実行された前記文言または前記翻訳文のいずれかについて、翻訳が不要である文言であることを示す制御コードを、前記テキスト中に埋め込む、
翻訳方法。
[付記21]
コンピュータに、
テキストに埋め込まれた制御コードであって、当該テキスト中の少なくとも1つの文言について翻訳が不要である文言であるか否かが特定可能な制御コードを検出する検出処理と、
前記制御コードに基づいて、当該テキスト中の翻訳が不要な文言を特定する、翻訳制御処理と、
を実行させるプログラム。
[付記22]
コンピュータに、
テキスト中の少なくとも1つの文言につき、少なくとも、当該文言が翻訳により生成した翻訳文であるか否かまたは翻訳が実行された元の文言であるか否か、を判別する判別処理と、
判別された文言について、判別結果に基づいた、当該文言が翻訳が不要である文言であるか否かを特定可能な制御コードを、前記テキスト中に埋め込む埋め込み処理と、
を実行させるプログラム。
[付記23]
少なくとも1つの前記制御コードは、複数の種類の空白文字のうちのいずれか、または、当該テキストを表示させる表示制御手段が表示させない文字列として設定されている文字列、の少なくともいずれかを1つ以上含む、
付記21または22に記載のプログラム。
[付記24]
少なくとも1つの前記制御コードは、複数の種類の空白文字の1つ以上の組み合わせから成る、
付記21または22に記載のプログラム。
[付記25]
少なくとも1つの前記制御コードは、翻訳済みの文言が何の言語に翻訳済みであるかを示す情報を含む、付記21から24のいずれか一項に記載のプログラム。
[付記26]
翻訳が実行されることで生成された翻訳文を含むテキストに、前記制御コードを生成して埋め込むコード生成処理をコンピュータに実行させる、付記21に記載のプログラム。
[付記27]
前記コード生成処理は、前記制御コードが埋め込まれたテキストに、埋め込まれた前記制御コードを示す復元情報を埋め込み、
前記検出処理は、前記復元情報を検出し、
前記翻訳制御処理は、前記復元情報に基づいて当該テキスト中の前記制御コードを補正する、
付記26に記載のプログラム。
[付記28]
特定のメールアドレスを宛先とする電子メールを受け取り、受け取った電子メールに含まれる本文を前記テキストとして前記検出処理に使用させ、受けとった電子メールの宛先のメールアドレスに基づいて翻訳前の言語と翻訳後の言語との組である翻訳方向を決定し、前記決定された翻訳方向を前記翻訳制御処理に使用させる制御処理と、
第一の言語から第二の言語へと翻訳された前記電子メールの返信先として、電子メールが前記第二の言語から前記第一の言語へと翻訳されるためのメールアドレスを設定する宛先設定処理と、
をさらに備える、付記21に記載のプログラム。

0177

1、2情報処理システム
5通信ネットワーク
10送受信装置
11文書作成部
20〜24翻訳システム
30〜33、30−2翻訳制御装置
111 送信部
112編集部
113 受信部
200 受信部
210 制御部
220 第一変換部
2201 検出部
2202翻訳制御部
2203翻訳部
230 翻訳部
240 第二変換部
241コード生成部
2401判別部
2402 埋め込み部
250宛先設定部
260 送信部
1700コンピュータ
1701 CPU
1702 ROM
1703 RAM
1704Aプログラム
1704B記憶情報
1705記憶装置
1706記録媒体
1707ドライブ装置
1708通信インタフェース
1709 通信ネットワーク
1710入出力インタフェース
1711 バス

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ