図面 (/)

技術 翻訳装置、翻訳システムおよびプログラム

出願人 富士ゼロックス株式会社
発明者 伊藤泰
出願日 2016年7月7日 (4年11ヶ月経過) 出願番号 2016-134715
公開日 2018年1月11日 (3年4ヶ月経過) 公開番号 2018-005749
状態 特許登録済
技術分野 機械翻訳
主要キーワード ゲイトウェイ 配置エラー 翻訳内容 クラウドサーバ アイテムコード 翻訳データ 翻訳語 翻訳文
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2018年1月11日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (12)

課題

複数回の翻訳を行なっても元の原稿の内容が変化しにくい翻訳装置等を提供する。

解決手段

原稿の内容を異なる言語に翻訳する翻訳部504と、翻訳部504が原稿の内容を第1の言語から第2の言語に翻訳したときに、第1の言語による原文と第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部506と、翻訳部504が原稿の内容を第2の言語から他の言語に翻訳するときに、第2の言語により記載された原稿の内容が履歴情報に存在した場合、履歴情報には記載されていない内容を抽出する抽出部507と、翻訳部504により履歴情報には記載されていない内容を第2の言語から他の言語に翻訳した結果と、履歴情報に存在した内容を履歴情報に基づき第2の言語から当該他の言語に置き換えた結果とを合成する合成部508と、を備える翻訳装置。

概要

背景

近年、原語で記載された紙文書電子文書を他言語に翻訳する翻訳サービスが提供されている。この翻訳サービスは、例えば、クラウドサービスとして提供される。これは端末装置等から翻訳サービスを行なうクラウドサーバ原文を送信すると、翻訳された後の訳文送り返されてくるものである。

特許文献1には、読取部によって読み取った原文の原稿の画像データから文字データを抽出し、文字データを指定された言語に翻訳し、翻訳文を原文のレイアウトに仮配置させ、配置エラーの有無を調べ、配置エラーが有る場合に、翻訳文の文字属性を変更する文字属性変更処理を行い、原文のレイアウトに仮配置させ、配置エラーの有無を調べる。そして依然として配置エラーが有る場合に、翻訳結果に基づいて、翻訳の方法を変更する翻訳方法変更処理あるいは翻訳後の文書を変更する翻訳文書変更処理のいずれか一方もしくは両方の処理からなる再翻訳処理を行い、翻訳内容を変更して翻訳文を原文のレイアウトに整合させることが開示されている。
また特許文献2には、文書データベースに原文に対応した最新版の翻訳データが予め存在する場合には、その翻訳データを利用し、翻訳データはなく最新版の文書データが存在している場合、文書データを翻訳処理して翻訳データを得、最新版の文書データおよび翻訳データがない場合、原稿から得た文書データを翻訳処理し、この翻訳データを利用する翻訳サーバが開示されている。

概要

複数回の翻訳を行なっても元の原稿の内容が変化しにくい翻訳装置等を提供する。原稿の内容を異なる言語に翻訳する翻訳部504と、翻訳部504が原稿の内容を第1の言語から第2の言語に翻訳したときに、第1の言語による原文と第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部506と、翻訳部504が原稿の内容を第2の言語から他の言語に翻訳するときに、第2の言語により記載された原稿の内容が履歴情報に存在した場合、履歴情報には記載されていない内容を抽出する抽出部507と、翻訳部504により履歴情報には記載されていない内容を第2の言語から他の言語に翻訳した結果と、履歴情報に存在した内容を履歴情報に基づき第2の言語から当該他の言語に置き換えた結果とを合成する合成部508と、を備える翻訳装置。

目的

本発明は、複数回の翻訳を行なっても元の原稿の内容が変化しにくい翻訳装置等を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

原稿の内容を異なる言語に翻訳する翻訳部と、前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、前記翻訳部が原稿の内容を前記第2の言語から他の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記他の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき当該第2の言語から当該他の言語に置き換えた結果とを合成する合成部と、を備える翻訳装置

請求項2

前記他の言語は、前記第1の言語であり、前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき当該第2の言語から当該第1の言語に置き換えた結果とを合成することを特徴とする請求項1に記載の翻訳装置。

請求項3

前記他の言語は、前記第1の言語および前記第2の言語とは異なる第3の言語であり、前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第3の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき前記第1の言語から当該第3の言語に翻訳し置き換えた結果とを合成することを特徴とする請求項1に記載の翻訳装置。

請求項4

前記履歴情報には存在しない内容は、ユーザが原稿に追加した事項であることを特徴とする請求項1乃至3の何れか1項に記載の翻訳装置。

請求項5

原稿のレイアウト解析するレイアウト解析部をさらに備え、前記翻訳部および前記合成部は、前記レイアウト解析部が解析したレイアウトを維持して翻訳結果を配することを特徴とする請求項1乃至4の何れか1項に記載の翻訳装置。

請求項6

前記抽出部は、前記レイアウト解析部により解析された翻訳対象の位置に基づき、前記履歴情報には存在しない内容を差分として抽出することを特徴とする請求項5に記載の翻訳装置。

請求項7

原稿の内容を翻訳する翻訳手段と、原語により記載された原稿の文書データを前記翻訳手段に送信する文書送信手段と、を備え、前記翻訳手段は、原稿の内容を異なる言語に翻訳する翻訳部と、前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、前記翻訳部が原稿の内容を前記第2の言語から他の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記他の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき当該第2の言語から当該他の言語に置き換えた結果とを合成する合成部と、を備える翻訳システム

請求項8

コンピュータに、原稿の内容を異なる言語に翻訳する翻訳機能と、前記翻訳機能が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成機能と、前記翻訳機能が原稿の内容を前記第2の言語から他の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出機能と、前記翻訳機能により前記履歴情報には存在しない内容を前記第2の言語から前記他の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき当該第2の言語から当該他の言語に置き換えた結果とを合成する合成機能と、を実現させるプログラム

技術分野

0001

本発明は、翻訳装置翻訳システムプログラムに関する。

背景技術

0002

近年、原語で記載された紙文書電子文書を他言語に翻訳する翻訳サービスが提供されている。この翻訳サービスは、例えば、クラウドサービスとして提供される。これは端末装置等から翻訳サービスを行なうクラウドサーバ原文を送信すると、翻訳された後の訳文送り返されてくるものである。

0003

特許文献1には、読取部によって読み取った原文の原稿の画像データから文字データを抽出し、文字データを指定された言語に翻訳し、翻訳文を原文のレイアウトに仮配置させ、配置エラーの有無を調べ、配置エラーが有る場合に、翻訳文の文字属性を変更する文字属性変更処理を行い、原文のレイアウトに仮配置させ、配置エラーの有無を調べる。そして依然として配置エラーが有る場合に、翻訳結果に基づいて、翻訳の方法を変更する翻訳方法変更処理あるいは翻訳後の文書を変更する翻訳文書変更処理のいずれか一方もしくは両方の処理からなる再翻訳処理を行い、翻訳内容を変更して翻訳文を原文のレイアウトに整合させることが開示されている。
また特許文献2には、文書データベースに原文に対応した最新版の翻訳データが予め存在する場合には、その翻訳データを利用し、翻訳データはなく最新版の文書データが存在している場合、文書データを翻訳処理して翻訳データを得、最新版の文書データおよび翻訳データがない場合、原稿から得た文書データを翻訳処理し、この翻訳データを利用する翻訳サーバが開示されている。

先行技術

0004

特開2007−87056号公報
特開2007−52614号公報

発明が解決しようとする課題

0005

ここで第1の言語で記載された原稿を第2の言語にいったん翻訳した後、他の言語に再翻訳する場合がある。例えば、送信元から送られ、第1の言語として英語で記載された原稿を第2の言語として日本語に翻訳し、必要な事項を日本語で追加した後、英語に再翻訳して送信元に送り返すような場合である。
しかしながらこの場合、送信元から送られた原稿の内容は、複数回の翻訳を行なうことになるため、複数回の翻訳後に元の英語の内容が維持されるとは限らない。
本発明は、複数回の翻訳を行なっても元の原稿の内容が変化しにくい翻訳装置等を提供することを目的とする。

課題を解決するための手段

0006

請求項1に記載の発明は、原稿の内容を異なる言語に翻訳する翻訳部と、前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、前記翻訳部が原稿の内容を前記第2の言語から他の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記他の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき当該第2の言語から当該他の言語に置き換えた結果とを合成する合成部と、を備える翻訳装置である。
請求項2に記載の発明は、前記他の言語は、前記第1の言語であり、前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき当該第2の言語から当該第1の言語に置き換えた結果とを合成することを特徴とする請求項1に記載の翻訳装置である。
請求項3に記載の発明は、前記他の言語は、前記第1の言語および前記第2の言語とは異なる第3の言語であり、前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第3の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき前記第1の言語から当該第3の言語に翻訳し置き換えた結果とを合成することを特徴とする請求項1に記載の翻訳装置である。
請求項4に記載の発明は、前記履歴情報には存在しない内容は、ユーザが原稿に追加した事項であることを特徴とする請求項1乃至3の何れか1項に記載の翻訳装置である。
請求項5に記載の発明は、原稿のレイアウトを解析するレイアウト解析部をさらに備え、前記翻訳部および前記合成部は、前記レイアウト解析部が解析したレイアウトを維持して翻訳結果を配することを特徴とする請求項1乃至4の何れか1項に記載の翻訳装置である。
請求項6に記載の発明は、前記抽出部は、前記レイアウト解析部により解析された翻訳対象の位置に基づき、前記履歴情報には存在しない内容を差分として抽出することを特徴とする請求項5に記載の翻訳装置である。
請求項7に記載の発明は、原稿の内容を翻訳する翻訳手段と、原語により記載された原稿の文書データを前記翻訳手段に送信する文書送信手段と、を備え、前記翻訳手段は、原稿の内容を異なる言語に翻訳する翻訳部と、前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、前記翻訳部が原稿の内容を前記第2の言語から他の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記他の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき当該第2の言語から当該他の言語に置き換えた結果とを合成する合成部と、を備える翻訳システムである。
請求項8に記載の発明は、コンピュータに、原稿の内容を異なる言語に翻訳する翻訳機能と、前記翻訳機能が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成機能と、前記翻訳機能が原稿の内容を前記第2の言語から他の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出機能と、前記翻訳機能により前記履歴情報には存在しない内容を前記第2の言語から前記他の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき当該第2の言語から当該他の言語に置き換えた結果とを合成する合成機能と、を実現させるプログラムである。

発明の効果

0007

請求項1の発明によれば、複数回の翻訳を行なっても元の第1の言語による原稿の内容が変化しにくい翻訳装置を提供することができる。
請求項2の発明によれば、第1の言語を第2の言語に翻訳し、さらに第1の言語に翻訳した場合でも元の第1の言語による原稿の内容が変化しにくくなる。
請求項3の発明によれば、第1の言語を第2の言語に翻訳し、さらに第3の言語に翻訳した場合でも元の第1の言語による原稿の内容が変化しにくくなる。
請求項4の発明によれば、ユーザが追加した事項について抽出し、翻訳を行なうことができる。
請求項5の発明によれば、翻訳を行なった後の原稿のレイアウトを維持しやすくなる。
請求項6の発明によれば、履歴情報には存在しない内容を抽出するのがより容易になる。
請求項7の発明によれば、複数回の翻訳を行なっても元の第1の言語による原稿の内容が変化しにくい翻訳システムを提供することができる。
請求項8の発明によれば、複数回の翻訳を行なっても元の第1の言語による原稿の内容が変化しにくい機能をコンピュータにより実現できる。

図面の簡単な説明

0008

本実施の形態が適用される翻訳システムの全体構成例を示したものである。
端末装置のハードウェア構成を示した図である。
画像形成装置のハードウェア構成例を示した図である。
(a)は、ファクシミリで送られてきた原稿の一例である。(b)は、クラウドサーバにより翻訳された後の原稿の一例である。(c)は、ユーザが翻訳後の原稿に対し、必要な事項を追加した例を示した図である。(d)は、(c)に示す追加後の原稿を、日本語から英語に再翻訳した例を示した図である。
クラウドサーバの機能構成例を示したブロック図である。
翻訳システムの動作について説明したフローチャートである。
レイアウト解析部が原稿のレイアウトを解析した結果について示した図である。
履歴作成部が作成する履歴情報の一例を示した図である。
(a)は、レイアウト解析部が原稿のレイアウトを再解析した結果について示した図である。(b)は、抽出部が検出した差分について示した図である。
履歴作成部が作成する差分についての履歴情報の一例を示した図である。
履歴作成部が翻訳結果を追加した後の履歴情報の一例を示した図である。

実施例

0009

<翻訳システムの全体構成の説明>
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
なお以後の説明において、「原語」とは、翻訳される対象となる言語であり、翻訳前の言語である。また「訳語」とは、翻訳後の言語である。さらに「原文」とは、原語で記された1文字以上の文章のことであり、「訳文」とは、訳語で記された1文字以上の文章のことである。

0010

図1は、本実施の形態が適用される翻訳システムの全体構成例を示したものである。
図示するように、この翻訳システム1は、端末装置10と、画像形成装置30とがネットワーク90に接続されることにより構成されている。また、ネットワーク90は、例えば、図示しないゲイトウェイサーバを介して、ネットワーク70に接続されており、ネットワーク70には、クラウドサーバ50が接続されている。
なお図では、1つの端末装置10しか示していないが、複数の端末装置10を設けてもよい。また図では、1つの画像形成装置30しか示していないが、複数の画像形成装置30を設けてもよい。

0011

端末装置10は、クラウドサーバ50に文書の翻訳を要求するコンピュータ装置である。ここで、端末装置10としては、PC(Personal Computer)、携帯端末携帯電話等を用いるとよい。

0012

画像形成装置30は、紙等の記録媒体に画像を形成し、印刷媒体として出力する装置である。画像形成装置30は、プリンタ機能を備えるが、これに加えて例えば、スキャナ機能ファクシミリ機能等の他の画像処理機能を備えていてもよい。

0013

また詳しくは後述するが、画像形成装置30からもクラウドサーバ50に文書の翻訳を要求することができる。画像形成装置30は、原語により記された原稿の文書データをクラウドサーバ50に送信する文書送信手段として機能する。

0014

クラウドサーバ50は、翻訳を行なうクラウドサービスを提供するサーバコンピュータである。クラウドサーバ50は、原稿の内容を翻訳する翻訳手段(翻訳装置)として機能する。

0015

ネットワーク70は、端末装置10とクラウドサーバ50との間の情報通信や、画像形成装置30とクラウドサーバ50との間の情報通信に用いられる通信手段であり、例えば、インターネットである。
ネットワーク90は、端末装置10と画像形成装置30との間の情報通信に用いられる通信手段であり、例えば、LAN(Local Area Network)である。

0016

次に、端末装置10のハードウェア構成について説明する。
図2は、端末装置10のハードウェア構成を示した図である。
図示するように、端末装置10は、演算手段であるCPU(Central Processing Unit)11と、記憶手段であるメインメモリ12及びHDD(Hard Disk Drive)13とを備える。ここで、CPU11は、OS(Operating System)やアプリケーション等の各種ソフトウェアを実行する。また、メインメモリ12は、各種ソフトウェアやその実行に用いるデータ等を記憶する記憶領域であり、HDD13は、各種ソフトウェアに対する入力データや各種ソフトウェアからの出力データ等を記憶する記憶領域である。
更に、端末装置10は、外部との通信を行うための通信インターフェース(以下、「通信I/F」と表記する)14と、ビデオメモリディスプレイ等からなる表示機構15と、キーボードマウス等の入力デバイス16とを備える。

0017

なお図2は、クラウドサーバ50のハードウェア構成を示した図として捉えることもできる。

0018

図3は、画像形成装置30のハードウェア構成例を示した図である。
図示するように、画像形成装置30は、CPU31と、RAM(Random Access Memory)32と、ROM(Read Only Memory)33と、HDD(Hard Disk Drive)34と、操作パネル35と、画像読み取り部36と、画像形成部37と、通信I/F38とを備える。

0019

CPU31は、ROM33等に記憶された各種プログラムをRAM32にロードして実行することにより、後述する各機能を実現する。
RAM32は、CPU31の作業用メモリ等として用いられるメモリである。
ROM33は、CPU31が実行する各種プログラム等を記憶するメモリである。
HDD34は、画像読み取り部36が読み取った画像データや画像形成部37における画像形成にて用いる画像データ等を記憶する例えば磁気ディスク装置である。
操作パネル35は、各種情報の表示やユーザからの操作入力の受付を行う例えばタッチパネルである。

0020

画像読み取り部36は、原稿に記録された画像を読み取る。ここで、画像読み取り部36は、例えばスキャナであり、光源から原稿に照射した光に対する反射光レンズ縮小してCCD(Charge Coupled Devices)で受光するCCD方式や、LED光源から原稿に順に照射した光に対する反射光をCIS(Contact Image Sensor)で受光するCIS方式のものを用いるとよい。

0021

画像形成部37は、記録媒体に画像を形成する印刷機構の一例である。ここで、画像形成部37は、例えばプリンタであり、感光体に付着させたトナーを記録媒体に転写して像を形成する電子写真方式や、インクを記録媒体上に吐出して像を形成するインクジェット方式のものを用いるとよい。
通信I/F38は、ネットワークを介して他の装置との間で各種情報の送受信を行う。

0022

この構成の翻訳システム1において、端末装置10は、翻訳前の原語による文書データをクラウドサーバ50に対し送信する。これは、例えば、端末装置10で動作するWebブラウザ等のソフトウェアを使用することで行なうことができる。具体的には、端末装置10の表示機構15にクラウドサーバ50が提供するクラウドサービスのWebページを表示し、Webページのメニュー等を入力デバイス16を用いて操作することで行なう。そしてクラウドサーバ50では、文書を原語から訳語に翻訳し、翻訳後の文書のデータを端末装置10に送り返す。端末装置10では、送り返された翻訳後の文書がWebページに表示される。なお文書データのフォーマットとしては、例えば、Word形式PDF形式を使用することができる。

0023

また端末装置10のみならず、画像形成装置30でも原語による文書データをクラウドサーバ50に対し送信することができる。この場合、例えば、画像読み取り部36で原稿をスキャンし、原稿に記録された画像を画像データを取得する。そして、原稿の画像データをPDF形式等のフォーマットからなる文書データとし、これをクラウドサーバ50に対し送信する。

0024

クラウドサーバ50では、文書を原語から訳語に翻訳した後、翻訳後の文書データを画像形成装置30または端末装置10に対し、送り返す。翻訳後の文書データが画像形成装置30に対し送り返されたときは、画像形成装置30では、例えば、操作パネル35に翻訳後の文書が表示される。あるいはHDD34でこれを記憶してもよい。また端末装置10に対し送り返されたときは、上述した場合と同様に翻訳後の文書がWebページに表示される。

0025

このときファクシミリで送られてきた原稿を使用して翻訳システム1を利用する場合の一例を以下に説明する。
図4(a)は、ファクシミリで送られてきた原稿の一例である。
図示する原稿は、注文書(Order Sheet)であり、英語で記載された文章からなる。この場合、まず原稿の書類名を表す「Order Sheet」が最上部に記載されている。そして書類名の下部左側には、注文を行なうために必要な事項を示す「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」が記載され、下部右側には、これらの事項に対応する内容を実際に記載するための空欄が設けられている。

0026

ユーザは、この原稿を画像形成装置30の画像読み取り部36で原稿をスキャンし、PDF形式等のフォーマットからなる文書データをクラウドサーバ50に対し送信する。その結果、クラウドサーバ50は、図4(a)に示した翻訳前の原稿の内容を原語である英語から訳語である日本語に翻訳する。そしてクラウドサーバ50は、翻訳後の原稿を文書データとして画像形成装置30に送り返す。

0027

図4(b)は、クラウドサーバ50により翻訳された後の原稿の一例である。
図示するように、原稿の最上部に記載された書類名を表す「Order Sheet」は、「注文書」に翻訳されている。また書類名の下部左側に記載された注文を行なうために必要な事項を示す「Name」、「E-mail address」等は、それぞれ「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」に翻訳されている。

0028

ユーザは、受け取った翻訳後の原稿に対し、必要な事項を追加する。この場合、「Name」、「E-mail address」等が記載されている箇所の右側にある空欄に必要な事項を記載する。このときユーザは、手書きで追加を行なってもよく、電子データにより追加を行なってもよい。

0029

図4(c)は、ユーザが翻訳後の原稿に対し、必要な事項を追加した例を示した図である。
この例では、ユーザは、「名前」に対し、「富士 太郎」を記載している。同様にユーザは、「電子メールアドレス」に対して、「Fuji.taro@fujixerox.co.jp」を記載し、「電話番号」に対しては、「123-4567-8910」を記載している。またユーザは、「郵便番号」に対して、「123-4567」を記載し、「アドレス」に対しては、「日本国日本県日本1-2-3」を記載している。さらにユーザは、「アイテムコード」に対して、「ABCDEF」を記載し、「意見」に対して、「日本特別仕様にして下さい。」を記載している。

0030

そしてユーザは、図4(c)に示す追加後の原稿をファクシミリの送信元に返信するにあたり、再度翻訳システム1を使用して、日本語から英語に再翻訳を行なう。そして英語に翻訳した再翻訳後の原稿をファクシミリを使用して返信する。

0031

図4(d)は、図4(c)に示す追加後の原稿を、日本語から英語に再翻訳した例を示した図である。
この例では、日本語の文章である「注文書」、「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」は、元の英語の原稿にあった「Order Sheet」、「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」に戻っている。またユーザが追加した「富士 太郎」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「日本国日本県日本村1-2-3」、「ABCDEF」、「日本特別仕様にして下さい。」は、それぞれ「Fujitarou」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「Japan Japan prefecture Japan village 1-2-3」、「ABCDEF」、「Make a Japanese special series.」に翻訳されている。

0032

しかしながらこのとき単に日本語から英語に再翻訳を行なうと、全ての文章が再翻訳の対象となるため、元の原稿にあった文章が図4(d)に示すように元の英語の文章に戻るとは限らない。つまり英語→日本語→英語の2回の翻訳を経るときに、元の英語の文章に戻らないことがある。具体的には、「注文書」、「名前」、「電子メールアドレス」等が元の原稿にあった「Order Sheet」、「Name」、「E-mail address」等に翻訳されるとは限らない。この場合、送信元から送られた翻訳前の原稿の意味と再翻訳語の原稿の意味が相違したり、または翻訳精度が低いと意味がわからなくなる場合も生ずる。この場合、送信元にとっては、返信された再翻訳後の原稿の内容理解が困難となる。

0033

<クラウドサーバ50の説明>
そこで本実施の形態では、クラウドサーバ50の構成を以下のようにし、この問題の抑制を図っている。

0034

図5は、クラウドサーバ50の機能構成例を示したブロック図である。なお図5では、クラウドサーバ50が有する種々の機能のうち本実施の形態に関係するものを選択して図示している。
図示するように、クラウドサーバ50は、原稿の文書データを取得するデータ取得部501と、翻訳の履歴である履歴情報を参照し取得した原稿が存在するか否かを判定する判定部502と、原稿のレイアウトを解析するレイアウト解析部503と、原文から訳文への翻訳を行なう翻訳部504と、翻訳辞書や履歴情報を記憶する記憶部505と、履歴情報を作成する履歴作成部506と、予め定められた文章を抽出する抽出部507と、翻訳結果を合成する合成部508と、翻訳後の文書データを出力するデータ出力部509とを備える。

0035

データ取得部501は、画像形成装置30から、原稿の文書データを取得する。ここでは、データ取得部501は、図4(a)で説明した英語で記載された原稿の文書データを取得したとして、以下の説明を行なう。

0036

判定部502は、取得した原稿が後述する履歴情報に存在するか否かを判定する。判定部502が原稿が履歴情報に存在するか否かを判定するには、例えば、取得した文書データに履歴情報を表すQRコード登録商標)が存在するか否かで行なう。

0037

レイアウト解析部503は、原稿のレイアウトを解析し、領域群を抽出する。レイアウト解析部503がレイアウトを解析する方法については、後述する。

0038

翻訳部504は、原稿の内容を異なる言語に翻訳する。翻訳部504は、記憶部505に記憶されている翻訳辞書を用いて、原語により記された原文を訳語により記された訳文に翻訳を行なう。この場合、翻訳部504では、英語から日本語に翻訳が行なわれ、図4(b)で説明した日本語で記載された文章に翻訳される。

0039

履歴作成部506は、翻訳部504が原稿の内容を第1の言語から第2の言語に翻訳したときに、第1の言語による原文と第2の言語による訳文との対応関係である翻訳結果を含む履歴情報を作成する。この場合、第1の言語は、英語であり、第2の言語は、日本語である。そして翻訳結果は、図4(a)〜(b)で示した例では、「Order Sheet」−「注文書」、「Name」−「名前」、「E-mail address」−「電子メールアドレス」、「Phone number」−「電話番号」、「Zip code」−「郵便番号」、「Address」−「アドレス」、「Item code」−「アイテムコード」、「Remarks」−「意見」の関係が、英語による原語と日本語による訳語との対応関係となる。そして履歴情報は、この対応関係を含む。

0040

抽出部507は、翻訳部504が原稿の内容を第2の言語から他の言語に翻訳するときに、第2の言語により記載された原稿の内容が履歴情報に存在した場合、履歴情報には存在しない内容を抽出する。
図4(c)に示す例で説明すると、第2の言語である日本語より記載された原稿の内容として、「注文書」、「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」は、履歴情報に存在する。一方、ユーザが追加した「富士 太郎」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「日本国日本県日本村1-2-3」、「ABCDEF」、「日本特別仕様にして下さい。」は、履歴情報に存在しない。よって抽出部507は、ユーザが追加した「富士 太郎」、「Fuji.taro@fujixerox.co.jp」等の文章を抽出する。つまり履歴情報には存在しない内容は、ユーザが原稿に追加した事項になる。詳しくは後述するが、抽出部507は、レイアウト解析部503により解析された翻訳対象の位置に基づき、履歴情報には存在しない内容を差分として抽出する。

0041

合成部508は、翻訳部504により履歴情報には存在しない内容を第2の言語から他の言語に翻訳した結果と、履歴情報に存在した内容を履歴情報により第2の言語から他の言語に置き換えた結果とを合成する。
この場合、翻訳部504により履歴情報には存在しない内容を第2の言語(この場合、日本語)から他の言語(この場合、英語)に翻訳した結果は、図4(d)に示す「Fujitarou」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「Japan Japan prefecture Japan village 1-2-3」、「ABCDEF」、「Make a Japanese special series.」となる。また履歴情報に存在した内容を履歴情報により第2の言語から他の言語(この場合、英語)に置き換えた結果は、「Order Sheet」、「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」である。つまり前者は、日本語の文章から英語の文章に翻訳されるのに対し、後者は、翻訳されず履歴情報により元の英語の文章に戻る。即ち、元の翻訳前の原稿にあった文章は、英語→日本語→英語の2回の翻訳を経ることはなく、履歴情報により元の英語の文章に戻ることになる。その結果、図4(d)に示す英語による原稿が得られる。

0042

また本実施の形態では、原稿のレイアウトを解析するレイアウト解析部503を設け、原稿のレイアウトを解析する。そのため翻訳部504および合成部508は、レイアウト解析部503が解析したレイアウトを維持して翻訳結果を配することができる。その結果、原稿のレイアウトを乱さずに翻訳結果を得ることができる。

0043

データ出力部509は、翻訳後の原稿のデータや再翻訳後の原稿のデータを文書データとして画像形成装置30に対し出力する。

0044

<翻訳システム1の動作の説明>
次に翻訳システム1の動作について説明を行なう。
図6は、翻訳システム1の動作について説明したフローチャートである。
まずユーザは、翻訳を行ないたい原稿(翻訳前の原稿)の文書データをクラウドサーバ50に対しアップロードする(ステップ101)。
この作業を画像形成装置30で行なう場合、ユーザは、画像読み取り部36において原稿をスキャンし、原稿の画像データを取得する。そして原稿の画像データをPDF形式等のフォーマットからなる文書データとし、これをクラウドサーバ50に対し送信する。このとき送信する文書データは、例えば、図4(a)に示した翻訳前の原稿の文書データであるとする。

0045

クラウドサーバ50では、データ取得部501が、送られた文書データを原稿の文書データとして取得する(ステップ102)。
次に判定部502が、データ取得部501が取得した文書データが履歴情報に存在するか否かを判定する(ステップ103)。ここでは、判定部502は、取得した文書データが履歴情報に存在するか否かを判定するのに、原稿に履歴情報を表すQRコードが存在するか否かで判定を行なうものとする。例えば、図4(a)に示した原稿は、QRコードがなく、そのため判定部502は、取得した文書データが履歴情報に存在しない新規のものであると判定する。

0046

データ取得部501が取得した文書データが新規のものであり、判定部502が履歴情報に存在しないと判定した場合(ステップ103でNo)、レイアウト解析部503が原稿のレイアウトを解析する(ステップ104)。

0047

図7は、レイアウト解析部503が原稿のレイアウトを解析した結果について示した図である。
図示するようにレイアウト解析部503は、原稿の中で文章が存在する箇所について矩形領域を設定する。図示する例では、「Order Sheet」、「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」のそれぞれについて矩形領域S1〜S8が設定される。そしてレイアウト解析部503は、矩形領域S1〜S8のそれぞれについて、領域情報群を作成する。領域情報群には、例えば、矩形領域の位置を表す情報、矩形領域に含まれる文章、矩形領域に含まれる文章の言語が含まれる。矩形領域の位置を表す情報は、例えば、矩形領域の始点(矩形領域の左上の座標)、矩形領域の終点(矩形領域の右下の座標)である。またこれに加えてページ番号などを含んでいてもよい。矩形領域に含まれる文章は、上述した「Order Sheet」、「Name」、「E-mail address」等のテキストデータである。また矩形領域に含まれる文章の言語は、この場合、英語である。またこれに加えて翻訳先の言語(この場合、日本語)の情報を含んでいてもよい。

0048

図6戻り、次に翻訳部504が、記憶部505に記憶されている翻訳辞書を使用して、原稿の内容を英語から日本語に翻訳する(ステップ105)。
この場合、領域情報群に含まれる「Order Sheet」、「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」は、それぞれ「注文書」、「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」に翻訳される。

0049

そして履歴作成部506が、履歴情報を作成する(ステップ106)。この履歴情報には、英語による原語と日本語による訳語との対応関係が含まれる。

0050

図8は、履歴作成部506が作成する履歴情報の一例を示した図である。
図示する履歴情報は、履歴ID、原稿ID、原語、訳語、翻訳結果からなる。そしてここでは、履歴IDとして10121および10122のものが既に存在し、今回履歴IDが10123のものが追加された例を示している。
原稿IDは、リンク情報であり、原稿IDが「3」のものを参照すると、図7で説明した領域情報群と翻訳前の原稿のイメージ情報を得ることができる。
また翻訳結果もリンク情報であり、翻訳結果が「R−3」のものを参照すると、上述した「Order Sheet」−「注文書」、「Name」−「名前」、「E-mail address」−「電子メールアドレス」、「Phone number」−「電話番号」、「Zip code」−「郵便番号」、「Address」−「アドレス」、「Item code」−「アイテムコード」、「Remarks」−「意見」の対応関係を得ることができる。また翻訳後の原稿のイメージ情報を得ることができる。即ち履歴情報には、英語による原語と日本語による訳語との対応関係が含まれている。

0051

図6に戻り、次に記憶部505が、この履歴情報を記憶する(ステップ107)。
さらにデータ出力部509が、翻訳後の日本語による原稿の文書データを画像形成装置30に対し出力する(ステップ108)。またデータ出力部509は、このとき履歴IDをQRコードとして出力する文書データに埋め込む(この場合、10123)。その結果、図4(b)で示した翻訳後の原稿となり、ユーザは翻訳後の原稿を得ることができる。

0052

そしてユーザは、受け取った翻訳後の原稿に対し、必要な事項を追加する。その結果、図4(c)で示すような追加後の原稿となる。

0053

そしてユーザが翻訳前の原稿の送信元に返信するため、再び追加後の原稿をアップロードした場合、これは図6のフローチャートのステップ101に戻ることを意味する。ただしステップ101およびステップ102の後のステップ103において、判定部502は、原稿に履歴情報を表すQRコードが存在するため、取得した文書データが履歴情報に存在すると判定する(ステップ103でYes)。この場合、レイアウト解析部503が原稿のレイアウトを再解析する(ステップ109)。

0054

図9(a)は、レイアウト解析部503が原稿のレイアウトを再解析した結果について示した図である。
レイアウト解析部503は、図7に示した場合と同様に原稿の中で文章が存在する箇所について矩形領域を設定する。その結果、レイアウト解析部503は、まず図7に示した矩形領域S1〜S8と同じ箇所に矩形領域を設定する。図示する例では、レイアウト解析部503は、「注文書」、「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」のそれぞれについて矩形領域T1〜T8を設定する。またさらにレイアウト解析部503は、原稿の中でユーザが追加した箇所について矩形領域T9〜T15を設定する。つまり「富士 太郎」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「日本国日本県日本村1-2-3」、「ABCDEF」、「日本特別仕様にして下さい。」のそれぞれについて矩形領域T9〜T15が設定される。そしてレイアウト解析部503は、矩形領域T1〜T15のそれぞれについて、領域情報群を作成する。領域情報群の内容は、図7で説明した場合と同様である。

0055

再び図6に戻り、次に抽出部507が、領域情報群を基に、図4(b)で示した翻訳後の原稿と図4(c)で示した追加後の原稿とで矩形領域の差分を検出する(ステップ110)。この差分は、履歴情報から得られる翻訳後の原稿のイメージと追加後の原稿のイメージを比較することで得られる。

0056

図9(b)は、抽出部507が検出した差分について示した図である。
この場合、矩形領域T9〜T15が差分として検出される。これは、抽出部507は、第2の言語(日本語)により記載された原稿の内容が履歴情報に存在したときに、履歴情報には存在しない内容を抽出する、と言い換えることもできる。

0057

そして抽出部507は、差分が存在するか否かを判断する(ステップ111)。このとき抽出部507が差分が存在しないと判断する場合(ステップ111でNo)は、ユーザが翻訳後の原稿に対し、何も追加しなかった場合である。この場合は、ステップ114に移行する。

0058

一方、抽出部507が差分が存在すると判断した場合(ステップ111でYes)は、ユーザが翻訳後の原稿に対し、追加を行ない、図4(c)に示すような原稿とした場合である。この場合、履歴作成部506が、差分についての履歴情報を作成する(ステップ112)。この履歴情報には、日本語による原文と英語による訳文との対応関係が含まれる。

0059

図10は、履歴作成部506が作成する差分についての履歴情報の一例を示した図である。
図示する履歴情報は、図8に示した履歴ID、原稿ID、原語、訳語、翻訳結果に加え、親履歴が加わっている。そしてここでは、履歴IDが10124のものが追加された例を示している。リンク情報である原稿IDは、「4」であり、これを参照すると、矩形領域T9〜T15の領域情報群を得ることができる。また追加後の原稿のイメージ情報を得ることができる。そして親履歴として、「10123」が記載される。これにより履歴IDが10124の原稿は、履歴IDが10123の原稿に対し、原稿IDが示す差分を追加したものであることがわかる。

0060

次に検出された差分である矩形領域T9〜T15内の文章を、翻訳部504が、記憶部505に記憶されている翻訳辞書を使用して、日本語から英語に翻訳する(ステップ113)。
具体的には、矩形領域T9〜T15内に含まれる「富士 太郎」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「日本国日本県日本村1-2-3」、「ABCDEF」、「日本特別仕様にして下さい。」は、それぞれ「Fujitarou」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「Japan Japan prefecture Japan village 1-2-3」、「ABCDEF」、「Make a Japanese special series.」に翻訳される。

0061

次に合成部508が、翻訳部504により履歴情報には存在しない内容を第2の言語(この場合、日本語)から他の言語(この場合、第1の言語である英語)に翻訳した結果と、履歴情報に存在した内容を履歴情報に基づき第2の言語(この場合、日本語)から他の言語(この場合、第1の言語である英語)に置き換えた結果とを合成する(ステップ114)。このうち前者は、矩形領域T9〜T15内に含まれる「富士 太郎」、「Fuji.taro@fujixerox.co.jp」等を、「Fujitarou」、「Fuji.taro@fujixerox.co.jp」等に翻訳した結果に該当する。また後者は、矩形領域T1〜T8内に含まれる「注文書」、「名前」等を「Order Sheet」、「Name」等に置き換えることに該当する。

0062

なおステップ111でNoであり、ユーザが翻訳後の原稿に対し、何も追加しなかった場合は、後者の矩形領域T1〜T8内に含まれる「注文書」、「名前」等を「Order Sheet」、「Name」等に置き換える処理だけがなされる。つまり図4(a)で示した翻訳前の原稿に戻る。

0063

次に履歴作成部506が、ステップ112で作成した履歴情報に翻訳結果を追加する(ステップ115)。

0064

図11は、履歴作成部506が翻訳結果を追加した後の履歴情報の一例を示した図である。
図示する履歴情報は、図8に示した履歴情報と比較して翻訳結果としてR−4が追加されている。この翻訳結果R−4を参照すると、上述した「富士 太郎」−「Fujitarou」、「Fuji.taro@fujixerox.co.jp」−「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」−「123-4567-8910」、「123-4567」−「123-4567」、「日本国日本県日本村1-2-3」−「Japan Japan prefecture Japan village 1-2-3」、「ABCDEF」−「ABCDEF」、「日本特別仕様にして下さい。」−「Make a Japanese special series.」の対応関係が得られる。また合成部508により作成された合成後の原稿のイメージ画像が得られる。

0065

次に記憶部505が、翻訳結果を追加した履歴情報を記憶する(ステップ116)。

0066

そしてデータ出力部509が、再翻訳後の英語による原稿の文書データを画像形成装置30に対し出力する(ステップ108)。またデータ出力部509は、このとき履歴ID(この場合、10124)をQRコードとして出力する文書データに埋め込む。その結果、図4(d)で示した再翻訳後の原稿となり、ユーザは再翻訳後の原稿を得ることができる。

0067

なお上述した形態は、合成部508において、再翻訳の対象となる言語を英語以外にする場合にも適用が可能である。例えば、再翻訳の対象となる言語を第3の言語である仏語とする。このとき合成部508は、翻訳部504により履歴情報には存在しない内容を第2の言語(この場合、日本語)から第3の言語(この場合、仏語)に翻訳した結果と、履歴情報に存在した内容を履歴情報に基づき第1の言語(この場合、英語)から第3の言語(この場合、仏語)に翻訳し置き換えた結果とを合成する。つまり前者は、日本語の文章から仏語の文章に翻訳されるのに対し、後者は、履歴情報により元の英語の文章から仏語の文章に翻訳される。即ち、元の翻訳前の原稿にあった文章は、英語→日本語→仏語の2回の翻訳を経ることはなく、英語→仏語の1回の翻訳しかなされない。その結果、元の英語の文章と翻訳後の仏語の文章との意味の相違が生じにくくなる。

0068

また上述した形態では、判定部502が、取得した文書データが履歴情報に存在するか否かを判定するのに、原稿に履歴情報を表すQRコードが存在するか否かで判定を行なっていたが、これに限られるものではない。QRコードの代わりにバーコード等であってもよい。
またQRコードやバーコードのような識別子情報でなくてもよい。例えは、文書データが構造化文書であった場合は、履歴情報をデータとして埋め込んでもよい。また文書データのファイルプロパティに設定してもよい。さらに文章のレイアウトの類似性から判定してもよい。
そして上述した例では、クラウドサーバ50は、ネットワーク70に接続されクラウドサービスを行なうものであったが、ネットワーク90に接続し、翻訳サーバとして使用してもよい。即ち、クラウドサーバ50が接続されるネットワークに特に制限はない。さらにクラウドサーバ50の機能を画像形成装置30に入れ込み、画像形成装置30単独で一連の処理を行ってもよい。この場合、画像形成装置30が翻訳装置として機能する。

0069

<プログラムの説明>
なお本実施の形態におけるクラウドサーバ50が行なう処理は、例えば、CPU11が、HDD13等に記憶された各種プログラムをメインメモリ12にロードして実行することにより行なわれる。

0070

よってクラウドサーバ50が行なう処理は、コンピュータに、原稿の内容を異なる言語に翻訳する翻訳機能と、翻訳機能が原稿の内容を第1の言語から第2の言語に翻訳したときに、第1の言語による原文と第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成機能と、翻訳機能が原稿の内容を第2の言語から他の言語に翻訳するときに、第2の言語により記載された原稿の内容が履歴情報に存在した場合、履歴情報には存在しない内容を抽出する抽出機能と、翻訳機能により履歴情報には存在しない内容を第2の言語から他の言語に翻訳した結果と、履歴情報に存在した内容を履歴情報に基づき第2の言語から他の言語に置き換えた結果とを合成する合成機能と、を実現させるプログラムとして捉えることもできる。

0071

なお、本実施の形態を実現するプログラムは、通信手段により提供することはもちろん、CD−ROM等の記録媒体に格納して提供することも可能である。

0072

1…翻訳システム、30…画像形成装置、50…クラウドサーバ、501…データ取得部、502…判定部、503…レイアウト解析部、504…翻訳部、505…記憶部、506…履歴作成部、507…抽出部、508…合成部、509…データ出力部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ