図面 (/)

技術 情報処理装置及び情報処理プログラム

出願人 富士ゼロックス株式会社
発明者 内海洋平
出願日 2015年7月8日 (5年1ヶ月経過) 出願番号 2015-136665
公開日 2017年1月26日 (3年6ヶ月経過) 公開番号 2017-021459
状態 特許登録済
技術分野 文字認識
主要キーワード 評価値欄 携帯情報通信機器 トータルスコア パラメータ項目 パラメータ保存 重み付けテーブル 完了結果 画像特徴検出
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2017年1月26日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (9)

課題

通信可能な複数の文字認識処理装置のうち、いずれかの文字認識処理装置に文字認識処理を行わせる場合にあって、対象となっている画像の特徴に応じて、画像に対して文字認識処理を行わせる文字認識処理装置を決定するようにした情報処理装置を提供する。

解決手段

情報処理装置の検出手段は、画像の特徴を検出し、決定手段は、通信可能な複数の文字認識処理装置のうち、前記特徴に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定し、送信手段は、前記画像を前記決定手段によって決定された文字認識処理装置に送信する。

概要

背景

特許文献1には、ネットワークを介して接続された外部サーバーに画像データの処理を依頼することが可能な画像処理装置において、画像処理を効率的に行えるようにすることを課題とし、画像処理装置は、外部サーバーから画像処理用プログラムダウンロードする受信手段と、前記プログラムを当該画像処理装置において実行する画像処理手段と、外部サーバーに画像データの処理を依頼する送信手段と、所定条件により、画像処理手段と外部サーバーのいずれで画像データの処理を行うかを切り換え切換手段とを備えることが開示されている。

概要

通信可能な複数の文字認識処理装置のうち、いずれかの文字認識処理装置に文字認識処理を行わせる場合にあって、対象となっている画像の特徴に応じて、画像に対して文字認識処理を行わせる文字認識処理装置を決定するようにした情報処理装置を提供する。情報処理装置の検出手段は、画像の特徴を検出し、決定手段は、通信可能な複数の文字認識処理装置のうち、前記特徴に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定し、送信手段は、前記画像を前記決定手段によって決定された文字認識処理装置に送信する。

目的

本発明は、通信可能な複数の文字認識処理装置のうち、いずれかの文字認識処理装置に文字認識処理を行わせる場合にあって、対象となっている画像の特徴に応じて、画像に対して文字認識処理を行わせる文字認識処理装置を決定するようにした情報処理装置及び情報処理プログラムを提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

画像の特徴を検出する検出手段と、通信可能な複数の文字認識処理装置のうち、前記特徴に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定する決定手段と、前記画像を前記決定手段によって決定された文字認識処理装置に送信する送信手段を具備することを特徴とする情報処理装置

請求項2

前記送信手段によって画像を送信した文字認識処理装置から、文字認識処理の結果を受信する受信手段をさらに具備し、前記決定手段は、前記受信手段によって受信された結果に基づいて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定することを特徴とする請求項1に記載の情報処理装置。

請求項3

前記決定手段は、前記特徴と各文字認識処理装置の重み付け値で算出した値が、通信可能な複数の文字認識処理装置の該値の合計値に占める割合に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定することを特徴とする請求項1又は2に記載の情報処理装置。

請求項4

コンピュータを、画像の特徴を検出する検出手段と、通信可能な複数の文字認識処理装置のうち、前記特徴に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定する決定手段と、前記画像を前記決定手段によって決定された文字認識処理装置に送信する送信手段として機能させるための情報処理プログラム

技術分野

0001

本発明は、情報処理装置及び情報処理プログラムに関する。

背景技術

0002

特許文献1には、ネットワークを介して接続された外部サーバーに画像データの処理を依頼することが可能な画像処理装置において、画像処理を効率的に行えるようにすることを課題とし、画像処理装置は、外部サーバーから画像処理用プログラムダウンロードする受信手段と、前記プログラムを当該画像処理装置において実行する画像処理手段と、外部サーバーに画像データの処理を依頼する送信手段と、所定条件により、画像処理手段と外部サーバーのいずれで画像データの処理を行うかを切り換え切換手段とを備えることが開示されている。

先行技術

0003

特開2003−036435号公報

発明が解決しようとする課題

0004

本発明は、通信可能な複数の文字認識処理装置のうち、いずれかの文字認識処理装置に文字認識処理を行わせる場合にあって、対象となっている画像の特徴に応じて、画像に対して文字認識処理を行わせる文字認識処理装置を決定するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。

課題を解決するための手段

0005

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像の特徴を検出する検出手段と、通信可能な複数の文字認識処理装置のうち、前記特徴に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定する決定手段と、前記画像を前記決定手段によって決定された文字認識処理装置に送信する送信手段を具備することを特徴とする情報処理装置である。

0006

請求項2の発明は、前記送信手段によって画像を送信した文字認識処理装置から、文字認識処理の結果を受信する受信手段をさらに具備し、前記決定手段は、前記受信手段によって受信された結果に基づいて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定することを特徴とする請求項1に記載の情報処理装置である。

0007

請求項3の発明は、前記決定手段は、前記特徴と各文字認識処理装置の重み付け値で算出した値が、通信可能な複数の文字認識処理装置の該値の合計値に占める割合に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定することを特徴とする請求項1又は2に記載の情報処理装置である。

0008

請求項4の発明は、コンピュータを、画像の特徴を検出する検出手段と、通信可能な複数の文字認識処理装置のうち、前記特徴に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定する決定手段と、前記画像を前記決定手段によって決定された文字認識処理装置に送信する送信手段として機能させるための情報処理プログラムである。

発明の効果

0009

請求項1の情報処理装置によれば、通信可能な複数の文字認識処理装置のうち、いずれかの文字認識処理装置に文字認識処理を行わせる場合にあって、対象となっている画像の特徴に応じて、画像に対して文字認識処理を行わせる文字認識処理装置を決定することができる。

0010

請求項2の情報処理装置によれば、文字認識処理の結果に基づいて、画像に対して文字認識処理を行わせる文字認識処理装置を決定することができる。

0011

請求項3の情報処理装置によれば、特徴と各文字認識処理装置の重み付け値で算出した値が、通信可能な複数の文字認識処理装置のその値の合計値に占める割合に応じて、画像に対して文字認識処理を行わせる文字認識処理装置を決定することができる。

0012

請求項4の情報処理プログラムによれば、通信可能な複数の文字認識処理装置のうち、いずれかの文字認識処理装置に文字認識処理を行わせる場合にあって、対象となっている画像の特徴に応じて、画像に対して文字認識処理を行わせる文字認識処理装置を決定することができる。

図面の簡単な説明

0013

本実施の形態の構成例についての概念的なモジュール構成図である。
本実施の形態を利用したシステム構成例を示す説明図である。
本実施の形態による処理例を示すフローチャートである。
パラメータテーブルデータ構造例を示す説明図である。
重み付けテーブルのデータ構造例を示す説明図である。
本実施の形態による処理例を示す説明図である。
本実施の形態による処理例を示す説明図である。
本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。

実施例

0014

以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能ソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。

0015

本実施の形態である情報処理装置100は、通信可能な複数の文字認識サービス提供装置250のうち、いずれかの文字認識サービス提供装置250に文字認識処理を行わせるものであって、図1の例に示すように、画像特徴検出モジュール105、依頼先決定モジュール110、相関データ記憶モジュール115、パラメータ保存モジュール120を有している。
情報処理装置100は、画像処理装置210、複数の文字認識サービス提供装置250と接続されている。画像処理装置210も複数あってもよい。

0016

画像処理装置210は、ユーザー155の操作にしたがって、文書を読み込んで、文字認識対象となるスキャン画像160を生成する。例えば、スキャナファックス複合機(スキャナ、プリンタ複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等が該当する。スキャン画像160は、情報処理装置100によって選択された文字認識サービス提供装置250のいずれかによって文字認識される。また、文字認識結果は、例えば、スキャン画像160とともに文書管理装置等に格納される。スキャン画像160は、2値画像多値画像カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、文字認識の対象となるものであればよく、例えば、ビジネスに用いられる文書、広告宣伝用パンフレット等であってもよい。

0017

文字認識サービス提供装置250は、複数あり、文字認識処理を行う。各文字認識サービス提供装置250は、それぞれ異なる文字認識処理(アルゴリズム認識用辞書等を含む)を行うようにしてもよいし、それぞれ異なるハードウェア性能(CPUの処理速度、メモリ容量等)を有していてもよいし、また、情報処理装置100が依頼した時点での処理量がそれぞれ異なっていてもよい。つまり、依頼するスキャン画像160の特徴によって、それぞれが異なる処理結果(文字認識結果の他に、処理時間等を含めてもよい)となってもよい。もちろんのことながら、文字認識処理が同じであるもの、ハードウェア性能が同じであるもの、情報処理装置100が依頼した時点での処理量が同じであるものが含まれていてもよい。

0018

画像特徴検出モジュール105は、依頼先決定モジュール110、画像処理装置210と接続されている。画像特徴検出モジュール105は、画像処理装置210によって生成されたスキャン画像160を受け取って、そのスキャン画像160の特徴を検出する。なお、画像特徴検出モジュール105は、画像処理装置210からスキャン画像160を受け取ることの他に、ハードディスク(情報処理装置100に内蔵されているものの他に、通信回線を介して接続されているもの等を含む)等に記憶されているスキャン画像160を読み出すようにしてもよい。
そして、例えば、画像特徴検出モジュール105は、次のような画像の特徴を抽出する。
(1)外部余白率
スキャン画像160の外周の余白面積が、スキャン画像160の面積に対して、何%を占めるかを示す特徴である。また、スキャン画像160の外周の余白の幅(又は高さ)が、スキャン画像160の全体の幅(又は高さ)に対して、何%を占めるかを示す特徴としてもよい。なお「外周の余白」とは、スキャン画像160の外側に沿って存在する余白をいう。その余白には、ノイズが含まれていてもよい。
(2)内部余白
前述の外周の余白を除いて、スキャン画像160内の白色部分が、全体の何%を占めるかを示す特徴である。
(3)色度相対値
スキャン画像160全体における色度の統計値平均値最頻値中央値等)である。具体的には、白黒データ(スキャン画像160が白黒のみからなっている場合)を0、カラフルサンプルの色度の統計値を100としたときの数値である。ここでのサンプルは、予め定められたスキャン画像160である。
(4)色度分布
カラフルな部分の分布状況を示す値である。具体的には、全体的にカラフルなら100に近い値となり、一箇所だけがカラフルなら0に近い値となる。
(5)彩度分布
前述の色度分布率を、彩度で測定する。
(6)フォーマット化
文字規則的に並んでいることを数値化したものである。例えば、帳票のように規則的に文字が並んでいるようなスキャン画像160であれば100に近い値となり、ランダムに近い文字配置となっているようなスキャン画像160であれば0に近い値となる。
例えば、画像特徴検出モジュール105は、パラメータテーブル400を生成する。図4は、パラメータテーブル400のデータ構造例を示す説明図である。パラメータテーブル400は、パラメータ項目欄410、評価値欄420を有している。パラメータ項目欄410は、パラメータ項目(前述の6つの画像の特徴)を記憶している。評価値欄420は、その画像の特徴に対応する評価値(画像特徴検出モジュール105によって検出した特徴を示す値)を記憶している。

0019

画像特徴検出モジュール105が検出する特徴として、スキャン画像160は、白黒データであるかカラーデータであるかを示す特徴を用いてもよい。また、スキャン画像160のファイルサイズ、スキャン画像160内の文字数を特徴としてもよい。

0020

依頼先決定モジュール110は、画像特徴検出モジュール105、相関データ記憶モジュール115、文字認識サービス提供装置250と接続されている。依頼先決定モジュール110は、通信可能な複数の文字認識サービス提供装置250のうち、画像特徴検出モジュール105によって検出された特徴に応じて、スキャン画像160に対して文字認識処理を行わせる文字認識サービス提供装置250を決定する。
また、依頼先決定モジュール110は、画像特徴検出モジュール105によって検出された特徴と各文字認識サービス提供装置250の重み付け値で算出した値が、通信可能な複数の文字認識サービス提供装置250のその値の合計値に占める割合に応じて、スキャン画像160に対して文字認識処理を行わせる文字認識サービス提供装置250を決定するようにしてもよい。
そして、依頼先決定モジュール110は、決定した文字認識サービス提供装置250にスキャン画像160を送信する。つまり、その文字認識サービス提供装置250に文字認識処理を依頼する。
なお、情報処理装置100も文字認識処理機能を有しており、選択対象としての文字認識サービス提供装置250の1つとして、情報処理装置100自身を含めるようにしてもよい。
さらに、依頼先決定モジュール110は、文字認識サービス提供装置250を利用するにあたっての利用料金を用いて、文字認識処理を行わせる文字認識サービス提供装置250を決定するようにしてもよい。例えば、文字認識処理を1ページ実施したときに、1ページあたりでかかる(かかった)価格を用いてもよい。

0021

相関データ記憶モジュール115は、依頼先決定モジュール110、パラメータ保存モジュール120と接続されている。相関データ記憶モジュール115は、各文字認識サービス提供装置250における文字認識処理における、画像の特徴との相関関係を示す情報を記憶している。つまり、情報処理装置100が文字認識サービス提供装置250を選択するにあたって、処理対象となる画像の各特徴に対して乗算する重み付け値を記憶している。例えば、重み付けテーブル500を記憶している。図5は、重み付けテーブル500のデータ構造例を示す説明図である。重み付けテーブル500は、文字認識サービス提供装置250A欄510、文字認識サービス提供装置250B欄520、文字認識サービス提供装置250C欄530を有している。文字認識サービス提供装置250A欄510は、文字認識サービス提供装置250Aの重み付け値を記憶している。文字認識サービス提供装置250B欄520は、文字認識サービス提供装置250Bの重み付け値を記憶している。文字認識サービス提供装置250C欄530は、文字認識サービス提供装置250Cの重み付け値を記憶している。

0022

パラメータ保存モジュール120は、相関データ記憶モジュール115、文字認識サービス提供装置250と接続されている。パラメータ保存モジュール120は、依頼先決定モジュール110によってスキャン画像160を送信した文字認識サービス提供装置250から、文字認識処理の結果を受信する。
そして、依頼先決定モジュール110は、パラメータ保存モジュール120によって受信された結果に基づいて、スキャン画像160に対して文字認識処理を行わせる文字認識サービス提供装置250を決定するようにしてもよい。
具体的には、依頼先決定モジュール110は、文字認識処理の結果から各文字認識サービス提供装置250の重み付け値を更新する。そして、その後は、その変更された重み付け値を用いて、依頼先決定モジュール110が、文字認識サービス提供装置250の決定処理を行う。

0023

図2は、本実施の形態を利用したシステム構成例を示す説明図である。
文字認識処理の対象データであるスキャン画像160を生成する画像処理装置210、文字認識処理を行う複数のサーバー250と、文字認識サービス提供装置250への文字認識処理の振り分けを行う情報処理装置100によって構成されているシステムである例を示す。
図2(A)に示す例では、情報処理装置100Aは、画像処理装置210A、画像処理装置210B、画像処理装置210C、文字認識サービス提供装置250A、文字認識サービス提供装置250B、文字認識サービス提供装置250C、文字認識サービス提供装置250Dと接続されている。情報処理装置100Bは、画像処理装置210D、画像処理装置210E、画像処理装置210F、文字認識サービス提供装置250A、文字認識サービス提供装置250B、文字認識サービス提供装置250G、文字認識サービス提供装置250Hと接続されている。情報処理装置100、文字認識サービス提供装置250は、サーバーとして構成してもよいし、情報処理装置100、文字認識サービス提供装置250の機能による機能は、クラウドサービスとして実現してもよい。
図2(B)に示す例では、情報処理装置100A、情報処理装置100B、画像処理装置210A、画像処理装置210B、画像処理装置210C、文字認識サービス提供装置250A、文字認識サービス提供装置250B、文字認識サービス提供装置250C、文字認識サービス提供装置250Dは、通信回線290を介してそれぞれ接続されている。通信回線290は、無線有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネットイントラネット等であってもよい。また、画像処理装置210内に、情報処理装置100を含んで構成してもよいし、文字認識サービス提供装置250内に情報処理装置100を含んで構成(前述のように情報処理装置100が文字認識処理機能を有している場合)してもよい。
ユーザーの操作によって、画像処理装置210で文書が読み込まれ、文字認識処理の指示が行われ、画像処理装置210から情報処理装置100に対して指示が行われる。そして、情報処理装置100では、スキャン画像160の画像特徴に応じて、文字認識処理を行わせる文字認識サービス提供装置250を選択し、その文字認識サービス提供装置250にスキャン画像160を送信する。その文字認識サービス提供装置250によって文字認識処理が行われる。そして、例えば、その文字認識結果とスキャン画像160を対応させて、文書データベースとしての機能を有する文書管理装置等に記憶させる。
また、画像処理装置210で、文字認識処理の対象となる複数ページの文書を読み込み、情報処理装置100は、スキャン画像160の各ページの画像データの画像特徴に合わせて、複数の文字認識サービス提供装置250に文字認識処理を行わせるようにしてもよい。

0024

図3は、本実施の形態による処理例を示すフローチャートである。
テップS302では、ユーザー155の操作に応じて、画像処理装置210は原稿スキャンを行い、スキャン画像160を生成する。
ステップS304では、画像処理装置210は、情報処理装置100に対して、フローを起動する。ここで、フローとは、スキャン画像160に対する一連の処理を行わせるプログラムであり、この処理の中に文字認識処理が含まれている。
ステップS306では、情報処理装置100は、スキャン画像160の画像特徴(原稿パラメータ)を算出する。
ステップS308では、情報処理装置100は、スキャン画像160の画像特徴に応じて、文字認識サービス提供装置250を選択し、その文字認識サービス提供装置250に対して、文字認識処理の実施依頼を行う。なお、依頼が少ない間(ステップS314の処理が予め定められた回数上行われていない場合)は、ラウンドロビンで文字認識サービス提供装置250を選択するようにしてもよい。なお、ラウンドロビンで選択するとは、予め定められた順序で選択してもよいし、ランダム(疑似乱数を含む)で選択してもよい。
ステップS310では、文字認識サービス提供装置250は、文字認識処理を行い、処理が完了したことを情報処理装置100に通知する。
ステップS312では、情報処理装置100は、画像処理装置210の液晶ディスプレイ等の表示装置に、文字認識処理が完了した旨のメッセージを表示することによって、ユーザー155に対して、完了結果を通知する。
ステップS314では、情報処理装置100は、できばえスコアを算出し、文字認識処理を行った文字認識サービス提供装置250の重み付け値を変更する。

0025

図6は、本実施の形態による処理例を示す説明図である。図6の例では、依頼先決定モジュール110が行う、文字認識サービス提供装置250を選択する処理を示している。
図6(A)の例に示すパラメータテーブル400は、図4の例に示したものである。つまり、画像特徴検出モジュール105によって、特徴を検出し、その検出した特徴を示す値が評価値欄420にそれぞれ記憶されている。
図6(B)の例に示す重み付けテーブル500は、図5の例に示したものである。つまり、各文字認識サービス提供装置250における、画像の特徴に対応する重み付け値である。
パラメータ項目欄410内の各値に、各文字認識サービス提供装置250の重み付け値を乗算し、トータルスコアを算出する。具体的には、図6(C)の例に示すトータルスコア600は、各文字認識サービス提供装置250に、評価値欄420内の値と重み付けテーブル500内の値を乗算して加算した値を示している。つまり、文字認識サービス提供装置250Aでは、(8×10+12×30+95×91+70×82+32×24+33×25)/100=164.18となり、文字認識サービス提供装置250Bでは、(8×5+12×71+95×14+70×13+32×82+33×91)/100=87.59となり、文字認識サービス提供装置250Cでは、(8×12+12×11+95×53+70×46+32×50+33×8)/100=103.47となる。
このトータルスコア600をもとに、どの文字認識サービス提供装置250へ依頼するかを決定する。例えば、(文字認識サービス提供装置250のトータルスコア/各トータルスコアの合計値)を算出し、その値(確率値)になるように、文字認識サービス提供装置250を選択すればよい。具体的には、文字認識サービス提供装置250Aに依頼する確率値は、(164.18/(164.18+87.59+103.47))=0.46となる。文字認識サービス提供装置250Bに依頼する確率値は、(87.59/(164.18+87.59+103.47))=0.25となる。同様に、文字認識サービス提供装置250Cに依頼する確率値は、(103.47/(164.18+87.59+103.47))=0.29となる。この確率値に沿うように、文字認識サービス提供装置250を選択すればよい。例えば、0以上1未満の乱数(疑似乱数を含む)を発生させ、その乱数が、0.00以上0.46未満の間にあれば文字認識サービス提供装置250Aを選択し、0.46以上0.71未満の間にあれば文字認識サービス提供装置250Bを選択し、0.71以上1.00未満の間にあれば文字認識サービス提供装置250Cを選択すればよい。

0026

図7は、本実施の形態による処理例を示す説明図である。図7の例では、パラメータ保存モジュール120が行う、文字認識サービス提供装置250を選択するための重み付け値の更新処理を示している。重み付けテーブル720は、もとのスコア欄730、変更後のスコア欄740を有している。もとのスコア欄730は、もとのスコア(重み付け値)を記憶している。変更後のスコア欄740は、更新後のスコア(重み付け値)を記憶している。
文字認識サービス提供装置250の実行結果からできばえスコアを算出する。文字認識処理のできばえを計算する方法は、既存の技術を利用すればよい。例えば、各文字認識結果の文字に対する文字認識確信度の統計値(平均値、最頻値、中央値等)を用いてもよい。文字認識確信度は、文字認識処理で、その文字である確率を示しており、例えば、認識辞書パタン認識対象のパタンとの距離の逆数等によって表される。文字認識確信度の統計値を0〜100の間の数値に正規化して、できばえスコアを算出してもよい。また、1文字あたりの処理時間を0〜100の間の数値に正規化して、できばえスコアを算出してもよい。さらに、文字認識確信度の統計値と1文字あたりの処理時間を加算した値を0〜100の間の数値に正規化して、できばえスコアを算出してもよい。また、文字認識結果を操作者が確認して、正解率を算出し、その正解率をできばえスコアとしてもよい。

0027

そして、以下の式を用いて、重み付け値を更新してもよい。
(もとの重み付け値:もとのスコア欄730の値)+(特徴値:評価値欄420の値)×((できばえスコア)−A)/100=(更新後の重み付け値:変更後のスコア欄740の値)
定数Aは、0〜100の間の予め定められた値(例えば、50等)であるが、適宜調整した値としてよい。
具体的には、図7の例に示すようにできばえスコア710が「30」であった場合、重み付けテーブル720の1行目では、
10+8×(30−50)/100=8
となる。
依頼先決定モジュール110は、更新後の重み付け値を用いて、次回の文字認識サービス提供装置250の選択処理を行うこととなる。

0028

なお、画像の特徴以外に、各文字認識サービス提供装置250における処理時間(ファイルサイズあたりの処理時間、1文字あたりの文字認識処理時間等)を、文字認識サービス提供装置250を選択する場合のパラメータとしてもよい。また、文字認識サービス提供装置250のできばえスコアを、文字認識サービス提供装置250を選択する場合のパラメータとしてもよい。もちろんのことながら、このできばえスコアは、過去の文字認識処理におけるできばえスコアを用いたものである。例えば、直前の文字認識処理におけるできばえスコアであってもよいし、過去のできばえスコアの統計値であってもよい。
そして、ユーザー155の操作によって、「品質優先」、「処理時間優先」、「品質と処理時間との間のバランス」を、設定するようにしてもよい。
「処理時間優先」が設定されたならば、「ファイルサイズあたりの処理時間」又は「1文字あたりの文字認識処理時間」が、予め定められた値よりも短い(つまり、処理速度が速い)文字認識サービス提供装置250における重み付け値を高くするようにしてもよい。
「品質優先」が設定されたならば、「できばえスコア」が、予め定められた値よりも大きい(つまり、認識精度がよい)文字認識サービス提供装置250における重み付け値を高くするようにしてもよい。
「品質と処理時間との間のバランス」が設定されたならば、「ファイルサイズあたりの処理時間」又は「1文字あたりの文字認識処理時間」を3段階にグループ分けし、「できばえスコア」についても3段階にグループ分けし、両者が同じグループに属している文字認識サービス提供装置250における重み付け値を高くするようにしてもよい。「3段階にグループ分け」として、例えば、異なる2つの閾値を用いて、3つのグループに分けるようにすればよい。具体的には、閾値T1、T2(T1<T2)を予め定めておき、T1未満のグループ(1)、T1以上T2未満のグループ(2)、T2以上のグループ(3)のように分ければよい。
ここで「重み付け値を高くする処理」として、例えば、その文字認識サービス提供装置250における重み付け値に対して、予め定められた値(0より大きい値)を加算すること、予め定められた値(1以上の値)を乗算すること等を行えばよい。

0029

図8を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図8に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナ等のデータ読み取り部817と、プリンタ等のデータ出力部818を備えたハードウェア構成例を示している。

0030

CPU(Central Processing Unit)801は、前述の実施の形態において説明した各種のモジュール、すなわち、画像特徴検出モジュール105、依頼先決定モジュール110、パラメータ保存モジュール120等の各モジュールの実行シーケンス記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。

0031

ROM(Read Only Memory)802は、CPU801が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)803は、CPU801の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス804により相互に接続されている。

0032

ホストバス804は、ブリッジ805を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス806に接続されている。

0033

キーボード808、マウス等のポインティングデバイス809は、操作者により操作される入力デバイスである。ディスプレイ810は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報テキストイメージ情報として表示する。

0034

DD(Hard Disk Drive)811は、ハードディスク(フラッシュメモリ等であってもよい)を内蔵し、ハードディスクを駆動し、CPU801によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、ハードディスクは、相関データ記憶モジュール115等としての機能を実現させる。さらに、その他の各種データ(画像データ、文字認識結果、重み付け値等)、各種コンピュータ・プログラム等が格納される。

0035

ドライブ812は、装着されている磁気ディスク光ディスク光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体813に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース807、外部バス806、ブリッジ805、及びホストバス804を介して接続されているRAM803に供給する。リムーバブル記録媒体813も、ハードディスクと同様のデータ記録領域として利用可能である。

0036

接続ポート814は、外部接続機器815を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート814は、インタフェース807、及び外部バス806、ブリッジ805、ホストバス804等を介してCPU801等に接続されている。通信部816は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部817は、例えばスキャナであり、ドキュメント読み取り処理を実行する。データ出力部818は、例えばプリンタであり、ドキュメントデータ出力処理を実行する。

0037

なお、図8に示す情報処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図8に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific IntegratedCircuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図8に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器携帯電話スマートフォンモバイル機器ウェアラブルコンピュータ等を含む)、情報家電ロボット、複写機、ファックス、スキャナ、プリンタ、複合機などに組み込まれていてもよい。

0038

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイルディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリCD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスクFD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカルエリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。

0039

100…情報処理装置
105…画像特徴検出モジュール
110…依頼先決定モジュール
115…相関データ記憶モジュール
120…パラメータ保存モジュール
155…ユーザー
160…スキャン画像
210…画像処理装置
250…文字認識サービス提供装置
290…通信回線

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • フューチャー株式会社の「 照合システム、照合方法及び照合プログラム」が 公開されました。( 2020/06/04)

    【課題】本人確認時において、照合成功率を改善する。【解決手段】照合システム100は、予め入力された照合先デジタル情報を記憶しておく照合先デジタル情報記憶部33と、撮影中の照合元対象物の照合元画像データ... 詳細

  • 寺田治の「 プログラム」が 公開されました。( 2020/06/04)

    【課題】手書き情報または任意の情報を取得、または手書き情報を文字認識するための、ウェブブラウザの種類に依存しない高機能な方法を提供する。【解決手段】ウェブブラウザ部と、ウェブブラウザ部と同じ端末上で実... 詳細

  • キヤノン株式会社の「 画像処理装置及びその制御方法、プログラム」が 公開されました。( 2020/06/04)

    【課題】 原稿内の文字列を使ってフォルダパスを設定する際のユーザの手間を軽減することを目的とする。【解決手段】 本発明の画像処理装置は画像データに含まれる文字を認識し文字情報を取得する文字認識処理... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ