図面 (/)

技術 文字読み取りシステムおよび同システムにおける読み取り制御情報管理方法

出願人 株式会社東芝東芝ソフトウェアエンジニアリング株式会社
発明者 三浦孝司木崎豊
出願日 1998年9月28日 (20年10ヶ月経過) 出願番号 1998-273474
公開日 2000年4月11日 (19年4ヶ月経過) 公開番号 2000-105797
状態 特許登録済
技術分野 文字入力
主要キーワード フォーマット定義情報 訂正用情報 ハウス型 読み取りモジュール 出力定義情報 JOB番号 エラー訂正モジュール データ入力業務
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2000年4月11日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (7)

課題

リジェクトエラー訂正などの訂正処理や、出力変換処理の完了を待たずにFC情報を更新できるようにする。

解決手段

FC情報記憶部21には複数世代のFC情報が世代別に記録・管理されており、OCR読み取りモジュール11が読み取り結果データを用いて中間ファイルデータを生成するときには、その文字読み取り処理で使用されたFC情報の世代を示す世代情報が中間ファイルデータに付加される。リジェクトエラー訂正モジュール12および出力変換モジュール13によって訂正処理・出力変換処理を実行するときは、中間ファイルデータに付加されている世代情報を用いて、訂正処理または出力変換処理でどの世代のFC情報を使用するかが決定される。

概要

背景

従来より、帳票から文字を読み取る文字読み取りステムOCRシステム)が知られている。このOCRシステムは、帳票からの文字読み取り処理を行う読み取り処理、その読み取り結果訂正する訂正処理、および読み取り結果(または訂正処理後の読み取り結果)を所定の出力フォーマットに変換して出力する出力変換処理から構成されている。これら読み取り処理、訂正処理、出力変換処理では、フォーマット制御(FC;Format Control)情報と称される読み取り制御情報(以下、FC情報と称する)が用いられる。

このFC情報には、1)読み取り対象帳票のフォーマット定義情報、2)読み取り性能向上のための知識処理定義情報、3)読み取り結果のチェック・訂正のための画面定義を含む訂正用情報、4)読み取り結果の編集および出力ファイルフォーマット変換のための出力定義情報、等が定義されている。

FC情報は、読み取り対象の帳票種更新時や帳票内のフィールド構成の変更時のみならず、システムの性能アップのため、知識処理定義のバージョンアップ、チェック・訂正のための画面定義の変更、さらには出力ファイルフォーマットの変更などに合わせて更新されるが、文字読み取り処理と、訂正・出力変換処理との間の処理の整合性を維持するため、文字読み取り処理で使用するFC情報と、訂正・出力変換処理で使用するFC情報とは常に同一でなければならない。

したがって、FC情報の更新を行いたい場合でも、未だリジェクトエラー訂正などの訂正処理や、出力変換処理が完了されてない場合には、FC情報の更新作業を行うことはできない。よって、FC情報の更新時には、訂正・出力変換処理が完了するのまで、システムの運用を一旦停止することが必要とされた。

特に、複数台ワークステーションパーソナルコンピュータネットワーク接続し、1台(もしくは複数台)を文字読み取り処理専用の読み取り用端末として使用し、残りの複数台を訂正・出力変換専用の訂正用端末として使用するマルチコレクションシステムにおいては、全ての訂正用端末が訂正処理・出力変換処理の作業を完了し、未処理の読み取り結果データが無くなるまでは、FC情報の更新を行うことができず、これによって作業効率が著しく低下するという問題が生じる。

すなわち、マルチコレクションシステムでは、複数台の訂正用端末によって訂正・出力変換処理を並列的に実行することができると共に、読み取り用端末によって得られた読み取り結果をファイル(以下、中間ファイルと称する)として生成することにより、複数台の訂正用端末による訂正・出力変換処理と、読み取り用端末による読み取り処理とを非同期に実行することができるが、このマルチコレクションシステム環境下においても、文字読み取り処理で使用するFC情報と、訂正・出力変換処理で使用するFC情報とは常に同一でなければならない。よって、全ての訂正用端末が訂正処理および出力変換処理の作業を完了し、未処理の中間ファイルが無くなるまではFC情報を更新することが出来ず、新たなFC情報を用いた読み取り処理を開始することができない。これにより、読み取り処理の実行が中断されてしまい、マルチコレクションシステムの作業効率が著しく低下することになる。

概要

リジェクトエラー訂正などの訂正処理や、出力変換処理の完了を待たずにFC情報を更新できるようにする。

FC情報記憶部21には複数世代のFC情報が世代別に記録・管理されており、OCR読み取りモジュール11が読み取り結果データを用いて中間ファイルデータを生成するときには、その文字読み取り処理で使用されたFC情報の世代を示す世代情報が中間ファイルデータに付加される。リジェクトエラー訂正モジュール12および出力変換モジュール13によって訂正処理・出力変換処理を実行するときは、中間ファイルデータに付加されている世代情報を用いて、訂正処理または出力変換処理でどの世代のFC情報を使用するかが決定される。

目的

本発明はこのような事情に鑑みてなされたものであり、リジェクトエラー訂正などの訂正処理や出力変換処理の完了を待たずに任意のタイミングで読み取り制御情報(FC情報)を更新できるようにし、システムの運用を停止することなくFC情報のバージョンアップなどの処理を効率よく行うことができる文字読み取りシステムおよび同システムにおける読み取り制御情報管理方法を提供することを目的とする。

効果

実績

技術文献被引用数
0件
牽制数
1件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

読み取り制御情報を用いて帳票からの文字読み取り処理を行う文字読み取りシステムにおいて、前記読み取り制御情報の更新に応じてその読み取り制御情報を世代別に管理する読み取り制御情報世代管理手段と、前記文読み取り処理による読み取り結果データに、その文字読み取り処理で使用した読み取り制御情報の世代を示す世代情報を付加する手段とを具備することを特徴とする文字読み取りシステム。

請求項2

前記読み取り結果データの訂正処理または出力変換処理を実行するとき、前記読み取り結果データに付加されている世代情報を用いて、前記訂正処理または出力変換処理に使用する読み取り制御情報を選択する手段をさらに具備することを特徴とする請求項1記載の文字読み取りシステム。

請求項3

前記文字読み取り処理は、最新世代の読み取り制御情報を用いて実行されることを特徴とする請求項1または2記載の文字読み取りシステム。

請求項4

帳票からの文字読み取り処理、その読み取り結果の訂正処理、および出力変換処理を同一の読み取り制御情報を用いて実行する文字読み取りシステムにおいて、複数世代分の読み取り制御情報を保持する読み取り制御情報記憶手段と、帳票からの文字読み取り処理によって得られた読み取り結果データに付加されている世代情報を用いて、前記複数世代分の読み取り制御情報が保持されている読み取り制御情報記憶手段から、前記訂正処理または出力変換処理に使用する読み取り制御情報を選択する手段とを具備することを特徴とする文字読み取りシステム。

請求項5

帳票からの文字読み取り処理、その読み取り結果の訂正処理、および出力変換処理を同一の読み取り制御情報を用いて実行する文字読み取りシステムにおいて、前記読み取り制御情報の更新に応じてその読み取り制御情報を世代別に管理する読み取り制御情報世代管理手段と、前記文字読み取り処理による読み取り結果データに、その文字読み取り処理で使用した読み取り制御情報の世代を示す世代情報を付加する手段と、前記読み取り結果データの訂正処理または出力変換処理を実行するとき、前記読み取り結果データに付加されている世代情報を用いて、前記訂正処理または出力変換処理に使用する読み取り制御情報を選択する手段とを具備することを特徴とする文字読み取りシステム。

請求項6

帳票からの文字読み取り処理を実行する読み取り用端末と、この読み取り用端末にネットワーク接続され、前記文字読み取り処理によって得られた読み取り結果を含む中間ファイルデータを用いて前記読み取り結果の訂正処理を実行する複数の訂正用端末とを含み、帳票からの文字読み取り処理、その読み取り結果の訂正処理、および出力変換処理を同一の読み取り制御情報を用いて実行する文字読み取りシステムにおいて、前記読み取り制御情報の更新に応じてその読み取り制御情報を世代別に管理する読み取り制御情報世代管理手段と、前記文字読み取り処理による読み取り結果を含む中間ファイルデータに、その文字読み取り処理で使用した読み取り制御情報の世代を示す世代情報を付加する手段と、前記読み取り結果の訂正処理または出力変換処理を実行するとき、前記中間ファイルデータに付加されている世代情報を用いて、前記訂正処理または出力変換処理に使用する読み取り制御情報を選択する手段とを具備することを特徴とする文字読み取りシステム。

請求項7

帳票からの文字読み取り処理を行う文字読み取りシステムで用いられる読み取り制御情報を管理する読み取り制御情報管理方法であって、前記読み取り制御情報の更新に応じてその読み取り制御情報を世代別に管理し、前記文字読み取り処理による読み取り結果データに、その文字読み取り処理で使用した読み取り制御情報の世代を示す世代情報を付加することを特徴とする読み取り制御情報管理方法。

請求項8

前記読み取り結果データの訂正処理または出力変換処理を実行するとき、前記読み取り結果データに付加されている世代情報を用いて、前記訂正処理または出力変換処理に使用する読み取り制御情報を選択することを特徴とする請求項7記載の読み取り制御情報管理方法。

請求項9

帳票からの文字読み取り処理、その読み取り結果の訂正処理、および出力変換処理を同一の読み取り制御情報を用いて実行する文字読み取りシステムに適用される読み取り制御情報管理方法であって、前記読み取り結果データの訂正処理または出力変換処理を実行するとき、帳票からの文字読み取り処理によって得られた読み取り結果データに付加されている世代情報を用いて、世代別に管理されている複数世代分の読み取り制御情報の中から読み取り制御情報を選択し、その選択した読み取り制御情報を使用して、前記読み取り結果データの訂正処理または出力変換処理を実行することを特徴とする読み取り制御情報管理方法。

請求項10

帳票からの文字読み取り処理、その読み取り結果の訂正処理、および出力変換処理を同一の読み取り制御情報を用いて実行する文字読み取りシステムに適用される読み取り制御情報管理方法であって、前記読み取り制御情報の更新に応じてその読み取り制御情報を世代別に管理し、前記文字読み取り処理による読み取り結果データに、その文字読み取り処理で使用した読み取り制御情報の世代を示す世代情報を付加し、前記読み取り結果の訂正処理または出力変換処理を実行するとき、前記読み取り結果データに付加されている世代情報を用いて、前記訂正処理または出力変換処理に使用する読み取り制御情報を選択することを特徴とする読み取り制御情報管理方法。

請求項11

帳票からの文字読み取り処理を実行する読み取り用端末と、この読み取り用端末にネットワーク接続され、前記文字読み取り処理によって得られた読み取り結果を含む中間ファイルデータを用いて前記読み取り結果の訂正処理を実行する複数の訂正用端末とを含み、帳票からの文字読み取り処理、その読み取り結果の訂正処理、および出力変換処理を同一の読み取り制御情報を用いて実行する文字読み取りシステムに適用される読み取り制御情報管理方法であって、前記読み取り制御情報の更新に応じてその読み取り制御情報を世代別に管理し、前記文字読み取り処理による読み取り結果を含む中間ファイルデータに、その文字読み取り処理で使用した読み取り制御情報の世代を示す世代情報を付加し、前記読み取り結果の訂正処理または出力変換処理を実行するとき、前記中間ファイルデータに付加されている世代情報を用いて、前記訂正処理または出力変換処理に使用する読み取り制御情報を選択することを特徴とする読み取り制御情報管理方法。

技術分野

0001

本発明は帳票からの文字読み取り処理、その読み取り結果訂正処理、および出力変換処理を同一の読み取り制御情報を用いて実行する文字読み取りシステムおよび同システムにおける読み取り制御情報管理方法に関する。

背景技術

0002

従来より、帳票から文字を読み取る文字読み取りシステム(OCRシステム)が知られている。このOCRシステムは、帳票からの文字読み取り処理を行う読み取り処理、その読み取り結果を訂正する訂正処理、および読み取り結果(または訂正処理後の読み取り結果)を所定の出力フォーマットに変換して出力する出力変換処理から構成されている。これら読み取り処理、訂正処理、出力変換処理では、フォーマット制御(FC;Format Control)情報と称される読み取り制御情報(以下、FC情報と称する)が用いられる。

0003

このFC情報には、1)読み取り対象帳票のフォーマット定義情報、2)読み取り性能向上のための知識処理定義情報、3)読み取り結果のチェック・訂正のための画面定義を含む訂正用情報、4)読み取り結果の編集および出力ファイルフォーマット変換のための出力定義情報、等が定義されている。

0004

FC情報は、読み取り対象の帳票種更新時や帳票内のフィールド構成の変更時のみならず、システムの性能アップのため、知識処理定義のバージョンアップ、チェック・訂正のための画面定義の変更、さらには出力ファイルフォーマットの変更などに合わせて更新されるが、文字読み取り処理と、訂正・出力変換処理との間の処理の整合性を維持するため、文字読み取り処理で使用するFC情報と、訂正・出力変換処理で使用するFC情報とは常に同一でなければならない。

0005

したがって、FC情報の更新を行いたい場合でも、未だリジェクトエラー訂正などの訂正処理や、出力変換処理が完了されてない場合には、FC情報の更新作業を行うことはできない。よって、FC情報の更新時には、訂正・出力変換処理が完了するのまで、システムの運用を一旦停止することが必要とされた。

0006

特に、複数台ワークステーションパーソナルコンピュータネットワーク接続し、1台(もしくは複数台)を文字読み取り処理専用の読み取り用端末として使用し、残りの複数台を訂正・出力変換専用の訂正用端末として使用するマルチコレクションシステムにおいては、全ての訂正用端末が訂正処理・出力変換処理の作業を完了し、未処理の読み取り結果データが無くなるまでは、FC情報の更新を行うことができず、これによって作業効率が著しく低下するという問題が生じる。

0007

すなわち、マルチコレクションシステムでは、複数台の訂正用端末によって訂正・出力変換処理を並列的に実行することができると共に、読み取り用端末によって得られた読み取り結果をファイル(以下、中間ファイルと称する)として生成することにより、複数台の訂正用端末による訂正・出力変換処理と、読み取り用端末による読み取り処理とを非同期に実行することができるが、このマルチコレクションシステム環境下においても、文字読み取り処理で使用するFC情報と、訂正・出力変換処理で使用するFC情報とは常に同一でなければならない。よって、全ての訂正用端末が訂正処理および出力変換処理の作業を完了し、未処理の中間ファイルが無くなるまではFC情報を更新することが出来ず、新たなFC情報を用いた読み取り処理を開始することができない。これにより、読み取り処理の実行が中断されてしまい、マルチコレクションシステムの作業効率が著しく低下することになる。

発明が解決しようとする課題

0008

上述のように、従来では、FC情報の更新を行いたい場合でも、未だリジェクトエラー訂正などの訂正処理や、出力変換処理が完了されてない場合には、FC情報の更新作業を行うことはできないので、FC情報の更新時には、訂正・出力変換処理が完了するまで、システムの運用が停止されてしまうという欠点があった。

0009

本発明はこのような事情に鑑みてなされたものであり、リジェクトエラー訂正などの訂正処理や出力変換処理の完了を待たずに任意のタイミングで読み取り制御情報(FC情報)を更新できるようにし、システムの運用を停止することなくFC情報のバージョンアップなどの処理を効率よく行うことができる文字読み取りシステムおよび同システムにおける読み取り制御情報管理方法を提供することを目的とする。

課題を解決するための手段

0010

上述の課題を解決するため、本発明は、読み取り制御情報を用いて帳票からの文字読み取り処理を行う文字読み取りシステムにおいて、前記読み取り制御情報の更新に応じてその読み取り制御情報を世代別に管理する読み取り制御情報世代管理手段と、前記文字読み取り処理による読み取り結果を含む中間ファイルデータに、その文字読み取り処理で使用した読み取り制御情報の世代を示す世代情報を付加する手段とを具備することを特徴とする。

0011

この文字読み取りシステムにおいては、読み取り制御情報の世代管理が行われており、文字読み取り処理による読み取り結果データである中間ファイルデータを生成するときには、その文字読み取り処理で使用された読み取り制御情報の世代を示す世代情報が中間ファイルデータに付加される。したがって、読み取り結果の訂正処理または出力変換処理を実行するときは、中間ファイルデータに付加されている世代情報を用いて、訂正処理または出力変換処理に使用する読み取り制御情報を選択することが可能となるので、未だ訂正処理または出力変換処理が完了しておらず中間ファイルデータが残っている状態であっても、システムの運用を停止することなく読み取り制御情報の更新を行うことができるようになり、最新の読み取り制御情報を用いた文字読み取り処理をすぐに開始できる。よって、訂正処理や出力変換処理の完了を待たずに任意のタイミングでFC情報を更新できるようになり、システムの運用を停止することなくFC情報のバージョンアップなどの処理を効率よく行うことができる。

0012

また、本発明は、帳票からの文字読み取り処理を実行する読み取り用端末と、この読み取り用端末にネットワーク接続され、前記文字読み取り処理によって得られた読み取り結果を含む中間ファイルデータを用いて前記読み取り結果の訂正処理を実行する複数の訂正用端末とを含み、帳票からの文字読み取り処理、その読み取り結果の訂正処理、および出力変換処理を同一の読み取り制御情報を用いて実行する文字読み取りシステムにおいて、前記読み取り制御情報の更新に応じてその読み取り制御情報を世代別に管理する読み取り制御情報世代管理手段と、前記文字読み取り処理による読み取り結果を含む中間ファイルデータに、その文字読み取り処理で使用した読み取り制御情報の世代を示す世代情報を付加する手段と、前記読み取り結果の訂正処理または出力変換処理を実行するとき、前記中間ファイルデータに付加されている世代情報を用いて、前記訂正処理または出力変換処理に使用する読み取り制御情報を選択する手段とを具備することを特徴とする。

0013

このように、マルチコレクションシステム環境に前述のような読み取り制御情報の世代管理を適用することにより、そのシステム性能の向上を図ることが可能となる。

発明を実施するための最良の形態

0014

以下、図面を参照して本発明の実施形態を説明する。図1には、本発明の一実施形態に係る文字読み取りシステム(以下、OCRシステムと称する)の基本構成が示されている。このOCRシステムは各種伝票などの帳票から文字を読み取り、その読み取り結果のチェック・訂正を行った後に所定の出力ファイル形式に変換してユーザアプリケーションに渡すためのものであり、図示のように、OCR読み取りモジュール11、リジェクトエラー訂正モジュール12、出力変換モジュール13、FC情報記憶部21、中間ファイル記憶部22、および出力ファイル記憶部23から構成されている。OCR読み取りモジュール11、リジェクトエラー訂正モジュール12、出力変換モジュール13はそれぞれソフトウェアによって実現されている。

0015

FC情報記憶部21には複数世代のFC情報が記憶・管理されている。これら複数世代のFC情報それぞれには、それに対応するFC世代番号対応付けられている。各FC情報は、前述したように、帳票読み取り、訂正、出力変換のための定義情報であり、1)読み取り対象帳票のフォーマット定義情報、2)読み取り性能向上のための知識処理定義情報、3)読み取り結果のチェック・訂正のための画面定義を含む訂正用情報、4)読み取り結果の編集および出力ファイルのフォーマット変換のための出力定義情報、等から構成されている。FC情報は、読み取り対象の帳票種の更新時や帳票内のフィールド御構成の変更時のみならず、システムの性能アップのため、知識処理定義のバージョンアップ、チェック・訂正のための画面定義の変更、さらには出力ファイルフォーマットの変更などに合わせて更新される。

0016

OCR読み取りモジュール11は、FC情報記憶部21に記憶されているFC情報に従って帳票から文字を読み取るためのソフトウェアモジュールであり、スキャナ等によって読み込まれた帳票イメージからフィールドおよび文字の切り出しを行い、そして各文字パターンを、良く知られたパターン解析構造解析処理、知識処理などを用いた文字認識処理を得て文字コードに変換する。このOCR読み取りモジュール11による読み取り処理では、常に最新世代のFC情報が用いられる。そして、OCR読み取りモジュール11では、その読み取り結果データが、認識文字コード、認識不能の捨て文字(リジェクト文字)の発生位置を示すリジェクトパターンデータ、類似文字の候補を示す候補文字情報、さらには帳票全体イメージ情報などを含む中間ファイルとして生成され、それが中間ファイル記憶部22に記憶される。

0017

この場合、中間ファイルには、OCR読み取りモジュール11が使用したFC情報に対応する世代番号がFC世代管理情報として付加される。リジェクトエラー訂正モジュール12は、FC情報記憶部21に記憶されているFC情報で規定された画面定義などに従って中間ファイルから訂正用画面を作成し、そしてその訂正用画面上で行われるユーザからの入力操作に従ってリジェクトエラー訂正などのエラー訂正処理を行う。訂正用画面上には、認識結果と帳票イメージとが対応して表示される。また、リジェクト文字に対応する位置には「?」などの記号が表示され、ユーザによって文字コードがキー入力されると、「?」の記号が入力文字コードに置き換えられる。

0018

このリジェクトエラー訂正モジュール12で使用するFC情報の世代は、訂正処理対象の中間ファイルに付加されたFC世代管理情報に従って選択される。出力変換モジュール13は、FC情報記憶部21に記憶されているFC情報で規定された出力ファイル形式に従って、リジェクトエラー訂正モジュール12による訂正が反映された中間ファイル(エラー無しの場合は、訂正処理が行われてない中間ファイル)上の読み取り結果を出力ファイルに変換し、それをユーザアプリケーションに渡すための出力ファイル記憶部23に格納する。この出力変換モジュール13で使用するFC情報の世代も、訂正処理対象の中間ファイルに付加されたFC世代管理情報に従って選択される。

0019

図2には、リジェクトエラー訂正モジュール12および出力変換モジュール13による訂正・出力変換処理で使用されるFC情報と、中間ファイルに付加されたFC世代管理情報との対応関係が示されている。

0020

ここでは、中間ファイル#1、#2にはFC世代番号#1を示すFC世代管理情報が付加されており、また中間ファイル#3にはFC世代番号#2のFC世代管理情報が、中間ファイル#4、#5にはFC世代番号#3のFC世代管理情報が、中間ファイル#6にはFC世代番号#4のFC世代管理情報が付加されている場合が示されている。

0021

この場合、中間ファイル#1または#2が訂正・出力変換処理対象の中間ファイルとしてリジェクトエラー訂正モジュール12および出力変換モジュール13によって選択された場合は、FC世代番号#1のFC情報が訂正・出力変換処理に用いられる。同様に、中間ファイル#3が訂正・出力変換処理対象として選択された場合はFC世代番号#2のFC情報が、中間ファイル#4または#5が選択された場合にはFC世代番号#3のFC情報が、中間ファイル#6が選択された場合にはFC世代番号#4のFC情報が、それぞれ訂正・出力変換処理に用いられる。

0022

次に、図3を参照して、FC情報世代管理の具体的な仕組みについて説明する。ここでは、FCテーブル単位で世代管理を行う場合を例示する。FCテーブルは、例えば在庫管理業務、発注業務納品業務といった帳票を用いた各データ入力処理業務(JOB)毎に、それら各業務で使用される帳票種(ID)それぞれに対応したFC情報を管理するためのものであり、図3(A)のような階層型ディレクトリ構造でFC情報記憶部21に記憶されている。

0023

このFCテーブル内の任意のFC情報の更新が行われる度、旧世代のFCテーブルを記憶・管理するためのディレクトリが作成され、そこに今まで使用していたFCテーブルの内容がコピーされ、今まで使用していたFCテーブルは最新の内容に更新される。図3(B)に、FCテーブルの世代管理構造の一例を示す。

0024

図3(B)では、3世代のFCテーブルが記憶されており、最新世代のFCテーブルについては「FCTABLE」というディレクトリに格納し、1世代前のFCテーブルは「FC TABLE01」というディレクトリに、また2世代前のFCテーブルは「FC TABLE02」というディレクトリに格納している。

0025

前述のFC世代番号として3世代の世代番号#1、#2、#3を使用する場合には、最新世代を示す世代番号#3が「FCTABLE」というディレクトリに対応し、1世代前を示す世代番号#2が「FC TABLE01」というディレクトリに対応し、2世代前を示す世代番号#1が「FC TABLE02」というディレクトリに対応することになる。なお、FCテーブル管理情報は、FCテーブルの所在とその世代番号との対応関係を定義できるものであればどのようなものであってもよい。

0026

このようにFC情報をその更新に応じて世代別に管理しておき、中間ファイル作成時には使用したFC情報の世代番号を中間ファイルに追加し、訂正・出力変換処理時には、中間ファイルに追加された世代番号を用いて使用するFC情報を決定することにより、システムの運用を停止することなくFC情報を更新することが可能となる。

0027

図4には、本OCRシステムを用いたマルチコレクションシステムの構成例が示されている。このマルチコレクションシステムは、前述したように、複数台のワークステーションやパーソナルコンピュータをネットワーク接続し、1台(もしくは複数台)を文字読み取り処理専用の読み取り用端末として使用し、残りの複数台を訂正・出力変換専用の訂正用端末として使用するシステムである。このマルチコレクションシステムには、読み取り用端末と訂正用端末とを営業所事業所などの同一サイト内に配置するインハウス型のものと、読み取り用端末と訂正用端末とを異なるサイトに配置して、その間を公衆網専用回線を用いて接続する遠隔システム型のものとがあるが、ここでは、遠隔システム型の構成について説明する。

0028

読み取り処理を行うための読み取りサイトにおいては、図示のように読み取り端末101と、帳票読み取り用のスキャナおよび専用の文字認識装置から構成されるOCR装置102と、FC情報記憶部103が設けられる。読み取り端末101では、前述のOCR読み取りモジュール11が実行される。このOCR読み取りモジュール11により認識処理を全てソフトウェアで実行する場合には、OCR装置102の代わりに、帳票読み取り用のスキャナのみを設ければよい。

0029

読み取り端末101は、公衆網や専用回線から構成されるネットワーク201を介して、各訂正・出力サイトのサーバコンピュータ301に接続されている。各訂正・出力サイトには、サーバコンピュータ301の他、FC情報記憶部302、中間ファイル記憶部303、サーバコンピュータ301にLAN経由で接続された複数台の訂正用端末(訂正クライアント)304が配置されている。各訂正用端末(訂正クライアント)304では、前述のリジェクトエラー訂正モジュール12および出力変換モジュール13が実行される。

0030

このマルチコレクションシステムにおいては、新たな帳票種の追加時やシステムの性能アップのために読み取りサイトのFC情報記憶部103の内容を更新する場合には、リモートメンテナンス処理が実行されて、各訂正・出力サイト内に配置されたFC情報記憶部302の更新も合わせて実行される。FC情報記憶部103およびFC情報記憶部302においては、図3で説明したように、FCテーブルを単位として、複数世代のFC情報が世代毎に管理されている。

0031

読み取り端末101によって生成された中間ファイルは、ネットワーク201を介してサーバコンピュータ301に送られ、中間ファイル記憶部303に格納される。この場合、読み取り端末101から送信される中間ファイルには、読み取り処理で使用したFC情報の世代を示すFC世代管理情報が付加される。

0032

各訂正クライアント304は、中間ファイル記憶部303からリジェクト訂正・出力変換対象の中間ファイルを選択し、その中間ファイルに付加されたFC世代情報で指定されるFC情報をFC情報記憶部302から検索する。そして、そのFC情報を用いて、訂正・出力変換処理を実行する。

0033

なお、読み取りサイトから訂正・出力サイトへの中間ファイルの送信や訂正・出力サイト側のFC情報の更新処理などは、読み取り端末101およびサーバコンピュータ301にネットワーク接続されたホストコンピュータ401経由で実行するようにしてもよい。また、このホストコンピュータ401によるリモートメンテナンス処理によって、読み取りサイトのFC情報記憶部103の内容と各訂正・出力サイトのFC情報記憶部302の内容の双方を、ネットワーク経由で更新することも可能である。さらに、各訂正クライアント304では訂正処理のみを行い、訂正処理された中間ファイルをホストコンピュータ401に送信し、そのホストコンピュータ401にて出力・変換処理を行うようにしても良い。

0034

次に、図5フローチャートを参照して、読み取り端末101上で実行されるOCR読み取り処理の手順について説明する。読み取り端末101上のOCR読み取りモジュール11は、まず、データ入力業務の種類を特定するためにJOB番号の選択を行う(ステップS101)、そして帳票の読み取りを開始する(ステップS102)。帳票にはその帳票種を示すID番号情報が記されており、OCR読み取りモジュール11は、ステップS102の読み取り処理結果からID番号を検出する(ステップS103)。この後、OCR読み取りモジュール11は、最新世代のFCテーブルをピックアップして(ステップS104)、そのテーブルから、ステップS101で選択されたJOB番号および検出したID番号に対応するFC情報を取得する(ステップS105)。

0035

そして、OCR読み取りモジュール11は、そのFC情報に定義された読み取り用のフォーム定義や知識処理定義情報を用いて読み取り処理を行い(ステップS106)、認識文字コード、認識不能の捨て文字(リジェクト文字)の発生位置を示すリジェクトパターンデータ、類似文字の候補を示す候補文字情報、さらには帳票全体のイメージ情報などを含む中間ファイルを生成する(ステップS107)。そして、ステップS106で使用したFC情報の世代番号を示すFC世代情報を中間ファイルに付加して出力する(ステップS108)。具体的には、中間ファイルの所定位置に、FC世代情報を埋め込めばよい。

0036

次に、図6のフローチャートを参照して、各訂正クライアント304上で実行される訂正・出力変換処理の手順について説明する。訂正クライアント304上のリジェクトエラー訂正モジュール12および出力変換モジュール13は、まず、訂正・出力変換処理対象の中間ファイルを選択し(ステップS201)、その選択した中間ファイルからFC世代管理情報を取得する(ステップS203)。ついで、リジェクトエラー訂正モジュール12および出力変換モジュール13は、FC世代管理情報で指定される世代のFC情報をFC情報記憶部302から取り込み(ステップS203)、そのFC情報の画面定義や出力フォーマットを用いて訂正処理や出力変換処理を実行する(ステップS204)。

0037

このようにマルチコレクションシステム環境にFC情報の世代管理を適用することにより、訂正処理または出力変換処理が完了しておらず中間ファイルが残っている状態であっても、システムの運用を停止することなくFC情報の更新を行うことができるようになり、最新のFC情報を用いた読み取り処理をすぐに開始することが可能となる。

0038

なお、中間ファイルに付加するFC世代管理情報としては、世代番号の他、使用したFC情報の更新日時など情報を用いることもできる。この場合には、複数世代のFC情報を更新日時情報に対応付けて記憶・管理しておき、中間ファイルに付加された更新日時情報を基に、訂正・出力変換処理で使用するFC情報を検索すればよい。

0039

また、FC情報の世代管理は、FCテーブル単位のみならず、例えばJOB単位やID番号単位で行うことも可能である。さらに、本実施形態のOCRシステムを構成するOCR読み取りモジュール11、リジェクトエラー訂正モジュール12、出力変換モジュール13はコンピュータプログラムとして実現できるので、これらを記録媒体を通じて通常のコンピュータに導入したり、あるいはネットワーク接続された複数のコンピュータにその役割に応じて選択的に導入するだけで、本実施形態と同様の効果を得ることが可能となる。

発明の効果

0040

以上説明したように、本発明によれば、リジェクトエラー訂正などの訂正処理や出力変換処理の完了を待たずに任意のタイミングで読み取り制御情報(FC情報)を更新できるようになり、システムの運用を停止することなくFC情報のバージョンアップなどの処理を効率よく行うことが可能となる。

図面の簡単な説明

0041

図1本発明の一実施形態に係るOCRシステムの基本構成を示すブロック図。
図2同実施形態のシステムで用いられる中間ファイルに付加されたFC世代管理情報と訂正・出力変換処理で使用されるFC情報との対応関係を示す図。
図3同実施形態のシステムにおけるFC情報世代管理の具体的な仕組みを説明するための図。
図4同実施形態のシステムを適用したマルチコレクションシステムの構成例を示すブロック図。
図5同実施形態のシステムにおけるOCR読み取り処理の手順を示すフローチャート。
図6同実施形態のシステムにおける訂正・出力変換処理の手順を示すフローチャート。

--

0042

11…OCR読み取りモジュール
12…リジェクトエラー訂正モジュール
13…出力変換モジュール
21…FC情報記憶部
22…中間ファイル記憶部
23…出力ファイル記憶部
101…読み取り端末
102…OCR装置
103…FC情報記憶部
201…ネットワーク
301…サーバコンピュータ
302…FC情報記憶部
303…中間ファイル記憶部
304…訂正クライアント
401…ホストコンピュータ

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ