図面 (/)

技術 文字認識前処理装置

出願人 株式会社エヌ・ティ・ティ・データ
発明者 大竹紀明中嶋正臣桜井隆博大浦貴裕
出願日 1994年3月24日 (26年7ヶ月経過) 出願番号 1994-078113
公開日 1995年10月13日 (25年1ヶ月経過) 公開番号 1995-262311
状態 拒絶査定
技術分野 文字入力 文字認識
主要キーワード 前処理制御 水平分布 書込ページ ラインマーク 読み込み文字 濃淡補正 ページデータ領域 光学式文字読取り装置
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1995年10月13日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (9)

目的

文字認識前処理装置において、処理量の多い文字処理高速に行ない、かつ前処理部バスライン負荷を削減して前処理全体を高速に行なう。

構成

前処理全体の制御を行う前処理制御装置1に対して、前処理部バスライン8を介して、の前処理を行う画像処理装置2が接続されている。画像処理装置2には、イメージスキャナのような画像取得装置3と、画像取得装置3からの書面イメージを格納するページデータ記憶装置4と、行イメージを格納するラインデータ記憶装置5と、文字パタンを格納する文字データ記憶装置6とが接続されている。画像処理装置2は、書面イメージをページデータ記憶装置4に書き込むページ処理と、ページデータ記憶装置4からデータを読み出しラインデータ記憶装置5に書込む行処理及び文字処理(濃度補正2値化、フィルタ処理)と、ラインデータ記憶装置6からデータを読み出し文字データ記憶装置に書込む文字処理(正規化文字切出し処理)とを同時並行的に実行する。

概要

背景

OCRは、機械によって印字された文字または手書きの文字を光学式読み取り、そのパタン電気信号に変換して、コンピュータに入力する装置である。

OCRに入力される画像には、傾き、濃淡汚れ(以後、雑音という)等があり、これらは文字認識を行なうためには理想的ではない。

精度良く文字認識を行なうために、OCRでは画像の傾きを補正したり、入力された画像から雑音等を取り除き指定された文字領域から1文字ずつ文字を切り出す前処理が行なわれている。

前処理には、画像の取得と入力された画像の傾きを補正するページ処理ラインマーク等により行中心を求める行処理、及び文字毎に文字の整形や切り出しを行なう文字処理がある。

さらに、文字処理には次のような処理が含まれる。

(1)濃淡補正:入力された画像の濃淡を整えること。

(2)2値化:入力された多階調の画像を適切な閾値で白と黒に量子化すること。

(3)フィルタ:入力された画像から雑音等を取り除くこと。

(4)正規化:大きさや位置を整えること。

(5)切り出し:2値化された画像から1文字ずつ文字を出力すること。

図6は、前処理を行なう従来装置の一例を示すブロック構成図である。

前処理制御装置101は、前処理全体を制御し、画像処理装置102から通知される画像の傾き情報、ラインマークの上端下端位置等に基づき補正処理を行なう。また、前処理制御装置101は、画像処理装置102に対して前処理を行なう画像の領域を指定し、処理の開始指示等を行なう。

画像処理装置102は、前処理制御装置101から指示される画像の指定領域に対して上述した内容の前処理を行なう。

画像取得装置103は、書面の画像を取得する装置で例えばイメージスキャナ等である。

ページラインデータ記憶装置104は、画像取得装置103から入力された書面の多値画像(ページデータ)を格納するページデータ領域と、この多値画像に2値化処理等を行った結果(2値画像)を格納するラインデータ領域からなる。

文字データ記憶装置106は、2値画像から切り出された文字パタンを格納する。

図7は、図6の装置における前処理の概略的処理流れを示すフローチャートである。

図7に示すように、まずページ処理を行ない(S1)、次に行処理を行ない(S2)、続いて、その行処理を行なった行内の全文字に対して、文字処理を行なう(S3)。その行内の全文字の文字処理が終了すると(S4)、次の行の行処理を行ない、全行が終了するまで繰り返す(S5)。

図6には、ページ処理、行処理及び文字処理におけるデータ流れが、各処理の参照符号〜を伴った矢印で示されている。

まず、ページ処理では、画像処理装置102が画像取得装置103から入力されるページデータ(多値画像)をページ/ラインデータ記憶装置104のページデータ領域に格納する。これと同時に、画像処理装置102は入力されたページデータから傾き情報を抽出し、前処理制御装置101へ通知する。前処理制御装置101はこの傾き情報から画像の傾きを補正する。

行処理では、画像処理装置102がページ/ラインデータ記憶装置104のページデータ領域に格納されているページデータ(多値画像)を読み出し、ラインマークの上端/下端位置等を検出する。前処理制御装置101は、このラインマークの上端/下端位置等から行中心を算出する。

文字処理の濃度補正・2値化・フィルタ処理では、画像処理装置102がページ/ラインデータ記憶装置104のページデータ領域に格納されているページデータ(多値画像)を読み出し、これに濃度補正・2値化・フィルタ処理を施し、その処理結果(2値画像)をページ/ラインデータ記憶装置104のラインデータ領域へ書き込む。これと同時に、画像処理装置102は処理領域の黒点の垂直/水平分布等を算出し、前処理制御装置101に通知する。前処理制御装置101は、黒点の垂直/水平分布等から文字の切り出し位置を決定する。

文字処理の正規化・切り出し処理では、画像処理装置102がページ/ラインデータ記憶装置104のラインデータ領域に格納されている濃度補正・2値化・フィルタ処理された画像(2値画像)を読み出し、各文字を切出して、切出した文字パタンを前処理部バスライン108を通じて文字データ記憶装置106へ書込む

また、以上の構成において、前処理を高速に行なうために、ページ/ラインデータ記憶装置104内にページデータを格納する領域を2面持ち、画像処理装置102が一方の領域にページ処理を行なっている時に、もう一方の領域に行処理や文字処理を行なうようなことも行われている。

図8は、このようなページ/ラインデータ記憶装置104内にページデータを格納する領域を2面(ページデータ領域1、ページデータ領域2)持つ前処理装置における処理の流れを示したものである。

図8に示すように、ページデータ領域1に対するページデータの書込み(ページ処理)と、ページデータ領域2からのデータの読み出し及びラインデータ領域への書込み(行処理や文字処理)とが同時並行的に行われ、これにより処理の高速化か図られている。

一方、行処理と文字処理(濃淡補正、2値化、フィルタ処理)と文字処理(正規化、切り出し処理)とは逐次的に処理されている。その理由は、図6に示したように、画像処理装置102とページ/ラインデータ記憶装置104との間は1つのバスラインで接続されているため、ページ/ラインデータ記憶装置104からのデータ読み出しが競合する行処理、文字処理及び文字処理は同時並行的には実行できないからである。

概要

文字認識前処理装置において、処理量の多い文字処理を高速に行ない、かつ前処理部バスラインの負荷を削減して前処理全体を高速に行なう。

前処理全体の制御を行う前処理制御装置1に対して、前処理部バスライン8を介して、の前処理を行う画像処理装置2が接続されている。画像処理装置2には、イメージスキャナのような画像取得装置3と、画像取得装置3からの書面イメージを格納するページデータ記憶装置4と、行イメージを格納するラインデータ記憶装置5と、文字パタンを格納する文字データ記憶装置6とが接続されている。画像処理装置2は、書面イメージをページデータ記憶装置4に書き込むページ処理と、ページデータ記憶装置4からデータを読み出しラインデータ記憶装置5に書込む行処理及び文字処理(濃度補正、2値化、フィルタ処理)と、ラインデータ記憶装置6からデータを読み出し文字データ記憶装置に書込む文字処理(正規化、文字切出し処理)とを同時並行的に実行する。

目的

従って、本発明の目的は、文字認識前処理において、処理量の多い文字処理が高速に行なえ、かつ、前処理部バスラインの負荷を削減し、もって前処理全体を高速に実行できる文字認識前処理装置を提供することにある。

効果

実績

技術文献被引用数
1件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

画像取得装置から書面イメージを受け、この書面イメージから行イメージを取り出し、そして、この行イメージから文字認識されるべき文字パタンを切出すための所定の前処理を行う画像処理装置と、前記画像処理装置と接続された、前記書面イメージを格納するための第1の記憶装置と、前記画像処理装置と接続された、前記行イメージを格納するための第2の記憶装置と、前記画像処理装置と接続された、前記文パタンを格納するための第3の記憶装置と、を備え、前記第3の記憶装置がこれに専用のバスラインを介して前記画像処理装置と接続されていることを特徴とする文字認識前処理装置

請求項2

画像取得装置から書面イメージを受け、この書面イメージから行イメージを取り出し、そして、この行イメージから文字認識されるべき文字パタンを切出すための所定の前処理を行う画像処理装置と、前記画像処理装置と接続された、前記書面イメージを格納するための第1の記憶装置と、前記画像処理装置と接続された、前記行イメージを格納するための第2の記憶装置と、前記画像処理装置と接続された、前記文字パタンを格納するための第3の記憶装置と、を備え、前記第1、第2及び第3の記憶装置が、それぞれ別個のバスラインを介して前記画像処理装置と接続されていることを特徴とする文字認識前処理装置。

請求項3

請求項2記載の文字認識前処理装置において、前記第2の記憶装置が、前記行イメージを各々格納できる2つのラインイメージ格納領域を有することを特徴とする文字認識前処理装置。

請求項4

請求項3記載の文字認識前処理装置において、前記第1、第2及び第3の記憶装置が、各々に専用のバスラインを介して前記画像処理装置と接続され、前記第1の記憶装置が、前記書面イメージを各々格納できる2つのページデータ格納領域を有し、前記第3の記憶装置が、前記文字パタンを各々格納できる複数の文字データ格納領域を有することを特徴とする文字認識前処理装置。

技術分野

0001

本発明は、光学式文字読取り装置OCR:Optical Character Reader)等に使用する文字認識前処理装置に関し、特に、入力された画像から雑音等を取り除き、文字切出し処理を行なう文字認識前処理装置に関するものである。

背景技術

0002

OCRは、機械によって印字された文字または手書きの文字を光学式読み取り、そのパタン電気信号に変換して、コンピュータに入力する装置である。

0003

OCRに入力される画像には、傾き、濃淡汚れ(以後、雑音という)等があり、これらは文字認識を行なうためには理想的ではない。

0004

精度良く文字認識を行なうために、OCRでは画像の傾きを補正したり、入力された画像から雑音等を取り除き指定された文字領域から1文字ずつ文字を切り出す前処理が行なわれている。

0005

前処理には、画像の取得と入力された画像の傾きを補正するページ処理ラインマーク等により行中心を求める行処理、及び文字毎に文字の整形や切り出しを行なう文字処理がある。

0006

さらに、文字処理には次のような処理が含まれる。

0007

(1)濃淡補正:入力された画像の濃淡を整えること。

0008

(2)2値化:入力された多階調の画像を適切な閾値で白と黒に量子化すること。

0009

(3)フィルタ:入力された画像から雑音等を取り除くこと。

0010

(4)正規化:大きさや位置を整えること。

0011

(5)切り出し:2値化された画像から1文字ずつ文字を出力すること。

0012

図6は、前処理を行なう従来装置の一例を示すブロック構成図である。

0013

前処理制御装置101は、前処理全体を制御し、画像処理装置102から通知される画像の傾き情報、ラインマークの上端下端位置等に基づき補正処理を行なう。また、前処理制御装置101は、画像処理装置102に対して前処理を行なう画像の領域を指定し、処理の開始指示等を行なう。

0014

画像処理装置102は、前処理制御装置101から指示される画像の指定領域に対して上述した内容の前処理を行なう。

0015

画像取得装置103は、書面の画像を取得する装置で例えばイメージスキャナ等である。

0016

ページラインデータ記憶装置104は、画像取得装置103から入力された書面の多値画像(ページデータ)を格納するページデータ領域と、この多値画像に2値化処理等を行った結果(2値画像)を格納するラインデータ領域からなる。

0017

文字データ記憶装置106は、2値画像から切り出された文字パタンを格納する。

0018

図7は、図6の装置における前処理の概略的処理流れを示すフローチャートである。

0019

図7に示すように、まずページ処理を行ない(S1)、次に行処理を行ない(S2)、続いて、その行処理を行なった行内の全文字に対して、文字処理を行なう(S3)。その行内の全文字の文字処理が終了すると(S4)、次の行の行処理を行ない、全行が終了するまで繰り返す(S5)。

0020

図6には、ページ処理、行処理及び文字処理におけるデータ流れが、各処理の参照符号〜を伴った矢印で示されている。

0021

まず、ページ処理では、画像処理装置102が画像取得装置103から入力されるページデータ(多値画像)をページ/ラインデータ記憶装置104のページデータ領域に格納する。これと同時に、画像処理装置102は入力されたページデータから傾き情報を抽出し、前処理制御装置101へ通知する。前処理制御装置101はこの傾き情報から画像の傾きを補正する。

0022

行処理では、画像処理装置102がページ/ラインデータ記憶装置104のページデータ領域に格納されているページデータ(多値画像)を読み出し、ラインマークの上端/下端位置等を検出する。前処理制御装置101は、このラインマークの上端/下端位置等から行中心を算出する。

0023

文字処理の濃度補正・2値化・フィルタ処理では、画像処理装置102がページ/ラインデータ記憶装置104のページデータ領域に格納されているページデータ(多値画像)を読み出し、これに濃度補正・2値化・フィルタ処理を施し、その処理結果(2値画像)をページ/ラインデータ記憶装置104のラインデータ領域へ書き込む。これと同時に、画像処理装置102は処理領域の黒点の垂直/水平分布等を算出し、前処理制御装置101に通知する。前処理制御装置101は、黒点の垂直/水平分布等から文字の切り出し位置を決定する。

0024

文字処理の正規化・切り出し処理では、画像処理装置102がページ/ラインデータ記憶装置104のラインデータ領域に格納されている濃度補正・2値化・フィルタ処理された画像(2値画像)を読み出し、各文字を切出して、切出した文字パタンを前処理部バスライン108を通じて文字データ記憶装置106へ書込む

0025

また、以上の構成において、前処理を高速に行なうために、ページ/ラインデータ記憶装置104内にページデータを格納する領域を2面持ち、画像処理装置102が一方の領域にページ処理を行なっている時に、もう一方の領域に行処理や文字処理を行なうようなことも行われている。

0026

図8は、このようなページ/ラインデータ記憶装置104内にページデータを格納する領域を2面(ページデータ領域1、ページデータ領域2)持つ前処理装置における処理の流れを示したものである。

0027

図8に示すように、ページデータ領域1に対するページデータの書込み(ページ処理)と、ページデータ領域2からのデータの読み出し及びラインデータ領域への書込み(行処理や文字処理)とが同時並行的に行われ、これにより処理の高速化か図られている。

0028

一方、行処理と文字処理(濃淡補正、2値化、フィルタ処理)と文字処理(正規化、切り出し処理)とは逐次的に処理されている。その理由は、図6に示したように、画像処理装置102とページ/ラインデータ記憶装置104との間は1つのバスラインで接続されているため、ページ/ラインデータ記憶装置104からのデータ読み出しが競合する行処理、文字処理及び文字処理は同時並行的には実行できないからである。

発明が解決しようとする課題

0029

このように、従来の文字認識前処理装置では、画像処理装置102とページ/ラインデータ記憶装置104の間が1つのバスラインで接続されているため、ページ/ラインデータ記憶装置104からのデータ読み出しが競合する行処理、文字処理(濃度補正、2値化、フィルタ処理)及び文字処理(正規化、切り出し処理)は逐次的に実行せざるを得ない。ところが、文字認識前処理では、通常、処理すべき画像は多くの文字を含むため、文字処理の処理量が他の処理に比べて多い。従って、文字処理が逐次的であることは、前処理の処理速度を大きく低下させることになる。

0030

また、文字処理の正規化・切り出し処理では、図6に示したように、文字パタンデータの転送に前処理部バスライン108を使用する。しかし、前処理部バスライン108は、本来、前処理装置全体の制御に関わるプログラムやデータの伝送に使用されるものであるため、文字パタンデータの伝送にも使用すると、この前処理部バスライン108の負荷が大きくなり過ぎるという問題がある。

0031

従って、本発明の目的は、文字認識前処理において、処理量の多い文字処理が高速に行なえ、かつ、前処理部バスラインの負荷を削減し、もって前処理全体を高速に実行できる文字認識前処理装置を提供することにある。

課題を解決するための手段

0032

本発明の文字認識前処理装置は、基本的構成として、画像取得装置から書面イメージを受け、この書面イメージから行イメージを取り出し、そして、この行イメージから文字認識されるべき文字パタンを切出すための所定の前処理を行う画像処理装置と、この画像処理装置と接続された、書面イメージを格納するための第1の記憶装置と、画像処理装置と接続された、行イメージを格納するための第2の記憶装置と、画像処理装置と接続された、文字パタンを格納するための第3の記憶装置とを備えている。

0033

この基本的構成において、本発明の第1の側面に従えば、第3の記憶装置がこれに専用のバスラインを介して画像処理装置と接続されている。

0034

また、本発明の第2の側面に従えば、第1、第2及び第3の記憶装置が、それぞれ別個のバスラインを介して画像処理装置に接続されている。より望ましい態様では、第2の記憶装置が、行イメージを各々格納できる2つのラインイメージ格納領域を有している。

0035

また、本発明の好適な実施例では、第1、第2及び第3の記憶装置が、各々に専用のバスラインを介して前記画像処理装置と接続され、第1の記憶装置が書面イメージを各々格納できる2つのページデータ格納領域を有し、第2の記憶装置が行イメージを各々格納できる2つのラインイメージ格納領域を有し、第3の記憶装置が文字パタンを各々格納できる複数の文字データ格納領域を有している。

0036

本発明の第1の側面に従う前処理装置では、文字パタンを格納するための第3の記憶装置が、他のバスラインとは切り離された専用のバスラインで画像処理装置と接続されているため、文字パタンデータの伝送が他のバスラインの負担を重くするという問題がなくなる。特に、従来技術と比較すると、前処理装置全体の制御情報を伝送するための前処理部バスラインから、文字パタンデータ伝送の負担が除去されるために、前処理装置全体の制御がより容易に行えるようになり、結果として前処理の高速化に寄与できる。

0037

本発明の第2の側面に従う前処理装置では、第1の記憶装置と第2の記憶装置と第3の記憶装置とが別個のバスラインで接続されているため、これら3つの記憶装置に対するアクセスの競合が発生する頻度が減り、前処理を高速に行うことが出来る。即ち、第1の記憶装置と第2の記憶装置とが別個のバスラインをもつことにより、第1の記憶装置からデータ読み出しを行う処理(例えば、行処理及び文字処理のうちの濃度補正・2値化・フィルタ処理)と、第2の記憶装置からデータ読み出しを行う処理(例えば、文字処理のうちの正規化・切り出し処理)との間で、データ読み出し動作が競合しなくなる。特に、処理量の多い文字処理の濃度補正・2値化・フィルタ処理と正規化・切り出し処理との競合が減るために、処理が高速にできるようになる。

0038

この第2の側面に従う前処理装置において、更に、第2の記憶装置に2つのラインデータ格納領域を設けた場合には、一方の領域への書込と他方の領域への読み出しとが実質的に同時並行的にできるため、文字処理の濃度補正・2値化・フィルタ処理と正規化・切り出し処理とが実質的に同時並行的に行え、処理速度は大きく向上する。

0039

また、好適な実施例に従う上記構成では、第1の記憶装置への書込を伴う処理(例えば、ページ処理)と、第1の記憶装置からの読み出しと第2の記憶装置への書込を伴う処理(例えば、文字処理の濃度補正・2値化・フィルタ処理)と、第2の記憶装置かの読み出しと第3の記憶装置への書込を伴う処理(例えば、文字処理の正規化・切り出し処理)と、第3の記憶装置からの読み出しを伴う処理(例えば、文字認識処理)とが、実質的に同時並行的に行える。さらに、前処理部バスラインの負担も軽減する。これらにより、文字認識前処理の大幅な高速化が期待できる。

0040

以下、本発明の実施例を図面により詳細に説明する。

0041

図1は本発明の文字認識前処理装置の一実施例の構成を示すブロック図である。

0042

前処理制御装置1は文字認識前処理全体を制御するもので、画像処理装置2から通知される画像の傾き情報、ラインマークの上端/下端位置等に基づき補正処理を行なう。また、前処理制御装置1は、画像処理装置2に対して前処理を行なう画像の領域を指定し、処理の開始指示等を行なう。

0043

画像処理装置2は、前処理制御装置1から指示された画像の指定領域に対して、既に述べたような内容の前処理を行なうものである。

0044

画像取得装置3は、処理すべき書面の多値画像(ページデータ)を取得する装置で例えばイメージスキャナ等である。

0045

ページデータ記憶装置4は、画像取得装置3から入力されたページデータを格納するためのものである。

0046

ラインデータ記憶装置5は、ページデータに対して濃度補正・2値化・フィルタ処理を施した結果の行イメージの2値画像(ラインデータ)を格納するためのものである。

0047

文字データ記憶装置6は、ラインデータから切り出された文字パタンを格納するものである。

0048

文字認識制御装置7は、切り出された文字パタンに対して特徴を抽出するなどの文字認識処理を行なうものである。

0049

前処理制御装置1と画像処理装置2とは、前処理部バスライン8を介して接続されている。また、文字データ記憶装置6と文字認識制御装置7とは、文字認識部バスライン9を介して接続されている。さらに、ページデータ記憶装置4、ラインデータ記憶装置5及び文字データ記憶装置6の各々と画像処理装置2との間は、それぞれ専用のバスラインを介して接続されている。

0050

図2図1の実施例により前処理を行う際の画像データの流れを示す。尚、前処理自体意の基本的な処理手順は、従来技術のそれと同様に、ページ処理、行処理、文字処理(濃度補正、2値化、フィルタ処理)、及び文字処理(正規化、切り出し処理)の順で行われる。

0051

図2に示すように、ページ処理では、画像処理装置2が画像取得装置3からページデータを入力してページデータ記憶装置4に書込む。これと同時に、画像処理装置2は入力されたページデータから傾き情報を抽出し、前処理制御装置1へ通知する。前処理制御装置1はこの傾き情報から画像の傾きを補正する。

0052

行処理では、画像処理装置2がページデータ記憶装置4からページデータ(多値画像)を読み出し、ラインマークの上端/下端位置等を検出する。前処理制御装置1は、このラインマークの上端/下端位置等から行中心を算出する。

0053

文字処理(濃度補正・2値化・フィルタ処理)では、画像処理装置2がページデータ記憶装置4からページデータ(多値画像)を読み出し、これに濃度補正・2値化・フィルタ処理を施し、その処理結果であるラインデータ(2値画像)をラインデータ記憶装置5へ書き込む。これと同時に、画像処理装置2は処理領域の黒点の垂直/水平分布等を算出し、前処理制御装置1に通知する。前処理制御装置1は、黒点の垂直/水平分布等から文字の切り出し位置を決定する。

0054

文字処理(正規化・切り出し処理)では、画像処理装置2がラインデータ記憶装置5からラインデータを読み出し、各文字を切出して、切出した文字パタンを文字データ記憶装置6へ書込む。

0055

以上の一連の処理の中で、従来技術との比較において注目すべき点は、第1に、各記憶装置4、5、6と画像処理装置2との間とがそれぞれ専用のバスラインで接続されているため、特に処理量の多い文字処理と文字処理とのデータ読み出しが異なるバスラインで行われるので競合することがない点である。また第2に、文字パタンの文字データ記憶装置6への書込みが、前処理部バスライン8を使わずに専用バスラインを通じて行われるため、前処理部バスライン8の負担が軽減される点である。

0056

図3は、以上の処理を行うための画像処理装置2の詳細な機能構成を示すブロック図である。

0057

図3において、画像処理装置制御部21は前処理制御装置8との通信を行なうとともに画像処理装置2全体の制御を行なう。

0058

画像取得部22は、画像取得部3と接続され、ページ処理を行なう。

0059

画像処理部23は、行処理及び文字処理、を行なう。

0060

ページデータ記憶装置制御部24は、ページデータ記憶装置4に対するページデータの書込み制御及び読み出し制御を行なう。この制御部24において、ページデータ格納位置算出部241は、書込み又は読み出しをすべき画像データのページデータ記憶装置4における格納位置を算出する。また、書込ページデータバッファ242は、数画素分まとめて画像データをページデータ記憶装置4に書込むための一時記憶装置であり、読み込みページデータバッファ243はページデータ記憶装置4から数画素分まとめて画像データを読み込み保持する一時記憶装置である。これにより、ページデータ記憶装置の画像データ書込及び読み出し回数を削減することが可能である。

0061

ラインデータ記憶装置制御部25は、ラインデータ記憶装置5に対するラインデータの書込制御及び読み出し制御を行なう。この制御部25において、ラインデータ格納位置算出部251は、書込み又は読み出しをすべき画像データの領域のラインデータ記憶装置5における格納位置を算出する。また、書込ラインデータバッファ252は数画素分まとめて画像データをラインデータ記憶装置に書込むための一時記憶装置であり、読み込みラインデータバッファ253はラインデータ記憶装置5から数画素分まとめて画像データを読み込み保持する一時記憶装置である。これにより、ラインデータ記憶装置5の画像データの書込及び読み出し回数を削減することが可能である。

0062

文字データ記憶装置制御部26は、文字データ記憶装置6に対する文字パタンの書込制御及び読み出し制御を行なう。この制御部26において、文字データ格納位置算出部261は、書込み及び読み出しを行なうべき画像データの文字データ記憶装置6における格納位置を算出する。また、書込文字データバッファ262は数画素分まとめて画像データを文字データ記憶装置6に書込むため一時記憶装置であり、読み込み文字データバッファ263は文字データ記憶装置6から数画素分まとめて画像データを読み込み保持する一時記憶装置である。これにより、文字データ記憶装置6の画像データの書込及び読み出し回数を削減することが可能である。

0063

図4はこの実施例における記憶装置4、5、6の構成を示すブロック図である。

0064

ページデータ記憶装置4は、ページデータ格納領域を2面もつ(領域1、領域2)。それにより、一方の領域(例えば、領域1)にページ処理を行なっている時に、同時に他方の領域(例えば、領域2)に対して行処理又は文字処理(濃度補正、2値化、フィルタ処理)を行なうことが可能である。

0065

ラインデータ記憶装置5も2つのラインデータ記憶領域を2面もつ(領域1、領域2)。これにより、一方の領域(例えば、領域1)に文字処理(濃度補正、2値化、フィルタ処理)を行なっている時に、同時に他方の領域(例えば、領域2)に対して文字処理(正規化、切り出し処理)を行なうことが可能である。

0066

文字データ記憶装置6は文字パタン格納領域を複数面もつ(領域1〜領域N)もつ。これにより、或領域に文字処理(正規化、切り出し処理)を行なっている時に、同時に違う領域から文字パタンを文字認識制御装置が読み出すことが可能である。

0067

図5は、この実施例における文字認識前処理の処理流れの例を示す説明図である。

0068

図5において、ページデータ記憶装置4では、その領域1に対してページ処理での画像データの書込が行われ、これと実質的に同時並行して、領域2に対し行処理又は文字処理(濃度補正、2値化、フィルタ処理)での画像データの読み出しが行われている。

0069

また、ラインデータ記憶装置5では、その領域1に対して文字処理(濃度補正、2値化、フィルタ処理)での画像データの書込が行なわれ、これと実質的に同時並行的して、領域2に対し文字処理(正規化、文字切出し処理)での画像データの読み出しが行われている。

0070

また、文字データ記憶装置6では、その領域i(i=1〜N)に対して文字処理(正規化、文字切出し処理)での文字パタンの書込みが行なわれ、これと実質的に同時並行して別の領域j(j=1〜N)から文字パタンが読み出され文字認識制御装置7に送られている。

0071

以上のようにして、ページ処理と、行処理及び文字処理と、文字処理とが同時並行的に実行されるため、特に、他の処理よりも処理量の多い文字処理と文字処理とが同時並行的に実行されるため、前処理の速度が向上する。

発明の効果

0072

本発明の第1の側面に従う文字認識前処理装置によれば、文字パタンの伝送を専用バスラインで行うようにしたため、従来これに用いられていた前処理部バスラインの負担が軽減され、前処理部バスラインの本来の用途である前処理装置全体の制御のための情報伝達が円滑に行い易くなり、前処理の効率化に寄与できる。

0073

また、本発明の第2の側面に従えば、書面イメージを格納する第1の記憶装置と、行イメージを格納する第2の記憶装置と、文字パタンを格納する第3の記憶装置とに対するアクセスを別個のバスラインを通じて独立して行えるようにしたため、前処理に含まれる複数種の画像処理の間でそれら記憶装置に対するアクセスが互いに競合する頻度が減少し、2つ以上の画像処理を実質的に同時並行的に実行することが可能になり、よって、文字認識前処理の高速化に寄与できる。

図面の簡単な説明

0074

図1本発明に係る文字認識前処理装置の一実施例の構成を示すブロック図である。
図2図1の実施例における前処理での画像データの流れを示す説明図である。
図3図1の実施例における画像処理装置の詳細構成を示すブロック図である。
図4図1の実施例における記憶装置の詳細構成を示すブロック図である。
図5図1の実施例において複数の画像処理を同時並行的に実行している処理例を示す説明図である。
図6従来の文字認識前処理装置の一例の構成を示すブロック図である。
図7図6の従来装置における前処理の流れを示すフローチャートである。
図8図6の従来装置において、ページ処理と同時並行的に行処理及び文字処理を行なう処理の流れを示す説明図である。

--

0075

1前処理制御装置
2画像処理装置
3画像取得装置
4ページデータ記憶装置
5ラインデータ記憶装置
6文字データ記憶装置
7文字認識制御装置
8 前処理部バスライン
9 文字認識部バスライン

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 富士ゼロックス株式会社の「 画像処理装置及びプログラム」が 公開されました。( 2020/09/24)

    【課題】本開示の技術は、画像を文字と標章とに分類する場合に断続線が文字に分類されることによって断続線が除去されない不具合を解消することができる画像処理装置及びプログラムを提供する。【解決手段】画像処理... 詳細

  • 富士ゼロックス株式会社の「 情報処理装置及びプログラム」が 公開されました。( 2020/09/24)

    【課題】顧客から委託元に提供された情報について特定の機密情報を識別できないような状態に加工して委託先に送付することができる情報処理装置及びプログラムを提供する。【解決手段】情報処理装置は、自装置に入力... 詳細

  • 株式会社THIRDの「 計器読取システム」が 公開されました。( 2020/09/24)

    【課題】直読式の計器で示される値を正確に読み取ることができる計器読取システムを提供する。【解決手段】数字が外周に表示された計量回転盤4を複数有し窓部6から計量回転盤4の数字が露出する直読式の計器Mを撮... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ