図面 (/)

技術 光学的文字読み取り装置および帳票の傾き角度検出方法

出願人 日本電気株式会社
発明者 水野昌昭
出願日 1995年9月21日 (23年9ヶ月経過) 出願番号 1995-243273
公開日 1997年4月4日 (22年3ヶ月経過) 公開番号 1997-091372
状態 拒絶査定
技術分野 文字入力
主要キーワード 各濃度分布 測定線 濃淡特徴 傾き検出処理 傾き算出 光学的文字 背景濃度 文字要素
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1997年4月4日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (7)

課題

帳票エッジを用いず、簡単な処理により帳票の傾き角度を検出を行う。

解決手段

帳票から複数階調帳票画像を得る画像取り込み部11と、パンチ穴濃度が定義された背景濃度定義部12と、帳票画像からパンチ穴濃度と近い濃度領域中心座標を求めるパンチ穴検出部13と、プレ印刷文字濃度が定義されたプレ印刷文字濃度定義部14と、帳票画像からプレ印刷文字濃度と近い濃度領域の中心座標を求めるプレ印刷文字検出部15と、特定のパンチ穴およびプレ印刷文字の中心座標を異なる帳票挿入方向ついて求めた座標テーブル16と、そのテーブルを基に帳票画像における特定のパンチ穴およびプレ印刷文字の中心座標および帳票挿入方向を求める帳票挿入方向判定部17と、その求められた帳票画像における中心座標を結ぶ測定線と挿入方向に関する座標テーブル16の中心座標を結ぶ基準線とのなす角度を帳票の傾き角度とする帳票傾き算出部18とを有する。

概要

背景

光学的文字読み取り装置は、帳票を供給する系と光学系の組み合せで供給された帳票上の画像情報読み取り、これを記憶装置に格納し、この画像情報を解析して文字認識を行うものである。この光学的文字読み取り装置では、通常、帳票フォーマットが決められている帳票から読み取られた画像情報が記憶装置に格納され、この格納された画像情報からフォーマット上で指定された位置の文字イメージ切り出して文字認識が行われる。

上記光学的文字読み取り装置において、文字認識を正しく行うためには、画像読み取り部に入力帳票を傾きのない状態で正しく取り込む必要があり、入力帳票が傾いた状態で画像読み取り部に取り込まれた場合には、フォーマット上で指定された座標と記憶装置に格納された画像情報の座標とにずれが生じ、文字イメージの切りだし位置にずれが生じてしまう。この文字イメージの切りだし位置のずれは、文字認識に影響する。このため、帳票が傾いて入力された場合には、帳票の傾き角度を検出して、フォーマット上で指定された座標と記憶装置に格納された画像情報の座標とのずれを補正し、正確に文字イメージの切りだしが行われるようにする必要がある。

挿入された帳票の傾き角度を検出して、文字イメージの切りだし位置のずれを補正する光学的文字読み取り装置が特開平5-233874号公報により提案されている。この公報によれば、2値で取り込んだ帳票画像からその帳票のエッジを検出して、エッジの方向により帳票の傾きを検出し、検出された傾き角度に基づいて文字イメージの切りだし位置のずれを補正している。

また、上記のような帳票のエッジによる傾き角度の検出とは異なる方法として、特開平2-108177号公報には、帳票画像中の文字列の並びを検出することにより帳票の傾きを検出する光学的文字読み取り装置が提案されている。この光学的文字読み取り装置では、印刷文字は概ね一直線上にあることを利用し、文書画像白黒2値画像とし、文字は白い背景の上にある黒い画素集まりとして表現するものとして、次のように帳票の傾き角度が推定される。文書画像全体に対してラベル付けを基にした連結成分の抽出、あるいは輪郭線の抽出を行い、抽出された連結成分(あるいは、輪郭線)毎に特徴量とその位置座標を求め、多数の方向について特徴量を積分する。積分した結果が最も尖鋭となる方向を求め、この方向を帳票の傾き角度と推定する。

概要

帳票エッジを用いず、簡単な処理により帳票の傾き角度を検出を行う。

帳票から複数階調の帳票画像を得る画像取り込み部11と、パンチ穴濃度が定義された背景濃度定義部12と、帳票画像からパンチ穴濃度と近い濃度領域中心座標を求めるパンチ穴検出部13と、プレ印刷文字濃度が定義されたプレ印刷文字濃度定義部14と、帳票画像からプレ印刷文字濃度と近い濃度領域の中心座標を求めるプレ印刷文字検出部15と、特定のパンチ穴およびプレ印刷文字の中心座標を異なる帳票挿入方向ついて求めた座標テーブル16と、そのテーブルを基に帳票画像における特定のパンチ穴およびプレ印刷文字の中心座標および帳票挿入方向を求める帳票挿入方向判定部17と、その求められた帳票画像における中心座標を結ぶ測定線と挿入方向に関する座標テーブル16の中心座標を結ぶ基準線とのなす角度を帳票の傾き角度とする帳票傾き算出部18とを有する。

目的

本発明の目的は、上記各問題を解決し、帳票のエッジの状態に関係なく、簡単な処理により帳票の傾き角度の検出を行うことができる光学的文字読み取り装置および帳票傾き角度検出方法を提供することにある。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

濃度による検出が可能な第1および第2の領域を有する帳票を対象とし、挿入された帳票を光学的に走査して得られる帳票画像から文字イメージを抽出し、これを解析文字認識を行う光学的文字読み取り装置において、前記帳票を光学的に走査して、複数の階調の帳票画像を格納する画像取り込み手段と、前記第1および第2の領域に関する濃度が予め記憶された濃度定義手段と、前記画像取り込み手段に格納された帳票画像中から、前記濃度定義手段に記憶された第1および第2の領域に関する濃度と近い濃度領域を全て検出し、それぞれの中心座標を求める検出手段と、前記第1および第2の領域の中心座標を、複数の異なる帳票挿入方向ついて予め求め、これをテーブル化した座標テーブルと、前記検出手段にて検出された各中心座標と前記座標テーブルとのマッチングをとり、座標テーブルのいずれかの方向の座標と一致もしくは最も近いものとなった座標を前記画像取り込み手段に格納された帳票画像における前記第1および第2の領域の中心座標とし、その方向を前記帳票が挿入された方向と判定する帳票挿入方向判定手段と、前記帳票挿入方向判定手段にて第1および第2の領域の中心座標とされた座標を結ぶ第1の線を求め、さらに、前記帳票挿入方向判定手段にて判定された挿入方向に関する前記座標テーブルの第1および第2の領域の中心座標を結ぶ第2の線を求めて、該第1の線と該第2の線とのなす角度を算出し、これを前記帳票の傾き角度とする傾き角度算出手段と、前記傾き角度算出手段にて算出された帳票の傾き角度に基づいて、前記文字認識の際に帳票画像から抽出される文字イメージの位置を補正する手段と、を有することを特徴とする光学的文字読み取り装置。

請求項2

パンチ穴が1つ以上設けられ、少なくとも1箇所に予め文字印刷されたプレ印刷文字領域を有する帳票を対象とし、挿入された帳票を光学的に走査して得られる帳票画像から文字イメージを抽出し、これを解析し文字認識を行う光学的文字読み取り装置において、前記帳票を光学的に走査して、複数の階調の帳票画像を格納する画像取り込み手段と、前記パンチ穴に関する濃度が予め記憶されたパンチ穴濃度定義手段と、前記画像取り込み手段に格納された帳票画像中から、前記パンチ穴濃度定義手段に記憶された濃度と近い濃度領域を全て検出し、それぞれの中心座標を求めるパンチ穴検出手段と、前記プレ印刷文字領域に関する濃度が予め記憶されたプレ印刷文字濃度定義手段と、前記画像取り込み手段に格納された帳票画像中から、前記プレ印刷文字濃度定義手段に記憶された濃度と近い濃度領域を全て検出し、それぞれの中心座標を求めるプレ印刷文字検出手段と、前記帳票の特定のパンチ穴およびプレ印刷文字領域に関する中心座標を、複数の異なる帳票挿入方向ついて予め求め、これをテーブル化した座標テーブルと、前記パンチ穴検出手段およびプレ印刷文字検出手段にてそれぞれ検出されたパンチ穴およびプレ印刷文字領域の中心座標と前記座標テーブルとのマッチングをとり、座標テーブルのいずれかの方向の座標と一致もしくは最も近いものとなった座標を前記画像取り込み手段に格納された帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とし、その方向を前記帳票が挿入された方向と判定する帳票挿入方向判定手段と、前記帳票挿入方向判定手段にて帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とされた座標を結ぶ第1の線を求め、さらに、前記帳票挿入方向判定手段にて判定された挿入方向に関する前記座標テーブルのパンチ穴およびプレ印刷文字領域の中心座標を結ぶ第2の線を求めて、該第1の線と該第2の線となす角度を算出し、これを前記帳票の傾き角度とする傾き角度算出手段と、前記傾き角度算出手段にて算出された帳票の傾き角度に基づいて、前記文字認識の際に帳票画像から抽出される文字イメージの位置を補正する手段と、を有することを特徴とする光学的文字読み取り装置。

請求項3

パンチ穴が1つ以上設けられ、少なくとも1箇所に予め文字が印刷されたプレ印刷文字領域を有する帳票を対象とし、挿入された帳票を光学的に走査して得られる帳票画像から文字イメージを抽出し、これを解析し文字認識を行う光学的文字読み取り装置において、前記帳票を光学的に走査して、複数の階調の帳票画像を格納する画像取り込み手段と、画像取り込み手段に格納された帳票画像の各画素毎の濃度の頻度分布を求める濃度分布算出手段と、濃度分布算出手段にて求められた濃度の頻度分布を基に前記パンチ穴に関する濃度を求めるパンチ穴濃度算出手段と、濃度分布算出手段にて求められた濃度の頻度分布を基に前記プレ印刷文字領域に関する濃度を求めるプレ印刷文字濃度算出手段と、前記画像取り込み手段に格納された帳票画像中から、前記パンチ穴濃度算出手段にて求められた濃度と近い濃度領域を全て検出し、それぞれの中心座標を求めるパンチ穴検出手段と、前記画像取り込み手段に格納された帳票画像中から、前記プレ印刷文字濃度算出手段に記憶された濃度と近い濃度領域を全て検出し、それぞれの中心座標を求めるプレ印刷文字検出手段と、前記帳票の特定のパンチ穴およびプレ印刷文字領域に関する中心座標を、複数の異なる帳票挿入方向ついて予め求め、これをテーブル化した座標テーブルと、前記パンチ穴検出手段およびプレ印刷文字検出手段にてそれぞれ検出されたパンチ穴およびプレ印刷文字領域の中心座標と前記座標テーブルとのマッチングをとり、座標テーブルのいずれかの方向の座標と一致もしくは最も近いものとなった座標を前記画像取り込み手段に格納された帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とし、その方向を前記帳票が挿入された方向と判定する帳票挿入方向判定手段と、前記帳票挿入方向判定手段にて帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とされた座標を結ぶ第1の線を求め、さらに、前記帳票挿入方向判定手段にて判定された挿入方向に関する前記座標テーブルのパンチ穴およびプレ印刷文字領域の中心座標を結ぶ第2の線を求めて、該第1の線と該第2の線となす角度を算出し、これを前記帳票の傾き角度とする傾き角度算出手段と、前記傾き角度算出手段にて算出された帳票の傾き角度に基づいて、前記文字認識の際に帳票画像から抽出される文字イメージの位置を補正する手段と、を有することを特徴とする光学的文字読み取り装置。

請求項4

濃度による検出が可能な第1および第2の領域を有する帳票を対象とし、挿入された帳票を光学的に走査して得られる帳票画像から文字イメージを抽出し、これを解析し文字認識を行う光学的文字読み取り装置において行われる帳票の傾き角度検出方法であって、前記帳票を光学的に走査して、複数の階調の帳票画像を得る第1のステップと、前記第1のステップにて得られた帳票画像中から、予め設定された前記第1および第2の領域に関する濃度と近い濃度領域を全て検出してそれぞれの中心座標を求める第2のステップと、前記第2のステップにて検出された各中心座標と、前記第1および第2の領域の中心座標を複数の異なる帳票挿入方向ついて予め求めた座標テーブルとのマッチングをとり、座標テーブルのいずれかの方向の座標と一致もしくは最も近いものとなった座標を前記第1のステップにて得られた帳票画像における前記第1および第2の領域の中心座標とし、その方向を前記帳票が挿入された方向と判定する第3のステップと、前記第3のステップにて第1および第2の領域の中心座標とされた座標を結ぶ第1の線を求め、さらに、前記第3のステップにて判定された挿入方向に関する前記座標テーブルの第1および第2の領域の中心座標を結ぶ第2の線を求めて、該第1の線と該第2の線とのなす角度を算出し、これを前記帳票の傾き角度とする第4のステップとを有することを特徴とする帳票の傾き角度検出方法。

請求項5

請求項4に記載の帳票の傾き角度検出方法において、第1および第2の領域がパンチ穴および予め文字が印刷されたプレ印刷文字領域であり、第3のステップにおいては、第2のステップにて検出された各中心座標と、帳票の特定のパンチ穴およびプレ印刷文字領域に関する中心座標を複数の異なる帳票挿入方向ついて予め求めた座標テーブルとのマッチングをとり、座標テーブルのいずれかの方向の座標と一致もしくは最も近いものとなった座標を前記第1のステップにて得られた帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とし、その方向を前記帳票が挿入された方向と判定することを特徴とする帳票の傾き角度検出方法。

技術分野

0001

本発明は、挿入された帳票光学的に走査して得られる帳票画像から文字イメージを抽出し、これを解析文字認識を行う光学的文字読み取り装置OCR:optical character reader)に関し、特に、挿入された帳票の傾き角度に基づいて、文字認識の際に帳票画像から抽出される文字イメージの位置を補正する光学的文字読み取り装置に関する。さらには、挿入された帳票の傾き角度を検出する帳票の傾き角度検出方法に関する。

背景技術

0002

光学的文字読み取り装置は、帳票を供給する系と光学系の組み合せで供給された帳票上の画像情報読み取り、これを記憶装置に格納し、この画像情報を解析して文字認識を行うものである。この光学的文字読み取り装置では、通常、帳票フォーマットが決められている帳票から読み取られた画像情報が記憶装置に格納され、この格納された画像情報からフォーマット上で指定された位置の文字イメージを切り出して文字認識が行われる。

0003

上記光学的文字読み取り装置において、文字認識を正しく行うためには、画像読み取り部に入力帳票を傾きのない状態で正しく取り込む必要があり、入力帳票が傾いた状態で画像読み取り部に取り込まれた場合には、フォーマット上で指定された座標と記憶装置に格納された画像情報の座標とにずれが生じ、文字イメージの切りだし位置にずれが生じてしまう。この文字イメージの切りだし位置のずれは、文字認識に影響する。このため、帳票が傾いて入力された場合には、帳票の傾き角度を検出して、フォーマット上で指定された座標と記憶装置に格納された画像情報の座標とのずれを補正し、正確に文字イメージの切りだしが行われるようにする必要がある。

0004

挿入された帳票の傾き角度を検出して、文字イメージの切りだし位置のずれを補正する光学的文字読み取り装置が特開平5-233874号公報により提案されている。この公報によれば、2値で取り込んだ帳票画像からその帳票のエッジを検出して、エッジの方向により帳票の傾きを検出し、検出された傾き角度に基づいて文字イメージの切りだし位置のずれを補正している。

0005

また、上記のような帳票のエッジによる傾き角度の検出とは異なる方法として、特開平2-108177号公報には、帳票画像中の文字列の並びを検出することにより帳票の傾きを検出する光学的文字読み取り装置が提案されている。この光学的文字読み取り装置では、印刷文字は概ね一直線上にあることを利用し、文書画像白黒2値画像とし、文字は白い背景の上にある黒い画素集まりとして表現するものとして、次のように帳票の傾き角度が推定される。文書画像全体に対してラベル付けを基にした連結成分の抽出、あるいは輪郭線の抽出を行い、抽出された連結成分(あるいは、輪郭線)毎に特徴量とその位置座標を求め、多数の方向について特徴量を積分する。積分した結果が最も尖鋭となる方向を求め、この方向を帳票の傾き角度と推定する。

発明が解決しようとする課題

0006

しかしながら、上述した従来の光学的文字読み取り装置には、以下のような問題点がある。

0007

特開平5-233874号公報に記載のものにおいては、帳票の傾き角度を検出できるものの、帳票の傾き角度の推定精度が帳票のエッジの状態により左右されるため、例えば、エッジが破損した帳票や切断誤差の大きな帳票(例えば、端辺が斜めになったり、あるいは曲ったりしたもの)が用いられた場合には、帳票の傾き角度の推定精度が低下してしまい、正確に帳票の傾き角度を検出することができないという問題点がある。

0008

特開平5-233874号公報に記載のものにおいては、文書画像全体に対してラベル付けを基にした連結成分の抽出、あるいは輪郭線の抽出を行って、2値画像から文字要素を抽出するといった複雑な処理が必要とされるため、処理に時間がかかるという問題点がある。

0009

本発明の目的は、上記各問題を解決し、帳票のエッジの状態に関係なく、簡単な処理により帳票の傾き角度の検出を行うことができる光学的文字読み取り装置および帳票傾き角度検出方法を提供することにある。

課題を解決するための手段

0010

本発明の光学的文字読み取り装置は、濃度による検出が可能な第1および第2の領域を有する帳票を対象とし、挿入された帳票を光学的に走査して得られる帳票画像から文字イメージを抽出し、これを解析し文字認識を行う光学的文字読み取り装置において、前記帳票を光学的に走査して、複数の階調の帳票画像を格納する画像取り込み手段と、前記第1および第2の領域に関する濃度が予め記憶された濃度定義手段と、前記画像取り込み手段に格納された帳票画像中から、前記濃度定義手段に記憶された第1および第2の領域に関する濃度と近い濃度領域を全て検出し、それぞれの中心座標を求める検出手段と、前記第1および第2の領域の中心座標を、複数の異なる帳票挿入方向ついて予め求め、これをテーブル化した座標テーブルと、前記検出手段にて検出された各中心座標と前記座標テーブルとのマッチングをとり、座標テーブルのいずれかの方向の座標と一致もしくは最も近いものとなった座標を前記画像取り込み手段に格納された帳票画像における前記第1および第2の領域の中心座標とし、その方向を前記帳票が挿入された方向と判定する帳票挿入方向判定手段と、前記帳票挿入方向判定手段にて第1および第2の領域の中心座標とされた座標を結ぶ第1の線を求め、さらに、前記帳票挿入方向判定手段にて判定された挿入方向に関する前記座標テーブルの第1および第2の領域の中心座標を結ぶ第2の線を求めて、該第1の線と該第2の線とのなす角度を算出し、これを前記帳票の傾き角度とする傾き角度算出手段と、前記傾き角度算出手段にて算出された帳票の傾き角度に基づいて、前記文字認識の際に帳票画像から抽出される文字イメージの位置を補正する手段と、を有することを特徴とする。

0011

また、本発明の光学的文字読み取り装置は、パンチ穴が1つ以上設けられ、少なくとも1箇所に予め文字が印刷されたプレ印刷文字領域を有する帳票を対象とし、挿入された帳票を光学的に走査して得られる帳票画像から文字イメージを抽出し、これを解析し文字認識を行う光学的文字読み取り装置において、前記帳票を光学的に走査して、複数の階調の帳票画像を格納する画像取り込み手段と、前記パンチ穴に関する濃度が予め記憶されたパンチ穴濃度定義手段と、前記画像取り込み手段に格納された帳票画像中から、前記パンチ穴濃度定義手段に記憶された濃度と近い濃度領域を全て検出し、それぞれの中心座標を求めるパンチ穴検出手段と、前記プレ印刷文字領域に関する濃度が予め記憶されたプレ印刷文字濃度定義手段と、前記画像取り込み手段に格納された帳票画像中から、前記プレ印刷文字濃度定義手段に記憶された濃度と近い濃度領域を全て検出し、それぞれの中心座標を求めるプレ印刷文字検出手段と、前記帳票の特定のパンチ穴およびプレ印刷文字領域に関する中心座標を、複数の異なる帳票挿入方向ついて予め求め、これをテーブル化した座標テーブルと、前記パンチ穴検出手段およびプレ印刷文字検出手段にてそれぞれ検出されたパンチ穴およびプレ印刷文字領域の中心座標と前記座標テーブルとのマッチングをとり、座標テーブルのいずれかの方向の座標と一致もしくは最も近いものとなった座標を前記画像取り込み手段に格納された帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とし、その方向を前記帳票が挿入された方向と判定する帳票挿入方向判定手段と、前記帳票挿入方向判定手段にて帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とされた座標を結ぶ第1の線を求め、さらに、前記帳票挿入方向判定手段にて判定された挿入方向に関する前記座標テーブルのパンチ穴およびプレ印刷文字領域の中心座標を結ぶ第2の線を求めて、該第1の線と該第2の線となす角度を算出し、これを前記帳票の傾き角度とする傾き角度算出手段と、前記傾き角度算出手段にて算出された帳票の傾き角度に基づいて、前記文字認識の際に帳票画像から抽出される文字イメージの位置を補正する手段と、を有することを特徴とする。

0012

また、本発明の光学的文字読み取り装置は、パンチ穴が1つ以上設けられ、少なくとも1箇所に予め文字が印刷されたプレ印刷文字領域を有する帳票を対象とし、挿入された帳票を光学的に走査して得られる帳票画像から文字イメージを抽出し、これを解析し文字認識を行う光学的文字読み取り装置において、前記帳票を光学的に走査して、複数の階調の帳票画像を格納する画像取り込み手段と、画像取り込み手段に格納された帳票画像の各画素毎の濃度の頻度分布を求める濃度分布算出手段と、濃度分布算出手段にて求められた濃度の頻度分布を基に前記パンチ穴に関する濃度を求めるパンチ穴濃度算出手段と、濃度分布算出手段にて求められた濃度の頻度分布を基に前記プレ印刷文字領域に関する濃度を求めるプレ印刷文字濃度算出手段と、前記画像取り込み手段に格納された帳票画像中から、前記パンチ穴濃度算出手段にて求められた濃度と近い濃度領域を全て検出し、それぞれの中心座標を求めるパンチ穴検出手段と、前記画像取り込み手段に格納された帳票画像中から、前記プレ印刷文字濃度算出手段に記憶された濃度と近い濃度領域を全て検出し、それぞれの中心座標を求めるプレ印刷文字検出手段と、前記帳票の特定のパンチ穴およびプレ印刷文字領域に関する中心座標を、複数の異なる帳票挿入方向ついて予め求め、これをテーブル化した座標テーブルと、前記パンチ穴検出手段およびプレ印刷文字検出手段にてそれぞれ検出されたパンチ穴およびプレ印刷文字領域の中心座標と前記座標テーブルとのマッチングをとり、座標テーブルのいずれかの方向の座標と一致もしくは最も近いものとなった座標を前記画像取り込み手段に格納された帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とし、その方向を前記帳票が挿入された方向と判定する帳票挿入方向判定手段と、前記帳票挿入方向判定手段にて帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とされた座標を結ぶ第1の線を求め、さらに、前記帳票挿入方向判定手段にて判定された挿入方向に関する前記座標テーブルのパンチ穴およびプレ印刷文字領域の中心座標を結ぶ第2の線を求めて、該第1の線と該第2の線となす角度を算出し、これを前記帳票の傾き角度とする傾き角度算出手段と、前記傾き角度算出手段にて算出された帳票の傾き角度に基づいて、前記文字認識の際に帳票画像から抽出される文字イメージの位置を補正する手段と、を有することを特徴とする。

0013

本発明の帳票の傾き角度検出方法は、濃度による検出が可能な第1および第2の領域を有する帳票を対象とし、挿入された帳票を光学的に走査して得られる帳票画像から文字イメージを抽出し、これを解析し文字認識を行う光学的文字読み取り装置において行われる帳票の傾き角度検出方法であって、前記帳票を光学的に走査して、複数の階調の帳票画像を得る第1のステップと、前記第1のステップにて得られた帳票画像中から、予め設定された前記第1および第2の領域に関する濃度と近い濃度領域を全て検出してそれぞれの中心座標を求める第2のステップと、前記第2のステップにて検出された各中心座標と、前記第1および第2の領域の中心座標を複数の異なる帳票挿入方向ついて予め求めた座標テーブルとのマッチングをとり、座標テーブルのいずれかの方向の座標と一致もしくは最も近いものとなった座標を前記第1のステップにて得られた帳票画像における前記第1および第2の領域の中心座標とし、その方向を前記帳票が挿入された方向と判定する第3のステップと、前記第3のステップにて第1および第2の領域の中心座標とされた座標を結ぶ第1の線を求め、さらに、前記第3のステップにて判定された挿入方向に関する前記座標テーブルの第1および第2の領域の中心座標を結ぶ第2の線を求めて、該第1の線と該第2の線とのなす角度を算出し、これを前記帳票の傾き角度とする第4のステップとを有することを特徴とする。

0014

上記帳票の傾き角度検出方法において、第1および第2の領域がパンチ穴および予め文字が印刷されたプレ印刷文字領域であり、第3のステップにおいては、第2のステップにて検出された各中心座標と、帳票の特定のパンチ穴およびプレ印刷文字領域に関する中心座標を複数の異なる帳票挿入方向ついて予め求めた座標テーブルとのマッチングをとり、座標テーブルのいずれかの方向の座標と一致もしくは最も近いものとなった座標を前記第1のステップにて得られた帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とし、その方向を前記帳票が挿入された方向を判定するようにしてもよい。

0015

<作用>帳票画像を複数の階調の画像(多値画像)として読み取り、この帳票画像(多値画像)に関して各画素毎に検出された濃度の頻度分布をとると、例えばパンチ穴やプレ印刷文字などの領域はそれぞれ異なる頻度分布を示す。このことから、パンチ穴やプレ印刷文字などの領域は、それぞれ該当する濃度に基づいて検出することが可能である。本発明の光学的文字読み取り装置では、例えばパンチ穴やプレ印刷文字領域など、濃度による検出が可能な第1および第2の領域を有する帳票を対象とし、帳票画像が複数の階調の画像として格納されるので、パンチ穴やプレ印刷文字領域に関する濃度を基に、格納された帳票画像中から第1および第2の領域に関する座標を抽出することができる。ここで、第1および第2の領域は、特定のパンチ穴およびプレ印刷文字領域としてもよいし、特定の2つのプレ印刷文字領域、あるいは2つのパンチ穴としてもよい。以下、第1および第2の領域を特定のパンチ穴とプレ印刷文字領域とした場合について説明する。

0016

座標テーブルには、帳票の特定のパンチ穴およびプレ印刷文字領域に関する中心座標を複数の異なる帳票挿入方向について求めたものがテーブル化されている。この座標テーブルのいずれかの方向の座標は、上記帳票画像中から抽出されたパンチ穴およびプレ印刷文字領域に関する座標のうちの1つと一致もしくは最も近いものとなる。よって、座標テーブルと格納された帳票画像中から抽出されたパンチ穴およびプレ印刷文字領域に関する全座標とのマッチングをとることにより、格納された帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標が得られ、その方向から帳票の挿入方向を判定することができる。ここで、座標テーブルとのマッチングの結果が一致となった状態は、帳票が正しく挿入された状態(傾き角度のない状態)であり、結果が最も近いものとなった状態は、帳票が傾いて挿入された状態(傾き角度を有する状態)である。

0017

上記座標テーブルとのマッチングにより得られた帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標と、判定された帳票の挿入方向に関する座標テーブルのパンチ穴およびプレ印刷文字領域の中心座標とのずれが、挿入された帳票の傾き角度であることから、座標テーブルとのマッチングにより得られた帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標を結ぶ第1の線と、判定された帳票の挿入方向に関する座標テーブルのパンチ穴およびプレ印刷文字領域の中心座標を結ぶ第2の線とのなす角度を算出することにより、帳票の傾き角度を得ることができる。

0018

以上のように、本発明の光学的文字読み取り装置では、パンチ穴やプレ印刷文字領域などの濃度による検出が可能な2つの領域をそれぞれ該当する濃度に基づいて検出し、その座標のずれを検出することにより帳票の傾き角度を検出することができるので、従来のように帳票の傾き角度の推定精度が帳票のエッジの状態により左右されることはない。また、文書画像全体に対してラベル付けを基にした連結成分の抽出、あるいは輪郭線の抽出など複雑な処理は必要ない。

0019

また、本発明のうち、格納された帳票画像の各画素毎の濃度の頻度分布を求め、求められた濃度の頻度分布を基にパンチ穴およびプレ印刷文字領域に関する濃度を求めるものにおいては、格納された帳票画像から求められたパンチ穴およびプレ印刷文字領域に関する濃度を基に、パンチ穴およびプレ印刷文字領域の検出が行われるので、帳票画像からのパンチ穴およびプレ印刷文字領域に関する中心座標の抽出は、より正確なものとなる。

発明を実施するための最良の形態

0020

次に、本発明の実施例について図面を参照して説明する。

0021

本発明の光学的文字読み取り装置は、帳票を供給する系と、供給された帳票上の画像情報を読み取るための光学系と、読み取った画像情報が格納される記憶部と、格納された画像情報を解析して文字認識を行う部とからなる基本構成に加えて、帳票の傾き角度を検出して文字イメージの切りだし位置のずれを補正する機能を有するものとなっている。

0022

図1は、本発明の第1の実施例の光学的文字読み取り装置の概略構成を示すブロック図である。

0023

11は、供給された帳票を光学的に走査し、その帳票上の文字を含む画像情報を読み取って記憶する画像取り込み部であって、その構成は、イメージスキャナ(不図示)と記憶部(不図示)からなる。この画像取り込み部11では、供給された帳票をイメージスキャナで読み取り、その読み取られた帳票画像を複数の階調の画像(以下、多値画像と称す)として記憶部に格納する。

0024

12は背景濃度定義部であり、予め使用者により設定された背景濃度が記憶されている。この使用者による背景濃度の設定は、以下のようにして行われる。

0025

図4(a)は画像取り込み部11に格納された帳票画像の一例、図4(b)は(a)に示した帳票画像(多値画像)に関してイメージスキャナの各画素毎に検出された濃度の頻度を示したグラフで、縦軸に頻度数、横軸に白黒濃度がとられている。図中、40は帳票、41はパンチ穴、42はプレ印刷文字である。

0026

図4から分かるように、パンチ穴やプレ印刷文字などの領域は、それぞれ異なる濃度分布を有する。このことから、パンチ穴およびプレ印刷文字の領域をそれぞれの濃度に基づいて抽出することが可能である。通常、背景は最も黒くなる(帳票に予め印刷された文字(プレ印刷文字)等に比べて濃度が高い)ことから、ここでは、使用者による背景濃度の設定は図4(b)に示す各やまのうちの濃度が最も高い(黒)ものの濃度と近い値に設定される。

0027

13はパンチ穴の座標を検出するパンチ穴検出部であり、画像取り込み部11に格納された多値画像中から背景濃度定義部12で定義された濃度と近い濃度領域を検出し、その検出された領域の中心座標を求める。背景濃度定義部12で定義された濃度と近い濃度領域が複数ある場合には、それぞれの領域の中心座標が求められる。

0028

14はプレ印刷文字濃度定義部であり、帳票に予め印刷された文字(プレ印刷文字)に関して想定される濃度が、予め使用者により設定されて記憶されている。通常、プレ印刷文字は背景の次に高い濃度となることから、ここでは、図4(b)に示す各濃度分布(やま)のうちの濃度が2番目に高いやまの濃度と近い値に設定される。

0029

15はプレ印刷文字の領域の座標を検出するプレ印刷文字検出部であり、画像取り込み部11に格納された多値画像中からプレ印刷文字濃度定義部14で定義された濃度と近い濃度領域を検出し、その検出された領域の中心座標を求める。プレ印刷文字濃度定義部14で定義された濃度と近い濃度領域が複数ある場合には、それぞれの領域の中心座標が求められる。

0030

16は、所定の帳票フォーマットにおける特定のパンチ穴およびプレ印刷文字の座標を0°,90°,180°,270°のそれぞれの挿入方向について予め求め、これをテーブル化した座標テーブルである。図5(a)に帳票上のパンチ穴およびプレ印刷文字の座標を示し、図5(b)に座標テーブル16のテーブル内容の一例を示す。なお、パンチ穴は通常2つあり、プレ印刷文字は複数存在するため、座標テーブル16を作成する際のパンチ穴とプレ印刷文字の選択は、後述の帳票挿入方向判定の際にこれらを特定できる位置関係にあるものを選択することが望ましい。

0031

17は帳票挿入方向判定部であり、帳票が0°,90°,180°,270°のいずれの方向に挿入されたかを判定する。この帳票挿入方向判定部では、パンチ穴検出部13にて検出されたパンチ穴の座標およびプレ印刷文字検出部15にて検出されたプレ印刷文字の座標と、座標テーブル16の各方向におけるパンチ穴およびプレ印刷文字の座標との比較が行われる。本実施例では、座標テーブル16は特定の位置関係にあるパンチ穴およびプレ印刷文字に関するものとなっているので、パンチ穴検出部13およびプレ印刷文字検出部15にて検出されたパンチ穴およびプレ印刷文字の座標のうちの1つは、座標テーブル16のいずれかの方向の座標と一致、あるいは最も近いものとなる。したがって、ここでは、パンチ穴検出部13およびプレ印刷文字検出部15にてそれぞれ検出されたパンチ穴およびプレ印刷文字の座標に対して座標テーブル16とのマッチングをとり、座標テーブルのいずれかの方向の座標と一致もしくは最も近いものとなった座標を画像取り込み部11に格納された帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とし、その方向が帳票が挿入された方向と判定される。

0032

18は、挿入された帳票の傾きを算出する傾き角度算出部である。この傾き角度算出部18では、パンチ穴検出部13およびプレ印刷文字検出部15によって検出されたパンチ穴およびプレ印刷文字の各中心座標のうちの、帳票挿入方向判定部17にて帳票画像における特定のパンチ穴およびプレ印刷文字の中心座標とされた座標を結ぶ測定線が求められる。さらに、帳票挿入方向判定部17にて判定された挿入方向に関する座標テーブル16のパンチ穴およびプレ印刷文字の中心座標を結ぶ基準線が求められる。そして、基準線と測定線とのなす角度が算出され、これが挿入された帳票の傾き角度とされる。図6に、帳票の傾き角度の算出の一例を示す。

0033

図6(a)は挿入方向を0°とし、傾き角度rで挿入された帳票に関する測定線61、図6(b)は座標テーブル16の挿入方向0°の場合の帳票に関する基準線62を示す図である。

0034

帳票の挿入方向を0°の方向とし、傾き角度rで挿入された場合には、まず、座標テーブル16の挿入方向0°におけるパンチ穴およびプレ印刷文字の座標から基準線62を求める(図6(a)参照)。続いて、パンチ穴検出部13にて検出されたパンチ穴の座標とプレ印刷文字検出部15にて検出されたプレ印刷文字の座標を結ぶ測定線61を求める(図6(b)参照)。そして、基準線62に対する測定線61の傾きを求めることにより傾き角度rを算出する。

0035

次に、この光学的文字読み取り装置の動作について説明する。

0036

まず、光学的文字読み取り装置に所定のフォーマットの帳票を挿入する。このとき、予め背景濃度およびプレ印刷文字濃度を設定しておき、これを背景濃度定義部12およびプレ印刷文字濃度定義部14に記憶しておく。さらに、挿入される所定の帳票フォーマットのパンチ穴およびプレ印刷文字(ただし、特定の位置関係にあるもの)に関する中心座標を、0°,90°,180°,270°のそれぞれの挿入方向について予め求め、これを基に座標テーブル16を作成しておく。

0037

帳票が挿入されると、画像取り込み部11によって帳票画像(多値画像)が読み取られて格納される。画像取り込み部11に帳票画像が格納されると、パンチ穴検出部13により、その格納された帳票画像中から背景濃度定義部12で定義された濃度と近い濃度領域が全て検出され、検出された各領域の中心座標がそれぞれ求められる。さらに、プレ印刷文字検出部15により、格納された多値画像中からプレ印刷文字濃度定義部14で定義された濃度と近い濃度領域が全て検出され、検出された領域の中心座標がそれぞれ求められる。

0038

全てのパンチ穴およびプレ印刷文字に関する中心座標が求められると、続いて、帳票挿入方向判定部17によって帳票の挿入方向が次のようにして判定される。まず、パンチ穴検出部13およびプレ印刷文字検出部15によって求められたパンチ穴およびプレ印刷文字に関する全ての中心座標と、座標テーブル16の各挿入方向におけるパンチ穴およびプレ印刷文字の中心座標とのマッチングをとり、座標テーブル16のいずれかの方向の座標と一致もしくは最も近いものとなった座標を画像取り込み部11に格納された帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とし、その方向を帳票が挿入された方向と判定する。

0039

帳票挿入方向判定部17にて帳票の挿入方向が判定されると、続いて、傾き角度検出部18によって帳票の傾き角度の検出が以下のようにして行われる。

0040

まず、パンチ穴検出部13およびプレ印刷文字濃度定義部15によって求められたパンチ穴およびプレ印刷文字の各中心座標のうちの、帳票挿入方向判定部17にて帳票画像における特定のパンチ穴およびプレ印刷文字領域の中心座標とされた座標を結ぶ測定線を求める。続いて、帳票挿入方向判定部17にて判定された挿入方向に関する座標テーブル16のパンチ穴およびプレ印刷文字領域の中心座標を結ぶ基準線を求める。そして、基準線と測定線となす角度を算出し、この算出した角度を挿入された帳票の傾き角度とする。

0041

以上のようにして帳票の傾き角度が求められると、光学的文字読み取り装置では、文字認識の際に、求められた傾き角度に基づいて文字イメージの切りだし位置のずれが補正される。

0042

次に、本発明の第2の実施例の光学的文字読み取り装置について説明する。

0043

上述した第1の実施例の光学的文字読み取り装置では、背景濃度定義部12およびプレ印刷文字濃度定義部14に記憶される背景濃度およびプレ印刷文字濃度の値は、予め使用者によって設定されているが、本実施例ではこの背景濃度およびプレ印刷文字濃度の値が挿入された帳票から算出されるようになっている。

0044

図2は、本発明の第2の実施例の光学的文字読み取り装置の概略構成を示すブロック図である。

0045

本実施例の光学的文字読み取り装置は、背景濃度定義部12およびプレ印刷文字濃度定義部14に代えて、濃度分布算出部19と背景濃度算出部20およびプレ印刷文字濃度算出部21が設けられた以外は、上述した第1の実施例の光学的文字読み取り装置の構成と同じものとなっている。図中、同じ構成部については同じ動作をするものとし、同じ符号を付してある。

0046

濃度分布算出部19は、画像取り込み部11に格納された帳票画像(多値画像)に対して、各画素毎に濃度を調べ、各濃度に対する頻度を濃度分布として求める。図3に、各画素毎に検出された濃度の頻度分布を示したグラフを示す。図中、縦軸は頻度数、横軸は白黒濃度を表し、パンチ穴やプレ印刷文字などの領域に関する濃度分布が、それぞれ特有の山の大きさ、形で表されている。

0047

背景濃度算出部20は、濃度分布算出部19にて求められた濃度分布における各山のうちから、山の大きさ、形、濃度を基に背景領域に関する山を特定し、その濃度を背景濃度とする。ここでは、図3に示す濃度分布における各山のうち、濃度が最も高い(黒)ものの濃度が背景濃度とされる。

0048

プレ印刷文字濃度算出部21は、濃度分布算出部19にて求められた濃度分布における各山のうちから、山の大きさ、形、濃度を基にプレ印刷文字領域に関する山を特定し、その濃度をプレ印刷文字濃度とする。ここでは、図3に示す濃度分布における各山のうち、背景濃度の次に濃度が高い山の濃度がプレ印刷文字濃度とされる。

0049

この光学的文字読み取り装置では、背景濃度算出部20によって求められた背景濃度に基づいてパンチ穴検出部13におけるパンチ穴の抽出が行われ、プレ印刷文字濃度算出部21によって求められたプレ印刷文字濃度に基づいてプレ印刷文字濃度算出部21におけるプレ印刷文字の抽出が行われる。

0050

以上説明した各実施例では、特定のパンチ穴およびプレ印刷文字に基づいて帳票の傾き角度を検出しているが、本発明はこれに限定されるものではなく、濃度による検出が可能な2つの領域(場合によっては、2つ以上とすることもできる)であればよい。例えば、特定の2つのプレ印刷文字、あるいは2つのパンチ穴に基づいて検出してもよい。

発明の効果

0051

本発明は以上説明したように構成されているので、以下に記載するような効果を奏する。

0052

請求項1,2に記載のもの、および請求項4,5に記載の方法においては、例えば帳票上のパンチ穴やプレ印刷文字領域を基に帳票の傾き角度の検出が行われるので、帳票の傾き角度の推定精度が帳票のエッジの状態により左右されない、安定した傾き検出処理を行うことができるという効果がある。さらに、プレ印刷文字領域等の抽出は濃淡特徴を利用した簡単な処理により行われ、連結成分の抽出、あるいは輪郭線の抽出といった複雑な処理は必要ないので、処理の高速化を図ることができるという効果がある。

0053

請求項3に記載のものにおいては、上記各効果に加えて、帳票画像から直接パンチ穴およびプレ印刷文字領域に関する濃度が検出され、その濃度を基に帳票画像からのパンチ穴およびプレ印刷文字領域に関する中心座標の抽出が行われるので、帳票の傾き角度の検出をより正確なものとすることができるという効果がある。

図面の簡単な説明

0054

図1本発明の第1の実施例の光学的文字読み取り装置の概略構成を示すブロック図である。
図2本発明の第2の実施例の光学的文字読み取り装置の概略構成を示すブロック図である。
図3各画素毎に検出された濃度の頻度分布を示したグラフである。
図4(a)は図1に示した像取り込み部11に格納された帳票画像の一例、(b)は(a)に示した帳票画像に関して各画素毎に検出された濃度の頻度分布を示したグラフである。
図5(a)は帳票上のパンチ穴およびプレ印刷文字の座標を示した図、(b)は座標テーブルのテーブル内容の一例を示した図である。
図6(a)は座標テーブルの挿入方向0°の場合の帳票に関する基準線62、(b)は挿入方向を0°とし、傾き角度rで挿入された帳票に関する測定線61を示した図である。

--

0055

11 画像取り込み部
12背景濃度定義部
13パンチ穴検出部
14プレ印刷文字濃度定義部
15 プレ印刷文字検出部
16座標テーブル
17帳票挿入方向判定部
18 帳票傾き算出
19濃度分布算出部
20 背景濃度算出部
21 プレ印刷文字濃度算出部
40 帳票
41 パンチ穴
42 プレ印刷文字
61測定線
62 基準線

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ