図面 (/)

技術 文字認識装置及び文字枠線の検出方法

出願人 株式会社日本デジタル研究所
発明者 本田勝也吉崎慶司
出願日 1999年11月30日 (20年4ヶ月経過) 出願番号 1999-339990
公開日 2001年6月8日 (18年10ヶ月経過) 公開番号 2001-155113
状態 特許登録済
技術分野 文字入力 FAX原画の編集 イメージ分析
主要キーワード 期待位置 最大差分 X座標 フィールド枠 フィールド境界 傾き補正後 変移量 区切り線
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2001年6月8日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (16)

課題

文字枠線の傾きや、実線破線など枠線線種にかかわりなく文字枠線を検出できる文字認識装置及び文字枠線の検出方法の提供。

解決手段

文字枠線検出部23はフィールド枠線検出部231、文字区切り線検出部232及びひげ線検出部233を備えており、文字枠線をその性質に応じて検出する。すなわち、フィールド枠線検出部231によりフィールドを構成する文字枠線の一種であるフィールド枠線(フィールド区切り線)を検出し、文字区切り線検出部232はフィールド枠線検出部231によって検出されたフィールド区切り線を基準としてフィールドを構成する文字枠線の一種である文字区切り線を検出する。また、ひげ線検出部233は同様にフィールド区切り線を基準としてフィールドを構成する文字枠線の一種であるひげ線を検出する。

概要

背景

光学的文字読取装置OCR)では帳票原稿上の文字を読み取って電気信号に変換し文字イメージを出力するが、帳票には、通常、文字枠線印刷されており文字は文字枠線内に収まるように印刷或いは記入されるので、読み取りの邪魔にならないように文字枠線は記入者に認識できるが装置には検出できないドロップアウトカラーで印刷されている場合が多い。これにより、文字認識の際に悪影響を及ぼす文字枠を消した状態にすることができ、装置は文字イメージのみを読み取ることができる。

しかし、文字枠線をドロップアウトカラーで印刷した帳票には、特殊な色のため帳票の印刷コストが高くなる点や、色が淡いので記入者にとって見づらい点、多くの場合、装置によって一色に決まっているので帳票の種類による色分けができない点等の不都合がある。

一方、上述したような不具合を解消するため文字枠線を非ドロップアウトカラーで印刷した帳票を光学的に読み取って文字認識を行う文字認識装置があるが、このような文字認識装置では、通常、文字認識を行う前段処理として文字枠線を検出し除去する枠線除去処理を行う場合が多い。

概要

文字枠線の傾きや、実線破線など枠線の線種にかかわりなく文字枠線を検出できる文字認識装置及び文字枠線の検出方法の提供。

文字枠線検出部23はフィールド枠線検出部231、文字区切り線検出部232及びひげ線検出部233を備えており、文字枠線をその性質に応じて検出する。すなわち、フィールド枠線検出部231によりフィールドを構成する文字枠線の一種であるフィールド枠線(フィールド区切り線)を検出し、文字区切り線検出部232はフィールド枠線検出部231によって検出されたフィールド区切り線を基準としてフィールドを構成する文字枠線の一種である文字区切り線を検出する。また、ひげ線検出部233は同様にフィールド区切り線を基準としてフィールドを構成する文字枠線の一種であるひげ線を検出する。

目的

本発明は、上記問題点に鑑みてなされたものであり、文字枠線の傾きや、実線、破線など枠線の線種にかかわりなく文字枠線を検出できる文字認識装置及び文字枠線の検出方法の提供を目的とする。

効果

実績

技術文献被引用数
0件
牽制数
1件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

原稿読み取りイメージから文字枠線イメージを取り除く文字枠線除去手段と、この文字枠線除去手段によって文字枠線が取り除かれた文字イメージから1文字ずつ文字イメージを切り出す切り出し手段と、この切り出された文字イメージの認識処理を行う文字認識手段と、を備えた文字認識装置において、前記文字枠線除去手段は、前記読取りイメージからフィールドイメージを切り出すフィールドイメージ切り出し手段と、前記フィールドイメージ切り出し手段によって切り出されたフィールドイメージを原稿の傾きに応じて回転して傾きを補正する傾き補正手段と、前記傾き補正手段による傾き補正後のフィールドイメージからフィールドを構成する文字枠線を検出する文字枠線検出手段と、この文字枠線検出手段によって検出された文字枠線を消去する文字枠線消去手段と、を備えることを特徴とする文字認識装置。

請求項2

前記文字枠線検出手段は、前記傾き補正後のフィールドイメージからフィールド境界の四辺をなすフィールド枠線を検出するフィールド枠線検出手段と、前記フィールド枠線検出手段によって検出されたフィールド内で1文字ずつの記入領域区画する縦線からなる文字区切り線を検出する文字区切り線検出手段と、を含むことを特徴とする請求項1記載の文字認識装置。

請求項3

前記文字枠線検出手段は、更に、前記フィールド枠線検出手段によって検出された前記フィールド枠線の下側の枠線から短く直立し、該フィールド内で1文字ずつの記入領域を区画する縦線からなるひげ線を検出するひげ線検出手段を含むことを特徴とする請求項2記載の文字認識装置。

請求項4

前記フィールド枠線検出手段は、前記傾き補正後のフィールドイメージから文字枠線を検出する際に候補線検出領域を設定する候補線領域設定手段と、候補線検出領域内黒画素の数及び白画素の数をそれぞれカウントする黒画素カウント手段及び白画素カウント手段と、前記白画素カウント手段によりカウントされた白画素の連続数カス閾値以内の場合はカスレとみなして前記白画素カウント手段の値をゼロクリアするカスレ判定手段と、黒画素カウント手段及び白画素カウント手段による前記候補線検出領域内の黒画素の数及び白画素の数のカウント終了後、該候補線検出領域の黒画素のカウント値実線閾値と比較し、カウント値が実線閾値以上の場合にはその候補線検出領域の文字枠線を実線と判定する実線判定手段と、を含むことを特徴とする請求項2記載の文字認識装置。

請求項5

原稿の読み取りイメージから検出した文字枠線を取り除いて1文字ずつ文字イメージを切り出して文字認識を行う文字認識装置において、前記読取りイメージからフィールドイメージを切り出し、前記切り出されたフィールドイメージを原稿の傾きに応じて回転して傾きを補正し、前記傾き補正後のフィールドイメージからフィールドを構成する文字枠線を検出する、ことを特徴とする文字枠線の検出方法

請求項6

前記傾き補正後のフィールドイメージから文字枠線を検出する際に候補線検出領域を設定し、候補線検出領域内の黒画素の数及び白画素の数をそれぞれカウントして調べ、白画素の数がカスレ閾値以内の場合はカスレとみなして白画素のカウント値をゼロクリアし、カウント終了後、候補線検出領域の黒画素のカウント値を実線閾値と比較し、カウント値が実線閾値以上の場合にはその候補線検出領域の文字枠線を実線と判定することを特徴とする請求項5記載の文字枠線の検出方法。

技術分野

0001

本発明は文字認識装置に関し、特に、原稿読み取り時の文字枠罫線(以下、文字枠線と記す)の検出技術に関する。

背景技術

0002

光学的文字読取装置OCR)では帳票原稿上の文字を読み取って電気信号に変換し文字イメージを出力するが、帳票には、通常、文字枠線が印刷されており文字は文字枠線内に収まるように印刷或いは記入されるので、読み取りの邪魔にならないように文字枠線は記入者に認識できるが装置には検出できないドロップアウトカラーで印刷されている場合が多い。これにより、文字認識の際に悪影響を及ぼす文字枠を消した状態にすることができ、装置は文字イメージのみを読み取ることができる。

0003

しかし、文字枠線をドロップアウトカラーで印刷した帳票には、特殊な色のため帳票の印刷コストが高くなる点や、色が淡いので記入者にとって見づらい点、多くの場合、装置によって一色に決まっているので帳票の種類による色分けができない点等の不都合がある。

0004

一方、上述したような不具合を解消するため文字枠線を非ドロップアウトカラーで印刷した帳票を光学的に読み取って文字認識を行う文字認識装置があるが、このような文字認識装置では、通常、文字認識を行う前段処理として文字枠線を検出し除去する枠線除去処理を行う場合が多い。

発明が解決しようとする課題

0005

上記枠線除去処理で文字枠線を検出する方法として、従来の方法は、縦横黒画素ヒストグラムを作成し、閾値以上の個所を文字枠線として検出する方法、黒画素ブロック化し、ブロックの縦横比など形状と特徴によって文字枠線を検出する方法に大別することができる。

0006

これら従来の方法のうち、の方法では、文字枠線のイメージは水平、垂直でなければならず、また、文字枠線がカスレたり、破線状になっている場合には文字枠線部分の黒画素ヒストグラム値が十分大きくならず、文字枠線を検出できない場合が生ずるといった問題点があり、の方法では、文字枠線のイメージはある程度傾いていても問題ないが、文字枠線がカスレたり破線状の場合はブロックが分断されてしまい、文字枠線を検出できない場合が生ずるといった問題点があった。

0007

本発明は、上記問題点に鑑みてなされたものであり、文字枠線の傾きや、実線破線など枠線の線種にかかわりなく文字枠線を検出できる文字認識装置及び文字枠線の検出方法の提供を目的とする。

課題を解決するための手段

0008

上記課題を解決するために、第1の発明の文字認識装置は、原稿の読み取りイメージから文字枠線イメージを取り除く文字枠線除去手段と、この文字枠線除去手段によって文字枠線が取り除かれた文字イメージから1文字ずつ文字イメージを切り出す切り出し手段と、この切り出された文字イメージの認識処理を行う文字認識手段と、を備えた文字認識装置において、文字枠線除去手段は、読取りイメージからフィールドイメージを切り出すフィールドイメージ切り出し手段と、フィールドイメージ切り出し手段によって切り出されたフィールドイメージを原稿の傾きに応じて回転して傾きを補正する傾き補正手段と、傾き補正手段による傾き補正後のフィールドイメージからフィールドを構成する文字枠線を検出する文字枠線検出手段と、この文字枠線検出手段によって検出された文字枠線を消去する文字枠線消去手段と、を備えることを特徴とする。

0009

また、第2の発明は上記第1の発明の文字認識装置において、文字枠線検出手段は、傾き補正後のフィールドイメージからフィールド境界の四辺をなすフィールド枠線を検出するフィールド枠線検出手段と、フィールド枠線検出手段によって検出されたフィールド内で1文字ずつの記入領域区画する縦線からなる文字区切り線を検出する文字区切り線検出手段と、を含むことを特徴とする。

0010

また、第3の発明は上記第2の発明の文字認識装置において、文字枠線検出手段は、更に、フィールド枠線検出手段によって検出されたフィールド枠線の下側の枠線から短く直立し、フィールド内で1文字ずつの記入領域を区画する縦線からなるひげ線を検出するひげ線検出手段を含むことを特徴とする。

0011

また、第4の発明は上記第2の発明の文字認識装置において、フィールド枠線検出手段は、傾き補正後のフィールドイメージから文字枠線を検出する際に候補線検出領域を設定する候補線領域設定手段と、候補線検出領域内の黒画素の数及び白画素の数をそれぞれカウントする黒画素カウント手段及び白画素カウント手段と、白画素カウント手段によりカウントされた白画素の連続数がカスレ閾値以内の場合はカスレとみなして白画素カウント手段の値をゼロクリアするカスレ判定手段と、黒画素カウント手段及び白画素カウント手段による前記候補線検出領域内の黒画素の数及び白画素の数のカウント終了後、該候補線検出領域の黒画素のカウント値を実線閾値と比較し、カウント値が実線閾値以上の場合にはその候補線検出領域の文字枠線を実線と判定する実線判定手段と、を含むことを特徴とする。

0012

また、第5の発明の文字枠線の検出方法は、原稿の読み取りイメージから検出した文字枠線を取り除いて1文字ずつ文字イメージを切り出して文字認識を行う文字認識装置において、読取りイメージからフィールドイメージを切り出し、切り出されたフィールドイメージを原稿の傾きに応じて回転して傾きを補正し、傾き補正後のフィールドイメージからフィールドを構成する文字枠線を検出する、ことを特徴とする。

0013

また、第6の発明は上記第5の発明の文字枠線の検出方法において、傾き補正後のフィールドイメージから文字枠線を検出する際に候補線検出領域を設定し、候補線検出領域内の黒画素の数及び白画素の数をそれぞれカウントして調べ、白画素の数がカスレ閾値以内の場合はカスレとみなして白画素のカウント値をゼロクリアし、カウント終了後、候補線検出領域の黒画素のカウント値を実線閾値と比較し、カウント値が実線閾値以上の場合にはその候補線検出領域の文字枠線を実線と判定することを特徴とする。

発明を実施するための最良の形態

0014

[文字認識装置の構成例]図1は文字認識装置の一実施例の構成を示すブロック図であり、図1(a)は全体構成図、図1(b)は枠線除去部の構成例を示すブロック図である。図1(a)で、文字認識装置1は、読取部10、枠線除去部20、文字切り出し部30、認識部40から構成されている。なお、図示していないが文字認識装置1は、CPUおよびその周辺回路からなり上述の各構成部分の動作の制御及び文字認識装置全体の動作を制御する制御部を備えている。

0015

読取部10は原稿上の文字を光学的に読み取って電気信号に変換し、文字イメージを出力する。また、枠線除去部20は読取部10で読み取った読み込みイメージ(帳票(原稿)イメージ)から文字枠線(罫線又は枠線(実線、破線、ひげ線等)を検出して文字枠線のイメージを除去した文字イメージを取得する。文字切り出し部30は、枠線除去部20によって文字枠線が除去されたイメージから1文字ずつ文字イメージを切り出して、切り出し文字イメージを取得する。認識部40は辞書部を備え、特徴検出を行った後、辞書部に登録された標準的な特徴量との距離計算等を行って文字認識を行い、認識文字コード又は棄却コードを出力する。

0016

[枠線除去部の構成例]図1(b)で、枠線除去部21はフィールドイメージ切り出し部21、フィールドイメージ回転補正部22、文字枠線検出部23及び文字枠線消去部24を備えており、フィールドイメージ切り出し部21はフィールド情報を基に帳票(原稿)イメージからフィールドの領域座標を算出し、フィールドイメージを切り出す。また、フィールドイメージ回転補正部22は後述するようにフィールドイメージを帳票(原稿)の傾きに応じて回転し、文字枠線が水平(垂直)な状態に補正する。また、文字枠線検出部23は後述するようにフィールドを構成する文字枠線の線種(例えば、フィールド枠線(フィールド区切り線)、文字区切り線、ひげ線)を検出する。また、文字枠線消去部24は文字枠線検出部23によって検出された線種の性質に応じてその文字枠線を消去する。

0017

[フィールドイメージ回転補正部]図2はフィールドイメージ回転補正部22によるフィールドイメージ回転方法の説明図であり、図2(a)は傾き補正前のフィールドイメージを示し、図2(b)は傾き補正後のフィールドイメージを示す。図2で、帳票イメージ全体の傾きθは読み取り時に傾きセンサ等によって予め検出されている。したがって、図2(a)に示すような傾き補正前のフィールドイメージ224では文字枠線222がθだけ傾いている。フィールドイメージ回転補正部22はこの文字枠線222を水平・垂直な状態に補正するために以下の処理を行う。

0018

まず、傾き補正前のフィールドイメージ224(図2(a))を、主走査主走査線221,223,225のようにX軸から+θだけ傾けた線で行い、副走査副走査線226のようにY軸に平行な線で行いながら画素値を取得し、同時に、傾き補正後のフィールドイメージ224’(図2(b))に、主走査を主走査線221’,223’,225’のようにX軸に平行な線で行い、副走査を副走査線226’のようにY軸から−θだけ傾けた線で行いながら、画素値を配置していく。また、走査点座標の算出は、例えば、よく知られているプレゼンハムアルゴリズムを用いて行うことができる(プレゼンハムのアルゴリズムでは全て整数演算を行うので、座標点の算出を高速に行うことができる)。

0019

[文字枠線検出部]図3は文字枠線検出部23の一実施例の構成を示すブロック図であり、文字枠線検出部23はフィールド枠線検出部231、文字区切り線検出部232及びひげ線検出部233を備えており、図4に示すような線種の文字枠線をその性質に応じて図6,7の例に示すように検出する。すなわち、フィールド枠線検出部231によりフィールドを構成する文字枠線の一種であるフィールド枠線(フィールド区切り線)を検出し、文字区切り線検出部232はフィールド枠線検出部231によって検出されたフィールド区切り線を基準としてフィールドを構成する文字枠線の一種である文字区切り線(図4(a))を検出する。また、ひげ線検出部233はフィールド枠線検出部231によって検出されたフィールド区切り線を基準としてフィールドを構成する文字枠線の一種であるひげ線(図4(b))を検出する。

0020

図4は文字枠線検出部23の検出対象である枠線の線種の例を示す図であり、図4(a)はフィールド枠線及び文字区切り線の説明図であり、図4(b)はひげ線の説明図である。図4でフィールド枠線41はフィールド区切り線からなり、フィールド境界四辺を区切る枠線である(以下、説明上、実線で示す)。また、文字区切り線42は文字を記入するフィールド内で1文字ずつの記入領域を区画する縦線である(以下、説明上、実線又は破線で示す)。また、ひげ線43はフィールド内で1文字ずつの記入領域を区画し、下側のフィールド区切り線から短く(例えば、1〜2mm程度)直立している縦線である(以下、説明上、実線で示す)。また、それぞれの線の、本数、太さ、長さ及び位置は読み取り前に設定されるフォーマット情報に含まれるフィールド情報によって得ることができる。

0021

1.フィールド枠線検出部
図5はフィールド枠線検出部231の一実施例の構成を示すブロック図であり、フィールド枠線検出部231は、黒画素ヒストグラム作成部51、候補線領域検出部52、実線判定部53、フィールド区切り線検出部54からなっている。図5で、黒画素ヒストグラム作成部51はフィールドイメージ回転補正部22によって傾き補正されたフィールドイメージ(図2(b))から縦横の黒画素ヒストグラムを作成し、縦の黒画素ヒストグラム(図6)からは縦のフィールド区切り線を検出し、横の黒画素ヒストグラムからは横のフィールド区切り線を検出する。候補線領域検出部52は後述(図8)するように黒画素ヒストグラムから縦横の候補線領域を検出する。実線判定部53は後述(図7図8)するように縦横の候補線領域のイメージを調べ、実線か否かを判定する。また、フィールド区切り線検出部54は縦横の候補線領域からそれぞれ縦横のフィールド区切り線(実線)を検出する。

0022

(フィールド枠線検出部の動作例)図6は候補線領域検出部52による候補線領域検出方法の説明図であり、図7は実線判定部53による実線判定方法の説明図である。また、図8はフィールド枠線検出部231の動作例を示すフローチャートであり、ステップS1、S2は黒画素ヒストグラム作成部51の動作に、S3、S4は候補線領域検出部52の動作に、S5〜S8は実線判定部53の動作に、S9、S10の動作はフィールド区切り線検出部54の動作に相当する。

0023

ステップS1:(縦の黒画素ヒストグラムの作成)
黒画素ヒストグラム作成部51はフィールドイメージ回転補正部22によって傾きが補正されたフィールドイメージの全領域について主走査方向をY軸方向、副走査方向をX軸方向として走査し、副走査座標毎に黒画素の数を集計し、縦の黒画素ヒストグラムを作成する。

0024

ステップS2:(横の黒画素ヒストグラムの作成)
同様に、黒画素ヒストグラム作成部51は傾きが補正されたフィールドイメージの全領域について主走査方向をX軸方向、副走査方向をY軸方向として走査し、副走査座標毎に黒画素の数を集計し、横の黒画素ヒストグラムを作成する。

0025

ステップS3:(縦方向の候補線領域検出)
候補線領域検出部52は上記ステップS1で作成した縦の黒画素ヒストグラムから図6に示すような頂点Pを検出する。次に、頂点Pの前後の一定範囲について黒画素ヒストグラムにおける差分を調べ、最大の差分を有する個所(最大差分個所)Ma、Mbを検出する。次に、最大差分個所Ma、Mbからそれぞれ、頂点Pから反対側に(つまり、頂点Pの前後に)差分を調べていき、差分の変動が閾値以下となる個所を検出し、そこを候補線領域の仮境界個所Ta、Tbと仮定する。

0026

最後に、仮境界個所Ta、Tbの間隔(距離)rが検出すべきフィールド区切り線の線幅r’の許容範囲内(|r−r’|<γ:γは閾値)であれば縦方向のフィールド区切り線の候補線領域として検出する。

0027

なお、縦方向のフィールド区切り線は通常2本(枠が印刷されている場合、枠線は、通常、縦方向に2本、横方向に2本のフィールド区切り線からなる(複数の枠が印刷されている場合は2本以上からなる))ので、縦の黒ヒストグラムは通常2つ生じ、頂点Pは2つ得られる。頂点Pが複数の場合、候補線領域検出部52は各頂点について上述したような最大差分個所を検出し、最大差分個所について頂点Pから反対側に(つまり、頂点の前後に)差分を調べていき、差分の変動が閾値以下となる個所を検出し、そこを候補線領域の仮境界個所と仮定し、仮境界個所の間隔(距離)rが検出すべきフィールド区切り線の線幅の許容範囲内であれば縦方向のフィールド区切り線の候補線領域として検出する。つまり、フィールドに1つの枠が印刷されている場合には通常2つの縦方向のフィールド区切り線の候補線領域が得られることとなる。

0028

ステップS4:(横方向の候補線領域検出)
同様に、候補線領域検出部52は上記ステップS2で作成した横の黒画素ヒストグラムからそれぞれ頂点を検出し、各頂点の前後の一定範囲について黒画素ヒストグラムにおける差分を調べ、最大の差分を有する個所(最大差分個所)を検出し、最大差分個所からそれぞれ、頂点から反対側に差分を調べていき、差分の変動が閾値以下となる個所を検出し、そこを候補線領域の仮境界個所と仮定し、仮境界個所の間隔(距離)が検出すべきフィールド区切り線の線幅の許容範囲内であれば横方向のフィールド区切り線の候補線領域として検出する。また、頂点が複数の場合の動作も上記ステップS3と同様であり、フィールドに1つの枠が印刷されている場合には通常2つの横方向のフィールド区切り線の候補線領域が得られることとなる。

0029

ステップS5:(縦方向の候補線領域の連続画素数カウント)
実線判定部53は縦方向の候補線領域のイメージを線に垂直な方向を主走査m、水平な方向を副走査sとして走査し画素値Q(m,s)を取得する。また、黒連続カウンタB、白連続カウンタW、黒連続数保持エリア、白連続数保持エリアを初期化(ゼロクリア)する。次に、主走査線上に黒画素が一つでもあれば黒フラグFをオンにし、黒フラグ1がオンの場合には黒連続カウンタBに1を加え、白連続カウンタWをゼロクリアする。また、黒フラグFがオフの場合には白連続カウンタWに1を加え、さらに、白連続カウンタWの値が閾値Wthに達している場合には白画素連続(つまり、線がない部分)とみなして黒連続カウンタの値と黒連続数保持エリアに格納されている値を比較し、黒連続カウンタの値が大きい場合にはその値を黒連続数保持エリアに上書きしてから黒連続カウンタBをクリアし、白連続カウンタWの値が閾値Wth未満の場合にはカスレとみなして白連続カウンタWをクリアし、黒連続カウンタBに1を加える(つまり、カスレた部分も含めて1つの線分みなす)。なお、この場合、黒連続カウンタBに白連続カウンタWの値を加えてから白連続カウンタWをクリアするようにしてもよい。

0030

ステップS6:(縦方向の候補線領域の実線判定)
実線判定部53は上記ステップS5で得た最大の黒連続数Bmax(つまり、黒連続カウンタの現在の値と黒連続数保持エリアに保持されている値のうちの大きいほう)と閾値Bthを比較し、Bmax>Bthのときその候補線領域を実線と判定する。また、上記S5、S6の動作は上記ステップS4で得た縦方向の候補線領域数に等しい回数分繰り返される。

0031

ステップS7:(横方向の候補線領域の連続画素数カウント)
上記ステップS5と同様に、実線判定部53は横方向の候補線領域のイメージを線に垂直な方向を主走査、水平な方向を副走査として走査し画素値を取得し、各カウンタを初期化する。次に、主走査線上に黒画素が一つでもあれば黒フラグFをオンにし、黒フラグ1がオンの場合には黒連続カウンタBに1を加え、白連続カウンタWをゼロクリアする。また、黒フラグFがオフの場合には白連続カウンタWに1を加え、さらに、白連続カウンタWの値が閾値Wthに達している場合には白画素連続とみなして黒連続カウンタの値と黒連続数保持エリアに格納されている値を比較し、黒連続カウンタの値が大きい場合にはその値を黒連続数保持エリアに上書きしてから黒連続カウンタBをクリアし、白連続カウンタWの値が閾値Wth未満の場合にはカスレとみなして白連続カウンタWをクリアし、黒連続カウンタBに1を加える。なお、この場合、黒連続カウンタBに白連続カウンタWの値を加えてから白連続カウンタWをクリアするようにしてもよい。

0032

ステップS8:(横方向の候補線領域の実線判定及び検出)
実線判定部53は上記ステップS7で得た最大の黒連続数と閾値を比較し、最大の黒連続数>閾値のときその候補線領域を実線と判定する。また、上記S7、S8の動作は上記ステップS4で得た横方向の候補線領域数に等しい回数分繰り返される。

0033

ステップS9:(縦方向のフィールド区切り線の検出)
フィールド区切り線検出部54は上記ステップS6で実線と判定した縦方向の候補線領域の全ての組み合わせについてそれぞれ間隔(距離)を算出し間隔検出すべきフィールド区切り線の横方向の間隔の許容範囲内に入っていればその候補線の組(対)を縦方向のフィールド区切り線として検出する。なお、縦方向のフィールド区切り線として検出可能な縦方向の候補線領域の組み合わせが複数ある場合には横方向の特定の位置(例えば、左側のフィールド区切り線位置)が期待位置に近い組み合わせを選びその組を縦方向のフィールド区切り線として検出する。また、フィールド区切り線の横方向の間隔は読み取り開始前に帳票(原稿)のフォーマット情報として設定され、縦方向のフィールド区切り線の期待位置は設定されたフォーマット情報を基に求めることができる。

0034

ステップS10:(横方向のフィールド区切り線の検出)
同様に、フィールド区切り線検出部54は上記ステップS7で実線と判定した横方向の候補線領域の全ての組み合わせについてそれぞれ間隔(距離)を算出し間隔検出すべきフィールド区切り線の縦方向の間隔の許容範囲内に入っていればその候補線の組(対)を横方向のフィールド区切り線として検出する。なお、横方向のフィールド区切り線として検出可能な横方向の候補線領域の組み合わせが複数ある場合には縦方向の特定の位置(例えば、上側のフィールド区切り線位置)が期待位置に近い組み合わせを選びその組を縦方向のフィールド区切り線として検出する。また、フィールド区切り線の縦方向の間隔は同様に読み取り開始前に帳票(原稿)のフォーマット情報として設定され、横方向のフィールド区切り線の期待位置は設定されたフォーマット情報を基に求めることができる。上記構成によりフィールド枠線検出部231は縦横のフィールド区切り線からなるフィールド枠線を検出することができる。

0035

2.文字区切り線(破線)検出部
図9は文字区切り線検出部232の一実施例の構成を示すブロック図であり、文字区切り線検出部232は、文字区切り線検出領域設定部61、変化点累積配列作成部62、文字区切り線決定部63からなっている。また、図10は変化点累積配列の説明図であり、図11は文字区切り線検出部232の動作例を示すフローチャートである。

0036

ステップT1:(文字区切り線検出領域の設定)
図11で、文字区切り線検出領域設定部61は原稿読み取り開始前に設定されたフォーマット情報を基にフィールド枠線検出部231によって検出されたフィールド区切り線(例えば、左側のフィールド区切り線)を基準として文字区切り線(破線)検出領域を設定する。

0037

ステップT2:(白→黒変化点累積配列の作成)
変化点累積配列作成部62は上記ステップT1で設定した文字区切り線検出領域101内のイメージ102をX方向を主走査方向、Y方向を副走査方向として走査し、図10に示すように白から黒の変化点が発生したX座標を累積した白→黒変化累積配列104(図10(b))を作成する。ここで、白→黒変化累積配列104は図10(a)に示すようにイメージ102を横に走査していき走査線103上で画素値が白から黒に変化した黒画素のX座標に該当する配列要素の数を1つ数えることにより作成する。白→黒変化累積配列104は枠線の左側の輪郭位置を検出するために用いる。

0038

ステップT3:(黒→白変化点累積配列の作成)
同様にして、変化点累積配列作成部62は黒から白の変化点が発生したX座標を累積した黒→白変化累積配列105(図10(c))を作成する。また、黒→白変化累積配列105はイメージ102を横に走査していき走査線103上で画素値が黒から白に変化した黒画素のX座標に該当する配列要素の数を1つ数えることにより作成する。黒→白変化累積配列105は枠線の右側の輪郭位置を検出するために用いる(変化点累積配列は黒画素ヒストグラムに比べ、文字区切り線が破線でも線としての特徴が現れやすく、破線の検出が簡単にできる)。上記T2、T3の動作は1フィールド分の走査が終わるまで繰り返される。

0039

ステップT4:(変化点累積配列のソート
1フィールド分の走査が修了すると、文字区切り線決定部63は上記ステップT2、T3で得た白→黒変化累積配列S[i]および黒→白変化累積配列E[j]を大きい順にソート(SORT:並べ替え)する。

0040

ステップT5:(文字区切り線領域の決定)
文字区切り線決定部63は、上記ステップT4で得たソート済みの両配列S[i],E[j]の1番目の要素について値がS[i],E[j]ともに閾値α以上であり、位置についてはiはjより小さく、期待値eとの差について|e−i|、|e−j|ともに閾値β以下である場合、iとjとの間を文字区切り線領域(破線の実線部分)と決定する。また、1番目の値で決定できなかった場合には両配列の1〜2番目の要素について同様に判定を行い、それでも決定できない場合には1〜3番目の要素について同様の判定を行い、この判定で決定できない場合には文字区切り線(=破線)なしと決定する(実施例では1〜3番目の要素までとしたがこれに限定されない)。

0041

3.ひげ線検出部
図12はひげ線検出部233の一実施例の構成を示すブロック図であり、ひげ線検出部233は、ひげ線検出領域設定部71、黒画素ヒストグラム作成部72、ひげ線範囲検出部73からなっている。また、図13はひげ線横範囲検出の説明図であり、図14はひげ線縦範囲検出の説明図である。また、図15はひげ線検出部233の動作例を示すフローチャートである。

0042

ステップU1:(ひげ線検出領域の設定)
ひげ線検出領域設定部71はフィールド枠線検出部231によって検出されているフィールド区切り線(例えば、左側と下側のフィールド区切り線)を基準としてひげ線検出領域を設定する。

0043

ステップU2:(黒画素ヒストグラムの作成)
黒画素ヒストグラム作成部72は上記ステップU1で設定したひげ線検出領域のイメージから縦の黒画素ヒストグラムを作成する。

0044

ステップU3:(ひげ線横範囲の検出)
ひげ線範囲検出部73は上記ステップU2で作成した縦の黒画素ヒストグラムから図13に示すようにしてひげ線の横範囲を検出する。すなわち、図13(a)に示すように縦の黒画素ヒストグラムから高さが閾値tha以上の有効範囲を検出し、図13(b)に示すように有効範囲内の黒画素ヒストグラムの高さh1が閾値thb以上で且つ直前のヒストグラムとの高さh0との差が閾値thc以上の個所を、ひげ線横範囲の始点として検出する。また、次に現れた有効範囲内の黒画素ヒストグラムから高さh2が閾値thb以上で且つ直前のヒストグラムの高さh3との差が閾値thc以上の個所を、ひげ線横範囲の終点として検出する。そして、検出された始点、終点の間隔が検出すべきひげ線の線幅の許容範囲内であれば、ひげ線の横範囲と決定する。なお、閾値tha、thb及びthcは読み取り開始前に設定されるフォーマット情報から得られる検出すべきひげ線の長さに応じて設定する。

0045

ステップU4:(ひげ線縦範囲(ひげ線の長さ)の検出)
ひげ線範囲検出部73は上記ステップU3で検出したようなひげ線の横範囲のイメージ(図14(a)で矩形の破線で囲って示した数字「7」の脚部近傍)を下から上に輪郭追跡し、追跡できなくなるか又はX(線幅)の変移量一定値以上になった場合、そこで追跡を終了する。このときのY変移量(縦方向の長さ)が閾値H以上であればひげ線縦範囲として検出する。また、閾値は読み取り開始前に設定されるフォーマット情報から得られる検出すべきひげ線の長さに応じて設定される。また、上記ステップU3、U4でひげ線が文字ストロークと交差接触していてひげ線の範囲が検出できない場合は3回まで再検出を繰り返す(3回に限定されない)。3回まで再検出を繰り返す場合は、2回目はひげ線検出領域の上半分で、3回目はひげ線検出領域の下半分で検出を繰り返す。

0046

また、フィールドイメージ回転補正部22によって回転補正されたフィールドイメージと、文字枠線検出部232によって検出されたフィールド区切り線、文字区切り線、及びひげ線等の文字枠情報図1(b)に示すように文字枠消去部24による文字枠消去処理に用いられる。

0047

以上、本発明の一実施例について説明したが本発明は上記実施例に限定されるものではなく、種々の変形実施が可能であることはいうまでもない。

発明の効果

0048

上記説明したように、第1〜第4の発明の文字認識装置および第5、第6の発明の文字枠線検出方法によれば、読み取った原稿イメージが傾いていてもフィールドの傾きを補正して文字枠線の検出を補正できるので縦横の黒画素ヒストグラムを作成しても従来のように傾きによって黒画素値の検出ができないといったようなことがないので、文字枠線を高精度に検出することができる。

0049

また、第4の発明の文字認識装置および第6の発明の文字枠線検出方法によれば、上記効果に加えて、カスレ部分を判定しカスレ部分を空白部分とはみなさないので、実線部分の一部がかすれていても連続した部分とみなして実線判定を行うことができるので、文字枠線がかすれていても文字枠線を高精度に検出することができる。

図面の簡単な説明

0050

図1文字認識装置の一実施例の構成を示すブロック図である。
図2フィールドイメージ回転補正部によるフィールドイメージ回転方法の説明図である。
図3文字枠線検出部の一実施例の構成を示すブロック図である。
図4文字枠線検出部の検出対象である枠線の線種の例を示す図である。
図5フィールド枠線検出部の一実施例の構成を示すブロック図である。
図6候補線領域検出部による候補線領域検出方法の説明図である。
図7実線判定部による実線判定方法の説明図である。
図8フィールド枠線検出部の動作例を示すフローチャートである。
図9文字区切り線検出部の一実施例の構成を示すブロック図である。
図10変化点累積配列の説明図である。
図11文字区切り線検出部の動作例を示すフローチャートである。
図12ひげ線検出部の一実施例の構成を示すブロック図である。
図13ひげ線横範囲検出の説明図である。
図14ひげ線縦範囲検出の説明図である。
図15ひげ線検出部の動作例を示すフローチャートである。

--

0051

1文字認識装置
20文字枠線除去部(文字枠線除去手段)
30文字切り出し部(文字切り出し手段)
40 認識部(文字認識手段)
21フィールドイメージ切り出し部(フィールドイメージ切り出し手段)
22 フィールドイメージ回転補正部(傾き補正手段)
23 文字枠線検出部(文字枠線検出手段)
24 文字枠線消去部(文字枠線消去手段)
51黒画素ヒストグラム作成部(候補線領域設定手段)
52 候補線領域検出部(候補線領域設定手段)
52実線判定部(カウント手段、カスレ判定手段、実線判定手段)
231フィールド枠線検出部(フィールド枠線検出手段)
232文字区切り線検出部(文字区切り線検出手段)
233ひげ線検出部(ひげ線検出手段)

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • Linne株式会社の「 画像情報表示装置」が 公開されました。( 2020/02/06)

    【課題】撮影した対象のカテゴリなどの情報を画像とともに迅速に表示することができ、利便性及び商品性を向上させることができる画像情報表示装置を提供する。【解決手段】画像情報表示装置1では、カメラ3で撮影さ... 詳細

  • 深セン衆リー電力科技有限公司の「 監視警報システム」が 公開されました。( 2020/02/06)

    【課題】衣服のスタイルの抽出に基づいて人の追跡および監視を実現する監視警報システムを提供する。【解決手段】監視警報システムは、人がいるかどうかを検出し、人が検出された時に信号を制御装置2に送信する赤外... 詳細

  • 株式会社ディー・エヌ・エーの「 本人確認のためのシステム、方法、及びプログラム」が 公開されました。( 2020/02/06)

    【課題】 本人確認のための適切な画像のユーザによる提供を支援する。【解決手段】 本発明の一実施形態に係るサービス提供システム1は、サービス提供サーバ10と、当該サーバ10とインターネット等の通... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ