図面 (/)

技術 網掛け領域処理方法

出願人 株式会社リコー
発明者 小島啓嗣
出願日 1993年9月20日 (27年2ヶ月経過) 出願番号 1993-233371
公開日 1995年4月7日 (25年7ヶ月経過) 公開番号 1995-093480
状態 特許登録済
技術分野 文字入力
主要キーワード Y座標 オーバーラップ処理 自己選択 存在状況 網掛け領域 実装メモリ 分割領域単位 中間変数
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1995年4月7日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (6)

目的

入力された文書原稿に含まれる網掛けによる文字修飾された領域を自動的にかつ高速に検出して、文字情報は保存したままで網掛けによる修飾情報を除去し、特に文字認識の前処理に好適な網掛け領域処理方法を提供する。

構成

入力される文書画像データより網掛け領域を構成する小ドットを抽出し、抽出された小ドットの存在状況に基づいて文書画像データより網掛け領域を検出して網掛けによる文字修飾を除去する。

概要

背景

従来より、文字認識装置においては、網掛けによって修飾された文字領域では網掛けのドット文字パターンが重なっているために文字の正確な切り出しが困難であった。そのために文書原稿中に網掛け領域を含む原稿を処理する場合には、文字の認識処理の前に、入力画像表示装置上に表示して、操作者が網掛け領域を避けるように文書領域を指定したり、網掛けによって発生する誤認識修正したりする必要があった。

また、背景模様によって修飾された領域に含まれる文字の抽出をおこなう技術としては、電子情報通信学会全国大会(1989年)に酒匂らによって発表された「自己組織多重解像度フィルタによる見だし文字抽出」に記載されている方法が知られている。

この方法では、自己組織化法によって、各テクスチャ領域内に学習領域を設け、多数の入力変数から2変数の組み合わせによって、新たに中間変数を作り、その中から、あらかじめ定めた評価基準によって、いくつかの中間変数を自己選択する。選択された中間変数の中に、出力として目的とする値に十分収束したものが存在するかどうかを判定して、十分収束した中間変数が存在しなければ、自己選択されたものを入力変数とし、組み合わせ発生の操作に戻る。収束条件を満す変数が得られるまで、以上の操作を繰り返し、高精度な変換関数を求めることによって原稿中の見だし領域の文字抽出を行なっている。

しかしながら、上記の方法においても、前処理として、操作者が文字を含む背景模様領域を予め指定しておく必要があった。また、自己組織化法によって変換関数を求める過程において、浮動小数点演算を繰り返す必要があるために、演算処理に時間がかかり、文字認識前処理方法としては不適切であった。

近年のワープロやDTP等の普及によって、網掛けによる文字修飾された文書原稿が増加しており、文字認識処理等の前処理として網掛けによる文字修飾を自動的かつ高速に検出して除去する技術が必要となってきた。

概要

入力された文書原稿に含まれる網掛けによる文字修飾された領域を自動的にかつ高速に検出して、文字情報は保存したままで網掛けによる修飾情報を除去し、特に文字認識の前処理に好適な網掛け領域処理方法を提供する。

入力される文書画像データより網掛け領域を構成する小ドットを抽出し、抽出された小ドットの存在状況に基づいて文書画像データより網掛け領域を検出して網掛けによる文字修飾を除去する。

目的

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

入力される文書画像データより網掛け領域を構成する小ドットを抽出し、前記文書画像データより該網掛け領域中の網掛け情報を除去することを特徴とする網掛け領域処理方法

請求項2

請求項1において、網掛け領域を構成する小ドットを抽出し、該ドットのみを統合して文書画像中の網掛け領域を検出することを特徴とする網掛け領域処理方法。

請求項3

請求項1において、文書画像データの所定の領域ごとに網掛け領域を検出することを特徴とする網掛け領域処理方法。

請求項4

請求項1において、網掛け領域の位置を出力することを特徴とする網掛け領域処理方法。

技術分野

0001

本発明は、入力される文書画像中網掛け領域を含む場合の網掛け領域処理方法に関し、特に文書原稿を画像データとして入力して、文字認識を行なう光学的文字読取装置OCR)における前処理方法として好適な網掛け領域処理方法に関する。

背景技術

0002

従来より、文字認識装置においては、網掛けによって修飾された文字領域では網掛けのドット文字パターンが重なっているために文字の正確な切り出しが困難であった。そのために文書原稿中に網掛け領域を含む原稿を処理する場合には、文字の認識処理の前に、入力画像表示装置上に表示して、操作者が網掛け領域を避けるように文書領域を指定したり、網掛けによって発生する誤認識修正したりする必要があった。

0003

また、背景模様によって修飾された領域に含まれる文字の抽出をおこなう技術としては、電子情報通信学会全国大会(1989年)に酒匂らによって発表された「自己組織多重解像度フィルタによる見だし文字抽出」に記載されている方法が知られている。

0004

この方法では、自己組織化法によって、各テクスチャ領域内に学習領域を設け、多数の入力変数から2変数の組み合わせによって、新たに中間変数を作り、その中から、あらかじめ定めた評価基準によって、いくつかの中間変数を自己選択する。選択された中間変数の中に、出力として目的とする値に十分収束したものが存在するかどうかを判定して、十分収束した中間変数が存在しなければ、自己選択されたものを入力変数とし、組み合わせ発生の操作に戻る。収束条件を満す変数が得られるまで、以上の操作を繰り返し、高精度な変換関数を求めることによって原稿中の見だし領域の文字抽出を行なっている。

0005

しかしながら、上記の方法においても、前処理として、操作者が文字を含む背景模様領域を予め指定しておく必要があった。また、自己組織化法によって変換関数を求める過程において、浮動小数点演算を繰り返す必要があるために、演算処理に時間がかかり、文字認識の前処理方法としては不適切であった。

0006

近年のワープロやDTP等の普及によって、網掛けによる文字修飾された文書原稿が増加しており、文字認識処理等の前処理として網掛けによる文字修飾を自動的かつ高速に検出して除去する技術が必要となってきた。

0007

本発明はかかる事情に鑑み、入力された文書原稿に含まれる網掛け領域を自動的にかつ高速に検出して文字情報は保存したままで網掛け情報を除去し、特に文字認識の前処理に好適な網掛け領域処理方法を提供することを目的としている。

課題を解決するための手段

0008

上述した課題を解決するために、請求項1記載の発明では、入力される文書画像データより網掛け領域を構成する小ドットを抽出し、前記文書画像データより該網掛け領域中の網掛け情報を除去するように構成した。

0009

また、請求項2記載の発明では、請求項1記載の発明に加えて、網掛け領域を構成する小ドットを抽出し、該ドットのみを統合して文書画像中の網掛け領域を検出するように構成した。また、請求項3記載の発明では、請求項1記載の発明に加えて、文書画像データの所定の領域ごとに網掛け領域を検出するように構成した。さらに、請求項4記載の発明では、請求項1記載の発明に加えて、検出した網掛け領域の位置を出力するように構成した。

0010

(実施例1基本処理)以下、図面に基づいて本発明を詳細に説明する。図1は網掛け領域検出の基本処理フローチャートである。網掛け領域の検出処理は、矩形抽出テップ矩形の統合ステップの2つのステップによって構成される。

0011

矩形抽出ステップは、入力された文書画像中の黒画素連続性から黒ランを抽出して、黒ランの外接矩形を抽出するステップである。一般に、網掛け領域を構成するドットは、文字の外接矩形よりもはるかに微小な外接矩形として抽出される。本発明では、処理対象文書で使用している文字サイズに応じた閾値(例えば3×3画素以内のサイズ)を設定することによって、文書画像中の網掛けドットの情報のみが、小ドット(矩形)として抽出される。設定する閾値としては、処理対象の文書中のカンマ読点等を、網掛けドットと誤検出しない程度の値を設定する。

0012

次に、矩形の統合ステップにおいて、抽出された小ドット間の距離に対して、水平方向、垂直方向閾値処理により、所定の閾値以内の距離(例えば10画素以内の距離)にある小ドット(矩形)を統合する処理を進めて、網掛け候補領域の矩形として抽出する。

0013

この矩形の統合ステップによって生成された網掛け候補領域の座標情報から、網掛け候補領域の大きさを調べることにより、網掛け領域かどうかの判定を行なう。一般に、網掛けによる文字修飾は1文字のみを対象とする場合よりも、複数の文字を対象として施される場合が多いため、本発明における網掛け領域の判定は、例えば文書の行の高さを基準にして、行の高さの2倍の長さ以上の網掛け候補領域を網掛け領域として判定する。

0014

網掛け領域と判定された領域には、その網掛け領域に属する小ドットの黒画素を白画素反転することにより、網掛け情報の除去処理を施す。どの網掛け領域にどの小ドットが所属しているのかという情報は、小ドットを統合して網掛け候補領域を抽出する過程で、統合される側の小ドットと統合する側の矩形領域の従属関係を管理することによって容易に把握することが可能である。

0015

図2は、本発明を文字認識装置に応用したブロック図である。文書画像原稿はスキャナ1から入力されて、画像メモリ2に文書画像データとして蓄積される。中央演算処理装置3は、網掛け処理プログラム格納ROM4より網掛け領域処理プログラム読み出して、ワークエリアRAM5において文書画像データに対する網掛け領域の抽出処理を実行して、文書画像から網掛けを除去する。このときRAM5には網掛け領域として抽出された矩形の座標も保持される。

0016

網掛けを除去された文書画像データは、中央演算処理装置3によって図示しない文字認識辞書とのパターンマッチング等による文字認識処理が施されて、画像データから文字コードデータに変換され、認識結果がディスプレイ6に表示される。

0017

(実施例2分割処理)ここで、原稿画像全体を処理対象にして実施例1の処理を施すと、そのために矩形データなどのワークエリアRAMをかなり必要とする。ワークエリアRAMが十分にあるシステムでは、実施例1の方法で処理が可能であるが、パーソナルコンピュータのような実装メモリが限られているようなシステム上で稼働させるためには、省メモリ化をはからなければならない。

0018

実施例2では、網掛け領域の抽出処理する範囲を分割して、分割領域単位で網掛け領域の抽出処理を行なうことにより、原稿画像全体に処理を行なう。図3に分割処理の網掛け領域検出の基本処理フローチャートを示す。

0019

処理単位を分割する実施例2では、網掛け領域が分割領域の境界に跨って存在する場合があるために、単位領域の境界部での処理が特徴となる。実施例2の分割処理では、網掛け候補領域とオーバーラップ領域、すなわち現在処理している単位領域の境界部に存在する適当な高さをもつ領域との位置関係により、網掛け領域の判定処理が行なわれる。

0020

図4に示される網掛け候補領域(1)、(2)、(3)を例に説明をする。領域(1)は、網掛け領域がオーバーラップ領域、すなわち現在処理している単位領域の境界部に存在する適当な高さをもつ領域にかかっていないので、この網掛け領域(1)については、基本処理と同様に網掛け領域の判定を行ない、適当な大きさであれば網掛け領域として網掛け情報を除去する。

0021

領域(2)は、網掛け候補領域の一部がオーバーラップ領域にかかっている状態の例で、領域(3)は、網掛け候補領域がオーバーラップ領域に含まれている状態の例である。網掛け候補領域が(2)、(3)状態の場合は、網掛け領域が次の単位領域にも跨って存在する可能性が高いために、図5にフローチャートを示す境界処理が実行される。

0022

まず、網掛け候補領域に対して基本処理と同様の網掛け領域の判定を行ない、所定の大きさの領域であれば網掛け領域として除去処理を行なう。ここで、網掛け候補領域が網掛け領域と判定された場合、オーバーラップ領域の始点のY座標(Yos)と、網掛け領域の終点のY座標(Yae)の比較を行ない、YaeがYos以上の場合には、網掛け領域が次の処理領域に跨って存在する可能性が高いために、この網掛け領域を次の処理領域に持ち越して、次の処理領域でも使うようにする。

0023

この処理によって、図4の(2)のように、網掛け領域が次の単位領域にも跨って存在する場合においても、この網掛け領域が次の単位領域に持ち越され、統合されて成長するために、境界にある網掛け領域も問題なく抽出することができる。

0024

また、網掛け候補領域が適当な大きさを持たないことにより、網掛け領域と判定されなかった場合には、オーバーラップ領域の始点のY座標(Yos)と、網掛け候補領域の始点のY座標(Yae)の比較を行ない、YaeがYos以下の場合には、網掛け領域の一部が現在処理している単位領域にあると考えられるので、この網掛け候補領域のY座標の始点Yasを,次の処理領域の始点の候補にする。

0025

この処理によって、次の処理の単位領域は、網掛け領域と判定されなかった網掛け候補領域の始点座標Yasまで戻らせて、処理領域を一部重複させている。このオーバーラップ処理させることにより、図4の(3)のように、網掛け領域がオーバーラップ領域に含まれて存在する場合においても、次の単位領域で網掛け領域判定に対応することができる。

0026

さらに、本発明では、網掛け領域として検出した矩形の位置(始点・終点の座標値、または始点の座標値と幅・高さ)を、ワープロやDTPソフトなどのアプリケーション側に出力することもできる。これにより、網掛けを除去して文字認識処理を施した後に、アプリケーション側で、網掛けによる文字修飾を再現して、認識結果に網掛けを施してディスプレイに表示したり、印字装置に出力することが可能になる。

0027

また、本実施例では矩形抽出ステップ後の小ドットのサイズに注目して、網掛け領域の判定処理の説明を進めたが、小ドットのサイズに加えて、矩形抽出ステップの前の入力画像データ中の網掛けドットの形状情報を利用することも有効である。

発明の効果

0028

以上説明したように、本発明による網掛け領域処理方法によれば、画像上に存在する網掛け領域を自動的に検出し、除去することができ、個々の網掛け領域を操作者が指定して除去する必要がなく、システムとしての操作性が向上して全体の処理時間が短縮される。また、文字認識処理の対象原稿広がり入力効率の向上が期待できる。

図面の簡単な説明

0029

図1本発明の網掛け領域検出の基本処理フローチャートである。
図2本発明を文字認識装置に応用したブロック図である。
図3分割処理の網掛け領域検出の基本処理フローチャートである。
図4境界部に存在する網掛け候補領域を説明する図である。
図5本発明の境界処理を示すフローチャートである。

--

0030

1スキャナ
2画像メモリ
3中央演算処理装置
4網掛け領域処理プログラムROM
5ワークエリアRAM
6 ディスプレイ

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 富士ゼロックス株式会社の「 情報処理装置及びプログラム」が 公開されました。( 2020/09/24)

    【課題】記入済み文書画像から文字の画像を含む領域を切り出す工程の作業のみを軽減するよう構成された場合に比較して、記入済み文書画像に基づく処理の全体の作業を軽減する。【解決手段】雛形文書を読み取ることに... 詳細

  • 富士ゼロックス株式会社の「 画像処理装置及びプログラム」が 公開されました。( 2020/09/24)

    【課題】本開示の技術は、画像を文字と標章とに分類する場合に断続線が文字に分類されることによって断続線が除去されない不具合を解消することができる画像処理装置及びプログラムを提供する。【解決手段】画像処理... 詳細

  • 富士ゼロックス株式会社の「 情報処理装置及びプログラム」が 公開されました。( 2020/09/24)

    【課題】顧客から委託元に提供された情報について特定の機密情報を識別できないような状態に加工して委託先に送付することができる情報処理装置及びプログラムを提供する。【解決手段】情報処理装置は、自装置に入力... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ