図面 (/)

技術 文字読取装置及び文字読取方法

出願人 株式会社東芝大蔵省印刷局長
発明者 輪島憲雄阿波尚芳大澤慈郎
出願日 1999年3月31日 (22年3ヶ月経過) 出願番号 1999-091752
公開日 2000年10月13日 (20年9ヶ月経過) 公開番号 2000-285200
状態 特許登録済
技術分野 文字入力
主要キーワード 多値演算 標本化処理 演算画像 演算処理後 色演算処理 処理対象外 処理エラー 認識エラー
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2000年10月13日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (7)

課題

読取対象の文字バックに何らかの背景画像が形成されているときの文字読取精度の低下を防止する文字読取装置及び文字読取方法を提供すること。

解決手段

読取対象物から画像を読み取り、複数の色成分に対応した画像信号を出力する画像読取手段(10)と、画像信号に含まれる複数の色成分の比率を変化させる色演算係数複数種類記憶する記憶手段(16c)と、画像信号に含まれる複数の色成分の比率を複数種類の色演算係数夫々により変化させる演算を実行する演算手段(14)と、この演算手段の演算結果として得られる異なる複数の演算画像のうち文字読取処理に相応しい演算画像を選択する選択手段(16)と、この選択手段により選択された演算画像に含まれる文字を読み取る文字読取手段(16)とを備えている。

概要

背景

従来の文字読取装置は、例えば、読取対象物から画像を読み取り画像信号を出力するビデオカメラ、このビデオカメラからの出力されるアナログ画像信号を8ビットデジタル多値画像信号に変換するA/D変換器、この多値画像信号から2値化画像を生成し、この2値化画像に対して文字読取処理を実行する文字読取部を含む構成となっている。文字読取部では、文字位置検出処理、文字の抽出処理文字単位ビットパターンの作成、文字の認識処理としての文字パターン正規化標本化辞書パターンとの比較による類似度処理が順次行われ、文字読取結果が出力される。

概要

読取対象の文字のバックに何らかの背景画像が形成されているときの文字読取精度の低下を防止する文字読取装置及び文字読取方法を提供すること。

読取対象物から画像を読み取り、複数の色成分に対応した画像信号を出力する画像読取手段(10)と、画像信号に含まれる複数の色成分の比率を変化させる色演算係数複数種類記憶する記憶手段(16c)と、画像信号に含まれる複数の色成分の比率を複数種類の色演算係数夫々により変化させる演算を実行する演算手段(14)と、この演算手段の演算結果として得られる異なる複数の演算画像のうち文字読取処理に相応しい演算画像を選択する選択手段(16)と、この選択手段により選択された演算画像に含まれる文字を読み取る文字読取手段(16)とを備えている。

目的

この発明の目的は、上記したような事情に鑑み成されたものであって、読取対象の文字のバックに何らかの背景画像が形成されているときの文字読取精度の低下を防止することができる文字読取装置及び文字読取方法を提供することにある。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

読取対象物から画像を読み取り、複数の色成分に対応した画像信号を出力する画像読取手段と、この画像読取手段から出力される前記画像信号に含まれる複数の色成分の比率を変化させる色演算係数複数種類記憶する記憶手段と、前記画像信号に含まれる複数の色成分の比率を前記記憶手段に記憶された前記複数種類の色演算係数夫々により変化させる演算を実行する演算手段と、この演算手段の演算結果として得られる異なる複数の演算画像の中から、文字読取処理に相応しい演算画像を選択する選択手段と、この選択手段により選択された演算画像に含まれる文字を読み取る文字読取手段と、を備えたことを特徴とする文字読取装置

請求項2

読取対象物から画像を読み取り、第1の色成分に対応した第1の画像信号、及びこの第1の色成分と異なる第2の色成分に対応した第2の画像信号を出力する画像読取手段と、この画像読取手段から出力される前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を変化させる第1の色演算係数、並びにこの第1の色演算係数と異なり前記第1及び第2の色成分の比率を変化させる第2の色演算係数を記憶する記憶手段と、前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を前記記憶手段に記憶された前記第1及び第2の色演算係数夫々により変化させる演算を実行する演算手段と、前記第1の色演算係数により前記演算手段の演算結果として得られる第1の多値演算画像、及び前記第2の色演算係数により前記演算手段の演算結果として得られる第2の多値演算画像を夫々2値化処理し、第1の2値化演算画像及び第2の2値化演算画像を生成する生成手段と、この生成手段により生成された第1及び第2の2値化演算画像のうち文字読取処理に相応しい方の演算画像を選択する選択手段と、この選択手段により選択された第1又は第2の2値化演算画像に含まれる文字を読み取る文字読取手段と、を備えたことを特徴とする文字読取装置。

請求項3

読取対象となる文字の文字数及び文字サイズのうち少なくとも一方の文字条件を指定する指定手段と、前記読取対象となる文字を含む読取対象物から画像を読み取り、第1の色成分に対応した第1の画像信号、及びこの第1の色成分と異なる第2の色成分に対応した第2の画像信号を出力する画像読取手段と、この画像読取手段から出力される前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を変化させる第1の色演算係数、並びにこの第1の色演算係数と異なり前記第1及び第2の色成分の比率を変化させる第2の色演算係数を記憶する記憶手段と、前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を前記記憶手段に記憶された前記第1及び第2の色演算係数夫々により変化させる演算を実行する演算手段と、前記第1の色演算係数により前記演算手段の演算結果として得られる第1の多値演算画像、及び前記第2の色演算係数により前記演算手段の演算結果として得られる第2の多値演算画像を夫々2値化処理し、第1の2値化演算画像及び第2の2値化演算画像を生成する生成手段と、この生成手段により生成された第1及び第2の2値化演算画像に含まれる文字数及び文字サイズのうち少なくとも一方の文字条件を検出する検出手段と、この検出手段で検出された文字条件と前記指定手段で指定された文字条件とを比較して、所定の条件を満足する比較結果が得られる方の2値化演算画像を選択する選択手段と、この選択手段により選択された第1又は第2の2値化演算画像に含まれる文字を読み取る文字読取手段と、を備えたことを特徴とする文字読取装置。

請求項4

読取対象となる文字の文字数及び文字サイズのうち少なくとも一方の文字条件を指定する指定手段と、前記読取対象となる文字を含む読取対象物から画像を読み取り、第1の色成分に対応した第1の画像信号、及びこの第1の色成分と異なる第2の色成分に対応した第2の画像信号を出力する画像読取手段と、この画像読取手段から出力される前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を変化させる第1の色演算係数、並びにこの第1の色演算係数と異なり前記第1及び第2の色成分の比率を変化させる第2の色演算係数を記憶する記憶手段と、前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を前記記憶手段に記憶された前記第1及び第2の色演算係数夫々により変化させる演算を実行する演算手段と、前記第1の色演算係数により前記演算手段の演算結果として得られる第1の多値演算画像、及び前記第2の色演算係数により前記演算手段の演算結果として得られる第2の多値演算画像を夫々2値化処理し、第1の2値化演算画像及び第2の2値化演算画像を生成する生成手段と、この生成手段により生成された第1及び第2の2値化演算画像に含まれる文字数及び文字サイズのうち少なくとも一方の文字条件を検出する検出手段と、この検出手段により前記第1の2値化演算画像から検出された文字条件と前記指定手段で指定された文字条件とを比較して、この第1の2値化演算画像から検出された文字条件と前記指定手段により指定された文字条件とが一致するときにはこの第1の2値化演算画像を選択し、この第1の2値化演算画像から検出された文字条件と前記指定手段により指定された文字条件とが一致しないときには、前記検出手段により前記第2の2値化演算画像から検出された文字条件と前記指定手段で指定された文字条件とを比較して、この第2の2値化演算画像から検出された文字条件と前記指定手段により指定された文字条件とが一致するときにはこの第2の2値化演算画像を選択する選択手段と、この選択手段により選択された第1又は第2の2値化演算画像に含まれる文字を読み取る文字読取手段と、を備えたことを特徴とする文字読取装置。

請求項5

前記記憶手段に記憶される色演算係数を任意の値に設定可能としたことを特徴とする請求項1、請求項2、請求項3、又は請求項4記載の文字読取装置。

請求項6

複数の色成分からなる画像信号の前記色成分の比率を複数種類に変化させる複数の色演算係数を記憶し、読取対象物から画像を読み取り、前記画像信号を出力し、前記画像信号に含まれる複数の色成分の比率を前記複数の色演算係数夫々により複数種類に変化させる演算を実行し、この演算の演算結果として得られる異なる複数種類の演算画像の中から、文字読取処理に相応しい演算画像を選択し、この選択された演算画像に含まれる文字を読み取る、ことを特徴とする文字読取方法。

請求項7

第1の色成分に対応した第1の画像信号の色成分及びこの第1の色成分と異なる第2の色成分に対応した第2の画像信号の色成分の比率を変化させる第1の色演算係数、並びにこの第1の色演算係数と異なり前記第1及び第2の画像信号の色成分の比率を変化させる第2の色演算係数を記憶し、読取対象物から画像を読み取り、前記第1及び第2の画像信号を出力し、前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を前記第1及び第2の色演算係数夫々により変化させる演算を実行し、前記第1の色演算係数により演算結果として得られる第1の多値演算画像、及び前記第2の色演算係数により演算結果として得られる第2の多値演算画像を夫々2値化処理して、第1の2値化演算画像及び第2の2値化演算画像を生成し、この生成された第1及び第2の2値化演算画像のうち文字読取処理に相応しい方の演算画像を選択し、この選択された第1又は第2の2値化演算画像に含まれる文字を読み取る、ことを特徴とする文字読取方法。

請求項8

読取対象となる文字の文字数及び文字サイズのうち少なくとも一方の文字条件を指定し、第1の色成分に対応した第1の画像信号の色成分及びこの第1の色成分と異なる第2の色成分に対応した第2の画像信号の色成分の比率を変化させる第1の色演算係数、並びにこの第1の色演算係数と異なり前記第1及び第2の画像信号の色成分を変化させる第2の色演算係数を記憶し、読取対象物から画像を読み取り、前記第1及び第2の画像信号を出力し、前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を前記第1及び第2の色演算係数夫々により変化させる演算を実行し、前記第1の色演算係数により演算結果として得られる第1の多値演算画像、及び前記第2の色演算係数により演算結果として得られる第2の多値演算画像を夫々2値化処理して、第1の2値化演算画像及び第2の2値化演算画像を生成し、この生成された第1及び第2の2値化演算画像に含まれる文字数及び文字サイズのうち少なくとも一方の文字条件を検出し、この検出された文字条件と前記指定された文字条件とを比較して、所定の条件を満足する比較結果が得られる方の2値化演算画像を選択し、この選択された第1又は第2の2値化演算画像に含まれる文字を読み取る、ことを特徴とする文字読取方法。

技術分野

0001

この発明は、読取対象物から画像を読み取り、この読み取られた画像から文字を読み取る文字読取装置及び文字読取方法に関する。

背景技術

0002

従来の文字読取装置は、例えば、読取対象物から画像を読み取り画像信号を出力するビデオカメラ、このビデオカメラからの出力されるアナログ画像信号を8ビットデジタル多値画像信号に変換するA/D変換器、この多値画像信号から2値化画像を生成し、この2値化画像に対して文字読取処理を実行する文字読取部を含む構成となっている。文字読取部では、文字位置検出処理、文字の抽出処理文字単位ビットパターンの作成、文字の認識処理としての文字パターン正規化標本化辞書パターンとの比較による類似度処理が順次行われ、文字読取結果が出力される。

発明が解決しようとする課題

0003

ところが、上記したような従来の文字読取装置では、読み取り対象の文字のバックに何らかの背景画像が形成されていると、この背景画像の影響により正確な文字位置検出及び文字画像の抽出処理ができなくなることがある。これにより、正確な文字認識処理ができなくなり、結果として文字読取精度が低下するという問題があった。

0004

この発明の目的は、上記したような事情に鑑み成されたものであって、読取対象の文字のバックに何らかの背景画像が形成されているときの文字読取精度の低下を防止することができる文字読取装置及び文字読取方法を提供することにある。

課題を解決するための手段

0005

この発明は、上記問題点に基づきなされたもので、この発明によれば、読取対象物から画像を読み取り、複数の色成分に対応した画像信号を出力する画像読取手段と、この画像読取手段から出力される前記画像信号に含まれる複数の色成分の比率を変化させる色演算係数複数種類記憶する記憶手段と、前記画像信号に含まれる複数の色成分の比率を前記記憶手段に記憶された前記複数種類の色演算係数夫々により変化させる演算を実行する演算手段と、この演算手段の演算結果として得られる異なる複数の演算画像の中から、文字読取処理に相応しい演算画像を選択する選択手段と、この選択手段により選択された演算画像に含まれる文字を読み取る文字読取手段と、を備えた文字読取装置が提供される。

0006

また、この発明によれば、読取対象物から画像を読み取り、第1の色成分に対応した第1の画像信号、及びこの第1の色成分と異なる第2の色成分に対応した第2の画像信号を出力する画像読取手段と、この画像読取手段から出力される前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を変化させる第1の色演算係数、並びにこの第1の色演算係数と異なり前記第1及び第2の色成分の比率を変化させる第2の色演算係数を記憶する記憶手段と、前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を前記記憶手段に記憶された前記第1及び第2の色演算係数夫々により変化させる演算を実行する演算手段と、前記第1の色演算係数により前記演算手段の演算結果として得られる第1の多値演算画像、及び前記第2の色演算係数により前記演算手段の演算結果として得られる第2の多値演算画像を夫々2値化処理し、第1の2値化演算画像及び第2の2値化演算画像を生成する生成手段と、この生成手段により生成された第1及び第2の2値化演算画像のうち文字読取処理に相応しい方の演算画像を選択する選択手段と、この選択手段により選択された第1又は第2の2値化演算画像に含まれる文字を読み取る文字読取手段と、を備えた文字読取装置が提供される。

0007

さらに、この発明によれば、読取対象となる文字の文字数及び文字サイズのうち少なくとも一方の文字条件を指定する指定手段と、前記読取対象となる文字を含む読取対象物から画像を読み取り、第1の色成分に対応した第1の画像信号、及びこの第1の色成分と異なる第2の色成分に対応した第2の画像信号を出力する画像読取手段と、この画像読取手段から出力される前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を変化させる第1の色演算係数、並びにこの第1の色演算係数と異なり前記第1及び第2の色成分の比率を変化させる第2の色演算係数を記憶する記憶手段と、前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を前記記憶手段に記憶された前記第1及び第2の色演算係数夫々により変化させる演算を実行する演算手段と、前記第1の色演算係数により前記演算手段の演算結果として得られる第1の多値演算画像、及び前記第2の色演算係数により前記演算手段の演算結果として得られる第2の多値演算画像を夫々2値化処理し、第1の2値化演算画像及び第2の2値化演算画像を生成する生成手段と、この生成手段により生成された第1及び第2の2値化演算画像に含まれる文字数及び文字サイズのうち少なくとも一方の文字条件を検出する検出手段と、この検出手段で検出された文字条件と前記指定手段で指定された文字条件とを比較して、所定の条件を満足する比較結果が得られる方の2値化演算画像を選択する選択手段と、この選択手段により選択された第1又は第2の2値化演算画像に含まれる文字を読み取る文字読取手段と、を備えた文字読取装置が提供される。

0008

さらにまた、この発明によれば、読取対象となる文字の文字数及び文字サイズのうち少なくとも一方の文字条件を指定する指定手段と、前記読取対象となる文字を含む読取対象物から画像を読み取り、第1の色成分に対応した第1の画像信号、及びこの第1の色成分と異なる第2の色成分に対応した第2の画像信号を出力する画像読取手段と、この画像読取手段から出力される前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を変化させる第1の色演算係数、並びにこの第1の色演算係数と異なり前記第1及び第2の色成分の比率を変化させる第2の色演算係数を記憶する記憶手段と、前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を前記記憶手段に記憶された前記第1及び第2の色演算係数夫々により変化させる演算を実行する演算手段と、前記第1の色演算係数により前記演算手段の演算結果として得られる第1の多値演算画像、及び前記第2の色演算係数により前記演算手段の演算結果として得られる第2の多値演算画像を夫々2値化処理し、第1の2値化演算画像及び第2の2値化演算画像を生成する生成手段と、この生成手段により生成された第1及び第2の2値化演算画像に含まれる文字数及び文字サイズのうち少なくとも一方の文字条件を検出する検出手段と、この検出手段により前記第1の2値化演算画像から検出された文字条件と前記指定手段で指定された文字条件とを比較して、この第1の2値化演算画像から検出された文字条件と前記指定手段により指定された文字条件とが一致するときにはこの第1の2値化演算画像を選択し、この第1の2値化演算画像から検出された文字条件と前記指定手段により指定された文字条件とが一致しないときには、前記検出手段により前記第2の2値化演算画像から検出された文字条件と前記指定手段で指定された文字条件とを比較して、この第2の2値化演算画像から検出された文字条件と前記指定手段により指定された文字条件とが一致するときにはこの第2の2値化演算画像を選択する選択手段と、この選択手段により選択された第1又は第2の2値化演算画像に含まれる文字を読み取る文字読取手段と、を備えた文字読取装置が提供される。

0009

またさらに、この発明によれば、複数の色成分からなる画像信号の前記色成分の比率を複数種類に変化させる複数の色演算係数を記憶し、読取対象物から画像を読み取り、前記画像信号を出力し、前記画像信号に含まれる複数の色成分の比率を前記複数の色演算係数夫々により複数種類に変化させる演算を実行し、この演算の演算結果として得られる異なる複数種類の演算画像の中から、文字読取処理に相応しい演算画像を選択し、この選択された演算画像に含まれる文字を読み取る、文字読取方法が提供される。

0010

さらにまた、この発明によれば、第1の色成分に対応した第1の画像信号の色成分及びこの第1の色成分と異なる第2の色成分に対応した第2の画像信号の色成分の比率を変化させる第1の色演算係数、並びにこの第1の色演算係数と異なり前記第1及び第2の画像信号の色成分の比率を変化させる第2の色演算係数を記憶し、読取対象物から画像を読み取り、前記第1及び第2の画像信号を出力し、前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を前記第1及び第2の色演算係数夫々により変化させる演算を実行し、前記第1の色演算係数により演算結果として得られる第1の多値演算画像、及び前記第2の色演算係数により演算結果として得られる第2の多値演算画像を夫々2値化処理して、第1の2値化演算画像及び第2の2値化演算画像を生成し、この生成された第1及び第2の2値化演算画像のうち文字読取処理に相応しい方の演算画像を選択し、この選択された第1又は第2の2値化演算画像に含まれる文字を読み取る、文字読取方法が提供される。

0011

またさらに、この発明によれば、読取対象となる文字の文字数及び文字サイズのうち少なくとも一方の文字条件を指定し、第1の色成分に対応した第1の画像信号の色成分及びこの第1の色成分と異なる第2の色成分に対応した第2の画像信号の色成分の比率を変化させる第1の色演算係数、並びにこの第1の色演算係数と異なり前記第1及び第2の画像信号の色成分を変化させる第2の色演算係数を記憶し、読取対象物から画像を読み取り、前記第1及び第2の画像信号を出力し、前記第1及び第2の画像信号に含まれる前記第1及び第2の色成分の比率を前記第1及び第2の色演算係数夫々により変化させる演算を実行し、前記第1の色演算係数により演算結果として得られる第1の多値演算画像、及び前記第2の色演算係数により演算結果として得られる第2の多値演算画像を夫々2値化処理して、第1の2値化演算画像及び第2の2値化演算画像を生成し、この生成された第1及び第2の2値化演算画像に含まれる文字数及び文字サイズのうち少なくとも一方の文字条件を検出し、この検出された文字条件と前記指定された文字条件とを比較して、所定の条件を満足する比較結果が得られる方の2値化演算画像を選択し、この選択された第1又は第2の2値化演算画像に含まれる文字を読み取る、文字読取方法が提供される。

発明を実施するための最良の形態

0012

以下、この発明の実施の形態について図面を参照して説明する。

0013

図1は、この発明の一実施の形態に係る文字読取装置の概略構成を示す図である。

0014

図1に示すように、文字読取装置は、読取対象物から画像を読み取りRGB信号カラー画像信号)を出力するカラービデオカメラ10、このカラービデオカメラ10から出力されるアナログのRGB信号をデジタルのRGB信号(8ビット)に変換するA/D変換器12、このA/D変換器12から出力されるデジタルのRGB信号を後述する色演算係数により演算処理する演算部14、この演算部14の演算結果として得られる演算画像に対して後述する各種処理を施すCPUユニット16、カラービデオカメラ10のRGB信号の出力タイミング等の各部における各種タイミングを制御するタイミング制御信号を生成する制御タイミング信号生成部18を備えている。さらに、この文字読取装置は、上記した色演算係数及び読取対象となる文字数並びに文字サイズ等を入力する入力部20aを有するメイン制御部20を備えている。

0015

上記したCPUユニット16は、このCPUユニット16全体を制御するCPU16a、このCPU16aの制御プログラム等が記憶されるROM16b、文字読取処理に必要とされる各種データを記憶するRAM16c、演算部14の演算結果として得られる2値化演算画像を記憶する画像メモリ16d、文字認識処理に必要とされる辞書を記憶する辞書メモリ16eを備えている。さらに、このCPUユニット16は、演算部14の演算結果として得られる多値演算画像を2値化処理する2値化処理部16f、2値化された2値化演算画像に含まれる文字の文字数及び文字サイズを検出する文字条件検出部16g、2値化演算画像に含まれる文字を読み取る文字読取部16hを備えている。

0016

ここで、メイン制御部20の入力部20aから入力される事項について説明する。この入力部20aからは上記説明したように色演算係数及び読取対象となる文字の文字数並びに文字サイズ等が入力される。これら入力された事項は、メイン制御部20からCPUユニット16へ送られ、RAM16cに記憶されるものとする。

0017

色演算係数とは、読取対象となる文字とこの文字の背景画像とを分離し易くするための係数である。換言すると、読取対象の文字を強調し、この文字の背景画像を減衰するための係数である。この実施形態では、例えば、3つの異なる色演算係数K1、K2、K3を設定するとする。ここで、赤色用演算係数をKrn(10ビット)、緑色用演算係数をKgn(10ビット)、青色用演算係数をKbn(10ビット)として、例えば各色演算係数K1、K2、K3を以下のように設定する。

0018

K1(Kr1、Kg1、Kb1)=K1(51(033h)、205(0CDh)、256(100h))
K2(Kr2、Kg2、Kb2)=K2(51(033h)、256(100h)、205(0CDh))
K3(Kr3、Kg3、Kb3)=K3(170(0AAh)、170(0AAh)、170(0AAh))
なお、カッコ内は各演算係数を16進数で表したものである。

0019

上記色演算係数K1は、赤色系の割合を約10%、緑色系の割合を約40%、青色系の割合を約50%とするものである。例えば、Kr1、Kg1、Kb1が等しい場合(約33%)は、入力画像のままの色バランスであるが、このK1は、赤色系を減衰し、緑色系をやや増幅し、青色系を増幅させた色バランスにするものである。従って、読取対象の文字が赤色系で、この文字の背景画像が青色系の場合に有効な係数と言える。

0020

上記色演算係数K2は、赤色系の割合を約10%、緑色系の割合を約50%、青色系の割合を約40%とするものである。つまり、赤色系を減衰し、緑色系を増幅し、青色系をやや増幅させた色バランスにするものである。従って、読取対象の文字が赤色系で、この文字の背景画像が緑色系の場合に有効な係数と言える。

0021

上記色演算係数K3は、赤色系、緑色系、及び青色系の割合を夫々均等にするものである。つまり、赤色系、緑色系、青色系を均等に反映させるものであり、入力画像のままの色バランスにするものである。

0022

例えば、図2(a)に示すように文字が赤色系で、この文字の背景画像が青緑色系の場合に、上記色演算係数K1、K2を用いて後述する演算式により色演算処理を施すと、図2(b)に示すように背景画像の大部分を減衰させることが可能となる。

0023

なお、上記した色演算係数はあくまでも一例であり、読取対象となる文字の色、及びこの文字の背景画像の色に応じた色演算係数を設定する必要があり、入力部20aにより状況に応じた色演算係数(任意の色演算係数)を設定することができる。

0024

続いて、読取対象となる文字の文字数及び文字サイズの入力について説明する。例えば、読取対象となる文字の文字数が20文字ならば読取対象の文字の文字数として「20」が、読取対象となる文字の文字サイズが10ポイントならば読取対象の文字の文字サイズとして「10ポイント」が入力部20aから入力される。

0025

次に、図3図5に示すフローチャート図を参照して、この文字読取装置による文字読取処理について説明する。図3は、文字読取装置による文字読取処理全体を説明するフローチャート図である。図4は、文字読取対象となる2値化演算画像PBnの選択処理を説明するフローチャート図である。図5は、文字読取(認識)処理を説明するフローチャート図である。なお、ここでは、上記説明したように3つの異なる色演算色演算係数K1、K2、K3により処理が進められるものとする。

0026

まず、図3を参照して文字読取処理全体を説明する。上記説明したように入力部20aから、色演算係数K1、K2、K3が設定され(ST1)、さらに、読取対象の文字条件が設定される(ST2)。文字条件とは、読取対象の文字の文字数及び文字サイズ等である。ここで、設定された色演算係数及び文字条件はRAM16cへ記憶され、CPU16aでのセットアップにより色演算係数K1、K2、K3は演算部14に出力される。

0027

上記設定が完了すると、カラービデオカメラ10により読取対象の文字を含む読取対象物の読取処理が開始され、読み取られた読取対象物に相当するRGB信号が出力される(ST3)。カラービデオカメラ10から出力されたアナログのRGB信号はA/D変換器12に入力され、このA/D変換器12においてデジタルのRGB信号に変換され出力される。そして、このデジタルのRGB信号が演算部14に入力され、この演算部14において色演算係数K1、K2、K3により演算処理される(ST4)。因みに、この実施形態では演算部14を加算器乗算器で構成し、RGB信号の各8ビットデータに対して色演算係数を乗算し、その乗算結果を加算する。

0028

つまり、RGB信号と色演算係数K1との演算により得られるグレー多値)演算画像P1、RGB信号と色演算係数K2との演算により得られるグレー演算画像P2、RGB信号と色演算係数K3との演算により得られるグレー演算画像P3は、具体的には次の演算式により求められる。

0029

グレー演算画像P1=(R*Kr1/512)+(G*Kg1/512)+(B*Kb1/512)
グレー演算画像P2=(R*Kr2/512)+(G*Kg2/512)+(B*Kb2/512)
グレー演算画像P3=(R*Kr3/512)+(G*Kg3/512)+(B*Kb3/512)
なお、RはR信号、GはG信号、BはB信号である。

0030

上記グレー演算画像P1〜P3は、画像メモリ16dに記憶される(ST5)。このグレー演算画像P1〜P3夫々から図6に示すような濃度分布ヒストグラムが作成され、この濃度分布ヒストグラムから2値化演算画像PB1〜PB3が作成される(ST6)。

0031

ここで、2値化演算画像PB1〜PB3の作成方法について簡単に説明する。ここでは、代表として、グレー演算画像P1を基にした2値化演算画像PB1の作成について説明する。なお、他の2値化演算画像P2、P3も同様に作成されるものとする。例えば、明るい地色背景暗い文字が記載されているとする。このような場合のグレー演算画像P1が、図6に示す濃度分布ヒストグラムに表されているとする。すると、暗い文字の文字画像(暗い)の階調と明るい地色の背景画像(明るい)の階調との2つの山を有する濃度分布が得られる。これら2つの山の谷をスライスレベルとし、このスライスレベルよりも低い階調の画像を全て「1」の信号、スライスレベルよりも高い階調の画像を全て「0」の信号とすることで2値化演算画像PB1が得られる。

0032

このような2値化処理は、2値化処理部16fにより実行される。作成された2値化演算画像PB1〜PB3の中から文字読取処理に相応しい2値化演算画像PBnが選択され(ST7)、この選択された2値化演算画像PBnに対して文字読取処理が施される。この選択処理はCPU16aにより実行され、文字読取処理は文字読取部16hにより実行される。

0033

続いて、図4に示す文字読取対象の2値化演算画像PBnの選択処理(ST7)について説明する。まず、2値化演算画像PBn(n=1〜3)のn=1が設定される(ST71)。これにより、以後の処理対象が2値化演算画像PB1に設定されることになる。

0034

この設定された2値化演算画像PB1に対して文字条件検出部16gにより文字検出処理が施される(ST72)。この文字検出処理では、読取対象の文字の文字数及び文字サイズが検出される。この検出方法としては、2値化演算画像PB1に対して斜影をとるなどの方法が考えられる。ST2で設定された文字数及び文字サイズと、上記ST72で検出された文字数及び文字サイズが比較され(ST73)、ST72における文字検出処理の信憑性チェックされる。例えば、ST2で設定された文字数が20文字、文字サイズが10ポイントであるとする。このとき、ST72で検出された文字数が20文字、文字サイズが12ポイントであるとすると、文字サイズが正しく検出されていないことが分かる(ST74、NO)。このような場合には、この2値化演算画像PB1は文字読取処理の対象から外され、他の2値化演算画像PBnが文字読取処理対象として相応しいか否かの判断へと移る。この後、適合しなかった2値化演算画像PBn(PB1)が、2値化演算画像PB3か否かが判断される。そして、適合しなかった2値化演算画像PBnが2値化演算画像PB3でない場合には(ST76、NO)、次の2値化演算画像PB2が設定され(ST78)、この設定された2値化演算画像PB2に対して文字検出処理が施される(ST72)。さらに、ST72の処理を行って、この設定された2値化演算画像PB2が文字読取処理対象から外されると(ST74、NO)、ST76の処理に供し(ST76、NO)、最後に、2値化演算画像PB3が設定され(ST78)、この設定された2値化演算画像PB3に対して文字検出処理が施される(ST72)。この設定された2値化演算画像PB3が文字読取処理対象から外されると(ST74、NO)(ST76、YES)、文字読取処理対象として相応しい2値化演算画像PBnが得られないため、文字読取処理エラーとなる(ST77)。

0035

仮に、2値化演算画像PB2が設定され、この設定された2値化演算画像PB2から検出された文字数及び文字サイズが、ST2で設定された文字数及び文字サイズと一致するような場合には(ST74、YES)、この設定された2値化演算画像PB2が文字読取対象に相応しいものとして選択される(ST79)。

0036

続いて、図5に示す文字読取(認識)処理(ST8)について説明する。

0037

上記選択処理において選択されたPBnに対する文字画像の抽出処理(文字パターン作成)(ST81)、文字の認識処理としての文字パターンの正規化、標本化処理(ST82)、辞書パターンとの比較処理(ST83)が実行され、文字読取結果が出力される。

0038

この実施の形態では、文字読取対象の2値化演算画像PBnを図4のフローチャートに示すような方法で選択し、選択された2値化演算画像PBnに対して図5に示すように文字読取処理を実行するものとしたが、これに限らず、例えば、全ての2値化演算画像PBnに対して図5のフローチャートに示すような文字読取処理を実行するようにしてもよい。このとき、認識エラーが生じるような2値化演算画像PBnは処理対象外とする。

0039

上記実施形態の作用効果まとめると次の通りである。

0040

この発明の文字読取装置は、読取対象物を読み取り、異なる複数の色成分に対応した画像信号(RGB信号)を出力する画像読取手段としてのカラービデオカメラ10と、前記画像信号に含まれる異なる複数の色成分の比率を変化させる異なる複数の色演算係数(K1、K2、K3)を記憶する記憶手段としてのRAM16Cと、前記画像信号に含まれる異なる複数の色成分の比率を前記異なる複数の色演算係数夫々により変化させる演算を実行する演算手段としての演算部14と、この演算部14の演算結果として得られる複数の演算画像(PB1、PB2、PB3)の中から文字読取処理に相応しい演算画像を選択する選択手段としてのCPUユニット16と、前記選択手段により選択された演算画像に含まれる文字を読み取る文字読取手段としてのCPUユニット16とを備えているので、色成分の変化の比率の異なる複数の演算画像が得られるとともに、この複数の演算画像の中から文字読取処理に相応しい演算画像に対して文字読取処理が実行される。

0041

つまり、複数の異なる色演算係数を用意することにより、色成分の変換の比率の異なる複数の演算画像が得られる。さらに、この複数の演算画像の中から文字読取処理に相応しい演算画像が選択される。この選択は、演算画像に含まれる読取対象の文字の文字数及び文字サイズを検出して、この検出結果と予め設定された読取対象の文字の文字数及び文字サイズとを比較し、検出結果の信憑性の高いものを文字読取処理に相応しい演算画像として選択する。即ち、検出結果の信憑性の高い演算画像は、演算処理により文字とこの文字の背景画像とが十分分離されたものであり、文字読取処理においても高精度の読取結果が期待されるためである。このようにして選択された演算画像に対して文字読取処理を実行することにより、精度の高い文字読取処理が実現できる。

0042

また、上記した色演算係数を任意に設定可能とすることにより、読取対象物中の文字及びこの文字の背景画像の色に応じた最適な色演算係数を設定することが可能となる。このこともまた、精度の高い文字読取処理の実現に貢献する。

0043

このようにして、色演算係数を複数用意することにより、読取対象物の色合いが多少変化しても、精度の高い文字読取処理が実行できる。さらに、予め読取対象物の色合いの変化が予測できるような場合には、色合いの変換に応じた色演算係数を用意しておくことにより、さらに精度の高い文字読取処理を実現できる。またさらに、読取対象物が別のものに変わっても、新たな読取対象物に応じた色演算係数を設定するだけで、精度の高い文字読取処理を実現できる。

0044

なお、色演算係数、文字数、及び文字サイズの情報は、同種の読取対象物を取扱う場合には、RAM16cに予め設定しておき、入力部20aからの入力によらず処理するようにしてもよい。

発明の効果

0045

この発明によれば、読取対象の文字のバックに何らかの背景画像が形成されているときの文字読取精度の低下を防止することが可能な文字読取装置及び文字読取方法を提供することができる。

図面の簡単な説明

0046

図1この発明の一実施の形態に係る文字読取装置の概略構成を示す図。
図2演算処理前の文字とこの文字の背景画像との状態、及び色演算係数による演算処理後の文字とこの文字の背景画像との状態を示す図。
図3文字読取装置による文字読取処理全体を説明するフローチャート図。
図4文字読取対象となる2値化演算画像の選択処理を説明するフローチャート図。
図5文字読取(認識)処理を説明するフローチャート図。
図6グレー演算画像から2値化演算画像を生成するとき、グレー演算画像から作成される濃度分布ヒストグラムの一例を示す図。

--

0047

10…カラービデオカメラ
12…A/D変換器
14…演算部
16…CPUユニット
16a…CPU
16b…ROM
16c…RAM
16d…画像メモリ
16e…辞書メモリ
16f…2値化処理部
16g…文字条件検出部
16h…文字読取部
18…制御タイミング信号生成部
20…メイン制御部
20a…入力部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ