図面 (/)

技術 文字認識装置、文字認識方法、文字認識プログラム、および記録媒体

出願人 シャープ株式会社
発明者 岩田圭
出願日 2005年12月6日 (14年10ヶ月経過) 出願番号 2005-352492
公開日 2007年6月21日 (13年4ヶ月経過) 公開番号 2007-156918
状態 未査定
技術分野 文字入力
主要キーワード 白色画素数 画像撮像ステップ 画像撮像処理 再認識処理 マスクROM 基準数 外接矩形座標 認識判定
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2007年6月21日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (11)

課題

画像から文字をより精度よく認識できる文字認識装置を提供する。

解決手段

文字認識装置1では、画像分割部15は、画像を複数の文字領域に分割する。このとき、つぶれ判定部16は、その複数の文字領域をつぶれているか否かを判定し、つぶれていると判定した場合、文字認識部17はその文字領域の認識をしない。このように、認識しても高精度な結果は得られない文字領域の認識をしないことにより、高精度な認識ができる文字領域の認識結果を効率的に出力する。

概要

背景

従来、携帯情報端末等のカメラによって撮像した画像から、文字を認識する文字認識装置考案されている。この形態の文字認識装置は、スキャナ等の、画像から文字を認識する文字認識装置と比較して手軽に文字を認識することができる。その一方、ユーザがカメラによって撮像した画像を入力するため、撮像距離が適切ではない、フォーカスがあっていない、撮像した画像が傾いている、あるいは、光源の影響により影になっている等の理由により、撮像状況によっては文字認識をするために必要な品質の画像が入力されず、二値化した画像がつぶれてしまい高精度の文字認識ができない場合がある。

そこで、特許文献1は、文字領域の二値化が適切であるかどうかを判定し、不適切な場合は再二値化処理をすることにより、文字認識の処理性能を高めた文字認識装置を提案している。
特開2002−314806号公報(2002年10月25日公開

概要

画像から文字をより精度よく認識できる文字認識装置を提供する。文字認識装置1では、画像分割部15は、画像を複数の文字領域に分割する。このとき、つぶれ判定部16は、その複数の文字領域をつぶれているか否かを判定し、つぶれていると判定した場合、文字認識部17はその文字領域の認識をしない。このように、認識しても高精度な結果は得られない文字領域の認識をしないことにより、高精度な認識ができる文字領域の認識結果を効率的に出力する。

目的

本発明では、上記の問題点に鑑みてなされたものであり、その目的は、画像から文字をより精度よく認識する文字認識装置、文字認識方法文字認識プログラム、および記録媒体を提供することを実現することにある。

効果

実績

技術文献被引用数
1件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

画像から文字を認識する文字認識装置であって、上記画像がつぶれているか否かを判定するつぶれ判定手段と、上記つぶれ判定手段が上記画像をつぶれていないと判定したとき、上記画像を文字として認識する文字認識手段とを備えていることを特徴とする文字認識装置。

請求項2

上記つぶれ判定手段は、上記画像においてつぶれていると判定できる部分と、つぶれていないと判定できる部分との比率が、一定の基準値より大きいとき、上記画像をつぶれていると判定することを特徴とする請求項1に記載の文字認識装置。

請求項3

上記画像は二値画像であり、上記つぶれ判定手段は、上記二値画像に含まれる黒色画素の数の、上記二値画像を構成する全画素に対する比率が、一定の基準値より大きいとき、上記二値画像をつぶれていると判定することを特徴とする請求項1に記載の文字認識装置。

請求項4

ユーザによる値の入力を受け付け入力手段と、上記入力手段が受け付けた値を、上記基準値として設定する基準値設定手段をさらに備えることを特徴とする請求項2または3に記載の文字認識装置。

請求項5

画像から文字を認識する文字認識装置であって、上記画像を、文字認識処理の対象となる複数の文字領域に分割する画像分割手段と、上記文字領域がつぶれているか否かを判定するつぶれ判定手段と、上記複数の文字領域のうち、上記つぶれ判定手段によってつぶれていないと判定された上記文字領域から文字を認識する文字認識手段とを備えていることを特徴とする文字認識装置。

請求項6

上記つぶれ判定手段によってつぶれていると判定された上記文字領域と、上記つぶれ判定手段によってつぶれていないと判定された上記文字領域とを、互いに異なる形態によって表示する表示手段をさらに備えている請求項5に記載の文字認識装置。

請求項7

文書撮像して上記画像を生成する撮像手段をさらに備え、上記撮像手段は、上記つぶれ判定手段によってつぶれていると判定された上記文字領域が上記文書において表す箇所を撮像することによって、上記箇所を表す新たな文字領域を生成し、上記つぶれ判定手段は、上記撮像手段が生成した上記新たな文字領域がつぶれているか否かを判定することを特徴とする請求項6に記載の文字認識装置。

請求項8

画像から文字を認識する文字認識装置であって、上記画像を、文字認識処理の対象となる複数の文字領域に分割する画像分割手段と、上記文字領域がつぶれているか否かを判定するつぶれ判定手段と、上記つぶれ判定手段によってつぶれていると判定された上記文字領域の数の、上記複数の文字領域の数に対する比率が、一定の基準値より小さいとき、上記画像から文字を認識する文字認識手段と備えていることを特徴とする文字認識装置。

請求項9

上記文字認識手段は、上記つぶれ判定手段によってつぶれていないと判定された上記文字領域から文字を認識することを特徴とする請求項8に記載の文字認識装置。

請求項10

画像から文字を認識する文字認識方法であって、上記画像がつぶれているか否かを判定するつぶれ判定ステップと、上記画像判定ステップにおいて上記画像をつぶれていないと判定した場合、上記画像から文字を認識する文字認識ステップとを含んでいることを特徴とする文字認識方法。

請求項11

請求項1〜9のいずれか1項に記載の文字認識装置を動作させる文字認識プログラムであって、コンピュータを上記の各手段として機能させるための文字認識プログラム。

請求項12

請求項11に記載の文字認識プログラムを記録しているコンピュータ読み取り可能な記録媒体

技術分野

0001

本発明は、画像から文字を認識する文字認識装置文字認識方法文字認識プログラム、および記録媒体等に関するものである。

背景技術

0002

従来、携帯情報端末等のカメラによって撮像した画像から、文字を認識する文字認識装置が考案されている。この形態の文字認識装置は、スキャナ等の、画像から文字を認識する文字認識装置と比較して手軽に文字を認識することができる。その一方、ユーザがカメラによって撮像した画像を入力するため、撮像距離が適切ではない、フォーカスがあっていない、撮像した画像が傾いている、あるいは、光源の影響により影になっている等の理由により、撮像状況によっては文字認識をするために必要な品質の画像が入力されず、二値化した画像がつぶれてしまい高精度の文字認識ができない場合がある。

0003

そこで、特許文献1は、文字領域の二値化が適切であるかどうかを判定し、不適切な場合は再二値化処理をすることにより、文字認識の処理性能を高めた文字認識装置を提案している。
特開2002−314806号公報(2002年10月25日公開

発明が解決しようとする課題

0004

しかしながら、一般に文字認識装置では、文字認識に必要な品質のない画像が入力された場合でも、できる限り正しい認識結果を出力しようと処理をする。そのため、品質の低い認識結果が出力され、認識結果全体の質が悪くなるという問題がある。

0005

また、特許文献1に記載された技術では、文字認識装置が、撮像した画像を二値化処理した後、撮像した画像中のすべての文字領域を文字として認識することを前提として再二値化処理する。これにより、撮像した画像中において読み取りができない品質の文字領域が不要であった場合、再二値化処理が無駄になってしまうという問題がある。

0006

具体的には、特に、名刺等の定型文書では、重要度によって文字列のフォントの大きさに差がある場合が多く、フォントが小さいために二値化された画像がつぶれてしまい、文字認識装置は、画像から文字を認識しても高精度な認識結果を得るのは困難になる。

0007

本発明では、上記の問題点に鑑みてなされたものであり、その目的は、画像から文字をより精度よく認識する文字認識装置、文字認識方法、文字認識プログラム、および記録媒体を提供することを実現することにある。

課題を解決するための手段

0008

本発明に係る文字認識装置は、上記課題を解決するために、
画像から文字を認識する文字認識装置であって、
上記画像がつぶれているか否かを判定するつぶれ判定手段と、
上記画像判定手段が上記画像をつぶれていないと判定したとき、上記画像を文字として認識する文字認識手段とを備えていることを特徴としている。

0009

上記の構成によれば、つぶれ判定手段は、画像がつぶれているか否かを判定する。ここでいう「つぶれ」とは、たとえば画像中に基準数以上の黒色画素が含まれており、白色画素と黒色画素とのバランスが、文字とみなすには悪すぎるような状態をいう。

0010

文字認識装置では、文字認識手段が、つぶれ判定手段によってつぶれていないと判定された画像から、文字を認識する。すなわち、つぶれていると判定された、文字認識に適さない画像からは、文字を認識しない。これにより、文字を認識できる可能性の低い画像を文字認識の対象とせず、可能性の高い画像だけを、文字認識の対象とする。したがって、つぶれている画像から、ユーザの期待していない不要な文字を無理に認識することがない。

0011

これにより文字認識装置は、画像から文字をより精度よく認識できる効果を奏する。すなわち、文字認識結果の質をより高めることができる。

0012

本発明に係る文字認識方法は、上記課題を解決するために、
画像を文字として認識する文字認識方法であって、
上記画像がつぶれているか否かを判定するつぶれ判定ステップと、
上記画像判定ステップにおいて上記画像がつぶれていないと判定した場合、上記画像を文字として認識する文字認識ステップとを含んでいることを特徴としている。

0013

上記の構成によれば、上述した文字認識装置と同様の作用効果を奏する。

0014

また、本発明に係る文字認識装置では、さらに、
上記つぶれ判定手段は、
上記画像においてつぶれていると判定できる部分と、つぶれていないと判定できる部分との比率が、一定の基準値より大きいとき、上記画像をつぶれていると判定することが好ましい。

0015

上記の構成によれば、つぶれ判定手段は、画像においてつぶれていると判定できる部分と、つぶれていないと判定できる部分との比率が、一定の基準値より大きいとき、画像をつぶれていると判定する。たとえば、ある行画像において、認識対象とすることができる全文字数が30文字であるとする。ここで、「行画像」とは、文字認識手段が文字と認識できる部分が連続している画像である。また、基準値は0.4であるとする。以上の場合において、つぶれ判定手段は、上記認識対象とすることができる全文字中10文字がつぶれていると判定したとする。つぶれていると判定できる部分とつぶれていないと判定できる部分の比率は、10÷20=0.5である。これにより、つぶれ判定手段は、上記比率が基準値よりも大きいと判定し、上記行画像がつぶれていると判定する。したがって、文字認識手段は、行画像を文字として認識しない。すなわち、文字認識手段は、つぶれ判定手段によってつぶれていると判定された、文字認識に適さない画像からは、文字を認識しない。これにより、文字を認識できる可能性の低い画像を文字認識の対象とせず、可能性の高い画像だけを、文字認識の対象とする。したがって、ユーザの期待していない不要な文字を無理に認識することがない。

0016

これにより、文字認識装置は文字認識結果の質をさらに高めることができる。すなわち、ユーザは一定の高い質を保った文字認識結果を得ることができる効果を奏する。

0017

また、本発明に係る文字認識装置では、さらに、
上記画像は二値画像であり、
上記つぶれ判定手段は、
上記二値画像に含まれる黒色画素の数の、上記二値画像を構成する全画素に対する比率が、一定の基準値より大きいとき、上記二値画像をつぶれていると判定することが好ましい。

0018

上記の構成によれば、文字認識装置において、画像が二値画像であり、つぶれ判定手段は、二値画像に含まれる黒色画素の数が、二値画像を構成する全画素に対する比率が、一定の基準値より大きいとき、二値画像をつぶれていると判定する。ここで、二値画像のデータ量は、フルカラー(多値)画像のものに比べて少ない。たとえば、二値画像を構成する一画素当たりのデータ量は1ビットであり、画像の色は、白色画素と黒色画素で表現される。フルカラー(多値)画像を構成する一画素当たりのデータ量は24ビットであり、画像の色は、赤色画素緑色画素青色画素の組み合わせで表現される。これにより、文字認識装置は、つぶれ判定手段による画像がつぶれているか否かの判定を、フルカラー(多値)画像のときよりも短時間ですることができる。したがって、ユーザは文字認識結果をフルカラー(多値)画像のときよりも素早く知ることができる効果を奏する。

0019

また、本発明に係る文字認識装置では、さらに、
ユーザによる値の入力を受け付け入力手段と、
記入力手段が受け付けた値を、上記基準値として設定する基準値設定手段をさらに備えることが好ましい。

0020

これにより、ユーザは値を入力し、基準値設定手段は、その値を基準値に設定できる。たとえば、ある行画像において、ユーザは、入力手段により、0.4という値を文字認識装置に入力する。これにより、基準値設定手段は、0.4を基準値に設定する。行画像における全文字数が30文字であるとすると、つぶれ判定手段が上記行画像の全文字中10文字つぶれていると判定したとき、つぶれていると判定できる部分とつぶれていないと判定できる部分の比率は、10÷20=0.5である。これにより、つぶれ判定手段は、上記比率が基準値よりも大きいと判定し、上記行画像がつぶれていると判定する。したがって、文字認識手段は、行画像を文字として認識しない。つまり、文字認識装置は、基準値が示す基準に満たない画像を文字として、認識しない。すなわち、文字認識装置は、ユーザの期待していない質の行画像から文字を認識せずに済む。

0021

したがって、ユーザは満足のいく質の文字認識結果を得ることができる効果を奏する。

0022

本発明に係る文字認識装置は、上記課題を解決するために、
上記画像を、文字認識処理の対象となる複数の文字領域に分割する画像分割手段と、
記文字領域がつぶれているか否かを判定するつぶれ判定手段と、
上記複数の文字領域のうち、上記つぶれ判定手段によってつぶれていないと判定された上記文字領域から文字を認識する文字認識手段とを備えていることを特徴としている。

0023

上記の構成によれば、文字認識装置は、文字領域がつぶれていない場合、文字領域から文字を認識する。すなわち、文字認識装置は、つぶれていると判定された文字領域からは、文字を認識しない。たとえば、画像分割手段がある画像を100部の文字領域に分割するとする。そのうち80部の文字領域が、つぶれ判定手段により、つぶれていないと判定されたとき、文字認識手段は上記80部の画像から文字を認識する。

0024

これにより、文字領域から文字をより精度よく認識できる効果を奏する。つまり、文字認識装置は、つぶれていると判定された文字領域を認識しない。すなわち、文字認識装置は、質の悪い文字領域を認識しない。これにより、文字領域を含む画像全体からの文字認識結果の質をより高めることができる。

0025

また、本発明に係る文字認識装置では、さらに、
上記つぶれ判定手段によってつぶれていると判定された上記文字領域と、上記つぶれ判定手段によってつぶれていないと判定された上記文字領域とを、互いに異なる形態によって表示する表示手段をさらに備えていることが好ましい。

0026

上記の構成によれば、文字認識装置は、つぶれ判定手段がつぶれていると判定した文字領域と、つぶれていないと判定した文字領域とを、互いに異なる形態によって表示する。
たとえば、表示手段が、携帯端末ディスプレイであるとする。ここで、ディスプレイの背景色は白色であり、文字の色は黒色であるとする。上記の場合、表示手段は、つぶれ判定手段がつぶれていると判定した文字領域を、背景色の白に対し、赤などの際立つ色を付けて表示する。また、表示手段は、つぶれ判定手段が、つぶれていないと判定した文字領域を、黒色によって表示する。

0027

これにより、ユーザは、つぶれていると判定された部分を一目で知ることができる効果を奏する。

0028

また、本発明に係る文字認識装置では、さらに、
文書を撮像して上記画像を生成する撮像手段をさらに備え、
上記撮像手段は、上記つぶれ判定手段によってつぶれていると判定された上記文字領域が上記文書において表す箇所を撮像することによって、上記箇所を表す新たな文字領域を生成し、
上記つぶれ判定手段は、上記撮像手段が生成した上記新たな文字領域がつぶれているか否かを判定することが好ましい。

0029

上記の構成によれば、撮像手段は、つぶれ判定手段がつぶれていると判定した文字領域を、撮像できる。さらに、つぶれ判定手段は、撮像手段が撮像した文字領域がつぶれているか否かを判定する。たとえば、撮像手段は、つぶれていると判定された文字領域を、条件を変えて撮像するとする。その場合、上記箇所はつぶれ判定手段によりつぶれていないと判定されることもありうる。これにより、文字認識手段は、前回認識対象ではなかった上記箇所から文字を認識する。すなわち、ユーザが撮像条件を変えることにより、文字認識手段は、画像から質の高い文字認識結果を得ることができる可能性がある。

0030

したがって、文字認識装置は、ユーザが少なくとも、当初の文字認識結果より質の高い文字認識結果を得る可能性を高める効果を奏する。

0031

本発明に係る文字認識装置は、上記課題を解決するために、
画像から文字を認識する文字認識装置であって、
上記画像を、文字認識処理の対象となる複数の文字領域に分割する画像分割手段と、
上記文字領域がつぶれているか否かを判定するつぶれ判定手段と、
上記つぶれ判定手段によってつぶれていると判定された上記文字領域の数の、上記複数の文字領域の数に対する比率が、一定の基準値より小さいとき、上記画像から文字を認識する文字認識手段と備えていることを特徴としている。

0032

上記の構成によれば、文字認識装置は、複数の文字領域がつぶれていない場合、画像から文字を認識する。すなわち、文字認識装置は、つぶれていると判定された文字認識に適さない画像からは、文字を認識しない。たとえば、画像分割手段は、ある画像を100部の文字領域に分割したとする。また、基準値は、0.2であるとする。上記の場合、つぶれ判定手段が、全文字領域中30部の文字領域をつぶれていると判定したとする。ここで、つぶれていると判定された文字領域の数と、複数の文字領域の数に対する比率は、30÷100=0.3である。これにより、つぶれ判定手段は、上記比率が基準値よりも大きいと判定し、文字認識手段に画像の認識をさせない判定をする。したがって、文字認識手段は、画像を文字として認識しない。すなわち、文字認識手段は、つぶれが多く存在する画面を認識しない。これにより、画像から文字をより精度よく認識できる効果を奏する。すなわち、文字領域を含む画像全体からの文字認識結果の質をより高めることができる。

0033

さらに、文字認識手段は、つぶれが多い画像を認識しないことにより、文字認識をする処理に要する時間を無視できる。これにより、ユーザは、文字認識処理が、文字を認識する時間を待たずに済む。

0034

また、本発明に係る文字認識装置では、さらに、
上記文字認識手段は、
上記つぶれ判定手段によってつぶれていないと判定された上記文字領域から文字を認識することが好ましい。

0035

上記の構成により、文字認識手段は、つぶれ判定手段によって、つぶれていないと判定された文字領域から文字を認識する。すなわち、文字を認識できる可能性の高い画像だけを、文字認識の対象とする。たとえば、つぶれ判定手段により、つぶれていると判定された文字領域が存在したとする。その場合、文字認識手段は、つぶれていると判定された文字領域からは文字を認識しない。それに対して、文字認識手段が、つぶれ判定手段がつぶれていると判定した文字領域からも文字を認識できた場合、文字認識結果は、ユーザが期待する質を満たさない。すなわち、文字領域を含む画像全体の質は低下する。

0036

したがって、画像から文字をより精度よく認識できる効果を奏する。すなわち、画像全体からの文字認識結果の質をより高めることができる。

0037

なお、上記文字認識装置は、コンピュータによって実現してもよい。この場合、コンピュータを上記各手段として動作させることにより上記文字認識装置をコンピュータにおいて実現する文字認識プログラム、およびその文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

発明の効果

0038

以上のように、本発明に係る文字認識装置は、画像がつぶれているか否かを判定するつぶれ判定手段と、上記画像判定手段が上記画像をつぶれていないと判定したとき、上記画像を文字として認識する文字認識手段とを備えているため、画像から文字をより精度よく認識できる効果を奏する。

発明を実施するための最良の形態

0039

以下の本発明に係る実施形態では、本発明の文字認識装置1の一例を、カメラの搭載された携帯情報端末に内蔵された文字認識装置1を用いて説明する。

0040

〔実施形態1〕
本発明の第一の実施形態について、図1図4に基づいて説明すると以下の通りである。

0041

(文字認識装置1)
図1は、本発明を実施するための文字認識装置1の構成を示すブロック図である。

0042

図1に示すように文字認識装置1は、文書上に印刷された文字を撮像する画像撮像部11(撮像手段)、撮像した画像データを記憶する画像メモリ12、記憶されたフルカラー(多値)画像データから、二値画像データを生成する二値画像生成部13、つぶれを判定するための基準値を設定する基準値設定部14(基準値設定手段)、画像を分割する画像分割部15(画像分割手段)、画像のつぶれを判定するつぶれ判定部16(つぶれ判定手段)、画像から文字を認識する文字認識部17(文字認識手段)、認識結果文字列等の情報を表示する表示部19(表示手段)、ユーザが操作入力をする操作部20(入力手段)から構成されている。

0043

本発明に係る文字認識装置1は、つぶれ判定部16が画像をつぶれていないと判定した場合、文字認識部17は上記画像から文字を認識することを特徴としている。換言すれば、つぶれ判定部16が画像をつぶれていると判定した場合、文字認識部17は、上記画像から文字を認識しない。これにより、文字認識に向かない画像から、無理に文字を認識することがない。そのため、文字認識結果の質を高めることができる。具体的には、以下に後述する。

0044

上記の一例として、本実施形態では、つぶれ判定部16が文字の二値画像データがつぶれていると判定した場合、文字認識部17が上記二値画像データから文字を認識しない例を示す。つぶれ判定部16が画像のつぶれを判定する方法として、文字全体黒画素白画素の比率を調べる方法を用いる。二値画像とは、黒色画素と白色画素とのみを構成画素とする画像である。ただし、上述した二値画像にのみ限定されずに、たとえば、フルカラー(多値)画像を用いてもよい。

0045

図2図3の説明)
上記構成において、図3名刺画像を、カメラの搭載された携帯情報端末に内蔵された文字認識装置1が認識する例を、図2に基づき説明すると、以下の通りである。図2は、つぶれ判定部16が文字の二値画像データがつぶれていると判定した場合、文字認識部17が上記二値画像データから文字を認識しない処理の流れを示したフローチャート図である。また、図3は、名刺画像の一例を示す図である。

0046

画像撮像処理
ステップS1において、ユーザが操作部20を操作することによって、画像撮像部11が名刺上に印刷された文字を撮像し、画像メモリ12にフルカラー(多値)画像データとして入力して、ステップS2に処理が進む。

0047

(二値画像データ切り出し処理
ステップS2において、二値画像生成部13は、画像メモリ12に入力されたフルカラー(多値)画像データを二値化する。このことにより、二値画像生成部13は、撮像した名刺の二値画像データを生成し、画像メモリ12へ入力して、ステップS3に処理が進む。ステップS3において、画像分割部15は、画像メモリ12に入力された二値画像データを参照して文字領域R1、R2、またはR3に分割する処理、すなわち抽出をし、ステップS4に処理が進む。ステップS4において、画像分割部15は、ステップS3において抽出した文字領域R1、R2、またはR3の中から、R1を認識対象文字領域として設定する。ステップS5において、画像分割部15は、画像メモリ12から文字領域R1の二値画像データを参照して、複数の行により構成されている文字領域R1から1行目に相当する行L1を抽出し、ステップS6に処理が進む。ステップS6において、画像分割部15は、画像メモリ12から行L1の二値画像データを参照して、複数の文字により構成されている行L1の画像データを、行L1を構成する1つ1つの文字画像データに分割する処理、すなわち文字切り出しをする。これにより、画像メモリ12は、行L1に含まれる1つ1つの文字「ア」「イ」「ウ」「エ」「オ」「株」「式」「会」「社」に相当する二値画像データを得ることができる。

0048

(つぶれ判定処理
次に、ステップS7において、つぶれ判定部16が、画像分割部15により切り出された文字の二値画像データを画像メモリ12から参照し、行L1の二値画像データがつぶれているかどうかを判定する。ここでいう「つぶれ」とは、たとえば画像中に基準数以上の黒色画素が含まれており、白色画素と黒色画素とのバランスが、文字とみなすには悪すぎるような状態をいう。行の二値画像データがつぶれているかどうかを判定する方法は、行を構成する文字の二値画像データがつぶれている比率Rcを調べ、その値がつぶれている文字を許容する比率Tc(基準値)を超えた場合に、その行がつぶれていると判定するものである。Tcは、メモリ等の記憶装置内に保存されている値である。基準値設定部14は、Tcの値を0より大きく1より小さい範囲において、任意に設定できる。ここで、ユーザは、操作部20によって値を入力し、基準値設定部14がその値を基準値に設定してもよい。たとえば、ユーザが入力ボタンのような操作部20から値として、0.4を入力する。これにより、基準設定手段14は0.4を、比率Tc(基準値)に設定する。

0049

つぶれ判定部16は、行を構成する文字の二値画像データがつぶれている比率Rcを調べるために、文字切り出し処理によって取得した文字の外接矩形座標、文字の外接矩形内の黒色画素数Mbと白色画素数Mwを数え、黒色画素数と白色画素数の比率Mb/Mwを計算する。その値が一定値以上であれば、つぶれ判定部16は、その文字はつぶれていると判定する。

0050

なお、上述において、文字の二値画像データがつぶれているかどうかを判定する方法として、文字全体の黒色画素と白色画素の比率を調べる方法について説明したが、これに限るものではない。

0051

本実施形態において、以上の判定方法を、Tcの値を0.25に設定し、行L1に対してする例を以下に説明する。

0052

上記例は、行L1に含まれる1つ1つの文字「ア」「イ」「ウ」「エ」「オ」「株」「式」「会」「社」のそれぞれについて、その二値画像データがつぶれているどうかを判定するものである。

0053

ここで、つぶれ判定部16が、「株」についてつぶれていると判定し、それ以外の文字はつぶれていないと判定した場合、行L1を構成する全文字数は9に対し、つぶれていると判定された文字数は1である。すなわち、行L1の中でつぶれている文字の比率Rcは0.11である。

0054

画像分割部15は、実際には、対象とする行を、必ずしも1文字単位により切り出せるわけではなく、文字の種類によっては複数の部分に分離して切り出すこともある。その場合でも、つぶれ判定部16は、その切り出された文字の一部分を1文字とみなして、上記の判定処理をすることが可能である。

0055

(文字認識処理)
つぶれ判定部16が、行L1の二値画像データがつぶれていないと判定した場合、文字認識部17が行L1の文字認識をするため、ステップS8に処理は進む。そうではなく、行L1の二値画像データがつぶれていると判定した場合、文字認識部17は、行L1の文字認識を行わず、ステップS9に処理が進む。この例において、つぶれ判定部16は、行L1の二値画像データがつぶれていないと判定し、ステップS8に処理は進む。ステップS8において、文字認識部17は、行L1から切り出した文字の二値画像データを参照して文字認識処理をする。文字認識部17は、認識した文字列、すなわち「アイウエオ株式会社」を出力し、ステップS9に処理が進む。

0056

上述において、画像分割部15は二値画像を複数の行画像に分割し、つぶれ判定部16がつぶれていないと判定した行画像を、文字認識部17が文字として認識した。しかし、これに限らず、画像分割部15はフルカラー(多値)画像を複数の文字領域に分割し、つぶれ判定部16がつぶれていないと判定した文字領域を、文字認識部17が文字として認識してもよい。たとえば、画像分割部15がある画像を100部の文字領域に分割する。そのうち80部の文字領域がつぶれ判定部16により、つぶれていないと判定されたとき、文字認識部17は上記80部の画像から文字を認識してもよい。

0057

これにより、文字領域から文字をより精度よく認識できる。

0058

次に、ステップS9において、つぶれ判定部16は、ステップS8で認識した行L1が、文字領域R1の中での最終行であるかを判定する。行L1は最終行ではないためステップS5に処理が戻り、ステップS5において、画像分割部15は、次の行L2を抽出する。

0059

このように、ステップS5からステップS8の処理を文字領域R1のすべての行に対して繰り返すことにより、文字領域R1の処理を終了する。

0060

さらに、文字領域R1の最終行である行L3を処理してステップS9に到達すると、ステップS10に処理が進む。ステップS10において、つぶれ判定部16はステップS3において抽出したすべての文字領域について処理が終了したかどうかを判定する。

0061

この例において、まだ文字領域R2とR3に対する処理が終了していないため、ステップS4に処理が戻る。画像分割部15は、文字領域R2を認識対象文字領域として設定し、ステップS5以下の処理が文字領域R2とR3においても、同様にされる。

0062

このように、文字認識装置1は、文字領域R1と同様の処理をすべての文字領域について繰り返し行い、すべての文字領域について終了してステップS10に到達すると、認識結果を表示部19に出力し、図3に示した名刺画像の認識処理の全体を終了する。

0063

図4の説明)
図4では、以上の処理を行い、最終的に図3に出力した名刺画像の認識結果を、表示部19の例である携帯情報端末のディスプレイ21に表示する。また、携帯情報端末の操作キー24は、操作部20の例である。

0064

この例において、つぶれ判定部16は、行L1、L3、L4、L6、L7、およびL8の二値画像データがつぶれていないと判定し、行L2、L5、およびL9の二値画像データがつぶれていると判定した。これにより、ディスプレイ21に、行L1、L3、L4、L6、L7、およびL8の認識結果が表示されている。

0065

(実施形態1のまとめ)
このように、本発明に係る文字認識装置1は、名刺等の定型文書を文字認識する際に、つぶれ判定部16が行の二値画像がつぶれていると判定する。さらに、認識しても高精度な結果が得られない場合、その行の認識を行わない。このようにして、二値画像がつぶれておらず高精度な認識ができる行の認識結果のみを効率的に得ることができる。さらに、文字認識結果の質をより高めることができる。

0066

〔実施形態2〕
本発明の第二の実施形態について、図5図9に基づいて説明すると以下の通りである。

0067

本発明に係る文字認識装置1は、文書を撮像する画像撮像部11を備え、画像撮像部11が、つぶれ判定部16がつぶれていると判定した上記文書の箇所を、撮像することにより、上記文書の箇所を表す新たな文字領域を生成し、つぶれ判定部16が上記文字領域をつぶれているか否かを判定することを特徴としている。

0068

上記の一例として、本実施形態では、図1を用いて実施形態1において説明した文字認識装置1の構成において、つぶれ判定部16が行の二値画像がつぶれていると判定したため認識を行わない場合に、表示部19が上記行を強調表示し、ユーザが操作部20を操作することによって、画像撮像部11が再撮像をする箇所を選択する。これにより、画像撮像部11がその認識されなかった行を再撮像し、文字認識装置1が再撮像した行を読み取る例を示す。

0069

図5の説明)
図5は、つぶれ判定部16が行の二値画像がつぶれていると判定したため認識をしない場合に、表示部19が上記行を強調表示し、ユーザが操作部20を操作することによって、画像撮像部11が再撮像をする箇所を選択し、画像撮像部11が、その認識されなかった行を再撮像し、文字認識装置1が再撮像した行を読み取る処理の流れを示したフローチャート図である。以下では、実施形態1と同様にカメラの搭載された携帯情報端末に内蔵された文字認識装置1が、図3に示した名刺画像を認識する例について、図5のフローチャート図を用いて説明する。

0070

強調表示処理
ステップS11、S12、S13、S14、S15、およびS16の処理はフローチャート図2のステップS1、S2、S3、S4、S5、およびS6と同様にする。

0071

ステップS17において、つぶれ判定部16が、撮像された行の二値画像データをつぶれていないと判定した場合、図2のステップS8と同様に文字認識部17が上記行の文字認識を行い、ステップS18に処理が進む。そうではなく、つぶれ判定部16が、撮像された行の二値画像データがつぶれていると判定した場合、文字認識部17は上記行の文字認識をせず、ステップS19に処理が進む。ステップS19において、画像メモリ12は、認識されない行を表示部19に強調表示し、ステップS20に処理が進む。

0072

図6の説明)
図6は、つぶれ判定部16が行L2の二値画像データをつぶれていると判定し、文字認識部17が認識しない場合、ステップS21においてその行が、強調表示部30として携帯情報端末のディスプレイ21に表示される図である。この図において、携帯情報端末のディスプレイ21は、画像撮像部11が撮像した図3の名刺画像とともに、行L2を抽出した際に取得した行画像の外接矩形座標を使って、行L2の外接矩形を表示している。

0073

上述において、表示部19は、つぶれ判定部16がつぶれていると判定した行画像を外接矩形座標によって表示する。しかし、表示部19は、つぶれ判定部16によりつぶれていると判定された文字領域を、互いに異なる形態で表示すればよい。たとえば、携帯情報端末のディスプレイ21の背景色は白色であり、文字の色は黒色であるとする。上記の場合、表示部19は、つぶれ判定部16がつぶれていると判定した文字領域を、背景色の白に対し、赤などの際立つ色を付けて表示してもよい。

0074

これにより、ユーザは、つぶれていると判定された部分を一目で知ることができる。

0075

ステップS18において、処理は図2のステップS8と同様に進み、ステップS20に処理が進む。ステップS20において、処理は図2のステップS9と同様に進み、ステップS21に戻る。

0076

ステップS21において、つぶれ判定部16は、ステップS13において画像分割部15が抽出したすべての文字領域について処理が終了したかどうかを判定する。終了していない場合、処理は、図2のステップS4と同様にステップS14に戻り、すべての文字領域において上記を繰り返す。

0077

(画像の再認識処理
すべての文字領域について終了した場合、処理はステップS22に進む。ステップS22において、つぶれ判定部16は、つぶれていると判定されて認識がされていない、すなわち表示部19に強調表示されている行があるかないかを調べる。

0078

強調表示される行がある場合、文字認識装置1は、認識結果を出力し、図3の名刺画像の認識処理全体を終了する。強調表示されている行がある場合、処理はステップS23に進む。そこで、ユーザは、操作部20を操作することによって、強調表示されている行の中から認識が必要な行を選択する。あるいは、認識を必要とする行がない場合、ユーザは操作部20を操作することによって認識結果を出力し、図3の名刺画像の認識処理全体を終了する。

0079

図7の説明)
図7は、ステップS23において、ユーザが行を選択するための表示部19と操作部20の例である。この図では、21は携帯情報端末のディスプレイ、24は携帯情報端末の操作キーである。全領域を処理した時点で、つぶれ判定部16が、図3の名刺画像の中において行L2、L5、およびL9をつぶれていると判定したため、表示部19が、それらの行を強調表示部30、31、および32として表示していることを示している。

0080

これらの行の中から、ユーザが認識を必要としている行を操作キー24のカーソルキーにより選択し、決定キーを押下することにより、その行を再撮像するための画面を表示部19に表示する。

0081

図8の説明)
図8は、ユーザが図7において行L5を選択し、再撮像画面を表示した例である。ディスプレイ21には矩形が表示され、矩形範囲の外部は灰色により表示されている。なお、上記の場合に限らず、表示部20は、矩形範囲の外部を、赤色などの色により表示してもよい。

0082

(再撮像処理
ユーザは、操作キー24のカーソルキーにより、行L5を矩形33の中央にあわせ、1回目に撮像したときよりカメラを近づけ、操作キー24の決定キーを押下することにより、行L5を再撮像する。

0083

ステップS24において、画像撮像部11は、撮像した画像を画像メモリ12にフルカラー(多値)画像データとして入力し、ステップS25に処理が進む。ステップS25において、二値画像生成部13は、画像メモリ12に入力されたフルカラー(多値)画像データを二値化して二値画像データを生成し、画像メモリ12へ入力して、ステップS26に処理が進む。ステップS26において、画像分割部15は、画像メモリ12から二値画像データを参照して、ディスプレイ21の矩形33の中央において撮像した行L5を抽出し、ステップS27に処理が進む。ステップS27において、画像分割部15は、画像メモリ12から行L5の二値画像データを参照して、行L5の文字切り出し処理をし、ステップS28に処理が進む。ステップS28において、文字認識部17は、行L5から切り出した文字の二値画像データを参照して文字を認識し、認識した文字列、すなわち「奈良県天理市櫟本XX-Y」を出力し、ステップS22に処理が戻る。

0084

図9の説明)
図9の携帯情報端末のディスプレイ21は、表示部19の例であり、以上の処理を行い、最終的に図3に示した名刺画像の認識結果を出力した様子を示している。この例において、つぶれていると判定されて認識されなかった行L5が、再撮像されて認識されたため、行L1、L3、L4、L5、L6、L7、およびL8の認識結果が表示されている。

0085

(実施形態2のまとめ)
すなわち、本発明に係る文字認識装置1は、名刺等の定型文書を文字認識する際に、つぶれ判定部16が二値化した行画像がつぶれていると判定し、つぶれ判定部16が認識しないと判定したことにより強調表示されている行に対して、ユーザはその表示を見て認識する必要がある行を選択し、上記文字認識装置1は再読み取りをすることができる。さらに、つぶれ判定部16が、再読み取りされた画像をつぶれていないと判定することもありうる。これにより、文字認識部17は前回認識対象ではなかった箇所から文字を認識できる可能性がある。

0086

〔実施形態3〕
本発明の第三の実施形態について、図10に基づいて説明すると以下の通りである。

0087

本発明に係る文字認識装置1は、画像分割部15が画像を複数の文字領域に分割し、つぶれ判定部16によりつぶれていると判定した上記複数の文字領域と上記複数の文字領域との比率が、基準値よりも小さいとき、文字認識部17は上記画像を認識することを特徴としている。

0088

上記の一例として、本実施形態においては、図1を用いて実施形態1で説明した文字認識装置の構成において撮像した画像の品質が悪いため全体画像の認識を行わない例について示す。

0089

図10は文字認識装置の構成において、撮像した画像の品質が悪いため全体画像の認識をしないとき、の処理の流れを示したフローチャート図である。以下では、実施形態1と同様にカメラの搭載された携帯情報端末に内蔵された文字認識装置1が、図3に示した名刺画像を認識する例について、図10のフローチャート図を用いて説明する。

0090

ステップS30、S31、S32、S33、S34、およびS35の処理は、実施形態1のフローチャート図2のステップS1、S2、S3、S4、S5、およびS6と同様とする。

0091

ただし、本実施形態のステップS31において、総行数を示す変数Nとつぶれている行数を示す変数N1を0にセットする。また、ステップS34において、行を抽出するごとに総行数を示す変数Nは1つ増加する。

0092

(全体画像認識判定処理)
ステップS36において、つぶれ判定部16は、行の二値画像データがつぶれているかどうかを判定する。上記つぶれ判定部16が、上記二値画像データはつぶれていないと判定した場合、実施形態1の場合とは異なり文字認識部17は文字認識を行わず、ステップS38に処理が進む。また、つぶれ判定部16が、上記二値画像データはつぶれていると判定した場合、ステップS37に処理が進む。ステップS37において、つぶれている行数を示す変数N1が1つ増加し、ステップS38に処理が進む。文字認識装置1は、ステップS38とS39において図2のステップS9とS10と同様の処理を行い、ステップS40に進む。ステップS40において、つぶれ判定部16は、つぶれている行数を示す変数N1の値を、総行数を示す変数Nの値により割った値と、つぶれている行を許容する比率Tl(基準値)と比較する。Tlは、メモリ等の記憶装置内に保存されている値である。このとき、N1/N>Tlであれば、つぶれ判定部16は、画像撮像部11が撮像した画像の品質は悪いと判定する。なお、基準値設定部14は、Tlの値を0より大きく1より小さい範囲において、任意に設定することが可能である。ここで、ユーザは、操作部20によって値を入力し、基準値設定部14がその値を比率Tl(基準値)に設定してもよい。

0093

本実施形態においては、Tlを0.5に設定し、図3に示した名刺画像を認識する場合について説明する。

0094

つぶれ判定部16は、全体画像に含まれる行L1からL9についてそれぞれ、その二値画像データがつぶれているどうかを判定する。行がつぶれているかどうか判定する方法については、実施形態1において示したため、ここでは省略する。

0095

ここで、つぶれ判定部16により行L2、L5、およびL9がつぶれていると判定された場合、全体画像を構成する行数9に対し、つぶれていると判定された行数は3である。これにより、全体画像の中において、つぶれている行の比率N1/Nは0.33である。ここで、N1/NとTlを比較するとN1/N<Tlであるため、つぶれ判定部16は、撮像した画像の品質は良いと判定する。

0096

ステップS40において、つぶれ判定部16が撮像した画像の品質が良いと判定した場合、ステップS41に処理が進む。ステップS41において、文字認識部17は、抽出した行を文字として認識する。文字認識をする方法は、すべての行を認識する方法がある。あるいは、実施形態1において示した、つぶれていない行のみを認識する方法がある。上記方法により、文字認識部17は、文字を認識できる可能性の高い画像だけを認識の対象とすることができる。たとえば、画像分割部15が画像を100部の文字領域に分割し、つぶれ判定部16が、そのうちの40部の文字領域がつぶれていると判定したとする。この場合、文字認識部17は、60部の文字領域からのみ文字を認識する。すなわち、つぶれ判定部16が、つぶれていると判定した、質の悪い文字認識結果になりうる文字領域が、認識対象から除かれている。これにより、画像全体からの文字認識結果の質が高まる。

0097

もしくは、文字認識をする方法として、実施形態2において示した、つぶれていない行のみを認識し、つぶれている行を再読み取りする方法などを用いることができる。

0098

また、ステップS41において、つぶれている行数を示す変数N1の値を、総行数を示す変数Nの値により割った値がTlを超えた場合、つぶれ判定部16は、撮像した画像の品質が悪いと判定し、文字認識部17は上記画像を文字として認識しない。表示部19は認識できなかったことを示すメッセージ、かつ再撮像するための画面を表示し、ステップS1に処理が戻る。

0099

(実施形態3のまとめ)
すなわち、本発明に係る文字認識装置1は、名刺等の定型文書を文字認識する際に、二値化された全体画像の中のつぶれている行画像の比率を調べる。これにより、つぶれ判定部16は、入力された画像の品質が文字認識するために十分であるかどうかを判定することができる。文字認識部17は、認識しても高精度な結果は得られない画像の認識を行わないことにより、素早く再読み取りへ移行することができる。さらに、文字認識部17は、つぶれの多い画像を認識しないことにより、文字を認識する処理に要する時間を無視することができる。

0100

なお、本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲において種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

0101

(他の構成)
なお、本発明を、以下のように表現することも可能である。

0102

(第1の構成)
名刺等の定型文書を読み取る文字認識装置であって、
画像を撮像する画像撮像手段と、
撮像した画像を二値化して二値画像を生成する二値画像生成手段と、
二値画像から文字領域を抽出する領域抽出手段と、
抽出した文字領域から行を抽出する行抽出手段と、
抽出した行から文字を切り出す文字切り出し手段と、
二値画像のつぶれを判定する二値画像判定手段と、
切り出した文字を認識する文字認識手段と、
文字認識結果等を表示する表示手段とを備え、
上記二値画像判定手段が、二値化された行画像がつぶれていると判定した場合、その行の認識を行わないことを特徴とする文字認識装置。

0103

(第2の構成)
上記行画像がつぶれていると判定する方法は、つぶれている文字画像の比率であることを特徴とする第1の構成に記載の文字認識装置。

0104

(第3の構成)
上記文字認識装置は、上記表示手段が、認識を行わない行を強調表示することを特徴とする第1または第2の構成に記載の文字認識装置。

0105

(第4の構成)
上記文字認識装置は、利用者が操作を行う操作手段を備え、上記強調表示した行を再撮像することを操作手段から入力によって行い、再撮像した行を読み取ることを特徴とする第3の構成に記載の文字認識装置。

0106

(第5の構成)
上記文字認識装置は、上記二値画像判定手段が、二値化された全体画像の品質が悪いと判定した場合、全体画像の認識を行わないことを特徴とする第1から第4の構成のいずれかに記載の上記文字認識装置。

0107

(第6の構成)
上記全体画像の品質が悪いと判定する方法は、つぶれている行画像の比率であることを特徴とする第5の構成に記載の文字認識装置。

0108

(第7の構成)
名刺等の定型文書を読み取る文字認識方法であって、
画像を撮像する画像撮像ステップと、
撮像した画像を二値化して二値画像を生成する二値画像生成ステップと、
二値画像から文字領域を抽出する領域抽出ステップと、
抽出した文字領域から行を抽出する行抽出ステップと、
抽出した行から文字を切り出す文字切り出しステップと、
二値画像のつぶれを判定する二値画像判定ステップと、
切り出した文字を認識する文字認識ステップと、
文字認識結果等を表示する表示ステップとを備え、
上記二値画像判定ステップが、二値化された行画像がつぶれていると判定した場合、その行の認識を行わないことを特徴とする文字認識方法。

0109

プログラムおよび記録媒体)
さらに、文字認識装置1に含まれている各ブロックは、ハードウェアロジックによって構成すればよい。または、次のように、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。

0110

すなわち、文字認識装置1は、各機能を実現する制御プログラム命令を実行するCPU、この制御プログラムを格納したROM(Read Only Memory)、上記制御プログラムを実行可能な形式展開するRAM(Random Access Memory)、および、上記制御プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)を備えている。

0111

この構成により、本発明の目的は、所定の記録媒体によっても、達成できる。この記録媒体は、上述した機能を実現するソフトウェアである文字認識装置1の制御プログラムのプログラムコード実行形式プログラム中間コードプログラムソースプログラム)をコンピュータで読み取り可能に記録していればよい。文字認識装置1に、この記録媒体を供給する。これにより、コンピュータとしての文字認識装置1(またはCPUやMPU)が、供給された記録媒体に記録されているプログラムコードを読み出し、実行すればよい。

0112

プログラムコードを文字認識装置1に供給する記録媒体は、特定の構造または種類のものに限定されない。すなわち、この記録媒体は、たとえば、磁気テープカセットテープ等のテープ系、フロッピー登録商標ディスクハードディスク等の磁気ディスクCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカードメモリカードを含む)/光カード等のカード系、あるいはマスクROMEPROM/EEPROM/フラッシュROM等の半導体メモリ系などとすることができる。

0113

また、文字認識装置1を、通信ネットワーク接続可能に構成しても、本発明の目的を達成できる。この場合、上記のプログラムコードを、通信ネットワークを介して文字認識装置1に供給する。この通信ネットワークは、文字認識装置1にプログラムコードを供給できるものであればよく、特定の種類または形態に限定されない。たとえば、インターネットイントラネットエキストラネット、LAN、ISDN、VAN、CATV通信網仮想専用網(Virtual Private Network)、電話回線網移動体通信網衛星通信網等であればよい。

0114

この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な任意の媒体であればよく、特定の構成または種類のものに限定されない。たとえば、IEEE1394、USB(Universal Serial Bus)、電力線搬送ケーブルTV回線電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線HDR携帯電話網衛星回線地上波デジタル網等の無線でも利用可能である。

0115

プログラムコードを供給する記録媒体は、特定の構造または種類のものに限定されない。すなわち、この記録媒体は、たとえば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などとすることができる。

0116

また、文字認識装置1を、通信ネットワークと接続可能に構成しても、本発明の目的を達成できる。この場合、上記のプログラムコードを、通信ネットワークを介して文字認識装置1に供給する。この通信ネットワークは、文字認識装置1にプログラムコードを供給できるものであればよく、特定の種類または形態に限定されない。たとえば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等であればよい。

0117

この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な任意の媒体であればよく、特定の構成または種類のものに限定されない。たとえば、IEEE1394、USB(Universal Serial Bus)、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。

0118

本発明は、画像から文字を精度良く認識できる文字認識装置として、幅広く利用できる。そのため、たとえばスキャナによって読み取られた画像から文字を認識する文字認識装置や、あるいはカメラによって撮影された画像から文字を認識する文字認識装置として、利用できる。

図面の簡単な説明

0119

本発明を実施するための文字認識装置の構成を示すブロック図である。
実施形態1に係る文字認識装置が画像から文字を認識する処理を示したフローチャート図である。
名刺画像の一例を示す図である。
実施形態1に係る文字認識装置が文字を認識する処理をし、名刺画像の認識結果を表示部の例である携帯情報端末のディスプレイに表示した図である。
実施形態2に係る文字認識装置が画像から文字を認識する処理を示したフローチャート図である
つぶれ判定部が、撮像された行の二値画像データをつぶれていると判定し、その行を強調表示部として、表示部の例である携帯情報端末のディスプレイに表示した図である。
ユーザが操作部を操作することによって、強調表示されている行の中から認識が必要な行を選択するために、強調表示されている行を、表示部の例である携帯情報端末のディスプレイに表示した図である。
ユーザが、強調表示された行を選択し、撮像部が再撮像するための画面を、表示部の例である携帯情報端末のディスプレイに表示した図である。
実施形態2に係る文字認識装置が文字を認識する処理をし、名刺画像の認識結果を表示部の例である携帯情報端末のディスプレイに表示した図である。
実施形態3に係る文字認識装置が画像から文字を認識するフローチャート図である。

符号の説明

0120

1文字認識装置
11画像撮像部(撮像手段)
12画像メモリ
13二値画像生成部
14基準値設定部(基準値設定手段)
15画像分割部(画像分割手段)
16つぶれ判定部(つぶれ判定手段)
17文字認識部(文字認識手段)
19 表示部(表示手段)
20 操作部(入力手段)
21携帯情報端末のディスプレイ
24 携帯情報端末の操作キー

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 富士ゼロックス株式会社の「 情報処理装置及びプログラム」が 公開されました。( 2020/08/31)

    【課題】抽出の対象となる第1の文字又は文字列と共通の属性を有する第2の文字又は文字列を誤って抽出することを抑制することが可能な情報処理装置及びプログラムを提供する。【解決手段】情報処理装置は、文字を認... 詳細

  • キヤノン株式会社の「 画像処理装置、画像処理方法、および、プログラム」が 公開されました。( 2020/08/31)

    【課題】文字数が少ない原稿であっても精度よく原稿の正方向を検知すること。【解決手段】単一文字毎の特徴量を保持する第1の辞書と、所定の文字毎の重み付け倍率を保持する第2の辞書と、前記原稿画像データに含ま... 詳細

  • 株式会社東芝の「 情報処理装置及びプログラム」が 公開されました。( 2020/08/31)

    【課題】効果的に画像から対象領域を特定することができる情報処理装置及びプログラムを提供する。【解決手段】実施形態によれば、情報処理装置は、インターフェースと、プロセッサと、を備える。インターフェースは... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ