図面 (/)

技術 文字認識装置

出願人 富士通株式会社
発明者 黒川浩司
出願日 1999年12月28日 (21年0ヶ月経過) 出願番号 1999-373267
公開日 2001年7月10日 (19年5ヶ月経過) 公開番号 2001-188881
状態 特許登録済
技術分野 文字認識
主要キーワード 標準幅 最短値 ステッフ 最小自乗近似 強調表現 重心距離 文字型 フォント間
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2001年7月10日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (7)

課題

様々なフォント強調表現が混在する文書に柔軟に対応し、相似文字大文字小文字識別率を向上する文字認識装置を提供する。

解決手段

文書画像から文字パターンの特徴量を抽出し文字辞書の特徴量と照合して特徴量の近い文字を選択する文字認識手段と、認識した結果から形状が相似の大文字と小文字を識別して出力する相似文字識別手段を有する文字認識装置であって、相似文字識別手段は、文字認識結果により、各文字の種類を相似文字型とその他の文字型に区分マークする文字型マーク手段と、認識結果の文字の中から所定数の文字パターンを取得し、その外接矩形に接する基準線を設定し、設定した基準線から所定の距離を閾値として設定する閾値設定手段と、所定数の文字パターンの中で、相似文字型とマークされた文字パターンについて基準線から重心までの長さが閾値より小さい文字を小文字と判別する相似文字判別手段とを備えたことを特徴とする文字認識装置。

概要

背景

図5に従来例の相似文字識別方法の説明図を示す。

上記の文字認識装置は、入力した文字パターンから、行の上基準線、下基準線および行の標準幅を決定して、各文字上空白比(上空白/行の標準幅)を求め、その値と所定の閾値との比較により、大文字小文字かの識別を行う。

図5に示すように、フォントおよびポイント数が同一であれば、大文字に対応する上側空白と小文字に対応する上側空白とは大きく異なっているから、標準行幅に対して、判別対象の文字に対応する上側空白が占める割合に基づいて、その文字が大文字であるか小文字であるかを容易に識別することができる。

概要

様々なフォントや強調表現が混在する文書に柔軟に対応し、相似文字の大文字、小文字の識別率を向上する文字認識装置を提供する。

文書画像から文字パターンの特徴量を抽出し文字辞書の特徴量と照合して特徴量の近い文字を選択する文字認識手段と、認識した結果から形状が相似の大文字と小文字を識別して出力する相似文字識別手段を有する文字認識装置であって、相似文字識別手段は、文字認識結果により、各文字の種類を相似文字型とその他の文字型に区分マークする文字型マーク手段と、認識結果の文字の中から所定数の文字パターンを取得し、その外接矩形に接する基準線を設定し、設定した基準線から所定の距離を閾値として設定する閾値設定手段と、所定数の文字パターンの中で、相似文字型とマークされた文字パターンについて基準線から重心までの長さが閾値より小さい文字を小文字と判別する相似文字判別手段とを備えたことを特徴とする文字認識装置。

目的

本発明の文字認識装置は、様々なフォントや強調表現が混在する文書に柔軟に対応し、相似文字の大文字、小文字の識別率の向上を目的とする。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

文書画像から文字パターンの特徴量を抽出し文字辞書の特徴量と照合して特徴量の近い文字を選択する文字認識手段と、認識した結果から形状が相似大文字小文字識別して出力する相似文字識別手段を有する文字認識装置であって、相似文字識別手段は、文字認識結果により各文字の種類を相似文字型とその他の文字型に区分マークする文字型マーク手段と、認識結果の文字の中から所定数の文字パターンを取得し、その外接矩形に接する基準線を設定し、設定した基準線から所定の距離を閾値として設定する閾値設定手段と、所定数の文字パターンの中で相似文字型とマークされた文字パターンについて基準線から重心までの長さが閾値より小さい文字を小文字と判別する相似文字判別手段とを備えたことを特徴とする文字認識装置。

請求項2

文字認識結果により各文字の種類を相似文字型と相似文字型の大文字相当の高さを有する大文字型とその他の文字型に区分しマークする文字型マーク手段と、認識結果の文字の中から取得した所定数の文字パターンから大文字型とマークされた文字パターンを選択し、選択した文字パターンの外接矩形に接して設定した基準線から大文字型の文字パターンの重心までの距離の最短値を取得し、取得した最短値をもとに閾値を設定する閾値設定手段とを備えたことを特徴とする請求項1記載の文字認識装置。

請求項3

文字認識結果により各文字の種類を相似文字型と相似文字型の大文字相当の高さを有する大文字型とその他の文字型に区分しマークする文字型マーク手段と、認識結果の文字の中から取得した所定数の文字パターンの中に大文字型とマークされた文字パターンがなかったときに、所定数の文字パターンの外接矩形に接して設定した基準線からその他の文字型にマークされた文字パターンの重心までの距離の最長値を取得し、取得した最長値をもとに閾値を設定する閾値設定手段とを備えたことを特徴とする請求項1記載の文字認識装置。

技術分野

0001

本発明は、活字文字文字認識を行う文字認識装置に関し、特に識別が困難な相似型の文字を識別する技術に関するものである。

0002

例えば、ひらがな大文字の「つ」と小文字の「っ」のように大文字と小文字がほぼ相似型の文字パターンの文字(以下相似文字と称する)は、一定のサイズに正規化圧縮又は、伸長される)された後、文字パターンの特徴量が抽出されるため、所定のフォントの文字の特徴量を抽出した文字辞書とのパターンマッチング技術のみでは、文字認識結果確定することが出来ない場合がある。このため、パターンマッチング技術による文字認識とは別に大文字か小文字かを識別する技術が必要とされている。

背景技術

0003

図5に従来例の相似文字識別方法の説明図を示す。

0004

上記の文字認識装置は、入力した文字パターンから、行の上基準線、下基準線および行の標準幅を決定して、各文字の上空白比(上空白/行の標準幅)を求め、その値と所定の閾値との比較により、大文字か小文字かの識別を行う。

0005

図5に示すように、フォントおよびポイント数が同一であれば、大文字に対応する上側空白と小文字に対応する上側空白とは大きく異なっているから、標準行幅に対して、判別対象の文字に対応する上側空白が占める割合に基づいて、その文字が大文字であるか小文字であるかを容易に識別することができる。

発明が解決しようとする課題

0006

しかしながら、最近の文書は、多数のフォントの切り替え等による多彩表現手法が用いられるようになっている。

0007

例えば、かなには、フォントにより、その高さが変化する物が多い。

0008

図6に示すように例えば「さ」については、フォント間で大きさに違いは見られないが、「エ」は、ゴシック体に比べ明体の高さが低い。

0009

明朝体「エ」の図6の閾値(大文字と小文字の上端の中間)で識別すると、ゴシック体「エ」の小文字を大文字と誤識別する場合が発生することがある。

0010

このように従来の相似文字識別方法では、判別対象の文字についての空白比と固定の閾値との比較結果に基づいて判別しているため、このような文書に含まれる相似文字の全てを正確に識別することは困難である。

0011

本発明の文字認識装置は、様々なフォントや強調表現が混在する文書に柔軟に対応し、相似文字の大文字、小文字の識別率の向上を目的とする。

課題を解決するための手段

0012

文書画像から文字パターンの特徴量を抽出し文字辞書の特徴量と照合して特徴量の近い文字を選択する文字認識手段と、認識した結果から形状が相似の大文字と小文字を識別して出力する相似文字識別手段を有する文字認識装置であって、相似文字識別手段は、文字認識結果により、各文字の種類を相似文字型とその他の文字型に区分マークする文字型マーク手段と、認識結果の文字の中から所定数の文字パターンを取得し、その外接矩形に接する基準線を設定し、設定した基準線から所定の距離を閾値として設定する閾値設定手段と、所定数の文字パターンの中で、相似文字型とマークされた文字パターンについて基準線から重心までの長さが閾値より小さい文字を小文字と判別する相似文字判別手段とを備えた構成である。

0013

この構成により、相似文字の基準線から重心までの距離が大文字と小文字で相違する点に着目し、所定の閾値を設定することで、相似文字の大文字小文字の判別が簡単で高精度に実現できる。

0014

また、文字認識結果により各文字の種類を相似文字型と相似文字型の大文字相当の高さを有する大文字型とその他の文字型に区分しマークする文字型マーク手段と、認識結果の文字の中から取得した所定数の文字パターンから大文字型とマークされた文字パターンを選択し、選択した文字パターンの外接矩形に接して設定した基準線から大文字型の文字パターンの重心までの距離の最短値を取得し、取得した最短値をもとに閾値を設定する閾値設定手段とを備えた構成である。

0015

この構成により、相似文字型の大文字の高さを有する大文字型の基準線から文字の重心までの最短の距離から閾値を求めることで、これより小さい相似型の文字は、小文字、大きい文字は、大文字と簡単に高精度に判別できる。

0016

文字認識結果により各文字の種類を相似文字型と相似文字型の大文字相当の高さを有する大文字型とその他の文字型に区分しマークする文字型マーク手段と、認識結果の文字の中から取得した所定数の文字パターンの中に大文字型とマークされた文字パターンがなかったときに、所定数の文字パターンの外接矩形に接して設定した基準線からその他の文字型にマークされた文字パターンの重心までの距離の最長値を取得し、取得した最長値をもとに閾値を設定する閾値設定手段とを備えた構成である。

0017

この構成により、大文字型が所定数の文字パターン内に見つからない場合は、漢字などの文字の基準線から重心までの距離が最長のものを選ぶことで、相似文字の大文字、子文字の判別を可能としている。これは、漢字などの文字は、文字の高さが変動するものが多いため、最短だと、判別ができないため、最長で、判別している。

発明を実施するための最良の形態

0018

図1に実施例の文字認識装置1の構成図を示す。

0019

文字認識装置1は、画像入力部11、文字認識部12、相似文字識別部2、文字処理部13から構成される。

0020

図2に文字認識装置の処理の流れ図を示す。

0021

文字認識装置1は、文書を画像入力部11で読み込む(S1ステッフ゜)。そして画像入力部11で読取った文字パターンを文字認識部12は、正規化して特徴量を抽出し、文字辞書の保持する文字の特徴量と照合してその差分の最も小さい文字を選択する。そして文字認識した結果と文字パターンを相似文字識別部2へ渡す(S2 ステッフ゜)。図3に文字認識装置の相似文字識別部の処理の流れ図を示す(S3 ステッフ゜)。

0022

「かな」についての例を説明する。

0023

相似文字識別部2は、図1に示すように文字情報記憶部3、文字型マーク部4、相似文字識別制御部5、判別結果出力部6から構成される。

0024

文字情報記憶部3で文字認識部12からの文字認識結果と入力された文字パターンを行単位に記憶する(S11ステッフ゜)。そして文字型マーク部4は、文字情報記憶部3に記憶されている文字認識結果から「かな」について、全文字情報の文字型を判定し、判定結果をマークとして文字情報記憶部3に記憶する(S12 ステッフ゜)。以下に文字型例を示す。
・相似文字型−形状が相似で大きさの異なるかな
あいうえおつやゆよわぁぃぅぇぉっゃゅょゎ
アイウエツヤユヨワァィゥェォッャュョヮ
・大文字型−−大文字型線と基準線に接し、かつ相似文字でないかな
かがきぎくぐけげこごさざしじすずそぞただちぢとどなにぬね
はばぱふぶぷほぼぽまみむもらりるれろゐゑをん
ガキギクグゲサザタダチヂトドナネホボポミメリヲ
・対象除外型−フォントにより高さが変動するなど
大文字型の条件を満たさないことがある文字
こごせぜてでのひびぴへべぺめ
ヴコゴシジスズセゼソゾヅテデニヌノ
ハバパヒビピフブプヘベペマムモラルレロヰヱン
次に、相似文字識別制御部5は、まず大文字型を含む行の基準線を求める。

0025

基準線は、読取った文書画像の頁単位に、1頁内の大文字型に属するかな外接矩形型の下辺中点集合から最小自乗近似法により直線を決定する(S13ステッフ゜)。次に文字情報を行単位に識別して行く。

0026

文字型を判定した結果が相似文字型を一部含む行であるのか、行内の文字に相似文字型が含まれないとき又は、相似型のみの行であるのかを判別する。

0027

そして、行内の文字に相似文字型が含まれないとき又は相似型のみの行のときには、そのまま認識結果を判別結果出力部6に渡す(S14ステッフ゜)。文字型を判定した結果が相似文字型を一部含む行のときには、一行の中の大文字型の有無を確認する(S15 ステッフ゜)。行中に大文字型が有る場合は、基準線から矩形の重心までの長さが一番短いものを求める。基準線から重心までが一番短い大文字型の長さに所定の定数(例えば0.86)をかけたものを閾値とし、相似文字型の中でそれより小さい場合を小文字、大きい場合を大文字と判定し、判別結果出力部6に渡す(S16 ステッフ゜)。図4に実施例の相似文字識別部の説明図を示す。

0028

図4(a) に大文字型の文字を基にした閾値設定を示す。

0029

大文字型の文字「ぬし」の基準線から外接矩形の重心までの距離を求める。その結果、「し」の重心が「ぬ」の重心に比べて低い位置のため、「し」の重心が最短距離となる。そして、次に閾値を求めて、相似文字「あ」「っ」の重心距離を比較すると「あ」の重心位置が閾値より大きく、「っ」の重心位置は、閾値より小さいため、「あ」は大文字、「っ」は、小文字と判断する。

0030

一行中に大文字型がなかった場合は、その行の外接矩形の下辺から基準線を設定する。

0031

そして、求めた基準線からその行の対象除外型の文字パターンの外接矩形の重心までの距離が一番長い文字を漢字、数字、かなから求め、それを大文字型とみなす。その長さに所定の定数(例えば0.86)をかけたものを閾値として同様の処理を行う(S17ステッフ゜)。図4(b) に大文字型以外の文字を基にした閾値設定を示す。

0032

漢字「ニ番」、対象除外型のかな「て」の基準線から重心までの距離を求める。その結果漢字「番」の基準線から重心までの距離が一番長い。そして、次に閾値を求めて、相似文字「あ」「っ」の重心距離を比較すると「あ」の重心位置が閾値より大きく、「っ」の重心位置は、閾値より小さいため、「あ」は大文字、「っ」は、小文字と判断する。

0033

そして判別結果出力部6は、大文字、子文字の判別した結果を出力する(S18ステッフ゜)。文字処理部13は、相似文字識別部2で判別した結果にもとづき、文字認識部12で認識した結果を修正して、ディスプレイ等に文字認識結果を出力する(S4ステッフ゜)。

発明の効果

0034

本発明によれば、相似文字識別の中の「かな」の相似文字判定を高精度に行うことができる。

図面の簡単な説明

0035

図1実施例の文字認識装置の構成図
図2実施例の文字認識装置の処理の流れ図
図3実施例の相似文字識別部の処理の流れ図
図4実施例の相似文字識別部の説明図
図5従来例の相似文字識別方法の説明図
図6従来の問題点の説明図

--

0036

1文字認識装置
2相似文字識別部
3文字情報記憶部
4文字型マーク部
5 相似文字識別制御部
6判別結果出力部
11画像入力部
12文字認識部
13文字処理部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ