図面 (/)

技術 文字認識装置

出願人 シャープ株式会社
発明者 北村義弘
出願日 1992年6月30日 (28年6ヶ月経過) 出願番号 1992-173166
公開日 1994年1月28日 (26年11ヶ月経過) 公開番号 1994-020096
状態 特許登録済
技術分野 文字認識
主要キーワード 専用LSI Y座標 輪郭特徴 識別メモリ X座標 抽出文字 特定相 作業バッファ
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1994年1月28日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (11)

目的

文字認識処理高速で、かつ正確な文字認識装置を提供する。

構成

文字認識装置16は、照合部14において、相似形文字に関して、その大文字または小文字のいずれか一方の標準パターンのみを相似形文字の標準パターンとして照合するので、照合に要する時間が短縮され、文字認識の高速化を図ることができる。また、相似形文字については、大文字小文字判定部11において、抽出文字画像の大きさに基づいて大文字か小文字かを判定し、認識結果メモリ9に出力された文字コードを適宜修正することによって認識結果とする。これによって、標準パターンとの照合では、正しく認識することが困難である相似形文字を、より正確に認識することができる。

概要

背景

文書文字情報コンピュータ処理によって認識する文字認識装置として、認識しようとする文字情報、たとえば日本語文字をCCD(電荷結合素子)などを用いて光電変換し、該光電変換された電気信号を1文字画像単位で切出し、認識部において所定の認識論理に従って1文字画像ずつ認識を行う、光学的文字認識装置OCR)が知られている。

認識の方法としては、文字の始点から輪郭を追跡し、方向コードを付与し、これを、方向コード列として辞書中の同様の標準パターンと照合し、類似度順に候補をあげ、文字コードを出力するなどの認識方法がある。

概要

文字認識処理高速で、かつ正確な文字認識装置を提供する。

文字認識装置16は、照合部14において、相似形文字に関して、その大文字または小文字のいずれか一方の標準パターンのみを相似形文字の標準パターンとして照合するので、照合に要する時間が短縮され、文字認識の高速化を図ることができる。また、相似形文字については、大文字小文字判定部11において、抽出文字画像の大きさに基づいて大文字か小文字かを判定し、認識結果メモリ9に出力された文字コードを適宜修正することによって認識結果とする。これによって、標準パターンとの照合では、正しく認識することが困難である相似形文字を、より正確に認識することができる。

目的

本発明の目的は、前述のような欠点を解消し、文字認識における認識処理の高速化を図り、大文字、小文字のより正確な識別を行えるような文字認識装置を提供することである。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

複数の文字が表示されている原稿を読取って画像データに変換して出力する読取手段と、読取手段からの画像データを記憶する画像メモリと、前記画像メモリから各文字画像を順次抽出する文字抽出手段と、抽出文字画像と照合する標準文字画像および対応する文字コードが記憶され、幾何学的に相似の関係にある大文字小文字とを持つ相似形文字に関しては、大文字または小文字のいずれか一方の標準文字画像のみが記憶されている辞書メモリと、抽出文字画像の大きさを検出する検出手段と、辞書メモリの記憶内容に基づいて、抽出文字画像を認識し、文字コードを出力する認識手段と、認識手段からの文字コードと、前記検出手段からの大きさとを認識結果として記憶する認識結果メモリと、認識結果メモリの内容に基づいて、相似形文字の文字コード毎に大きさに基づくヒストグラムを作成し、該ヒストグラムの分割点をしきい値として大文字であるか小文字であるかの判定を行う判定手段とを含むことを特徴とする文字認識装置

請求項2

前記判定手段は、特定の相似形文字に関して、ヒストグラムを作成できないとき、または、ヒストグラムに基づいてしきい値を決定できないときには、前記特定相似形文字以外の相似形文字のしきい値に基づいて、判定を行うことを特徴とする請求項1に記載の文字認識装置。

請求項3

前記判定手段は、予め定める数の相似形文字の認識結果に基づいてしきい値を判定した後は、該しきい値に基づいて残余の相似形文字の判定を行うことを特徴とする請求項1に記載の文字認識装置。

技術分野

0001

本発明は、読取った文字画像から特徴データを抽出し、辞書に予め格納されている標準文字画像と照合することによって、文字を認識する文字認識装置に関する。

背景技術

0002

文書文字情報コンピュータ処理によって認識する文字認識装置として、認識しようとする文字情報、たとえば日本語文字をCCD(電荷結合素子)などを用いて光電変換し、該光電変換された電気信号を1文字画像単位で切出し、認識部において所定の認識論理に従って1文字画像ずつ認識を行う、光学的文字認識装置OCR)が知られている。

0003

認識の方法としては、文字の始点から輪郭を追跡し、方向コードを付与し、これを、方向コード列として辞書中の同様の標準パターンと照合し、類似度順に候補をあげ、文字コードを出力するなどの認識方法がある。

発明が解決しようとする課題

0004

この種の文字認識装置においては、認識対象となる全ての文字に関して、大文字小文字双方の標準パターンを持っており、文字画像と文字辞書の全ての標準パターンとの照合後に認識された結果(文字コード)を出力する認識方法が実施されている。この方法では、大文字、小文字双方の標準パターンを持つので、標準パターンの数が増加し、標準パターンとの照合に時間がかかるといった欠点がある。

0005

また前述のように、輪郭特徴データを抽出して文字認識を行う場合、輪郭の多い漢字などの認識には好適であるが、ひらがな、かたかな、アルファベットのうち、大文字と小文字とが相似形である相似形文字の場合、たとえば「ゆ」と「ゅ」では輪郭の区別がつきにくく、認識率が低くなってしまう。

0006

本発明の目的は、前述のような欠点を解消し、文字認識における認識処理高速化を図り、大文字、小文字のより正確な識別を行えるような文字認識装置を提供することである。

課題を解決するための手段

0007

本発明は、複数の文字が表示されている原稿を読取って画像データに変換して出力する読取手段と、読取手段からの画像データを記憶する画像メモリと、前記画像メモリから各文字画像を順次抽出する文字抽出手段と、抽出文字画像と照合する標準文字画像および対応する文字コードが記憶され、幾何学的に相似の関係にある大文字と小文字とを持つ相似形文字に関しては、大文字または小文字のいずれか一方の標準文字画像のみが記憶されている辞書メモリと、抽出文字画像の大きさを検出する検出手段と、辞書メモリの記憶内容に基づいて、抽出文字画像を認識し、文字コードを出力する認識手段と、認識手段からの文字コードと、前記検出手段からの大きさとを認識結果として記憶する認識結果メモリと、認識結果メモリの内容に基づいて、相似形文字の文字コード毎に大きさに基づくヒストグラムを作成し、該ヒストグラムの分割点をしきい値として大文字であるか小文字であるかの判定を行う判定手段とを含むことを特徴とする文字認識装置である。

0008

また本発明は、前記判定手段は、特定の相似形文字に関して、ヒストグラムを作成できないとき、または、ヒストグラムに基づいてしきい値を決定できないときには、前記特定相似形文字以外の相似形文字のしきい値に基づいて、判定を行うことを特徴とする。

0009

また本発明は、前記判定手段は、予め定める数の相似形文字の認識結果に基づいてしきい値を判定した後は、該しきい値に基づいて残余の相似形文字の判定を行うことを特徴とする。

0010

請求項1記載の本発明に従えば、文字認識装置は、読取手段において、複数の文字が表示されている原稿を読取り、画像データに変換し、読取手段からの画像データを画像メモリに記憶して、文字抽出手段によって、前記画像メモリから各文字画像を順次抽出し、認識手段においては、辞書メモリの内容に基づいて、抽出文字画像を認識し、文字コードを出力する。辞書メモリは、抽出文字画像と照合する標準文字画像および対応する文字コードを記憶し、幾何学的に相似の関係にある大文字と小文字とを持つ相似形文字に関しては、大文字または小文字のいずれか一方の標準文字画像のみを記憶している。さらに、文字認識装置は検出手段によって抽出文字画像の大きさを検出し、認識手段からの文字コードとともに認識結果として認識結果メモリに記憶する。前記文認識装置は、判定手段において、認識結果メモリの内容に基づいて、相似形文字の文字コード毎に大きさに基づくヒストグラムを作成し、該ヒストグラムの分割点をしきい値として大文字であるか小文字であるかの判定を行う。

0011

請求項2記載の本発明に従えば、文字認識装置は前記判定手段が特定の相似形文字に関してヒストグラムを作成できないとき、たとえば入力された相似形文字が1個以下である場合、または、しきい値を決定できないとき、たとえば相似形文字の大きさがかたよって入力された場合には、前記特定の相似形文字以外の相似形文字のしきい値に基づいて、大文字、小文字の判定を行う。

0012

請求項3記載の本発明に従えば、文字認識装置は前記判定手段は、予め定める数の相似形文字の認識結果に基づいてしきい値を決定した後は、該しきい値に基づいて残余の相似形文字の大文字、小文字を判定する。

0013

図1は、本発明の一実施例である文字認識装置16の構成を簡略化して示すブロック図である。入力部1は、スキャナなどの光電変換可能な入力装置である。制御部2は、文字認識装置16全体の制御を行う部分であり、制御部として独立している必要はない。表示部3は、入力された文字画像について行われた認識の結果を活字文字で表示する。認識部4は、後述の認識辞書15中の標準文字画像と、入力された文字画像から特徴抽出された文字画像とを照合し、その認識結果を後述の認識結果メモリ9に出力する。

0014

言語処理部5は、認識部4での結果を解析し、言語情報を生かし、文字認識精度を向上させるものである。言語処理部5は場合によっては不要であり、認識部4に包含されていても構わない。出力部6は、インターフェイスであり、フロッピィディスク、RS−232C、LAN(ローカルエリアネットワーク)などに情報を出力する。

0015

図2は、図1において示される制御部2の構成を簡略化して示すブロック図である。制御部2は、CPU(中央処理装置)もしくは専用LSI大規模集積回路)7、画像メモリ8、認識結果メモリ9、大文字小文字識別メモリ10から成る。CPU7および大文字小文字識別メモリ10によって、大文字小文字判定部11が構成される。画像メモリ8は、入力部1で得られた2値画像多値画像でもよい)を蓄積する。

0016

CPU7は、画像メモリ8にある画像から文字画像を切出し、切出した文字画像とその画像が位置する座標(X1,Y1),(X2,Y2)を認識部4に転送する。また、CPU7は、認識部4からの認識結果を受け取る。さらに、CPU7は、後述する方法で大文字、小文字の判定を行う。画像メモリ8は、CPU7が必要とする作業バッファを含んでいる。含まない場合には、CPU7に直結された作業バッファを必要とする。

0017

認識結果メモリ9は、認識部4から得られた認識結果、たとえば、文字コード、文字画像の位置、文字画像の縦横の大きさを順次蓄積するメモリである。大文字小文字識別メモリ10は、個々の文字画像のヒストグラム、頻度表を蓄積すると同時に、一部は作業バッファとして用いてもよい。

0018

文字切出し部12は、CPU7が画像メモリ8から1文字に対応する文字画像の切出しを行わない場合のみ必要とする。文字切出し部12が存在する場合、作業バッファ13への出力は、文字画像とその画像が位置する座標(X1,Y1),(X2,Y2)である。作業バッファ13は、画像メモリ8を用いてCPU7が処理を行い、得られる文字画像と座標とを蓄積するメモリであり、照合処理の作業バッファとして用いる。

0019

照合部14は、認識辞書15を参照して、予め定める認識論理に従って照合し、制御部2の認識結果メモリ9に文字画像に対応すると考えられる文字コードを類似度順に並べて、その先頭から複数個(1位からn位まで)分の、文字画像の位置、文字画像の縦横の大きさを送る。

0020

本実施例では、認識辞書15に大文字、小文字が相似である相似形文字に関しては小文字を入れないことによって、照合部14での処理を軽くしている。

0021

図3は、CPU7が切出した文字画像と座標軸との関係を示す図である。X軸およびY軸は、画像メモリ8に予め設定されており、各1文字に対してX軸、Y軸に対応する2辺が平行となるように、外接矩形を選ぶ。この外接矩形の、座標原点Oから最も近い点Pの座標(X1,Y1)と、座標原点Oから最も遠い点Qの座標(X2,Y2)とを、この文字画像の位置データとして認識結果メモリ9に格納する。

0022

図4は、文字認識装置16における文字認識の動作を示すフローチャートである。まず、ステップk1で入力部1において、スキャナなどの入力装置から画像データが入力され、制御部2の画像メモリ8に格納される。次のステップk2で、画像メモリ8内に文字画像データがあれば、ステップk3に移り、CPU7あるいは文字切出し部12は、前述の図3に示されるような外接矩形で1文字画像を切出すと同時に、その文字画像が原稿の何行、何列目に位置するかを画像メモリ8内に記憶する。

0023

ステップk4では、CPU7は画像メモリ8内の作業バッファ、あるいは作業バッファ13を用いて1文字分の画像データから文字としての特徴を抽出した文字画像データと、その文字画像の位置データ(X1,Y1),(X2,Y2)とを認識部4に出力する。ステップk5では、認識部4の照合部14は、作業バッファ13から送られてきた入力文字データと標準文字パターンとを照合し、標準文字パターンと対応した文字コードを、入力文字データとの類似度順に並べかえ、次のステップk6でその第1位から第n位までの複数個の文字コードを認識結果メモリ9に出力する。ただし、照合に使用する標準文字パターンは、相似形文字に関しては大文字のみ(あるいは小文字のみ)である。1文字分の認識処理が終了するとステップk2に戻り、画像メモリ8内の次の1文字画像データについて、ステップk2〜k6の処理を行う。

0024

ステップk2において、画像メモリ8に文字画像データがない場合は、次のステップk7に移る。ステップk7で認識結果メモリ9に認識結果データがあればステップk8に移り、データがなければ終了する。

0025

ステップk8で、CPU7は大文字小文字判定部11で使用する頻度表を作成し、この頻度表に基づいて、相似形文字の抽出文字画像の大きさのヒストグラムを作成する。次に、ステップk9において、CPU7は、前述のように作成されたヒストグラムから、大文字か小文字かを判定する基準となる分割点の文字画像の大きさ、すなわち、しきい値cを決定する。

0026

ステップk10で、CPU7はステップk9で得られた分割点の値cと、各文字画像の位置座標から計算された文字の大きさを照合し、大文字か小文字かを判定する。ステップk11では、CPU7は、小文字と判定されたステップk6の認識結果に関して、対応する文字コードを修正した後、認識結果を表示部3や出力部6から出力する。

0027

図5は大文字小文字判定部11で実行される頻度表作成の手順を示すフローチャートであり、図6図5のフローチャートに示す動作で作成される頻度表のデータの構成例を示す図である。まず、ステップm1で図6で示すテーブルの頻度欄および大きさ欄をクリアする。頻度表を作成する対象となるカテゴリは、大文字と小文字とが相似形である相似形文字、すなわち「あ、い、う、え、お、つ、や、ゆ、よ、わ、ア、イ、ウ、エ、オ、ツ、ヤ、ユ、ヨ、ワ、カ、ケ、C、O、S、V、W、X、Z」である。

0028

ステップm2で、認識結果メモリ9内に認識結果データがあるかをチェックする。認識結果メモリ9内にデータがない場合は、処理を終了する。ステップm3で、認識結果メモリ9から1文字ずつの認識結果、たとえば、文字コードおよび座標を読取る。ステップm4で、認識結果メモリ9から読取った文字コードが「あ、い、う、え、お、つ、や、ゆ、よ、わ、ア、イ、ウ、エ、オ、ツ、ヤ、ユ、ヨ、ワ、カ、ケ、C、O、S、V、W、X、Z」でない場合はステップm2に戻る。相似形文字である場合は、次のステップm5に移る。ステップm5では、対応する文字コードの頻度欄に1を加える。ステップm6では対応する大きさ欄の末尾に座標から引算で求まる縦横の大きさを書加え、ステップm2へ戻る。

0029

図7図6に示される頻度表のデータに基づいてヒストグラムを作成し、大文字・小文字判別の分割点を求める動作を示すフローチャートであり、図8図6に示される頻度表のデータをもとに作成されるヒストグラムである。まず、ステップn1で頻度表にデータがあるかどうかを判断し、データがない場合は、処理を終了する。データがある場合は次のステップn2に進み、図6の頻度表の1行分のデータを読む。ステップn3で、読んだ行の頻度が1以下の場合、ステップn1に戻り、次の行のデータを読む。ステップn3で読んだ行の頻度が1以上の場合、ステップn4でテーブルに記述されている大きさを用い、図8に示すような水平軸を大きさ、垂直軸個数としたヒストグラムを作成し、さらに、図8に示すような値a,bを求める。

0030

さらに、ステップn5では、c=(a+b)/2を満足する値cを決定する。この際、入力原稿画像横書きならば、横の大きさヒストグラムで値cを求める。縦書きならば、縦の大きさヒストグラムから値cを求めることとする。

0031

なお、頻度表の頻度が1以下で、ヒストグラムを作成できない場合や、大文字ばかりや小文字ばかりで値a,bが検出できない場合には、分割点の値をカテゴリ内の他の文字データに関して得られた分割点の値、あるいはそれらの平均値を分割点として用いる。

0032

分割点の値cが決定された後、認識結果メモリ9の内容を縦もしくは横の大きさと分割点の値cとを比べ、小文字の文字コードに変換する。値cより大きさが小さい場合、小文字となる。

0033

図9は、文字を含む原稿20が読取られ、一旦文字画像として記憶され、認識後、再び、原稿20と同様の形態で出力される様子を示す図である。図9(1)において、入力部1が読取る原稿20の一例を示す。スキャナなどの入力装置である入力部1は、原稿20の仮想線22で囲まれた領域の画像21を読取り、光電変換などによって画像メモリ8に2値画像として出力する。2値画像とは、入力信号振幅、すなわち光の強度や印刷濃度などのヒストグラムを求め、あるレベル、すなわちしきい値より振幅が大きいとき1に、小さいとき0として表す画像である。たとえば、ある点の濃度が1のとき黒、0のとき白にそれぞれ対応して表される。

0034

図9(2)は、画像メモリ8内に入力された2値画像21の一部を示す。画像メモリ8内では、2値画像21がX座標およびY座標に対応して記憶され、CPU4または文字切出し部12は、切出す文字の外接矩形23の位置を表す点Pおよび点Qの各座標(X1,Y1),(X2,Y2)とともに、この座標値から計算された1文字の縦横の大きさ、および切出す文字が何行何列目にあるかを認識結果メモリ9に出力する。

0035

図9(3)は、読込まれた原稿20が、文字認識装置16で認識処理された後、出力部6を経て記録紙32に印刷出力された一例を示す。文字認識装置16で認識処理された文字は、以下に示す図10(1)の認識結果メモリ8内の位置を表す行と列のデータ30に基づいて、配列される。

0036

図10は、認識結果メモリ9内に記憶されている各入力文字に関するデータを示す図である。

0037

図10(1)は、照合部14において認識辞書15との照合を受けた後、認識結果メモリ9内に格納された入力文字データを示す。認識結果メモリ9内には、各1文字分に対応する種々のデータが格納されている記憶領域のアドレス24、切出された文字画像が照合部14で認識辞書15との照合を受けた結果、類似度順に並べられ出力された第1文字コード25〜第n位文字コード26、図3および図9(2)に示される、切出された1文字画像の位置座標P(X1,Y1)27およびQ(X2,Y2)28、1文字画像の縦横の大きさ29、その文字が入力された入力画像21の何行何列目に位置するかを示す位置(行と列)30などのデータが各1文字に対応して記憶されている。

0038

図10(2)は、図10(1)の第1位文字コード25の部分を抜出した図である。認識結果として出力される第1位文字コードについて、図10(1)に示す文字コード25は、相似形文字の照合に関して大文字のみの標準パターンが使用されているので、小文字「ッ 」に対して大文字「ツ」の文字コード0536が与えられている。また、同様に、小文字「ィ 」に対して、大文字「イ」の文字コード0504が与えられている。

0039

図10(3)は、入力文字画像がヒストグラムから求められたしきい値に基づいて、大文字小文字判定部11で大文字か小文字かを判定された後、書直された文字コードのうち、第1位文字コード31を示す。

0040

図10(2)で、それぞれ大文字の文字コードを与えられていた「ッ 」、「ィ」は、それぞれ小文字のコード0535,0503に書直されている。

0041

このように認識辞書15には、標準パターンとして幾何学的に相似の関係にある大文字と小文字とを持つ相似形文字に関しては、大文字のみの標準パターンを記憶し、この相似形文字に関しては、文字認識に際して照合部14による大文字か小文字かの判定を行わない。これによって照合する標準パターンの数を減らすことができ、より高速に文字認識を行うことができる。また相似形文字に関しては、抽出文字画像の大きさに基づいて大文字か小文字かを判定するので、標準パターンとの照合では正確な認識がむずかしい相似形文字の認識精度を高めることができる。

発明の効果

0042

以上のように請求項1記載の本発明によれば、辞書メモリには標準文字画像として幾何学的に相似の関係にある大文字と小文字とを持つ相似形文字に関して大文字あるいは小文字のいずれか一方の標準文字画像を記憶し、相似形文字に関しては、文字認識に際して認識手段による大文字か小文字かの判定を行わない。標準文字画像は、相似形文字であるか否かに拘わらず、全抽出文字画像に対して照合が行われるので、標準文字画像の数を減少し、文字認識の高速化を図ることができる。また、相似形文字に関しては、別途、抽出文字画像の大きさを検出手段において検出し、ヒストグラムを作成して分割点を求め、この大きさをしきい値として大文字であるか小文字であるかを判定するので、従来、標準文字画像との照合では正確な認識が困難である該相似形文字の認識を、より正確に行うことができる。

0043

また、請求項2記載の本発明によれば、特定の相似形文字に関して、ヒストグラムを作成できないとき、またはヒストグラムに基づいてしきい値を決定できないときは、前記特定相似形文字以外の相似形文字のしきい値に基づいて、抽出文字画像が大文字か小文字かの判定を行うので、文字の誤認識発生頻度を低減することができる。

0044

また、請求項3記載の本発明によれば、予め定める数の相似形文字の認識結果に基づいてしきい値を決定した後は、該しきい値に基づいて残余の相似形文字の判定を行うので、ヒストグラム作成に要する時間を短縮でき、文字認識の高速化を図ることができる。

図面の簡単な説明

0045

図1本発明の一実施例である文字認識装置16の構成を簡略化して示すブロック図である。
図2図1に示される制御部2の構成を簡略化して示すブロック図である。
図3CPU7が切出した文字画像と座標軸との関係を示す図である。
図4文字認識装置16における文字認識の動作を示すフローチャートである。
図5大文字小文字判定部11で実行される頻度表作成の手順を示すフローチャートである。
図6図5のフローチャートに示す動作で作成される頻度表のデータの構成例を示す図である。
図7大文字・小文字判別の分割点cを求める手順を示すフローチャートである。
図8図6に示される頻度表のデータに基づいて作成されるヒストグラムである。
図9文字を含む原稿20が読取られ、一旦文字画像として記憶され、認識後、再び、原稿20と同様の形態で出力される様子を示す図である。
図10認識結果メモリ9内に記憶されている各入力文字に関するデータの一例を示す図である。

--

0046

1 入力部
2 制御部
4 認識部
7 CPU
8画像メモリ
9 認識結果メモリ
10大文字小文字識別メモリ
11 大文字小文字判定部
12文字切出し部
14 照合部
15認識辞書
16 文字認識装置

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ