図面 (/)

技術 特許文書中の単語または単語の組み合わせの例示装置、プログラム、及び方法

出願人 富士通株式会社
発明者 田中一成
出願日 2009年10月30日 (11年0ヶ月経過) 出願番号 2009-251505
公開日 2011年5月12日 (9年6ヶ月経過) 公開番号 2011-096149
状態 特許登録済
技術分野 検索装置 文書処理装置 機械翻訳 文書処理装置
主要キーワード 段落部分 例外ルール 近接関係 組み合わせ文字列 制約ルール 要約中 一致位置 可搬記録媒体駆動装置
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2011年5月12日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

特許文書中の単語または単語の組み合わせの理解を支援するための技術に関し、特許文書中に請求項で使っている単語または単語の組み合わせが想定している具体例がない場合であっても、請求項で使っている単語または単語の組み合わせが想定している具体例を提示可能とする。

解決手段

特許文書検索部102は、特許データベース101から指定された明細書のテキストデータを検索する。拒絶理由通知検索部104は、明細書に対して示された拒絶の理由を示す文書のテキストデータを検索する。言葉対抽出部106は、拒絶の理由を示す文書のテキストデータから、単語または単語の組み合わせの具体例を示す対象となる明細書の請求項に記載された単語または単語の組み合わせ文字列とその単語または単語の組み合わせに対比して示される単語または単語の組み合わせの文字列を抽出する。抽出された対となる単語または単語の組み合わせの組のデータは、表示部109にて対比して表示される。

概要

背景

特許文書たとえば請求項は特許の専門家以外でも、発明者が他社特許の侵害を回避するなどの目的で読む必要がある。
しかし、特許文書中の特許請求の範囲に記載される請求項などは一般に、単語又は単語の組合せで記述されることにより或る特定の意味を持つ言葉抽象的な言葉で書かれることが多く、特許文書に不慣れな発明者が、請求項に書かれている発明を具体的に理解するのは難しい。

従って、請求項で使っている言葉が想定している具体例を表示することで内容のイメージを容易にし、請求項を理解しやすいようにする支援技術が要請されている。
例えば、図1Aに示される特許文書中の請求項1の例では、下線部として示されるように、「コンテンツ情報」「個人意見の開示単位」「意見の対象」「個人の評価」という言葉が使われている。この場合に、これら言葉の具体例を示す言葉を提示することで、請求項が表す内容をイメージすることができ可読性を高めることができる。

請求項の言葉の理解を支援するための第1の従来技術として、シソーラス同義語辞書などからより具体的な言葉や関連語を表示する技術が知られている。
また、請求項の言葉の理解を支援するための第2の従来技術として、請求項と実施例又は発明を実施するための形態とをリンク付け等で対応付けることによって、請求項の解釈を支援する技術が知られている。(たとえば、特許文献1)
さらに、本文構造解析の結果から参照文献の参考理由を判断し、参照理由を含む参照関係の情報を出力するものもある。(たとえば、特許文献2)

概要

特許文書中の単語または単語の組み合わせの理解を支援するための技術に関し、特許文書中に請求項で使っている単語または単語の組み合わせが想定している具体例がない場合であっても、請求項で使っている単語または単語の組み合わせが想定している具体例を提示可能とする。 特許文書検索部102は、特許データベース101から指定された明細書のテキストデータを検索する。拒絶理由通知検索部104は、明細書に対して示された拒絶の理由を示す文書のテキストデータを検索する。言葉対抽出部106は、拒絶の理由を示す文書のテキストデータから、単語または単語の組み合わせの具体例を示す対象となる明細書の請求項に記載された単語または単語の組み合わせ文字列とその単語または単語の組み合わせに対比して示される単語または単語の組み合わせの文字列を抽出する。抽出された対となる単語または単語の組み合わせの組のデータは、表示部109にて対比して表示される。A

目的

本発明の課題では、特許文書中に請求項で使っている言葉が想定している具体例がない場合であっても、請求項で使っている言葉が想定している具体例を提示可能とすることである

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

特許文書中の単語または単語の組合せの理解を支援するための装置であって、前記特許文書に含まれる単語または単語の組み合わせの具体例を示す対象となる明細書を特定する情報を受け付ける受け付け部と、前記明細書に対して示された拒絶の理由を示す文書を記録した拒絶理由データベースから、前記単語または単語の組み合わせの具体例を示す対象となる明細書に対して示された、拒絶の理由を示す文書のテキストデータを、前記明細書を特定する情報に基づいて検索する拒絶理由を示す文書の検索部と、前記検索された拒絶の理由を示す文書のテキストデータから、あらかじめ記憶された対表現パターンと同じ対表現パターンの文字列を検出し、前記対表現パターンの文字列に基づいて、前記特許文書に記載された文字列と前記文字列に対比して示される文字列とをそれぞれ含む対となる文字列を検出し、前記対となる文字列から不要文字列を削除することにより、前記単語または単語の組み合わせの具体例を示す対象となる明細書のテキストデータに記載された単語または単語の組み合わせの文字列と、前記単語または単語の組み合わせに対比して示される単語または単語の組み合わせの文字列の対を抽出する抽出部と、前記抽出された対となる単語または単語の組み合わせの文字列の組を出力する出力部と、を具備することを特徴とする特許文書中の単語または単語の組み合わせの例示装置

請求項2

前記抽出部は、前記拒絶の理由を通知する文書に前記対表現パターンの文字列が存在した場合、本願特定パターン引用文特定パターンを検出し、これらのパターンの前または後から前記対となる文字列を特定し、あるいは、文字列パターン「には」に続いて、第1の文字列、文字列パターン「に相当する」、第2の文字列の順に文字列が存在する場合には、前記第1の文字列と前記第2の文字列を前記対となる文字列パターンとして抽出する、ことを特徴とする請求項1に記載の特許文書中の単語または単語の組み合わせの例示装置。

請求項3

前記不要文字列を削除する処理は、品詞と文字列を要素とする形態素辞書と、品詞の接続確率を定義したテーブルを用いて、最も確率が高い形態素列を選択する形態素解析処理と、文節接続ルールによって形態素を接続して文節を生成する文節分離処理と、文節の接続確率と制約ルールによって、最も確率が高い係り受け先を選択する係り受け解析処理とからなる、ことを特徴とする請求項1に記載の特許文書中の単語または単語の組み合わせの例示装置。

請求項4

前記拒絶の理由を示す文書の記載において引用されている引用文献の明細書のテキストデータと拒絶の対象とされている明細書のテキストデータとにおいて、前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせに対応する文字列データの該各明細書のテキストデータ内での出現位置を特定することにより、該対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせのどちらが具体例を示す単語または単語の組み合わせであるかを判定する具体例判定部を更に含む、ことを特徴とする請求項1に記載の特許文書中の単語または単語の組み合わせの例示装置。

請求項5

特許文書中の単語または単語の組み合わせの理解を支援するための装置であって、前記特許文書に含まれる単語または単語の組み合わせの具体例を示す対象となる明細書のテキストデータを、前記明細書を蓄積したデータベースから順次入力する入力部と、前記明細書に対して示された拒絶の理由を示す文書を記録した拒絶理由データベースから、前記単語または単語の組み合わせの具体例を示す対象となる明細書に対して示された、拒絶の理由を示す文書のテキストデータを、前記明細書を特定する情報に基づいて検索する拒絶理由を示す文書の検索部と、前記検索された拒絶の理由を示す文書のテキストデータから、あらかじめ記憶された対表現パターンと同じ対表現パターンの文字列を検出し、前記対表現パターンの文字列に基づいて、前記特許文書に記載された文字列と前記文字列に対比して示される文字列とをそれぞれ含む対となる文字列を検出し、前記対となる文字列から不要文字列を削除することにより、前記単語または単語の組み合わせの具体例を示す対象となる明細書のテキストデータに記載された単語または単語の組み合わせの文字列と前記単語または単語の組み合わせに対比して示される単語または単語の組み合わせの文字列の対を抽出する抽出部と、前記抽出された対となる単語または単語の組み合わせの文字列の組を蓄積する言葉対データベースと、を含むことを特徴とする特許文書中の単語または単語の組み合わせの例示装置。

請求項6

特許文書中の単語または単語の組み合わせの理解を支援するための装置に、前記特許文書に含まれる単語または単語の組み合わせの具体例を示す対象となる明細書を特定する情報を受け付け、前記明細書に対して示された拒絶の理由を示す文書を記録した拒絶理由データベースから、前記単語または単語の組み合わせの具体例を示す対象となる明細書に対して示された、拒絶の理由を示す文書のテキストデータを、前記明細書を特定する情報に基づいて検索し、前記検索された拒絶の理由を示す文書のテキストデータから、あらかじめ記憶された対表現パターンと同じ対表現パターンの文字列を検出し、前記対表現パターンの文字列に基づいて、前記特許文書に記載された文字列と前記文字列に対比して示される文字列とをそれぞれ含む対となる文字列を検出し、前記対となる文字列から不要文字列を削除することにより、前記単語または単語の組み合わせの具体例を示す対象となる明細書のテキストデータに記載された単語または単語の組み合わせの文字列と、前記単語または単語の組み合わせに対比して示される単語または単語の組み合わせの文字列の対を抽出し、前記抽出された対となる単語または単語の組み合わせの文字列の組を出力する、機能を実行させるためのプログラム

請求項7

コンピュータが特許文書中の単語または単語の組み合わせの理解を支援するための方法であって、前記特許文書に含まれる単語または単語の組み合わせの具体例を示す対象となる明細書を特定する情報を受け付け、前記明細書に対して示された拒絶の理由を示す文書を記録した拒絶理由データベースから、前記単語または単語の組み合わせの具体例を示す対象となる明細書に対して示された、拒絶の理由を示す文書のテキストデータを、前記明細書を特定する情報に基づいて検索し、前記検索された拒絶の理由を示す文書のテキストデータから、あらかじめ記憶された対表現パターンと同じ対表現パターンの文字列を検出し、前記対表現パターンの文字列に基づいて、前記特許文書に記載された文字列と前記文字列に対比して示される文字列とをそれぞれ含む対となる文字列を検出し、前記対となる文字列から不要文字列を削除することにより、前記単語または単語の組み合わせの具体例を示す対象となる明細書のテキストデータに記載された単語または単語の組み合わせの文字列と、前記単語または単語の組み合わせに対比して示される単語または単語の組み合わせの文字列の対を抽出し、前記抽出された対となる単語または単語の組み合わせの文字列の組を出力する、ことを前記コンピュータが実行をすることを特徴とする特許文書中の単語または単語の組み合わせの例示方法

技術分野

0001

特許文書たとえば請求項中の言葉の理解を支援するための技術に関する。

背景技術

0002

特許文書たとえば請求項は特許の専門家以外でも、発明者が他社特許の侵害を回避するなどの目的で読む必要がある。
しかし、特許文書中の特許請求の範囲に記載される請求項などは一般に、単語又は単語の組合せで記述されることにより或る特定の意味を持つ言葉が抽象的な言葉で書かれることが多く、特許文書に不慣れな発明者が、請求項に書かれている発明を具体的に理解するのは難しい。

0003

従って、請求項で使っている言葉が想定している具体例を表示することで内容のイメージを容易にし、請求項を理解しやすいようにする支援技術が要請されている。
例えば、図1Aに示される特許文書中の請求項1の例では、下線部として示されるように、「コンテンツ情報」「個人意見の開示単位」「意見の対象」「個人の評価」という言葉が使われている。この場合に、これら言葉の具体例を示す言葉を提示することで、請求項が表す内容をイメージすることができ可読性を高めることができる。

0004

請求項の言葉の理解を支援するための第1の従来技術として、シソーラス同義語辞書などからより具体的な言葉や関連語を表示する技術が知られている。
また、請求項の言葉の理解を支援するための第2の従来技術として、請求項と実施例又は発明を実施するための形態とをリンク付け等で対応付けることによって、請求項の解釈を支援する技術が知られている。(たとえば、特許文献1)
さらに、本文構造解析の結果から参照文献の参考理由を判断し、参照理由を含む参照関係の情報を出力するものもある。(たとえば、特許文献2)

先行技術

0005

特開2002−149704号公報
特開2000−357170号公報

発明が解決しようとする課題

0006

しかし、前述した第1の従来技術では、請求項に書かれている言葉は、抽象的で、分野などにより解釈が異なることもある。このため、一般的なシソーラスの下位語では、発明者が意図した例になっているとは限らないという問題点を有していた。

0007

また、前述した第2の従来技術では、1件の特許の中に明示的な例が書かれていない場合には、請求項の解釈を効果的に支援することはできないという問題点を有していた。例えば、図1Bに示される例では、請求項1において、「個人の評価」という言葉が使われている。しかし、発明の詳細な説明の部分である[発明の開示]を見ても、「個人の評価(例えば良い評価又は悪い評価)」という程度の記述しかない。このため、このような例では、具体的なイメージを掴みづらい。

0008

更に、たとえ発明の詳細な説明の中に請求項中の言葉の具体例が書いてあったとしても、請求項の各項に対応する実施例又は発明を実施するための形態までは特定できるが、具体例の書き方は様々である。このため、前述した第2の従来技術では、機械的に言葉と言葉の関係などの細かい対応付けまでを行うのは難しいという問題点を有していた。

0009

そこで、本発明の課題では、特許文書中に請求項で使っている言葉が想定している具体例がない場合であっても、請求項で使っている言葉が想定している具体例を提示可能とすることである。

課題を解決するための手段

0010

本発明の一つの態様の特許文書中の言葉(単語または単語の組み合わせ)の例示装置によれば、特許文書中の言葉の理解を支援するための装置において、特許文書に含まれる言葉の具体例を示す対象となる明細書を特定する情報を受け付ける受け付け部と、明細書に対して示された拒絶の理由を示す文書を記録した拒絶理由データベースから、言葉の具体例を示す対象となる明細書に対して示された、拒絶の理由を示す文書のテキストデータを、明細書を特定する情報に基づいて検索する拒絶理由を示す文書の検索部と、検索された拒絶の理由を示す文書のテキストデータから、あらかじめ記憶された対表現パターンと同じ対表現パターンの文字列を検出し、対表現パターンの文字列に基づいて、特許文書に記載された文字列とその文字列に対比して示される文字列とをそれぞれ含む対となる文字列を検出し、その対となる文字列から不要文字列を削除することにより、言葉の具体例を示す対象となる明細書のテキストデータに記載された言葉の文字列と、その言葉に対比して示される具体例の文字列の対を抽出する抽出部と、抽出された対となる言葉の文字列の組を出力する出力部とを具備する。

発明の効果

0011

対象特許の明細書が明確に例を示していない場合も、その特許の内容を深く理解していると思われる審査官の解釈を利用することで、特許文書たとえば請求項中の言葉が具体的に何を表しているかを知ることが可能となる。この結果、特許文書たとえば請求項の記述方法馴染みの無い利用者であっても特許文書たとえば請求項を理解することを支援することができる。

図面の簡単な説明

0012

請求項の記述例を示す図である。
従来技術の問題点の説明図である。
第1の実施形態の構成図である。
第1の実施形態の説明図である。
拒絶理由通知パターンを示す図である。
第1の実施形態のフローチャートである。
図4のステップS403の説明図である。
図4のステップS404(言葉の対を抽出する処理)の詳細フローチャートである。
表現パターン辞書の例を示す図である。
図3(a)の例1に対応する第1の実施形態の動作説明図である。
図3(b)の例2に対応する第1の実施形態の動作説明図である。
図3(c)の例3に対応する第1の実施形態の動作説明図である。
図3(d)の例4(例外ルール)に対応する第1の実施形態の動作説明図である。
表示部の表示例を示す図である。
特許データベース101の例を示す図である。
拒絶理由データベース105の例を示す図である。
パターンマッチング処理の具体的な動作を示す詳細フローチャートである。
係り受け解析による不要文字削除処理を示すフローチャートである。
係り受け解析処理の説明図である。
第2の実施形態の構成図である。
第2の実施形態のフローチャートである。
図15のステップS1501(どちらが具体例かを判定する処理)の詳細フローチャート(その1)である。
図16のステップS1601(方法1の処理)の詳細フローチャートである。
方法1における言葉対テーブルの内容例を示す図である。
図16のステップS1603(方法2の処理)の詳細フローチャートである。
方法2における言葉対テーブルの内容例を示す図である。
図15のステップS1501(どちらが具体例かを判定する処理)の詳細フローチャート(その2)である。
図21のステップS2103の処理(請求項と実施例等の対応関係を解析する処理)の詳細フローチャートである。
言葉対データベースの例を示す図である。
第3の実施形態の構成図(その1)である。
第3の実施形態の構成図(その2)である。
第3の実施形態のフローチャート(その1)である。
第3の実施形態のフローチャート(その2)である。
実施形態のシステムを実現するハードウェアの構成図である。

実施例

0013

以下、本発明を実施するための形態について図面を参照しながら詳細に説明する。
図2Aは、特許文書中の言葉(単語または単語の組み合わせ)の例示装置の第1の実施形態の構成図である。第1の実施形態のシステムは、特許データベース101、特許文書検索部102、出願番号抽出部103、拒絶理由通知検索部104、拒絶理由データベース105、言葉対抽出部106、表現パターン辞書107、具体例付加対象特定部108、及び表示部109を備える。

0014

図2Bは、第1の実施形態の基本動作説明図である。
第1の実施形態では、特許データベース101(図1)から検索される特許文書に対して、審査官が拒絶理由通知等の拒絶の理由を示す文書で書いている言葉の対応関係を利用して、他の特許で書かれている具体例が抽出される。例えば、特許文書に対応する図2Bに示される公報データ201に対する拒絶理由202を説明する。公報データ201に対応する拒絶理由202は、公報データ201中の「出願番号」項目に記載されている出願番号によって拒絶理由データベース105(図2A)を検索することで、得ることができる。拒絶理由202に書かれている『引用文献2に記載の「中傷や風説」が請求項1に係る発明の「個人の評価」に相当し、』といった表現を利用して、「個人の評価」の具体例は、「中傷や風説」であるという情報が得られる。この結果、図2Bの203として示されるような表示がなされる。

0015

ここで、「言葉」とは、単語または単語の組合せを指し、この単語または単語の組み合わせは複合語、係り受け語、複数文節の組合せ等を含む。
ここで、拒絶理由通知等の拒絶の理由を示す文書は審査官が書いているため公報に比べれば形が整っており、比較的扱いやすいが、それでも様々なバリエーションがあり、単純なパターンでは対応する言葉の対を抽出することができない。拒絶理由通知等の記述パターンとしては、例えば、図3(a)〜(d)の例1、例2、例3、例4に示されるような、4つの書くパターン(書き方)がある。

0016

図3(a)の例1は、引用文献の言葉「ネットワークトポロジ」に括弧書きで対応することを示す「相当」の前に本願の言葉「通信状態情報」を書くパターンである。
図3(b)の例2は、対応することを示す「相当」の前に引用文献の言葉「掲示板」、本願の言葉「コンテンツ」の順に対応する言葉を書くパターンである。

0017

図3(c)の例3は、引用文献の言葉「クライアント計算機、A書店コンビニエンスチェーン」をまとめて書く。そして、それに対応する本願の言葉「第1の情報処理装置、第3の情報処理装置、第2の情報処理装置」を対応する順に書き、対応することを示す「相当」を本願の言葉の後に書くパターンである。

0018

図3(d)の例4は、本願の言葉「メタレベルタスク」が先に書かれ、対応することをと示す「相当する」の後に、引用文献の言葉「移動の指示」を書くパターンである。
上記例1から例4において、本願の言葉、引用文献の言葉、相当はそれぞれワークメモリ内文字列データ(以下単に「文字列」と記述する)として格納され、文字列の各格納位置として書くパターンすなわち記述パターンが決定される。なお、例1から例3は、いずれも引用文献の言葉が本願の言葉より先に現れるが、例4では本願の言葉が引用文献の言葉より先に出現する書き方の例外パターンである。すなわち、その書くパターンのテキストデータがワークメモリ展開されて、逐次走査される場合、例1ないし例3では文字列位置からみて引用文献に続いて本願の順にスキャンされ、例4では本願に続いて引用文献の順にスキャンされる。

0019

図4は、図2Aに示される構成を有する特許文書中の単語または単語の組み合わせの例示装置の第1の実施形態の制御動作を示す動作フローチャートである。この動作フローチャートにおける各処理は、例えばCPU(中央演算処理装置)とメモリ外部記憶装置を搭載したコンピュータシステムによって実行される。

0020

まず、特許データベース101(図2A)が検索されることにより、利用者によって指定された特許文書(以下これを「表示特許」と呼ぶ)のファイルが検索される(ステップS401)。この処理は、図2Aの特許文書検索部102の機能を実現する。特許データベース101は、記憶装置上に記憶されている。図12Aは、特許データベース101のデータ構成例を示す図である。図12Aに示すように、特許データベース101に登録される各特許文書のレコードデータは、出願番号、公開番号に続いて、要約インデックス、請求項インデックス、実施例イデックス、発明の名称データ、及び特許文書の本文の各フィールドから構成される。なお、実施例のインデックスは、発明を実施するための形態のインデックスであってもよい。利用者は、出願番号、公開番号、要約中の言葉、請求項中の言葉、実施例中の言葉、発明の名称に含まれる言葉等のキーワードデータによって、特許文書のファイルのメモリワーク領域に展開した特許データベースを検索することができる。出願番号が検索指定された場合には、特許データベース101中の出願番号フィールドに検索指定された出願番号の文字列と一致するレコードがあるか否かが検索される。公開番号が検索指定された場合には、特許データベース101中の公開番号フィールドに検索指定された公開番号の文字列と一致するレコードがあるか否かが検索される。要約、請求項、実施例、又は発明の名称に含まれる言葉が検索指定された場合には、特許データベース101中の要約、請求項、実施例のインデックスフィールド、又は発明の名称フィールド内に検索指定された言葉の文字列が登録されているか否かが検索される。この結果、検索されたレコードの本文フィールドに登録されているテキストデータが抽出される。

0021

次に、拒絶理由通知等を検索するために、ステップS401で検索された特許文書から出願番号を示す文字列が抽出される(ステップS402)。具体的には、ステップS401にて検出が行われたレコードの出願番号フィールドに登録されている文字列が抽出される。この処理は、図1の出願番号抽出部103の機能を実現する。

0022

次に、ステップS401で検索された特許文書である表示特許に関して、拒絶理由データベース105(図1)が検索される。拒絶理由データベース105は、例えば後述する図27の外部記憶装置3005等の記憶装置のファイルに記憶されている。具体的には、表示特許についての拒絶理由通知等及び、表示特許を引用している拒絶理由通知のファイルがワークメモリに展開されたものが検索される(図4のステップS403)。図12Bは、拒絶理由データベース105のデータ構成例を示す図である。図12Bに示すように拒絶理由データベース105に登録される各拒絶理由通知等のレコードは、引用元出願番号、引用先情報、及び拒絶理由通知等の本文の各フィールドから構成される。表示特許についての拒絶理由通知等が検索される場合には、ステップS402で抽出された出願番号が、拒絶理由データベース105の引用元出願番号フィールドの登録内容と一致するレコードが検索される。表示特許を引用している拒絶理由通知等が検索される場合には、ステップS402で抽出された出願番号が、拒絶理由データベース105の引用先情報フィールドに含まれるレコードが検索される。この結果、検索されたレコードの本文フィールドに登録されているテキストデータが抽出される。この処理は、図2Aの拒絶理由通知検索部104の機能を実現する。ここで拒絶理由データベースには、拒絶理由通知のほか、拒絶の理由を示す文書、例えば拒絶査定、審決、審査前置報告等が含まれる。以下の説明では、これらを合わせた「拒絶の理由を示す文章」を「拒絶理由通知等」と呼ぶことにする。

0023

次に、ステップS403で検索された拒絶理由通知等とステップS401で得られている表示特許(特許文書)とから、後述する図5Bの動作フローチャートで示される制御動作に従って、言葉の対のデータが抽出される(ステップS404)。この処理は、図2Aの言葉対抽出部106の機能を実現する。

0024

次に、ステップS404で言葉の対のデータが抽出できたか否かが判定される(ステップS405)。
ステップS405の判定がYESならば、ステップS401で得られている表示特許中の特許請求の範囲における請求項の文字列において、具体例が付加される対象となる言葉の文字列が特定される(ステップS406)。即ち、ステップS404の言葉の対の抽出処理によって得られる各言葉の対の文字列に含まれる各抽象的な言葉の文字列と対となる言葉の各文字列が、請求項の文字列上で特定される。この処理は、図2Aの具体例付加対象特定部108の機能を実現する。

0025

そして、ステップS406で特定された請求項中の各具体例付加対象の言葉とそれぞれに対応する具体例とが対比されて、利用者のコンピュータディスプレイに表示される(ステップS407)。または、具体例付加対象にリンクを設定しておき、利用者にクリックされた時に具体例を表示するようにしてもいい。この処理は、図2Aの表示部109の機能を実現する。ただし、ここで述べた具体例は、請求項中の各具体例付加対象の言葉と対応する言葉の例示であり、最終的に言葉が具体例か否かの判断は第2の実施例を参照して後述する。

0026

前述のステップS404で言葉の対のデータが抽出できずステップS405の判定がNOならば、言葉の対の表示は行われず、利用者によって指定された現在の表示特許に対する請求項中の言葉の例示処理を終了する。

0027

上述のように、ステップS403において、表示特許についての拒絶理由通知及び表示特許を引用している拒絶理由通知の2種類の拒絶理由通知等が検索されるのは、以下の理由による。即ち、表示特許についての拒絶理由通知等では、図5A(a)に示されるように、例えば『引用文献1の「中傷や風説」が請求項1の「個人の評価」に相当』という記述形式において、「請求項1」が表示特許(ステップS401で検索された特許文書)の請求項1を指している。一方、表示特許を引用している拒絶理由通知等では、図5(b)に示されるように、例えば『引用文献2の「個人の評価」が請求項2の「中傷や風説」に相当』という記述形式において、「引用文献2」が表示特許(ステップS401で検索された特許文書)を指している。

0028

そして、どちらの記述形式でも、「中傷や風説」という具体的な言葉と「個人の評価」という抽象的な言葉は、引用文献特定パターン「引用文献」及び本願特定パターン「請求項」で区切られた部分から抽出されている。ここでいう「本願」とは、拒絶理由通知等でいう「本願」の意味である。

0029

しかし、図5A(a)の記述形式では、「請求項1」を含む表示特許に関する拒絶理由通知等が「引用文献1」を引用する場合である。そして、本願特定パターンである「請求項1」から後の部分に含まれる言葉「個人の評価」が、表示特許中に含まれる抽象的な言葉である。また、本願特定パターンである「請求項1」から前の部分に含まれる言葉「中傷や風説」が、具体的な言葉即ち具体例である。

0030

一方、図5A(b)の記述形式では、逆に、「請求項2」を含む他の特許に関する拒絶理由通知等が、表示特許である「引用文献2」を引用する場合である。そして、本願特定パターンである「請求項2」から後の部分に含まれる言葉「中傷や風説」が、具体的な言葉即ち具体例である。また、本願特定パターンである「請求項2」から前の部分に含まれる言葉「個人の評価」が、表示特許中に含まれる抽象的な言葉である。

0031

このように、表示特許についての拒絶理由通知等(図5A(a))と、表示特許を引用している拒絶理由通知等(図5A(b))の何れにおいても、拒絶理由通知等に含まれる引用文献特定パターンと本願特定パターンに基づいて、次の処理へ言葉の対が抽出される。

0032

しかし、表示特許についての拒絶理由通知等(図5A(a))と、表示特許を引用している拒絶理由通知等(図5A(b))とでは、表示特許の中の抽象的な言葉と拒絶理由通知等の中の具体的な言葉をそれぞれ抽出する部分の位置関係が逆になっている。

0033

以上のように、表示特許についての拒絶理由通知等(図5A(a))と、表示特許を引用している拒絶理由通知等(図5A(b))の何れからでも、表示特許中の抽象的な言葉と拒絶理由通知等中の具体的な言葉の対応関係すなわち言葉の対を抽出できる。このため、ステップS403では、拒絶理由データベース105(図2A)から図5A(a)及び図5A(b)の両方の拒絶理由通知等が検索される。

0034

次に第1の実施形態における言葉の対を抽出するステップS404における言葉の対の抽出処理の概略の手順を述べる。以下の手順1、2、3−1又は3−2に基づくコンピュータによるパターンマッチング処理と位置検索処理と不要文字削除処理により、上述の例1から例4までのパターンがそれぞれ判別されながら、本願についての記述部分と引用文献の記述部分が判別、分割されて、請求項で使っている言葉と引用文献中の具体例の言葉の対が抽出される。

0035

手順1:
利用者から指定された特許文書ファイルに対応して検索された拒絶の理由を示す文書(文字列)から、「相当」などの対表現パターン文字列が存在する1文を複数の文字パターンのパターンマッチング処理により抽出する。ここで対表現パターンとは、「相当」のように、その前の言葉と後の言葉が意味的に同じあるいは対となっていることを示す文字列であって、あらかじめ決められたものが辞書に格納されている。一文とは、例えば句点の次の文字から始まり、次の句点までの文字列である。対表現パターンについてはそのテーブルのデータ構成を図6を参照して後述する。

0036

手順2:
手順1で抽出された1文が、本願の言葉が先に書かれ対表現パターン文字列「相当」の後に引用文献の言葉を書く書き方を有するか(例外ルール→図3(d)の例4)、否か(通常処理図3(a)の例1、図3(b)の例2、図3(c)の例3)を判別する。

0037

手順3−1:(通常処理→図3(a)の例1、図3(b)の例2、図3(c)の例3):
引用文献特定パターン例えば「引用文献」と本願特定パターン例えば「本願」によって、手順1で抽出された1文の記述部分を分割する。

0038

本願特定パターンの前を「引用文献の言葉」文字列として抽出し、本願特定パターンの後を「本願の言葉」文字列として抽出する。
抽出部分の文字列において、不要文字列を削除する。

0039

本願特定パターン、引用文献特定パターン、不要文字列については、そのテーブルのデータ構成を図6を参照して後述する。

0040

手順3—2:(例外ルール→図3(d)の例4):
対表現パターン文字列、例えば「相当」の文字列によって、手順1で抽出された1文文字列の記述部分を分割する。即ち、上記対表現パターン文字列の文字列の後を「引用文献の言葉」文字列として抽出し、対表現パターン文字列の前を「本願の言葉」文字列として抽出する。
各抽出部分のデータにおいて、不要文字列を削除する。

0041

次に、図4のステップS404における言葉の対の抽出処理(図2Aの言葉対抽出部106の機能)の詳細について、図5Bに示される動作フローチャートに従って説明する。この動作フローチャートにおける各処理は、例えばCPUとメモリと外部記憶装置を搭載したコンピュータシステムによって実行される。

0042

図4のステップS403で前述したように、表示特許のテキストデータとそれに対応する拒絶理由文書のテキストデータから言葉の対のデータが抽出される場合には、引用文献特定パターンと本願特定パターンとが判定されながら、抽出処理が実行される。そして、図3の(a)から(d)で示される例1から例4までのパターンが前述した手順1、2、3−1又は3−2に基づくパターンマッチング処理、位置検出処理により判別されながら、本願についての記述部分と引用文献の記述部分が判別、分割される。以下、図3の(a)から(d)で示される例1から例4までのパターンを例示しながら、図5Bの動作フローチャートの処理を説明する。

0043

まず、拒絶理由通知等のテキストデータにおいて、対表現パターン文字列、例えば「相当」の文字列が存在するか否かがパターンマッチング処理によって判定される(ステップS501)。ステップS501の具体的処理としては、拒絶理由データベースの先頭から1文字ずつ読み込まれながら、対表現パターン文字列のマッチングを検索するパターンマッチング処理が実行される。今、図2Aの表現パターン辞書107内には、例えば図6(a)に例示されるような対表現パターンテーブルが記憶されている。この対表現パターンテーブルには、拒絶理由通知等における本願特許中の言葉と引用文献中の言葉とを対として結びつける「相当」「対応」「等価」「等しい」等の対表現パターンが登録されている。ステップS501では、拒絶理由通知等のファイルにおいて、対表現パターンテーブルに登録されている例えば「相当」等の文字列が存在するか否かが判定される。なお、表現パターン辞書107は、例えば後述する図27の外部記憶装置3005等の記憶装置に記憶されている。

0044

対表現パターン文字列のデータがなくステップS501の判定がNOならば、言葉の対のデータの抽出は行われず図5Bの動作フローチャートの処理を終了する。
ステップS501の判定がYESならばまず、上述した手順1として、拒絶理由通知のテキストデータにおいて、例えば「相当」という対表現パターン文字列が存在する1文の文字列が抽出されて文字列Yとされる(ステップS502)。この文字列Yは、ワークメモリ(例えば後述する図27のメモリ3002に対応する)上に保持される。例えば、前述した図3(a)に示される例1の記述パターンでは、図7(a)に示される1文が抽出される。また、図3(b)に示される例2の記述パターンでは、図8(a)に示される1文のデータが抽出される。また、図3(c)に示される例1の記述パターンでは、図9(a)に示される1文のデータが抽出される。更に、図3(d)に示される例4の例外記述パターンでは、図10(a)に示される1文のデータが抽出される。

0045

次に、上述の手順2として、文字列Yにおいて、文字列パターン「には」に続いて、本願の言葉が第1の文字列として先に書かれ、対表現パターン文字列「相当する」の文字列の後に、引用文献の言葉が第2の文字列として書かれる記述パターンがあるか否かが判定される(ステップS503)。これは、前述した図3(d)の例4に対応する例外ルールパターンであるか否かを判定する処理である。具体的には、ステップS502は、ワークメモリ上の文字列Yがスキャンされながら、例えば「×××には・・・に相当する〜」という記述パターンがあるか否かを判定する処理である。更に具体的には、まず、ワークメモリ上の文字列Yの先頭から1文字ずつ読み込まれながら、パターンマッチングにより、パターン「には」がまず検索される。そして、そのパターンがマッチしたら、文字列Yの「には」以降でパターン「に相当する」が検索される。例えば図3(a)、(b)、又は(c)に示される例1、例2、例3の記述パターンでは、ステップS503の判定はNOとなる。また、図3(d)に示される例4の例外記述パターンでは、ステップS503の判定はYESとなる。

0046

上述の記述パターンがなくステップS503の判定がNOの場合には、手順3−1に対応するデータ処理としてとして、ステップS504からS512の一連の処理が実行される。

0047

まず、文字列Yに引用文献特定パターンがあるか否かが判定される(ステップS504)。ここで、前述した図2Aの表現パターン辞書107には、例えば図6(b)に例示される引用文献特定パターンテーブルが記憶されている。ステップS504では、ワークメモリ上の文字列Yがスキャンされながら、表現パターン辞書107内の図6(b)に例示される引用文献特定パターンテーブルに登録されている引用文献特定パターンの文字列が含まれるか否かが判定される。具体的には、文字列Yの先頭から1文字ずつ読み込まれながら、パターンマッチングにより引用文献特定パターンテーブル中の各引用文献特定パターンを各検索パターンとする各パターンマッチング処理が実行される。ここで、文字列Yから引用文献特定パターンが検出される毎に、その引用文献特定パターンの末尾以降の文字列Yの領域で更に引用文献特定パターンを検出するパターンマッチング処理が繰り返し実行される。これにより、図3(b)に示されるように、文字列Y中に含まれる複数の引用文献特定パターンを検出できる。

0048

文字列Yに引用文献特定パターンが含まれずステップS504の判定がNOならば、図5Bの動作フローチャートの処理を終了する。
ステップS504の判定がYESならば、ワークメモリ上の文字列Yが記憶アドレス逆順にスキャンされながら、以下のパターンマッチング処理が実行される。即ち、最も後ろに出現する検索された引用文献特定パターンの後ろから「相当」等の対表現パターン文字列又は「相当」等の対表現パターン文字列がない場合は文字列Yの末尾までが、文字列Zとして抽出される。この文字列Zも、ワークメモリ上に保持される。そして、ワークメモリ上の文字列Yがスキャンされながら、ワークメモリ上の文字列Zに一致する文字列と上述の検索された引用文献特定パターンに一致する文字列が削除される。その結果、新たな文字列Yがワークメモリ上に得られる(ステップS505)。例えば、図3(a)に示される例1の記述パターンでは「引用文献2には、アドホックネットワークにおいて調停端末がネットワークトポロジ(本願の「通信状態情報」に相当)の変化を検知し、 ...」(図7(a))から、図7(b)に示される部分「2には、アドホックネットワークにおいて調停端末がネットワークトポロジ(本願の「通信状態情報」に相当」が文字列Zとして抽出される。また、新たな文字列Yは「)の変化を検知し、・・・」となる。図3(b)に示される例2の記述パターンでは、図8(b)に示される部分が文字列Zとして抽出される。また、新たな文字列Yは「...引用文献1に記載の「掲示板」が請求項1に係る発明の「コンテンツ情報」に相当し、引用文献1に記載の「記事」が請求項1に係る発明の「個人の意見の開示単位」に相当し、する。」となる。図3(c)に示される例3の記述パターンでは、図9(b)に示される部分が文字列Zとして抽出される。また、新たな文字列Yは「...する。」となる。

0049

次に、ワークメモリ上の文字列Zに本願特定パターンがあるか否かが判定される(ステップS506)。ここで、前述した図6の表現パターン辞書107には、例えば図6(c)に例示される本願特定パターンテーブルが記憶されている。ステップS506では、ワークメモリ上の文字列Zがスキャンされながら、表現パターン辞書107内の図6(c)に例示される本願特定パターンテーブルに登録されている本願特定パターンの文字列が含まれるか否かが判定される。具体的には、文字列Zの先頭から1文字ずつ読み込まれながら、パターンマッチング処理により、本願特定パターンテーブルに登録されている各本願特定パターンの文字列を各検索パターンとする各パターンマッチング処理が実行される。例えば図3(a)に示される例1の記述パターンでは、図7(b)に示される文字列Zに「本願」という本願特定パターンが含まれるため、ステップS506の判定はYESとなる。図3(b)に示される例2の記述パターンでは、図7(b)に示される文字列Zに「請求項」という本願特定パターンが含まれるため、ステップS506の判定はYESとなる。図3(c)に示される例2の記述パターンでは、図9(b)に示される文字列Zに「本願請求項」という本願特定パターンが含まれるため、ステップS506の判定はYESとなる。

0050

文字列Zに本願特定パターンがなくステップS506の判定がNOならば、その文字列Zからは言葉の対の文字列は抽出されず、残りの文字列Yに対して、ステップS504からS506までの処理が繰り返される。

0051

ステップS506の判定がYESならば、ワークメモリ上の文字列Zにおいて、検索された本願特定パターンに対応する文字列の前の文字列部分が、文字列αとして抽出される(ステップS507)。文字列αは、ワークメモリ上に記憶される。この文字列αは、引用文献の言葉に対応する。例えば図3(a)に示される例1の記述パターンでは、図7(b)の文字列Zから、本願特定パターン「本願」の前の部分「2には、アドホックネットワークにおいて調停端末がネットワークトポロジ(」が、文字列α即ち引用文献の言葉として抽出される。即ち、図7(c)の如くである。図3(b)に示される例2の記述パターンでは、図8(b)の文字列Zから、本願特定パターン「請求項」の前の部分「1に記載の「悪口」が」が、文字列α即ち引用文献の言葉として抽出される。即ち、図8(c)の如くである。図3(c)に示される例3の記述パターンでは、図9(b)の文字列Zから、本願特定パターン「本請求項」の前の部分「1のクライアント計算機、A書店、コンビニエンスチェーンが各々」が、文字列α即ち引用文献の言葉として抽出される。即ち、図9(c)の如くである。

0052

続いて、ワークメモリ上の文字列Zにおいて、本願特定パターンに対応する文字列の後の文字列部分が、文字列βとして抽出される(ステップS508)。文字列βも、ワークメモリ上に記憶される。なお、図5B中では、「文字列β」は、「文字列β」と表示されている。この文字列βは、本願の言葉に対応する。例えば図3(a)に示される例1の記述パターンでは、図7(b)の文字列Zから、本願特定パターン「本願」の後の部分「の「通信状態情報」に相当」が、文字列β即ち本願の言葉として抽出される。即ち、図7(c)の如くである。図3(b)に示される例2の記述パターンでは、図8(b)の文字列Zから、本願特定パターン「請求項」の後の部分「1に係る発明の「個人の評価」に相当」が、文字列β即ち本願の言葉として抽出される。即ち、図8(c)の如くである。図3(c)に示される例3の記述パターンでは、図9(b)の文字列Zから、本願特定パターン「本請求項」の後の部分「1の第1の情報処理装置、第3の情報処理装置、第2の情報処理装置に相当」が、文字列β即ち本願の言葉として抽出される。即ち、図9(c)の如くである。

0053

次に、ワークメモリ上の文字列α(引用文献の言葉)と文字列β(本願の言葉)のそれぞれにおいて、かぎ括弧と句読点による分割が行われる(ステップS509)。これは、言葉の並列記載を分割するための処理である。具体的には、文字列αと文字列βのそれぞれにおいて、先頭から1文字ずつ読み込まれながら、かぎ括弧と句読点を各検索パターンとする各パターンマッチング処理が実行され、各文字列上でのかぎ括弧と句読点のアドレスが検出される。このアドレスを区切りとして、各文字列が分割される。例えば図3(a)に示される例1の記述パターンでは、図7(c)の文字列α(引用文献の言葉)「2には、アドホックネットワークにおいて調停端末がネットワークトポロジl」と文字列β(本願の言葉)「の通信状態に相当」から、図7(d)の文字列α(引用文献の言葉)と文字列β(本願の言葉)が得られる。図3(b)に示される例2の記述パターンでは、図8(c)の文字列α(引用文献の言葉)と文字列β(本願の言葉)から、図8(d)の文字列α(引用文献の言葉)と文字列β(本願の言葉)が得られる。図3(c)に示される例3の記述パターンでは、図9(c)の文字列α(引用文献の言葉)と文字列β(本願の言葉)から、図9(d)の文字列α(引用文献の言葉)と文字列β(本願の言葉)が得られる。特にこの図9(c)の文字列α(引用文献の言葉)と文字列β(本願の言葉)では、各言葉の並列記載が行われている。このため、これらの言葉が図9(d)の文字列α(引用文献の言葉)と文字列β(本願の言葉)として示されるように分割されることになる。

0054

次に、ワークメモリ上の文字列α(引用文献の言葉)と文字列β(本願の言葉)のそれぞれにおいて、不要文字列に対応する文字列が削除される(ステップS510)。ここで、前述した図2Aの表現パターン辞書107には、例えば図6(d)に例示される不要文字列テーブルが記憶されている。ステップS510では、ワークメモリ上の文字列αと文字列βのそれぞれがスキャンされながら、図6(d)に例示される不要文字列テーブルの各登録パターンに該当する不要文字列がパターンマッチングにより検索され削除される。また、ステップS510では、後述する係り受け解析処理により、ワークメモリ上の文字列αと文字列βのそれぞれにおいて、係り受け解析を実行して不要文字列が削除される。

0055

ステップS510では、ワークメモリ上の文字列αと文字列βのそれぞれにおいて、例えば、最後の複合語に係っていない文節も、不要文字列として削除される。図3(a)に示される例1の記述パターンにおいて、図7(d)の文字列αから不要文字列テーブルに基づいて不要文字列が削除された後の文字列「アドホックネットワークにおいて調停端末がネットワークトポロジ」を考える。この文字列から、最後の複合語「ネットワークトポロジ」に係っていない文節「アドホックネットワークにおいて調停端末が」の部分が削除される。この結果、図7(e)の文字列αが得られる。

0056

この結果、図7(e)の文字列α「ネットワークトポロジ」が得られる。また、図7(d)の本願の言葉を示す文字列β「の通信状態情報に相当」から、先頭のひらがな1文字「の」と記号「「」、文字列「相当」と末尾のひらがな1文字「に」と記号「」」が削除される。この結果、図7(e)の文字列β「通信状態情報」が得られる。図3(b)に示される例2の記述パターンでは、図8(d)の文字列αから、先頭の数字「1」とひらがな1文字「に」、及び「記載」、ひらがな1文字「の」、記号「「」「」」、末尾のひらがな1文字「が」が削除される。この結果、図8(e)の文字列αが得られる。また、図8(d)の文字列βから、先頭の数字「1」とひらがな1文字「に」、及び文字列「係る」「発明」、ひらがな1文字「の」、記号「「」、文字列「相当」、ひらがな1文字「に」、記号「」」が削除される。この結果、図8(e)の文字列βが得られる。図3(c)に示される例3の記述パターンでは、図9(d)の文字列α中の「1のクライアント計算機」から先頭の数字「1」とひらがな1文字「の」が削除される。また、文字列α中の「A書店」から記号「A」が削除される。更に、文字列α中の「コンビニエンスチェーンが各々」から文字列「各々」と末尾のひらがな1文字「が」が削除される。この結果、図9(e)の文字列αが得られる。また、図9(d)の文字列β中の「1の第1の情報処理装置」から先頭の数字「1」とひらがな1文字「の」が削除される。また、文字列β中の「第2の情報処理装置に相当」から文字列「相当」と末尾のひらがな1文字「に」が削除される。この結果、図9(e)の文字列βが得られる。

0057

以上のようにして最終的に、ワークメモリ上の文字列α(引用文献の言葉)から得られた言葉とワークメモリ上の文字列β(本願の言葉)から得られた言葉が対応付けられ、ワークメモリ上に言葉の対を示す文字列として記憶される(ステップS511)。例えば図3(a)に示される例1の記述パターンでは、図7(e)の文字列α中の言葉「ネットワークトポロジ」と文字列β中の言葉「通信状態情報」が対応付けられる。図3(b)に示される例2の記述パターンでは、図8(e)の文字列α中の言葉「悪口」と文字列β中の言葉「個人の評価」が対応付けられる。図3(c)に示される例3の記述パターンでは、図9(e)の文字列α中の言葉「クライアント計算機」と文字列β中の言葉「第1の情報処理装置」が対応付けられる。また、図9(e)の文字列α中の言葉「書店」と文字列β中の言葉「第3の情報処理装置」が対応付けられる。更に、図9(e)の文字列α中の言葉「コンビニエンスチェーン」と文字列β中の言葉「第2の情報処理装置」が対応付けられる。

0058

以上のステップS507からS511までの一連の処理によって、ワークメモリ上の文字列Zに対する処理が終了すると、ワークメモリ上の残りの文字列Yが空であるか否かが判定される(ステップS512)。そして、ステップS512の判定がNOならば、ステップS504に戻って、ワークメモリ上の文字列Yが再びスキャンされながら、引用文献特定パターンの文字列があるか否かが判定される。例えば、図3(a)に示される例1の記述パターンでは、ステップS505の処理により、残りの文字列Yは「...)の変化を検知し、・・・」となっている。このためステップS512の判定はNOとなる。しかし、文字列Yには引用文献特定パターンが含まれないため、ステップS504の判定はNOとなって、図5Bの動作フローチャートの処理を終了する。また、図3(c)に示される例3の記述パターンでは、ステップS505の処理により、残りの文字列Yは「...する。」となっているため、この場合もステップS512の判定はNOとなる。しかし、文字列Yには引用文献特定パターンが含まれないため、ステップS504の判定はNOとなって、図5Bの動作フローチャートの処理を終了する。

0059

一方、図3(b)に示される例2の記述パターンでは、ステップS505の処理により、残りの文字列Yは「...引用文献1に記載の「掲示板」が請求項1に係る発明の「コンテンツ情報」に相当し、引用文献1に記載の「記事」が請求項1に係る発明の「個人の意見の開示単位」に相当し、する。」となっている。即ち、文字列Yには引用文献特定パターンが含まれている。このためステップS512の判定がNOとなった後、ステップS504の判定がYESとなる。

0060

この結果、新たに実行されるステップS505において、「1に記載の「記事」が請求項1に係る発明の「個人の意見の開示単位」に相当」が文字列Zとして抽出される。そして、新たな文字列Yが「...引用文献1に記載の「掲示板」が請求項1に係る発明の「コンテンツ情報」に相当し、」となる。更に、文字列Zに対して、ステップS506の判定がYESとなってステップS507からS511までの一連の処理が実行され、言葉の対のデータが抽出される。

0061

更に、ステップS512の判定がNO、ステップS504の判定が再びYESとなった後、新たに実行されるステップS505において、「1に記載の「掲示板」が請求項1に係る発明の「コンテンツ情報」に相当」が文字列Zとして抽出される。そして、新たな文字列Yが「...し、する」となる。更に、文字列Zに対して、ステップS506の判定がYESとなってステップS507からS511までの一連の処理が事項され、言葉の対が抽出される。

0062

最後に、ステップS512の判定がNO、残りの文字列Y「...し、する」に対してステップS504の判定がNOとなって、図5Bの動作フローチャートの処理を終了する。

0063

次に、図5BのステップS503で、文字列Yに、本願の言葉が先に書かれ対表現パターン文字列のデータ「相当する」の後に引用文献の言葉を書く記述パターン「×××には・・・に相当する〜」が存在すると判定された場合には、ステップS513からS517の一連の処理が実行される。これは、図3(d)の例4に対応する前述した手順3−2に対応するデータ処理である。

0064

まず、ワークメモリ上の文字列Yがスキャンされながら、対表現パターン文字列のデータの後の文字列部分が、文字列αとして抽出される(ステップS513)。この文字列αは、ワークメモリ上に記憶される。この文字列αは、引用文献の言葉に対応する。例えば図3(d)に示される例4の例外記述パターンでは、図10(b)の文字列Yから、対表現パターン文字列の「に相当する」の後の部分「「移動の指示」(段落[0100])に基づくスケジューリングも開示されている。」が、文字列α即ち引用文献の言葉として抽出される。即ち、図10(c)の如くである。

0065

続いて、ワークメモリ上の文字列Yにおいて、対表現パターン文字列「に相当する」に対応する文字列のデータの前の文字列部分が、文字列βとして抽出される(ステップS514)。この文字列βも、ワークメモリ上に記憶される。この文字列βは、本願の言葉に対応する。例えば図3(d)に示される例4の例外記述パターンでは、図10(b)の文字列Yから、対表現パターン文字列「に相当する」の前の部分「1にはまた、メタレベルタスクに」が、文字列β即ち引用文献の言葉として抽出される。即ち、図10(c)の如くである。

0066

次に、ワークメモリ上の文字列α(引用文献の言葉)と文字列β(本願の言葉)のそれぞれにおいて、かぎ括弧と句読点による分割が行われる(ステップS515)。これは、前述したステップS509の処理と同様の、言葉の並列記載を分割するための処理である。例えば図3(d)に示される例4の例外記述パターンでは、図10(c)の文字列α(引用文献の言葉)と文字列β(本願の言葉)から、図10(d)の文字列α(引用文献の言葉)と文字列β(本願の言葉)が得られる。

0067

次に、ワークメモリ上の文字列α(引用文献の言葉)と文字列β(本願の言葉)のそれぞれがスキャンされながら、文字列パターンマッチングに基づいて、図6(d)に例示される不要文字列テーブルの各登録パターンに該当する不要文字列が検索され削除されまたは係り受け解析により不要文字列が削除される(ステップS516)。例えば図3(d)に示される例4の例外記述パターンでは、図10(d)の文字列αの「する「移動の指示」から図10(e)の文字列α「移動の指示」が得られる。また、図10(d)の文字列β「1にはまた」「メタレベルタスク」から図10(e)の文字列β「メタレベルタスク」が得られる。

0068

以上のようにして最終的に、ワークメモリ上の文字列α(引用文献の言葉)から得られた言葉とワークメモリ上の文字列β(本願の言葉)から得られた言葉が対応付けられ、ワークメモリ上に言葉の対を示すデータとして記憶される(ステップS517)。例えば図3(d)に示される例4の例外記述パターンでは、図10(e)の文字列α中の言葉「移動の指示」と文字列β中の言葉「メタレベルタスク」が対応付けられる。

0069

以上説明した第1の実施形態の処理で、図5BのステップS511又はS517にて文字列α(引用文献の言葉)から得られた言葉と文字列β(本願の言葉)から得られた言葉が対応付けられ、ワークメモリ上に言葉の対を示すデータとして記憶される。これを受けて、その言葉の対のデータに含まれる各抽象的な言葉のデータと意味的に同じあるいは対となる言葉の各データ部分が、表示特許の特許請求の範囲の請求項のデータ上で特定される。
以上のステップS513からS517までの一連の処理によって、ワークメモリ上の文字列Yに対する処理が終了し、図5Bの動作フローチャートの処理を終了する。

0070

図11は表示部の表示例を示す。表示特許の請求項1101とともに、請求項に記載された言葉、たとえば「コンテンツ情報」と引用文献に記載された言葉、たとえば「掲示板」等との対応関係1102が表示される。

0071

図13Aは、図5のステップS501、S503、S504、S506、S509、S510、S513、S515、S518、又はS519の処理におけるパターンマッチング処理及び文字列位置検出処理の具体的な動作を示す動作フローチャートである。この動作フローチャートにおける各処理は、例えばCPUとメモリと外部記憶装置を搭載したコンピュータシステムによって実行される。

0072

図13Aでは、まず、検索を行いたいパターン文字列のデータがワークメモリ又は記憶装置からワークメモリ上の所定領域に読み込まれる(ステップS601)。例えば、図5BのステップS501では、このパターン文字列は、記憶装置上の表現パターン辞書107(図2A)中の図7(a)に示される対表現パターンテーブルから読み込まれる各対表現パターンの文字列である。

0073

次に、パターンマッチング処理の対象となる文字列であるマッチング対象文字列のデータがワークメモリ又は記憶装置からワークメモリ上の所定領域に読み込まれる(ステップS602)。例えば、図5BのステップS501では、マッチング対象文字列は、記憶装置上の拒絶理由データベース105から読み込まれる拒絶理由通知等のファイルである。

0074

次に、ワークメモリ上の変数領域に保持されるパターンポインタp1に、ステップS601でワークメモリ上の所定領域に読み込まれたパターン文字列の先頭文字のアドレスがセットされる(ステップ603)。

0075

次に、ワークメモリ上の変数領域に保持されるマッチング基点ポインタp2とマッチングポインタp3に、ステップS602でワークメモリ上の所定領域に読み込まれたマッチング対象文字列の先頭文字のアドレスがセットされる(ステップS604、S605)。

0076

次に、マッチングポインタp3のアドレスが1ずつインクリメントされながら(ステップS607)、パターンポインタp1で示されるパターン文字列中の先頭文字と一致する文字が、マッチング対象文字列中から検索される(ステップS606→S607→S608→S606の繰返し処理)。

0077

なお、マッチングポインタp3がインクリメントされた結果、p3の値がワークメモリ上の所定領域に読み込まれているマッチング対象文字列の末尾のアドレスを超えた場合には、マッチング無しが出力され図13Aの処理を終了する(ステップS608→S609)。

0078

パターンポインタp1で示されるパターン文字列中の先頭文字がマッチング対象文字列中で一致しステップS606の判定がYESになると、以下のステップS610からS617の一連の処理が実行される。ここでは、マッチング対象文字列中で上記一致位置から続く文字列がパターン文字列の2文字目以降の全てと一致するか否かが判定される。

0079

まず、ワークメモリ上のマッチング基点ポインタp2にステップS606で一致が検出されたときのマッチングポインタp3のアドレスがセットされる(ステップS610)。
次に、ワークメモリ上のパターンポインタp1のアドレス値が+1される(ステップS611)。

0080

次に、パターンポインタp1のアドレス値が、ワークメモリ上の所定領域に読み込まれているパターン文字列の末尾のアドレスを超えたか否かが判定される(ステップS612)。

0081

ステップS612の判定がNOならば、マッチングポインタp3のアドレス値が+1される(ステップS613)。
次に、マッチングポインタp3のアドレス値が、ワークメモリ上の所定領域に読み込まれているマッチング対象文字列の末尾のアドレスを超えたか否かが判定される(ステップS615)。

0082

ステップS614の判定がNOならば、マッチングポインタp3が指すマッチング対象文字列中のアドレス位置の文字が、パターンポインタp1が指すパターン文字列中のアドレス位置の文字と一致するか否かが判定される(ステップS617)。つまり、ステップS606がYESとなった後に最初にステップS617が実行されるときには、マッチング対象文字列中でステップS606で一致位置が検出された位置から数えて2文字目が、パターン文字列の2文字目と一致するか否かが判定される。

0083

ステップS617の判定がYESならば、ステップS611に戻って再びステップS617までの一連の処理が実行される。ここでは、パターンポインタp1とマッチングポインタp3の各アドレス値が+1される(ステップS611、S614)。この結果、更にマッチング対象文字列中でステップS606により一致位置が検出された位置から数えて3文字目が、パターン文字列の3文字目と一致するか否かが判定される。

0084

以上の処理の繰返しにより、マッチング対象文字列中でステップS606で一致が検出された位置から続く文字列がパターン文字列の2文字目以降の全てと一致するか否かが判定される。

0085

上記一連の処理で、ステップS611でインクリメントされたパターンポインタp1の値がワークメモリ上の所定領域に読み込まれているパターン文字列の末尾のアドレスを超えた場合は、マッチング対象文字列上でパターン文字列との一致が検出されたことになる。この場合には、マッチング対象文字列中でステップS606により一致が検出された位置を示すマッチング基点ポインタp2のアドレス値がマッチング結果として出力され、図13Aの処理を終了する(ステップS612→S613)。

0086

一方、ステップS614でインクリメントされたマッチングポインタp3の値が、ワークメモリ上の所定領域に読み込まれているマッチング対象文字列の末尾のアドレスを超えた場合には、マッチング無しが出力され図13Aの処理を終了する(ステップS615→S616)。

0087

上記一連の処理で、マッチングポインタp3が指すマッチング対象文字列中のアドレス位置の文字が、パターンポインタp1が指すパターン文字列中のアドレス位置の文字と一致せずステップS617の判定がNOとなったとなった場合には、再検索が実行される。即ち、パターンポインタp1に、ステップS601でワークメモリ上の所定領域に読み込まれたパターン文字列の先頭文字のアドレスがセットされる(ステップ618)。また、マッチングポインタp3に、マッチング基点ポインタp2が指すステップS606で一致が検出された位置の次の位置に対応するアドレス値がセットされる(ステップS619)。その後、ステップS606の処理に戻り、マッチングポインタp3のアドレスが上記一致位置の次の位置から1ずつインクリメントされながら(ステップS607)、以下の処理が実行される。即ち、パターンポインタp1で示されるパターン文字列中の先頭文字と一致する文字が、マッチング対象文字列中から再検索される(ステップS606→S607→S608→S606の繰返し処理)。

0088

そして、パターンポインタp1で示されるパターン文字列中の先頭文字がマッチング対象文字列中で再度一致しステップS606の判定がYESになると、以下のステップS610からS617の一連の処理が実行される。これにより、マッチング対象文字列中で上記一致位置から続く文字列がパターン文字列の2文字目以降の全てと一致するか否かが再度判定される。

0089

以上の一連の処理の繰返しにより、マッチング対象文字列中でパターン文字列が検索され、マッチングに成功した場合には、その一致の先頭位置がマッチング結果として出力される(ステップS613)。

0090

次に3ステップによる係り受け解析による不要文字削除処理を図13Bのフローチャート及び図13C形態素の辞書(a)、品詞接続確率(b)、文節の接続ルール(c)、文節の接続確率(d)の各テーブルを参照して説明する。なお、この動作フローチャートにおける各処理は、例えばCPUとメモリと外部記憶装置を搭載したコンピュータシステムによって実行される。

0091

ステップS1301:まず、形態素解析が実行される。名詞助詞動詞などの品詞と文字列を要素とする形態素の辞書(a)と、品詞の接続確率を定義したテーブル(b)を用いて、最も確率が高い形態素列を選択する。形態素の辞書(a)と、品詞の接続確率を定義したテーブル(b)は、例えばワークメモリ又は記憶装置上に記憶されている。ここで例えば、1文が「引用文献に記載の掲示板が請求項に係る発明のコンテンツ情報に相当する。」である場合について説明する。以下のような形態素列の候補について確率が計算され、最も確率が高い形態素列が選択される。
(1)引用(サ変名詞)、文献(名詞)、に(助詞)、記載(サ変名詞)、の(助詞)...
(2)引用(サ変名詞)、文(名詞)、献(未登録語)、に(助詞)、記載(サ変名詞)...

0092

ステップS1302:次に、文節分割の処理を行なう。すなわち文節の接続ルール(c)によって形態素を接続して文節を生成する。
上記の例では、以下のような文節が生成される。
「引用文献に」「記載の」など

0093

ステップS1303:次に、係り受け解析を行う。即ち、
(1)文節の接続確率(d)と制約ルールによって、最も確率が高い係り受け先を選択する。
(2)接続確率(d)は文節のタイプや近接関係などにより定義する。
例えば、上記の例では、文節のタイプは以下のようになり、引用文献に → 「に」格の名詞節、記載の → 「の」格の名詞節となる。
(3)近接関係の処理を行なう。例えば、以下のように求められ、「引用文献に」と「記載の」は隣接、「引用文献に」と「掲示板が」は1文節間隔である。

0094

これに対し、以下のような制約条件を満たし、かつ、確率が最大になる係り先を求める。

・最後以外の文節は後方に必ず一つの係り先文節を持つ
・係り受け関係は交差しない

最終的には、上記の例から以下のような係り受け組が生成される。

・「引用文献に−記載の」「記載の−掲示板が」「掲示板が−相当する」など

0095

上述の係り受け解析処理では、係り受け組は、辞書とのパターンマッチングと、マッチングしたパターンに付けられている確率の計算によって生成される。なお、上述の係り受け解析は、文字列α又はβのみからではなく、元の文字列Yを使って全体的な係り受け関係が抽出されるように実行されてもよい。

0096

以上説明した特許文書中の単語または単語の組み合わせの例示装置の第1の実施形態によって、発明者が表示特許中で明確に例を示していない場合も、その表示特許の内容を深く理解していると思われるその表示特許に対応する拒絶理由通知等を作成した審査官の解釈が利用される。これにより、請求項中の言葉が具体的に何を表しているかを知ることができ、請求項の記述方法に馴染みの無い利用者であっても請求項を理解することができるようになる。

0097

以上の説明では、請求項の中で使われている言葉に具体例を表示するものとして説明したが、同様の処理を請求項以外の言葉にも対しても適用することで、例えば、実施例や発明を実施するための形態の中で使われている言葉に具体例を表示することもできる。

0098

図14は、特許文書中の単語または単語の組み合わせの例示装置の第2の実施形態の構成図である。図14において、図1に示される第1の実施形態と同じ処理を行う部分には、同じ番号が付されている。

0099

第2の実施形態の構成は、図1に示される第1の実施形態の構成に加えて、以下の構成を含む。即ち、言葉対データベース1402を参照することにより、言葉対抽出部106において抽出された各言葉の対を構成する2つの言葉のうちどちらか具体例であるかを判定する具体例判定部1401を含む。具体例判定部1401は更に、特許文書解析部1401−1、言葉の出現位置特定部1401−2、特許文書検索ヒット件数取得部1401−3、及び判定部1401−4を含む。

0100

第1の実施形態において、言葉の対のみからでは、その2つの言葉のうちどちらが具体例なのかを単純に判別することができない場合がある。
言葉の対にまで情報を落とさないで拒絶理由の記述を利用すれば、言葉が使われているセクション明細書中の請求項や実施例又は発明を実施するための形態などのセクション)の情報が書かれている場合もあり、これを使って、どちらが具体的かを推定できる可能性もあるが、必ずしもセクションの情報が書かれるとは限らない。

0101

例えば、下記のような拒絶理由通知等においては、引用文献の言葉の方が具体的である。
拒絶理由通知等の記述例1:
『引用文献1に記載の「掲示板」が請求項1に係る発明の「コンテンツ情報」に相当し、引用文献1に記載の「記事」が請求項1に係る発明の「個人の意見の開示単位」に相当し、引用文献1に記載の「悪口」が請求項1に係る発明の「個人の評価」に相当する。』
拒絶理由通知等の記述例2:
『引用文献2には、アドホックネットワークにおいて調停端末がネットワークトポロジ(本願の「通信状態情報」に相当)の変化を検知し、』

0102

一方、下記のような拒絶理由通知においては、本願(又は請求項に係る発明)の言葉の方が具体的である。
拒絶理由通知等の記述例3:
『引用文献1に記載の発明の「信号処理回路14」は、請求項1に係る発明の「経路選択手段」に相当し、』
拒絶理由通知等の記述例4:
『引用文献2に記載の「板バネ状部材」は、魚体の後部を内部から支えているといえることから、当該「板バネ状部材」は、本願の請求項2に係る発明の「肋骨状部分」に相当するといえる。』

0103

ここで一般的に、請求項で使われる言葉は、実施例又は発明を実施するための形態(以下、「実施例等」と呼ぶ)で使われる言葉に比べて抽象的である可能性が高い。そこで、第2の実施形態では、具体例判定部1401が、言葉対抽出部106で抽出された言葉の対を構成する各言葉について、各言葉がどのセクションで使われているかという情報を解析し、その解析結果に基づいて、言葉の対を構成する各言葉のどちらが具体例かを判定する。

0104

更に具体的には、具体例判定部1401は、以下の2つの方法を組み合わせた判定処理を実行する。

0105

方法1:特許データベース101(図12A参照)の中で拒絶理由通知における引用文献の特許文書と本願の特許文書について、抽出された言葉の対を構成する各言葉が使われている出現位置(セクション)を特定することによる判定処理が実施される。すなわち、出現位置(セクション)が[特許請求の範囲]のセクションかあるいはそれ以外のセクション例えば[発明の実施する形態]、[発明の概要]、[要約書]等のセクションかが判定される。

0106

方法2:方法1で何れかの特許文書の請求項と発明を実施する形態等の両方で使用されている言葉がある場合に、抽出された言葉の対を構成する各言葉によって特許データベース101(図12A参照)に登録されている特許文書集合全体が検索される。そして、各検索の結果である各ヒット件数に基づいて判定処理が実施される。

0107

図15は、図14に示される構成を有する特許文書中の単語または単語の組み合わせの例示装置の第2の実施形態の制御動作を示す動作フローチャートである。この動作フローチャートにおける各処理は、例えばCPUとメモリと外部記憶装置を搭載したコンピュータシステムによって実行される。図15において、図4に示される第1の実施形態と同じ処理を行う部分には、同じ番号S401、S402、S403、S405、S406が付されている。第2の実施形態の制御動作では、第1の実施形態での制御動作に加えて更に、以下の制御動作が実行される。即ち、図15のステップS404にて言葉の対のデータが抽出できてステップS405の判定がYESとなった言葉の対のデータ毎に、各言葉の対を構成する2つの言葉のうちどちらが具体例かを判定する処理が実行される(ステップS1501)。このステップS1501の処理は、図14の具体例判定部1401−4の機能を実現する。

0108

図16は、図15のステップS1501の具体的な制御動作を示す動作フローチャートである。この動作フローチャートにおける各処理は、例えばCPUとメモリと外部記憶装置を搭載したコンピュータシステムによって実行される。なお、ここでの処理は、図15のステップS404にて抽出された言葉の対のデータ毎に繰り返し実行される。そして、その結果得られた具体例は、後述する言葉の対テーブルに登録される。

0109

まず、前述した方法1による判定処理、即ち拒絶理由通知における引用文献の特許文書と本願の特許文書の各本文中で、抽出された言葉の対を構成する各言葉が使われている出現位置(セクション)を特定することによる判定処理が実施される(ステップS1601)。この処理は、図14の特許文書解析部1401−1及び言葉の出現位置特定部1401−2の機能を実現する。

0110

次に、方法1により判定ができたか否かが判断される(ステップS1602)。この処理は、図14の判定部1401−4の機能の一部を実現する。
方法1により判定ができた場合には、図16の動作フローチャートの処理を終了する。一方、方法1により判定ができなかった場合には、前述した方法2による判定処理が実行される(ステップS1603)。即ち、抽出された言葉の対を構成する各言葉によって特許データベース101(図12A参照)に登録されている所定の特許文書集合全体が検索される。そして、各検索の結果である各ヒット件数に基づいて判定処理が実施される。この処理は、図14の特許文書検索ヒット件数取得部1401−3の機能及び判定部1401−4の一部の機能を実現する。

0111

図17は、図16のステップS1601の方法1の詳細な制御動作を示す動作フローチャートである。この動作フローチャートにおける各処理は、例えばCPUとメモリと外部記憶装置を搭載したコンピュータシステムによって実行される。

0112

まず、図15のステップS403にて検索された拒絶理由通知等のファイルにて指定されている引用文献特許文書のファイルと本願特許文書のファイルが、特許データベース101から取得される(ステップS1701)。各特許文書のファイルは、ワークメモリ上に展開される。

0113

次に、ステップS1701にてワークメモリ上に取得された各特許文書のファイルにおいて、セクション構造が解析される(ステップS1702)。具体的には、各特許文書のファイルにおいて、付き括弧タグで囲まれた各見出しに対応する文字列が検索されることにより、特許請求の範囲中の各請求項のセクションと、明細書中の実施例を含む実施の形態等が記述されているセクションが解析される。

0114

次に、ステップS1701にて取得された各特許文書において、言葉の対の抽出処理(図15のステップS404)にて抽出された言葉の対を構成する言葉Aの文字列と言葉Bの文字列の出現する位置(セクション)が特定される(ステップS1703)。このとき、ステップS1702でのセクションの解析結果が参照される。なお、言葉Aは、拒絶理由通知等にて指定されている引用文献特許文書に関連付けて抽出された言葉である。また、言葉Bは、拒絶理由通知等にて指定されている本願特許文書に関連付けて抽出された言葉である。なお、ステップ404にて抽出された言葉の対のデータは、図23に示されるデータ構成例を有する言葉対データベース1402に登録される。言葉対データベース1402は、記憶装置に記憶される。言葉対データベース1402の各レコードは、被引用側即ち拒絶理由通知等の中で引用文献として引用される引用文献に関する情報として、引用先情報即ち引用文献を特定する情報(公開番号や文献名等)を登録するフィールドを有する。また、各レコードは、引用先即ち引用文献に関連付けてステップS404にて抽出された引用先での言葉を登録するフィールドを有する。更に、各レコードは、引用側即ち拒絶理由通知等の中で本願として引用される特許文書に関する情報として、引用元情報即ち本願を特定する出願番号を登録するフィールドを有する。また、各レコードは、引用元即ち本願に関連付けてステップS404にて抽出された引用先での言葉を登録するフィールドを有する。加えて、各レコードは、具体例判定結果フィールドを有する。このフィールドの内容は、ステップS404において抽出された言葉の対が各レコードに登録される時点では空欄である。そして、ステップS1501の具体例判定処理が実行された結果、引用先での言葉フィールドに登録された言葉と引用元での言葉フィールドに登録された言葉のうち具体例として判定された方の言葉が登録される。

0115

次に、言葉Aのデータが引用文献特許文書のテキストデータ中で出現する場所が請求項のセクションのみで、かつ、言葉Bのデータが本願特許文書のテキストデータ中で実施例を含む実施の形態等のセクションに出現する(同時に請求項のセクションに出現してもよい)か否かが判定される(ステップS1704)。

0116

ステップS1704の判定がYESの場合に、言葉Bが具体例であると判定される(ステップS1705)。そして、図17の動作フローチャート即ち図16のステップS1601の処理を終了する。

0117

ステップS1705の判定がNOの場合、更に以下の判定が実行される。即ち、言葉Aのデータが引用特許文書のテキストデータ中で実施例を含む実施の形態等に出現し(同時に請求項のセクションに出現してもよい)、かつ、言葉Bのデータが本願特許文書のテキストデータ中で出現する場所が請求項のセクションのみであるか否かが判定される(ステップS1706)。

0118

ステップS1706の判定がYESの場合に、言葉Aが具体例であると判定される(ステップS1707)。そして、図17の動作フローチャート即ち図16のステップS1601の処理を終了する。
ステップS1706の判定がNOの場合には、方法1では判定は行われず、図17の動作フローチャート即ち図16のステップS1601の処理を終了する。

0119

上述の図17の制御動作の実行時には、図4、ステップ404にて抽出された言葉の対のデータは、図18に示されるデータ構成例を有する言葉対テーブルに登録される。言葉対テーブルは、ワークメモリ上に保持される。言葉対テーブルの各行は、被引用側即ち拒絶理由通知等の中で引用文献特許文書に関連付けてステップS404にて抽出された言葉Aを登録するフィールドを有する。また、各行は、その言葉Aの引用文献特許文書内での出現位置(セクション)をステップS1703の処理に基づいて登録するフィールドを有する。更に、各行は、引用側即ち拒絶理由通知等の中で本願特許文書に関連付けてステップS404にて抽出された言葉Bを登録するフィールドを有する。加えて、各行は、その言葉Bの引用文献特許文書内での出現位置(セクション)をステップS1703の処理に基づいて登録するフィールドを有する。そして、各行は、出現位置による具体例判定結果を登録するフォールドを有する。このフィールドには、言葉Aフィールドと言葉Bフィールドに登録された言葉のうち、それぞれに対応する出現位置フィールドの内容に基づいてステップS1704及びS1706で具体例と判定された結果に基づく言葉が登録される。

0120

例えば、図18の1801で示される各行においては、被引用例(引用文献)での言葉A「クライアント計算機、書店、コンビニエンスチェーン」のデータの出現位置が引用文献特許文書のテキストデータ内の実施例等のセクションに現れているため、図17、ステップS1704の判定がNOとなる。また、引用側(本願)言葉B「第1の情報処理装置、第3の情報処理装置、第2の情報処理装置」のデータの出現位置が本願特許文書のテキストデータ内の請求項のセクションのみに現れているためステップS1706の判定がYESとなる。この結果、これらの行においては、言葉Aフィールドの言葉が具体例となるので具体例判定結果の登録フィールドに、言葉Aフィールドに登録されている言葉が登録「クライアント計算機、書店、コンビニエンスチェーン」される。図18の1801で示される各行以外の行においては、言葉Aのデータ「移動の指示、悪口、板バネ状部分」の出現位置が引用文献特許文書のテキストデータ内の実施例等のセクションに現れているため、ステップS1704の判定がNOとなる。また、言葉Bのデータ「メタルベルタスク、個人の評価、肋骨状部分」の出現位置が本願特許文書のテキストデータ内の請求項と実施例等の両方のセクションに現れているため、ステップS1706の判定もNOとなる。このため、1801で示される各行以外の行では、言葉A、言葉Bともに実施例に出現しているのでどちらが具体例か判定できないので、図17の動作フローチャートでは、これらの行においては、具体例判定結果の登録フィールドへの登録は行われない。

0121

図19は、図16のステップS1601で方法1により判定ができず、図16のステップS1602の判定がNOとなって実行される、図16のステップS1603の方法2の詳細な制御動作を示す動作フローチャートである。この動作フローチャートにおける各処理は、例えばCPUとメモリと外部記憶装置を搭載したコンピュータシステムによって実行される。

0122

まず、図17のステップS1701でワークメモリ上に展開された特許文書において、図17のステップS1702でのセクションの解析結果に基づいて決定された請求項のセクションのみが検索範囲とされる。そして、その検索範囲が言葉Aに対応する文字列で検索されたときのヒット件数CA1が算出される(ステップS1901)。

0123

次に、図17のステップS1701でワークメモリ上に展開された特許文書において、図17のステップS1702でのセクションの解析結果に基づいて決定された実施例等のセクションのみが検索範囲とされる。そして、その検索範囲が言葉Aに対応する文字列で検索されたときのヒット件数CA2が算出される(ステップS1902)。

0124

続いて、図17のステップS1701でワークメモリ上に展開された文書において、図17のステップS1702でのセクションの解析結果に基づいて決定された請求項のセクションのみが検索範囲とされる。そして、その検索範囲が言葉Bに対応する文字列で検索されたときのヒット件数CB1が算出される(ステップS1903)。

0125

更に、図17のステップS1701でワークメモリ上に取得された文書のファイルにおいて、図17のステップS1702でのセクションの解析結果に基づいて決定された実施例等のセクションのみが検索範囲とされる。そして、その検索範囲が言葉Bに対応する文字列で検索されたときのヒット件数CB2が算出される(ステップS1904)。

0126

そして、CA2/CA1の値とCB2/CB1の値が、それぞれ算出され、各算出結果がワークメモリに保持される。CA2/CA1は、特許文書中で、言葉Aが請求項のセクションに対して実施例等のセクションでどの程度多く出現するかを示す値である。同様に、CB2/CB1は、本願特許文書中で、言葉Bが請求項のセクションに対して実施例等のセクションでどの程度多く出現するかを示す値である。この結果、ワークメモリ上のCA2/CA1の値よりもワークメモリ上のCB2/CB1の値のほうが大きいか否かが判定される(ステップS1905)。

0127

ステップS1905の判定がYESの場合には、言葉Bのほうが具体例であると判定される(ステップS1906)。このケースは、言葉Bが特許文書中で実施例等のセクションに現れる割合のほうが、言葉Aが特許文書中で実施例等のセクションに現れる割合よりも大きい場合である。

0128

一方、ステップS1905の判定がNOの場合には、言葉Aのほうが具体例であると判定される(ステップS1907)。このケースは、言葉Aが特許文書中で実施例等のセクションに現れる割合のほうが、言葉Bが特許文書中で実施例等のセクションに現れる割合よりも大きい場合である。
以上の判定は、具体的な言葉のほうが、実施例等のセクション中で使用される確率が高いという経験則に基づいている。

0129

上述の図19の制御動作の実行時には、図17の制御動作においてワークメモリ上の図18に例示される言葉の対テーブルの具体例判定結果フィールドへの登録が行われなかった行の言葉の対、例えば、移動の指示とメタレベルタスクが、図20に示されるデータ構成例を有する言葉対テーブルに登録される。この言葉対テーブルは、ワークメモリに保持される。この言葉対テーブルの各行は、被引用側即ち拒絶理由通知等の中で引用文献特許文書に関連付けてステップS404にて抽出された言葉A(移動の指示、悪口、板バネ状部材)を登録するフィールドを有する。また、各行は、ステップS1901及びS1902で算出される各ヒット件数CA1及びCA2をそれぞれ登録する各フィールドを有する。更に、各行は、引用側即ち拒絶理由通知等の中で本願特許文書に関連付けてステップS404にて抽出された言葉B(メタレベルタスク、個人の評価、肋骨状部分)を登録するフィールドを有する。また、各行は、ステップS1903及びS1904で算出される各ヒット件数CB1及びCB2をそれぞれ登録する各フィールドを有する。そして、各行は、ヒット件数による具体例判定結果を登録するフォールドを有する。このフィールドには、CA2/CA1及びCB2/CB1の各割合に基づいてステップS1905で判定された結果に基づく言葉が登録される。

0130

例えば、図20の2001及び2002で示される各行においては、CA2/CA1の割合のほうがCB2/CB1の割合よりも大きいため、言葉Aフィールドに登録されている言葉(移動の指示、悪口)が、具体例判定結果の登録フィールドに登録される。また、図20の2003で示される行においては、CB2/CB1の割合のほうがCA2/CA1の割合よりも大きいため、言葉B(肋骨状部分)フィールドに登録されている言葉が、具体例判定結果の登録フィールドに登録される。

0131

以上のようにして、方法1により得られた図18に例示される言葉の対テーブルの内容と方法2により得られた図20に例示される言葉の対テーブルの内容とに基づいて、各言葉の対に対応する具体例判定結果が得られる。これらの各言葉の対テーブルに得られた具体例判定結果が、図23に例示される言葉対データベース1402(図14)に登録される。この結果、図15のステップS1501での具体例の判定処理が終了する。

0132

その後、図4の第1の実施形態の場合と同様にして、図15のステップS401で得られている表示特許中の特許請求の範囲における請求項において、具体例が付加される対象となる言葉が特定される(ステップS406)。即ち、図23に例示される言葉対データベース1402に今回新たに登録された各言葉の対において、具体例判定結果フィールド(図23)に登録された言葉と同じ言葉の各部分が、請求項上で特定される。

0133

そして、図11の1101として例示されるステップS406で特定された請求項中の各具体例付加対象の言葉とそれぞれに対応する具体例とが対比されて、図11の1102に例示されるようにして、利用者のコンピュータのディスプレイに表示される(ステップS407)。

0134

図21は、第2の実施形態における図15のステップS1501の具体例の判定処理の制御動作のその他の実施形態の動作フローチャートを示す図である。この実施形態では本願と引用文献に限定されない。この動作フローチャートにおける各処理は、例えばCPUとメモリと外部記憶装置を搭載したコンピュータシステムによって実行される。

0135

この制御動作では、言葉の対を構成する2つの言葉について、特許データベース101中からそれぞれ独立に件数を求めるのではなく、2つの言葉の両方が1件の中に使われている特許文書の集合が作成される。そして、その集合の中での2つの言葉の出現場所によって、どちらの方がより具体的な言葉かが判定される。

0136

まず、言葉の対の抽出処理(図15のステップS404)にて抽出された言葉の対のデータを構成する言葉Aと言葉Bを共に含む特許文書のファイルが、特許データベース101(図14)から検索され、その結果得られる特許集合が作成され、ワークメモリに保持される(ステップS2101)。即ち、図21の2101の如くである。

0137

次に、ワークメモリに保持される件数変数D1及びD2に、共に値ゼロが代入される(ステップS2102)。
次に、図21のステップS2101で作成された特許集合中の各特許文書のファイルについて、ステップS2102からステップS2108までの処理が繰り返し実行される。

0138

まず、現在の特許文書のファイルにおいて、特許請求の範囲中の各請求項のセクションと実施例等のセクション中の段落との対応関係が解析される(ステップS2103)。これは、言葉Aと言葉Bを、請求項とそれに対応する実施例の中から選択するためである。

0139

図22は、図21のステップS2103の解析処理の詳細動作を示す動作フローチャートである。この動作フローチャートにおける各処理は、例えばCPUとメモリと外部記憶装置を搭載したコンピュータシステムによって実行される。

0140

まず、現在の特許文書のファイルから、テキスト情報が読み込まれる(ステップS2201)。
次に、ステップS2201で読み込まれたテキスト文書のデータが、墨付括弧タグにより、セクションごとに分割される(ステップS2202)。

0141

次に、ステップS2202で分割されたセクションのうち、請求項のセクションの文書のテキストデータ部分が、請求項の各項毎に分割される(ステップS2203)。
次に、ステップS2203で分割された請求項の各項から、キーワードデータが抽出される(ステップS2204)。キーワードデータは、請求子とそれに対応する実施例を見つけるためのものであり、請求項の各項のテキストデータに対して、例えば形態素解析処理を実行することで抽出できる。

0142

次に、ステップS2201で読み込まれた実施例等のセクションのテキスト文書のデータが、墨付括弧タグにより、段落ごとに分割される(ステップS2205)。
次に、ステップS2205で分割された実施例等の各段落部分から、キーワードが抽出される(ステップS2206)。キーワードは、実施例等の各段落部分のテキストデータに対して、例えば形態素解析処理を実行することで抽出できる。

0143

最後にステップS2203で分割された請求項の各項に対応するデータに対し、ステップS2204で抽出されたキーワードと最も類似するステップS2206によるキーワードが含まれるステップS2205で分割された実施例等の段落のデータが対応付けられる(ステップS2207)。

0144

以上の図22の動作フローチャートの処理として、図21のステップS2103の処理が実行される。
図21の動作フローチャートに戻り、ステップS2103の処理の後、現在の特許文書において、言葉Aが請求項で使われており、かつ、この請求項に対応する実施例等の段落に言葉Bが使われているか否かが判定される(ステップS2104)。なお、請求項に対応する実施例等の段落は、ステップS2103によって得られたものが選択される。

0145

ステップS2104の判定がYESならばワークメモリ上の件数変数D1がインクリメントされ、NOならば件数変数D1はインクリメントされない(ステップS2105)。
次に、現在の特許文書において、言葉Bが請求項で使われており、かつ、この請求項に対応する実施例等に言葉Aが使われているか否かが判定される(ステップS2106)。この場合も、請求項に対応する実施例等の段落は、ステップS2103によって得られたものが選択される。

0146

ステップS2106の判定がYESならば件数変数D2がインクリメントされ、NOならば件数変数D2はインクリメントされない(ステップS2107)。
その後、ステップS2101で作成された集合内の全ての特許文書のファイルが処理されたか否かが判定される(ステップS2108)。

0147

ステップS2108の判定がNOならば、ステップS2103に戻って、処理が繰り返される。
ステップS2108の判定がYESになったなら最後に、件数変数D1が件数変数D2よりも多いか否かが判定される(ステップS2109)。

0148

互いに対応する請求項と実施例等の段落で、言葉Aが請求項側で使われ言葉Bが実施例等の側で使われる件数のほうが、言葉Bが請求項側で使われ言葉Aが実施例等の側で使われる件数のより多ければ、言葉Bが具体例であると認定される(ステップS2010)。

0149

逆に、言葉Bが請求項側で使われ言葉Aが実施例等の側で使われる件数が、言葉Aが請求項側で使われ言葉Bが実施例等の側で使われる件数以上であれば、言葉Aが具体例であると認定される(ステップS2011)。

0150

以上のようにして図21及び図22の動作フローチャートによって各言葉の対に対応する具体例判定結果が得られたら、これらの各言葉の対テーブルに得られた具体例判定結果が、図23に例示される言葉対データベース1402(図14)に登録される。この結果、図15のステップS1501での具体例の判定処理が終了する。

0151

その後の処理は前述した通りである。
以上説明した第2の実施形態によれば、特許文書中で言葉の対を構成する2つの言葉がどのように出現するかを解析することにより、どちらの言葉が具体例に相当するかを的確に判定することが可能となる。

0152

図24A及び図24Bは、特許文書中の単語または単語の組み合わせの例示装置の第3の実施形態の構成図である。図24A及び図24Bにおいて、図14に示される第2の実施形態と同じ処理を行う部分には、同じ番号が付されている。

0153

図14に示される第2の実施形態では、利用者により指定された特許文書に対して、言葉対抽出部106で言葉の対が抽出される。更に、具体例判定部1401で、言葉の対を構成する2つの言葉のうち具体例となる言葉が判定されながら、請求項中の言葉の具体例が例示される。この場合、言葉の対は、それを構成する2つの言葉のうちどちらが具体例であるかを示す情報と共に、図23に例示される言葉対データベース1402として蓄積することができる。

0154

そこで、第3の実施形態では、言葉対データベース1402を予め蓄積する構成と、利用者による特許文書の指定時には、言葉対データベース1402から言葉の対及び具体例を検索しながら例示する構成とが独立して実現される。、
まず、図24Aの構成は、図15の構成に比較して、具体例付加対象特定部108及び表示部109が無い。そして、この構成の機能を実現する制御動作は、図25の動作フローチャートによって示される。この動作フローチャートにおける各処理は、例えばCPUとメモリと外部記憶装置を搭載したコンピュータシステムによって実行される。図25において、図15に示される第2の実施形態と同じ処理を行う部分には、同じ番号が付されている。

0155

図25の動作フローチャートでは、ステップS402からS1501までの一連の処理は、図15の場合と同様である。
図25は、ステップS2501で特許データベース101から最初の特許文書が読み込まれた後、ステップS2503で全ての特許文書が処理されたと判定されるまで、ステップS2504で次の特許文書が特許データベース101から順次読み込まれる。そして、各特許文書のファイルに対して、ステップS402からS1501までの一連の処理によって、第2の実施形態の場合と同様にして、言葉の対の抽出と具体例の判定処理が実行される。そして、言葉の対の抽出と具体例の判定結果が、ステップS2502において、図23に例示される構成を有する言葉対データベース1402に保存される。

0156

以上の処理により、特許データベース101中の特許文書のファイルに対して、請求項中に出現する言葉とそれに対応する具体的な言葉の対を、言葉対データベース1402として予め蓄積することができる。

0157

図24Bは、利用者により指定された特許文書に対して、言葉対データベース1402から言葉の対及び具体例を検索しながら例示する第3の実施形態の構成である。
図24Bにおいて、特許データベース101、特許文書検索部102、及び出願番号抽出部103は、第1の実施形態(図1)又は第2の実施形態(図14)におけるものと同じである。即ち、利用者により、特許文書が指定されるとその特許文書が特許データベース101から検索され、出願番号が抽出される。

0158

次に、言葉対検索部2401は、指定された特許文書の請求項中から言葉を抽出し、その言葉に対応する具体例を言葉対データベース1402から検索する。
具体例付加対象特定部108及び表示部109の機能は、第1の実施形態(図1)又は第2の実施形態(図14)におけるものと同じである。

0159

図24Bの構成の機能を実現する制御動作は、図26の動作フローチャートによって示される。この動作フローチャートにおける各処理は、例えばCPUとメモリと外部記憶装置を搭載したコンピュータシステムによって実行される。図26において、ステップS401とステップS402の処理は、図4に示される第1の実施形態又は図15に示される第2の実施形態の場合と同じである。即ち、特許データベース101(図1)が検索されることにより、利用者によって指定された特許文書(表示特許)が検索される(ステップS401)。次に、ステップS401で検索された特許文書から出願番号が抽出される(ステップS402)。

0160

次に、図23に例示されるデータ構成例を有する言葉対データベース1402がアクセスされ、ステップS402で抽出された出願番号によって引用元情報フィールド及び引用先情報フィールドが検索される。そして、レコードが抽出できた場合には、そのレコードの具体例判定結果フィールドの言葉とその言葉と対になる言葉が抽出される(以上、ステップS2601)。

0161

次に、ステップS2601にて具体例が見つかったか否かが判定される(ステップS2602)。
以上のステップS2601とステップS2602の処理は、図24の言葉対検索部2401の機能を実現する。

0162

ステップS2602の判定がYESならば、ステップS401で得られている表示特許中の特許請求の範囲における請求項において、具体例が付加される対象となる言葉が特定される(ステップS406)。そして、図8の801として例示されるステップS406で特定された請求項中の各具体例付加対象の言葉とそれぞれに対応する具体例とが対比されて、図11の1102に例示されるようにして、利用者のコンピュータのディスプレイに表示される(ステップS407)。

0163

以上の第3の実施形態により、請求項中の言葉の具体例を例示するための言葉対データベース1402を予め作成しておくことが可能となる。この結果、利用者による特許文書の指定時には、その特許文書中の請求項中の言葉の具体例の提示を、言葉対データベース1402を参照して高速に実行することが可能となる。

0164

図27は、上述の各実施形態のシステムを実現できるコンピュータのハードウェア構成の一例を示す図である。
図27に示されるコンピュータは、CPU3001、メモリ3002、入出力装置3003、出力装置3004、外部記憶装置3005、可搬記録媒体3009が挿入される可搬記録媒体駆動装置3006、及び通信ネットワーク3007を有し、これらがバス3008によって相互に接続された構成を有する。同図に示される構成は上記システムを実現できるコンピュータの一例であり、そのようなコンピュータはこの構成に限定されるものではない。

0165

CPU3001は、当該コンピュータ全体の制御を行う。メモリ3002は、プログラムの実行、データ更新等の際に、外部記憶装置3005(或いは可搬記録媒体3009)に記憶されているプログラム又はデータを一時的に格納するRAM等のメモリである。CUP3001は、プログラムをメモリ3002に読み出して実行することにより、全体の制御を行う。

0166

入出力装置3003は、ユーザによるキーボードマウス等による入力操作を検出し、その検出結果をCPU3001に通知し、CPU3001の制御によって送られてくるデータを表示装置印刷装置に出力する。

0167

外部記憶装置3005は、例えばハードディスク記憶装置である。主に各種データやプログラムの保存に用いられる。
可搬記録媒体駆動装置3006は、光ディスクやSDRAMコンパクトフラッシュ(登録商標)等の可搬記録媒体3009を収容するもので、外部記憶装置3005の補助役割を有する。

0168

通信インターフェース3007は、例えばLAN(ローカルエリアネットワーク)又はWANワイドエリアネットワーク)の通信回線を接続するための装置である。
第1、第2、又は第3の実施形態によるシステムは、各実施形態の機能を実現する図4図5B図13A図13B図15図16図17図19図21図22図25、又は図26の各動作フローチャートに対応する各制御プログラムを、CPU3001が実行することで実現される。そのプログラムは、例えば外部記憶装置3005や可搬記録媒体3009に記録して配布してもよく、或いは通信インターフェース3007によりネットワークから取得できるようにしてもよい。図1、図14図24A図24B等の特許データベース101や拒絶理由データベース105、及び表現パターン辞書112、図14図24A図24B等の言葉対データベース1302などは、例えば外部記憶装置3005に記憶して運用される。また、メモリ3002上には必要に応じて、前述したワークメモリの領域が展開される。

0169

以上の第1〜第3の実施形態に関して、更に以下の付記を開示する。
(付記1)
特許文書中の単語または単語の組み合わせの理解を支援するための装置であって、
前記特許文書に含まれる単語または単語の組み合わせの具体例を示す対象となる明細書を特定する情報を受け付ける受け付け部と、
前記明細書に対して示された拒絶の理由を示す文書を記録した拒絶理由データベースから、前記単語または単語の組み合わせの具体例を示す対象となる明細書に対して示された、拒絶の理由を示す文書のテキストデータを、前記明細書を特定する情報に基づいて検索する拒絶理由を示す文書の検索部と、
前記検索された拒絶の理由を示す文書のテキストデータから、あらかじめ記憶された対表現パターンと同じ対表現パターンの文字列を検出し、前記対表現パターンの文字列に基づいて、前記特許文書に記載された文字列と前記文字列に対比して示される文字列とをそれぞれ含む対となる文字列を検出し、前記対となる文字列から不要文字列を削除することにより、前記単語または単語の組み合わせの具体例を示す対象となる明細書のテキストデータに記載された単語または単語の組み合わせの文字列と、前記単語または単語の組み合わせに対比して示される単語または単語の組み合わせの文字列の対を抽出する抽出部と、
前記抽出された対となる単語または単語の組み合わせの文字列の組を出力する出力部と、
を具備することを特徴とする特許文書中の単語または単語の組み合わせの例示装置。
(付記2)
前記抽出部は、
文字列パターンマッチングの処理と、
文字列における位置検出の処理と、
不要文字辞書とのパターンマッチングと係り受け解析に基づく不要文字列の削除の処理と、
を実行することを特徴とする付記1に記載の特許文書中の単語または単語の組み合わせの例示装置。
(付記3)
前記抽出部は、
前記拒絶の理由を通知する文書に前記対表現パターンの文字列が存在した場合、本願特定パターンと引用文献特定パターンを検出し、これらのパターンの前または後から前記対となる文字列を特定し、あるいは、
文字列パターン「には」に続いて、第1の文字列、文字列パターン「に相当する」、第2の文字列の順に文字列が存在する場合には、前記第1の文字列と前記第2の文字列を前記対となる文字列パターンとして抽出する、
ことを特徴とする付記1に記載の特許文書中の単語または単語の組み合わせの例示装置。
(付記4)
前記不要文字列を削除する処理は、
品詞と文字列を要素とする形態素の辞書と、品詞の接続確率を定義したテーブルを用いて、最も確率が高い形態素列を選択する形態素解析処理と、
文節の接続ルールによって形態素を接続して文節を生成する文節分離処理と、
文節の接続確率と制約ルールによって、最も確率が高い係り受け先を選択する係り受け解析処理とからなる、
ことを特徴とする付記1に記載の特許文書中の単語または単語の組み合わせの例示装置。
(付記5)
前記拒絶の理由を示す文書の記載において引用されている引用文献の明細書のテキストデータと拒絶の対象とされている明細書のテキストデータとにおいて、前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせに対応する文字列データの該各明細書のテキストデータ内での出現位置を特定することにより、該対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせのどちらが具体例を示す単語または単語の組み合わせであるかを判定する具体例判定部を更に含む、
ことを特徴とする付記1に記載の特許文書中の単語または単語の組み合わせの例示装置。
(付記6)
前記具体例判定部は、前記出現位置を特定するだけでは前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせのどちらが具体例を示す単語または単語の組み合わせであるかを判定できない場合に、前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせに対応する文字列で明細書のデータを蓄積した特許データベースを検索し、前記明細書の請求項中及び実施例中での前記各単語または単語の組み合わせの出現数に基づいて、前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせのどちらが具体例を示す単語または単語の組み合わせであるかを判定する、
ことを特徴とする付記5に記載の特許文書中の単語または単語の組み合わせの例示装置。
(付記7)
特許文書中の単語または単語の組み合わせの理解を支援するための装置であって、
前記特許文書に含まれる単語または単語の組み合わせの具体例を示す対象となる明細書のテキストデータを、前記明細書を蓄積したデータベースから順次入力する入力部と、
前記明細書に対して示された拒絶の理由を示す文書を記録した拒絶理由データベースから、前記単語または単語の組み合わせの具体例を示す対象となる明細書に対して示された、拒絶の理由を示す文書のテキストデータを、前記明細書を特定する情報に基づいて検索する拒絶理由を示す文書の検索部と、
前記検索された拒絶の理由を示す文書のテキストデータから、あらかじめ記憶された対表現パターンと同じ対表現パターンの文字列を検出し、前記対表現パターンの文字列に基づいて、前記特許文書に記載された文字列と前記文字列に対比して示される文字列とをそれぞれ含む対となる文字列を検出し、前記対となる文字列から不要文字列を削除することにより、前記単語または単語の組み合わせの具体例を示す対象となる明細書のテキストデータに記載された単語または単語の組み合わせの文字列と前記単語または単語の組み合わせに対比して示される単語または単語の組み合わせの文字列の対を抽出する抽出部と、
前記抽出された対となる単語または単語の組み合わせの文字列の組を蓄積する単語または単語の組み合わせ対データベースと、
を含むことを特徴とする特許文書中の単語または単語の組み合わせの例示装置。
(付記8)
付記7に記載の単語または単語の組み合わせ対データベースを使って特許文書中の単語または単語の組み合わせの理解を支援するための装置であって、
前記特許文書に含まれる単語または単語の組み合わせの具体例を示す対象となる明細書を特定する情報を受け付ける指示部と、
前記特許文書中で前記単語または単語の組み合わせ対データベースに含まれる単語または単語の組み合わせを検索することにより、前記特許文書に含まれる単語または単語の組み合わせの文字列と対となる前記単語または単語の組み合わせの具体例を示す単語または単語の組み合わせの文字列を検索する検索部と、
前記検索された対となる単語または単語の組み合わせの文字列の組を出力する出力部と、
を含むことを特徴とする特許文書中の単語または単語の組み合わせの例示装置。
(付記9)
特許文書中の単語または単語の組み合わせの理解を支援するための装置に、
前記特許文書に含まれる単語または単語の組み合わせの具体例を示す対象となる明細書を特定する情報を受け付け、
前記明細書に対して示された拒絶の理由を示す文書を記録した拒絶理由データベースから、前記単語または単語の組み合わせの具体例を示す対象となる明細書に対して示された、拒絶の理由を示す文書のテキストデータを、前記明細書を特定する情報に基づいて検索し、
前記検索された拒絶の理由を示す文書のテキストデータから、あらかじめ記憶された対表現パターンと同じ対表現パターンの文字列を検出し、前記対表現パターンの文字列に基づいて、前記特許文書に記載された文字列と前記文字列に対比して示される文字列とをそれぞれ含む対となる文字列を検出し、前記対となる文字列から不要文字列を削除することにより、前記単語または単語の組み合わせの具体例を示す対象となる明細書のテキストデータに記載された単語または単語の組み合わせの文字列と、前記単語または単語の組み合わせに対比して示される単語または単語の組み合わせの文字列の対を抽出し、
前記抽出された対となる単語または単語の組み合わせの文字列の組を出力する、
機能を実行させるためのプログラム。
(付記10)
前記抽出の処理は、
文字列パターンマッチングの処理と、
文字列における位置検出の処理と、
不要文字辞書とのパターンマッチングと係り受け解析に基づく不要文字列の削除の処理と、
を含むことを特徴とする付記9に記載のプログラム。
(付記11)
前記抽出の処理は、
前記拒絶の理由を通知する文書に前記対表現パターンの文字列が存在した場合、本願特定パターンと引用文献特定パターンを検出し、これらのパターンの前または後から前記対となる文字列を特定し、あるいは、
文字列パターン「には」に続いて、第1の文字列、文字列パターン「に相当する」、第2の文字列の順に文字列が存在する場合には、前記第1の文字列と前記第2の文字列を前記対となる文字列パターンとして抽出する、
処理であることを特徴とする付記9に記載のプログラム。
(付記12)
前記不要文字列を削除する処理は、
品詞と文字列を要素とする形態素の辞書と、品詞の接続確率を定義したテーブルを用いて、最も確率が高い形態素列を選択する形態素解析処理と、
文節の接続ルールによって形態素を接続して文節を生成する文節分離処理と、
文節の接続確率と制約ルールによって、最も確率が高い係り受け先を選択する係り受け解析処理とからなる、
ことを特徴とする付記9に記載のプログラム。
(付記13)
前記拒絶の理由を示す文書の記載において引用されている引用文献の明細書のテキストデータと拒絶の対象とされている明細書のテキストデータとにおいて、前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせに対応する文字列データの該各明細書のテキストデータ内での出現位置を特定することにより、該対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせのどちらが具体例を示す単語または単語の組み合わせであるかを判定する機能を更に実行する、
ことを特徴とする付記9に記載のプログラム。
(付記14)
前記具体例の判定は、前記出現位置を特定するだけでは前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせのどちらが具体例を示す単語または単語の組み合わせであるかを判定できない場合に、前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせに対応する文字列で明細書のデータを蓄積した特許データベースを検索し、前記明細書の請求項中及び実施例中での前記各単語または単語の組み合わせの出現数に基づいて、前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせのどちらが具体例を示す単語または単語の組み合わせであるかを判定する処理である、
ことを特徴とする付記13に記載のプログラム。
(付記15)
コンピュータが特許文書中の単語または単語の組み合わせの理解を支援するための方法であって、
前記特許文書に含まれる単語または単語の組み合わせの具体例を示す対象となる明細書を特定する情報を受け付け、
前記明細書に対して示された拒絶の理由を示す文書を記録した拒絶理由データベースから、前記単語または単語の組み合わせの具体例を示す対象となる明細書に対して示された、拒絶の理由を示す文書のテキストデータを、前記明細書を特定する情報に基づいて検索し、
前記検索された拒絶の理由を示す文書のテキストデータから、あらかじめ記憶された対表現パターンと同じ対表現パターンの文字列を検出し、前記対表現パターンの文字列に基づいて、前記特許文書に記載された文字列と前記文字列に対比して示される文字列とをそれぞれ含む対となる文字列を検出し、前記対となる文字列から不要文字列を削除することにより、前記単語または単語の組み合わせの具体例を示す対象となる明細書のテキストデータに記載された単語または単語の組み合わせの文字列と、前記単語または単語の組み合わせに対比して示される単語または単語の組み合わせの文字列の対を抽出し、
前記抽出された対となる単語または単語の組み合わせの文字列の組を出力する、
ことを前記コンピュータが実行をすることを特徴とする特許文書中の単語または単語の組み合わせの例示方法
(付記16)
前記抽出の処理は、
文字列パターンマッチングの処理と、
文字列における位置検出の処理と、
不要文字辞書とのパターンマッチングと係り受け解析に基づく不要文字列の削除の処理と、
を含むことを特徴とする付記15に記載の特許文書中の単語または単語の組み合わせの例示方法。
(付記17)
前記抽出の処理は、
前記拒絶の理由を通知する文書に前記対表現パターンの文字列が存在した場合、本願特定パターンと引用文献特定パターンを検出し、これらのパターンの前または後から前記対となる文字列を特定し、あるいは、
文字列パターン「には」に続いて、第1の文字列、文字列パターン「に相当する」、第2の文字列の順に文字列が存在する場合には、前記第1の文字列と前記第2の文字列を前記対となる文字列パターンとして抽出する、
処理であることを特徴とする付記15に記載の特許文書中の単語または単語の組み合わせの例示方法。
(付記18)
前記不要文字列を削除する処理は、
品詞と文字列を要素とする形態素の辞書と、品詞の接続確率を定義したテーブルを用いて、最も確率が高い形態素列を選択する形態素解析処理と、
文節の接続ルールによって形態素を接続して文節を生成する文節分離処理と、
文節の接続確率と制約ルールによって、最も確率が高い係り受け先を選択する係り受け解析処理とからなる、
ことを特徴とする付記15に記載の特許文書中の単語または単語の組み合わせの例示方法。
(付記19)
前記拒絶の理由を示す文書の記載において引用されている引用文献の明細書のテキストデータと拒絶の対象とされている明細書のテキストデータとにおいて、前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせに対応する文字列データの該各明細書のテキストデータ内での出現位置を特定することにより、該対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせのどちらが具体例を示す単語または単語の組み合わせであるかを前記コンピュータが更に判定する、
ことを特徴とする付記15に記載の特許文書中の単語または単語の組み合わせの例示方法。
(付記20)
前記具体例の判定は、前記出現位置を特定するだけでは前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせのどちらが具体例を示す単語または単語の組み合わせであるかを判定できない場合に、前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせに対応する文字列で明細書のデータを蓄積した特許データベースを検索し、前記明細書の請求項中及び実施例中での前記各単語または単語の組み合わせの出現数に基づいて、前記対となる単語または単語の組み合わせの組を構成する各単語または単語の組み合わせのどちらが具体例を示す単語または単語の組み合わせであるかを判定する処理である、
ことを特徴とする付記19に記載の特許文書中の単語または単語の組み合わせの例示方法。
(付記21)
特許文書中の単語または単語の組み合わせの理解を支援するための装置であって、
前記特許文書を含む明細書を特定する情報を受け付ける受け付け部と、
拒絶の理由を示す文書を記録した拒絶理由データベースから、前記明細書に対して示された、拒絶の理由を示す文書のテキストを、前記明細書を特定する情報に基づいて検索する拒絶理由を示す文書の検索部と、
前記検索された拒絶の理由を示す文書のテキストから、前記特許文書に記載された単語または単語の組み合わせ文字列と前記明細書以外の文献に記載され、該単語または単語の組み合わせに対比して示される単語または単語の組み合わせの文字列を抽出する抽出部と、
該抽出された対となる単語または単語の組み合わせデータを出力する出力部と、
を具備することを特徴とする特許文書中の単語または単語の組み合わせの例示装置。

0170

101特許データベース
102特許文書検索部
103 出願番号抽出部
104拒絶理由通知検索部
105拒絶理由データベース
106言葉対抽出部
107表現パターン辞書
108 具体例付加対象特定部
109 表示部
201公報データ
202拒絶理由
1401 具体例判定部
1401−1 特許文書解析部
1401−2 言葉の出現位置特定部
1401−3 特許文書検索ヒット件数取得部
1401−4 判定部
1402 言葉対データベース
2401 言葉対検索部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 富士ゼロックス株式会社の「 データ管理システム」が 公開されました。( 2020/09/24)

    【課題】階層構造になっている管理システムにおいて、管理対象データの実体を最上位の装置が全て管理する場合と比較して、管理対象データがユーザの意図しない装置に提供されないシステムを提供する。【解決手段】管... 詳細

  • 株式会社ウフルの「 デバイス管理システム、デバイス管理方法、情報処理装置、及びプログラム」が 公開されました。( 2020/09/24)

    【課題】デバイスの信頼性を向上可能なデバイス管理システム、デバイス管理方法、情報処理装置、デバイス及びプログラムを提供する。【解決手段】デバイス管理システム1は、複数の情報処理装置2をネットワーク3で... 詳細

  • 本田技研工業株式会社の「 サーバ」が 公開されました。( 2020/09/24)

    【課題】車両の利用者が、該利用者の生活圏外の人であって前記利用者の属性に類似した属性を持つ地域人(地元民)が利用したPOI情報をリコメンドとして受けることができるサーバを提供する。【解決手段】サーバ1... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ