図面 (/)

技術 文書処理方法

出願人 キヤノン株式会社
発明者 若井聖範
出願日 1996年12月27日 (23年11ヶ月経過) 出願番号 1996-349579
公開日 1998年7月21日 (22年5ヶ月経過) 公開番号 1998-187702
状態 未査定
技術分野 文書処理装置 文書処理装置
主要キーワード 単語コード 適用ステップ 用例データ 隣接間 チェックステップ 文節情報 学習ステップ 適用せず
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1998年7月21日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

かな漢字変換において、変換の学習した後、その学習を変更する変更結果の記憶による悪影響を避けながら、最大の効果を得ることを目的とする。

解決手段

最初に、変換された結果から変更された部分を見つけ(s401)、変更された部分と何らかの関係がある他の部分との組み合わせを知り(s404)、関係のある部分の組み合わせを記憶し(s405)、記憶された部分の組み合わせを参照して変更結果を決定する。

概要

背景

従来の文書処理のかな漢字変換では、入力された文字列に対応するかな漢字混じり変換候補単語辞書を参照することなどで抽出され、以前に行った変更結果を記憶した変換候補単独の情報である単語学習や、あらかじめ用意された組み合わせの情報である用例辞書や、以前に行った変更結果の隣接間の組み合わせを記憶した隣接用構築学習が参照され、変換候補の中から1つに決定して変換結果として表示・出力していた。

また、同音語変更ステップは、かな漢字変換ステップで変換された結果を変更したい場合に起動され、変換結果の元となった入力文字列から変換可能な他の変換候補を表示し、選択・変更していた。

また、上記の同音語変更時や変換結果の確定時に、変更結果の変換候補単独の情報である単語学習や、隣接する変換候補の組み合わせの情報である隣接用例構築学習を記憶し、再び同じ文字列が入力された時には、変更結果を反映して変換されるようにしていた。

概要

かな漢字変換において、変換の学習した後、その学習を変更する変更結果の記憶による悪影響を避けながら、最大の効果を得ることを目的とする。

最初に、変換された結果から変更された部分を見つけ(s401)、変更された部分と何らかの関係がある他の部分との組み合わせを知り(s404)、関係のある部分の組み合わせを記憶し(s405)、記憶された部分の組み合わせを参照して変更結果を決定する。

目的

本発明は上記従来例に鑑みてなされたものであり、変更結果の記憶による悪影響を避けながら、最大の効果を得ることを目的とする。

効果

実績

技術文献被引用数
1件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

入力文字列からかな漢字混じり文に変換するかな漢字変換テップと、変換された文字列の一部が変換される元となった入力文字列から、変換可能な別のかな漢字混じり文に変更する同音語変更ステップとを具備した文字処理方法において、最初に変換された結果から変更された部分を見つける変更部分摘出ステップと、前記の部分と何らかの関係がある他の部分との組み合わせを知る用例構築学習組み合わせ摘出ステップと、前記の関係のある部分の組み合わせを記憶する用例構築学習組み合わせ記憶ステップと、前記のかな漢字変換ステップで、前記で記憶された部分の組み合わせを参照して変換結果を決定する用例構築学習適用ステップとを具備し、用例構築学習組み合わせ摘出ステップで摘出される組み合わせの関係とは、あらかじめ記憶されていた組み合わせの情報が適用された用例適用関係、または用例構築学習適用ステップで適用された用例構築学習適用関係、または係り受け関係を含む文法的な情報が適用された文法適用関係、または前記以外の共に変換されやすいという共起関係の情報が適用された共起情報適用関係、などであることを特徴とする文書処理方法

請求項2

前記用例構築学習適用ステップでは、用例構築学習組み合わせ記憶ステップで記憶された組み合わせを、組み合わせを構成する部分の順序を無視して適応することを特徴とする請求項1記載の文書処理方法。

請求項3

前記用例構築学習組み合わせ記憶ステップで、組み合わせを構成する部分の順序やそれぞれの部分の間の関係を記憶し、前記用例構築学習適用ステップで、前記用例構築組み合わせ関係記憶ステップで記憶された順序や関係が成立するかどうかを判断することを含むことを特徴とする請求項1記載の文書処理方法。

請求項4

前記用例構築学習組み合わせ記憶ステップは、記憶する組み合わせが既に存在しているかどうか判断する用例構築学習存在チェックステップと、既に存在する組み合わせの場合に、用例構築学習組み合わせ関係記憶ステップで記憶された情報を更新する用例構築学習組み合わせ関係更新ステップとを含むことを特徴とする請求項1記載の文書処理方法。

請求項5

用例構築学習組み合わせ摘出ステップで摘出される組み合わせの関係は、かな漢字変換ステップで変換された時に成立していた関係であることを特徴とする請求項1〜4いずれかに記載の文書処理方法。

請求項6

用例構築学習組み合わせ記憶ステップで記憶される情報は、組み合わせを構成するそれぞれの部分の単語を示す単語コードであることを特徴とする請求項1〜4いずれかに記載の文書処理方法。

技術分野

0001

本発明は例えば漢字の読みを入力して該当する文字表記に変換して出力するかな漢字変換を有する文書処理方法に関するものである。

背景技術

0002

従来の文書処理のかな漢字変換では、入力された文字列に対応するかな漢字混じり変換候補単語辞書を参照することなどで抽出され、以前に行った変更結果を記憶した変換候補単独の情報である単語学習や、あらかじめ用意された組み合わせの情報である用例辞書や、以前に行った変更結果の隣接間の組み合わせを記憶した隣接用構築学習が参照され、変換候補の中から1つに決定して変換結果として表示・出力していた。

0003

また、同音語変更ステップは、かな漢字変換ステップで変換された結果を変更したい場合に起動され、変換結果の元となった入力文字列から変換可能な他の変換候補を表示し、選択・変更していた。

0004

また、上記の同音語変更時や変換結果の確定時に、変更結果の変換候補単独の情報である単語学習や、隣接する変換候補の組み合わせの情報である隣接用例構築学習を記憶し、再び同じ文字列が入力された時には、変更結果を反映して変換されるようにしていた。

発明が解決しようとする課題

0005

従来の技術において、単語学習や隣接用例構築学習と用例辞書とが競合した時に、どちらを優先させるかのかという問題が発生する。

0006

例えば、単語学習と用例辞書とが競合した時に単語学習を優先すると、以前に別の入力文字列で「お湯がとても暑い」を「お湯がとても熱い」と変更して「熱い」を単語学習したことで、本来は用例辞書の情報「は暑い」から「夏はとても暑い」と変換されるべきなのに、「夏はとても熱い」と誤変換を起こしてしまう。

0007

逆に、用例辞書を優先すると、「夏はとても暑い」を「夏はとても熱い」と変更して「熱い」を単語学習したのにもかかわらず、それ以降も「夏はとても暑い」と変換されることになる。

0008

一方、隣接用例構築学習が用例辞書と競合した時に隣接用例構築学習を優先すると、以前に別の入力文字列で「夏はとても暑い」を「夏はとても熱い」と変更して「とても熱い」の組み合わせを隣接用例構築学習したことで、本来は用例辞書の情報「本は厚い」から「本はとても厚い」と変換されるべきなのに、「本はとても熱い」と誤変換を起こしてしまう。

0009

逆に、用例辞書を優先すると、「夏はとても暑い」を「夏はとても熱い」と変更して「とても熱い」の組み合わせを隣接用例構築学習したのにもかかわらず、それ以降も「夏はとても暑い」と変換されることになる。

0010

以上のように、単語学習や隣接用例構築学習では、どうしても悪影響を招くか又は変更結果の学習の効果をなくす結果になっていた。

0011

本発明は上記従来例に鑑みてなされたものであり、変更結果の記憶による悪影響を避けながら、最大の効果を得ることを目的とする。

課題を解決するための手段

0012

上記目的を達成するために、本発明の文書処理方法は以下の様なステップを備える。

0013

請求項1記載の発明は、入力文字列からかな漢字混じり文に変換するかな漢字変換ステップと、変換された文字列の一部が変換される元となった入力文字列から、変換可能な別のかな漢字混じり文に変更する同音語変更ステップとを具備した文字処理方法において、最初に変換された結果から変更された部分を見つける変更部分摘出ステップと、前記の部分と何らかの関係がある他の部分との組み合わせを知る用例構築学習組み合わせ摘出ステップと、前記の関係のある部分の組み合わせを記憶する用例構築学習組み合わせ記憶ステップと、前記のかな漢字変換ステップで、前記で記憶された部分の組み合わせを参照して変換結果を決定する用例構築学習適用ステップとを具備し、用例構築学習組み合わせ摘出ステップで摘出される組み合わせの関係とは、あらかじめ記憶されていた組み合わせの情報が適用された用例適用関係、または用例構築学習適用ステップで適用された用例構築学習適用関係、または係り受け関係を含む文法的な情報が適用された文法適用関係、または前記以外の共に変換されやすいという共起関係の情報が適用された共起情報適用関係、などであることを特徴とする文書処理方法である。

0014

請求項2記載の発明は、前記用例構築学習適用ステップでは、用例構築学習組み合わせ記憶ステップで記憶された組み合わせを、組み合わせを構成する部分の順序を無視して適応することを特徴とする請求項1記載の文書処理方法である。

0015

請求項3記載の発明は、前記用例構築学習組み合わせ記憶ステップで、組み合わせを構成する部分の順序やそれぞれの部分の間の関係を記憶し、前記用例構築学習適用ステップで、前記用例構築組み合わせ関係記憶ステップで記憶された順序や関係が成立するかどうかを判断することを含むことを特徴とする請求項1記載の文書処理方法である。

0016

請求項4記載の発明は、前記用例構築学習組み合わせ記憶ステップは、記憶する組み合わせが既に存在しているかどうか判断する用例構築学習存在チェックステップと、既に存在する組み合わせの場合に、用例構築学習組み合わせ関係記憶ステップで記憶された情報を更新する用例構築学習組み合わせ関係更新ステップとを含むことを特徴とする請求項1記載の文書処理方法である。

0017

請求項5記載の発明は、用例構築学習組み合わせ摘出ステップで摘出される組み合わせの関係は、かな漢字変換ステップで変換された時に成立していた関係であることを特徴とする請求項1〜4いずれかに記載の文書処理方法である。

0018

請求項6記載の発明は、用例構築学習組み合わせ記憶ステップで記憶される情報は、組み合わせを構成するそれぞれの部分の単語を示す単語コードであることを特徴とする請求項1〜4いずれかに記載の文書処理方法である。

0019

本発明によれば、最初に変換された結果から変更された部分を見つけ、上記の部分と何らかの関係がある他の部分との組み合わせを知り、上記の関係のある部分の組み合わせを記憶し、上記で記憶された部分の組み合わせを参照して変換結果を決定することで、従来技術の単語学習や用例構築学習を組み合わせだけでは、避けられなかった誤変換や、学習の効果が出なくなるという問題点を解決できる。

0020

また、最初に変換された結果から変更された部分を見つけ、上記の部分と何らかの関係がある他の部分との組み合わせを知り、上記の関係のある部分の組み合わせを記憶し、上記で記憶された部分の組み合わせを、組み合わせを構成する部分の順序を無視して参照して変換結果を決定することで、組み合わせを構成する部分の順序が学習時と同じ場合にしか適用しない場合の用例構築学習データ数の増大と、処理時間の増大と、保存のためのメモリサイズの増大を避けることができる。

0021

最初に変換された結果から変更された部分を見つけ、上記の部分と何らかの関係がある他の部分との組み合わせを知り、上記の関係のある部分の組み合わせと、組み合わせを構成する部分の順序やそれぞれの部分の間の関係を記憶し、上記で記憶された部分の組み合わせを参照して、上記で記憶された順序や関係が成立するかどうか判断して変換結果を決定することで、変更結果の学習時に作成された用例構築学習データが、作成された時とは異なる組み合わせの順序や関係の入力文字列に対して適用されることで、誤変換を起こすような悪影響を避けることができる。

0022

最初に変換された結果から変更された部分を見つけ、上記の部分と何らかの関係がある他の部分との組み合わせを知り、上記の関係のある部分の組み合わせが既に記憶されているかされているか判断し、以前に記憶されていない組み合わせの場合には、上記の関係のある部分の組み合わせと、組み合わせを構成する部分の順序やそれぞれの部分の間の関係を記憶し、以前に記憶されている組み合わせの場合には、組み合わせを構成する部分の順序やそれぞれの部分の間の関係の記憶を更新し、上記で記憶された部分の組み合わせを参照して、上記で記憶された順序や関係が成立するかどうか判断して変換結果を決定することで、用例構築学習しようとしている組み合わせの順序やその他の条件が異なったとしても、それぞれ別の用例構築学習データが作成されることを避けられ、用例構築学習データの増加を抑えることができる。また、用例構築学習データの増加による、処理時間の増大と、メモリサイズの増大も同時に避けることができる。

0023

さらに、上記の記憶される関係のある組み合わせとして、変換された時に成立していたものを用いることで、新たに関係を見つける必要がなく、処理が簡略化される。

0024

記憶される組み合わせの情報として、組み合わせを構成する単語の単語コードを用いることで、単語そのものをデータとして持つよりもメモリが節約される。

発明を実施するための最良の形態

0025

以下、添付図面を参照して本発明の好適な実施形態例を詳細に説明する。

0026

図1は、本実施形態例の文書処理装置概略構成を示すブロック図である。

0027

図1において、101は装置全体を制御するCPU、104はCPU101によって実行される制御プログラムや各種データを記憶しているプログラムメモリで、図2以降に示す各種機能を実行する制御プログラムが記憶されている。102はキーボードで、マウス等のポインティングデバイス102aを接続し、オペレータの操作により各種データやコマンドなどが入力される。103は、例えばCRT液晶などで構成された表示部である。105はRAMで、CPU101の実行時にワークエリアとして使用されるとともに、、ハードディスク106よりロードされた単語辞書105aや、用例辞書105b、単語学習105c、用例構築学習105dが記憶されている。106は外部記憶装置としてのハードディスク、107も同様に外部記憶装置であるフロッピディスク装置である。108はプリンタで、文書データなどの印刷に使用される。ここで、プログラムメモリ104や単語辞書105aや、用例辞書105b、単語学習105c、用例構築学習105dは、外部記憶装置106,107や、図には記入されていないがネットワークを介して外部の環境に格納されていることもあり、CPU101の制御でRAM105に読み込まれることもある。

0028

[第1実施形態例]図2は入力文字列をかな漢字混じり文に変換するかな漢字変換処理のフローチャートであり、図3は変換結果を変更する時に起動する同音語変更処理のフローチャートであり、図4は変更された結果を学習する変更結果学習処理のフローチャートである。

0029

図5はかな漢字変換処理や同音語変更処理で文節候補を抽出するために参照される単語の情報が記憶された単語辞書であり、図6はかな漢字変換処理で抽出された候補を選択するために参照される単語の組み合わせの情報が記憶された用例辞書である。

0030

まず、従来技術で説明したものと同じ入力文字列「おゆがとてもあつい」を用いて、本特許の実施形態例を説明する。

0031

ここで、説明を簡単にするため、単語辞書には図5で示した7つの単語だけが格納され、用例辞書には図6で示したただ2つの組み合わせだけが格納され、単語学習及び用例構築学習はされてもおらず、データは存在していないものとする。

0032

また、本特許を説明するのに必要ない前半の「おゆがとても」は、既に「お湯がとても」と変換されているものとする(図7参照)。

0033

図2のかな漢字変換処理が起動されると、まだ変換されていない部分「あつい」が解析される。

0034

ステップS201では、入力文字列「あつい」と同じ入力読みを持つ単語を単語辞書(図5)を参照し、文節候補「暑い」「熱い」「厚い」が抽出される。

0035

続いて、ステップS202では用例構築学習データを参照して、学習されている組み合わせがあればそれを変換結果として決定するのだが、まだ学習されていないのでステップS204に進む。

0036

ステップS204では、図6に示されている用例辞書を参照し、文節候補「暑い」と「夏」、および「厚い」と「本」の組み合わせが見つかるが、変換結果に「夏」や「本」が存在しないので用例は適用されず、ステップS206に進む。

0037

ステップS206では、単語学習データを参照して、学習されている単語があればそれを変換結果として決定するのだが、まだ学習されていないのでステップS207に進む。

0038

ステップS207では、文節候補「暑い」「熱い」「厚い」のどれかに決定し、変換結果を表示する。この場合には、用例構築学習も、用例も、単語学習も適用されていないので、たまたま先に抽出された「暑い」が変換結果として表示される。

0039

続いて、ステップS208で変換結果の文節情報が作成される。図8に示すように、文節情報のNOは3番目なので3となり、入力は「あつい」で、変換結果が「暑い」で、変更の有無はただ変換されただけなので「なし」で、他の文節との関係は用例構築学習も、用例も適用されていないので、「なし」となる。

0040

この変換結果を変更したい時、変更したい部分を指定して図3の同音語変更ステップが起動される。

0041

まず、ステップS301では、かな漢字変換処理の時と同様に、変更したい部分の入力「あつい」から、文節候補「暑い」「熱い」「厚い」が抽出される。ステップS302でそれらの候補が表示され、ステップS303で候補の変更が指示された場合、ステップS305で変更結果が出力され、表示される。そして、図9に示すように、ステップS306で変換結果の文節情報は変更され、変更の有無が「あり」になる。

0042

ここで、同じ文字列が入力された時に、上記の変更結果になるようにするために、図4の変更結果学習処理が起動される。

0043

まず、ステップS401では文節情報データの項目「変更」を参照して、変更「あり」の部分を探す。この場合、文節情報NO.3の、入力「あつい」、結果「熱い」が変更のあった部分である。

0044

続いてステップS403では、文節情報データの項目「関係」を参照して、関係のある文節との用例構築学習の対象となる組み合わせを探す。このときは、関係「なし」なので、ステップS406に進む。ステップS406では、変更された単語の持つ単語コードを記憶することで、単語学習する。「熱い」の単語コードは、図5に示す単語辞書から「1」であるとわかるので、図9のように単語学習データが作成される。

0045

このように学習の後、また同じ文字列「おゆがとてもあつい」を入力して、かな漢字変換処理を起動すると、ステップS206までは前回と同様に進むが、ステップS206で図9に示されている単語学習を参照すると、文節候補「熱い」が学習されているので、変換結果としてこの単語学習を採用し、「熱い」と決定され出力される。

0046

ここまでは、従来技術と同じ変換結果を得ている。そこで、従来技術では単語学習よりも用例を優先した場合には学習の効果をなくし、用例よりも単語学習を優先した場合には誤変換を起こした文字列「なつはとてもあつい」が入力された場合を説明する。

0047

ここで、前回と同様に説明を簡単にするために、「夏はとても」は既に変換されているものとする(図10参照)。

0048

図2のかな漢字変換処理が起動されると、ステップS204までは前回と同様に進むが、ステップS204で、図6に示す用例辞書を参照すると、文節候補「暑い」と「夏」の組み合わせが見つかり、しかも変換結果に「夏」が存在するので、用例が適用され、単語学習(図9)の「熱い」を適用せずに、ステップS207に進み、変換結果が用例の適用された「暑い」に決定される。

0049

続いてステップS208では、「夏」と「暑い」に用例が適用されたので、図11に示すように、文節情報データのNO3が作成され、「関係」の項目に「1」と格納される。

0050

このように、従来技術において、単語学習よりも用例を優先した場合と同じように、正しい変換結果が得られる。

0051

次に、この変換結果を前回と同様に同音語変更ステップにより「熱い」に変更すると、図12に示すように、対応するNO3の文節情報のデータ項目「変更」が「あり」に変更される。

0052

更に、図4に示す変更結果学習の処理が起動されると、ステップS403までは前回と同様に進むが、ステップS403で文節情報データの項目「関係」に関係のある文節NOが「1」と記されているので、ステップS405に進み、その単語コードの組み合わせを記憶することで、用例構築学習される。

0053

この場合、組み合わせの一方「夏」の単語コードは単語辞書(図5)から「5」であり、もう一方の「熱い」の単語コードは「1」なので、図12のように用例構築学習データが作成される。

0054

次に、また同じ文字列「なつはとてもあつい」を入力して、かな漢字変換ステップを起動すると、ステップS202までは前回と同様に進むが、ステップS202で用例構築学習(図12)を参照すると文節候補「熱い」が、変換結果「夏」と共に組み合わされて用例構築学習されているので、変換結果として決定され出力される。

0055

このように、従来技術において、単語学習よりも用例を優先した場合には学習の効果がなかったものでも、学習効果を得られるようになり、単語学習の問題点を解決することができた。

0056

一方、これは従来技術において、用例よりも隣接用例構築学習を優先した場合と同じ正しい変換結果である。

0057

そこで、従来技術では隣接用例構築学習よりも用例を優先した場合には学習の効果をなくし、用例よりも隣接用例構築学習を優先した場合には誤変換を起こした文字列「ほんはとてもあつい」が入力された場合を説明する。

0058

ここで、前回と同様に説明を簡単にするために、「本はとても」は既に変換されているものとする(図13)。

0059

図2のかな漢字変換ステップが起動されると、ステップS202までは前回と同様に進むが、ステップS202で用例構築学習(図12)を参照すると文節候補「熱い」が、「夏」と共に組み合わされて用例構築学習されているが、変換結果に「夏」が存在しないので、適用されずステップS204に進む。

0060

ステップS204で用例辞書(図6)を参照すると文節候補「厚い」と「本」の組み合わせがあり、変換結果にも「本」が存在するので、適用され変換結果として決定される(図14)。

0061

このように、従来技術において、用例よりも隣接用例辞書を優先した場合には誤変換をおこしたものでも、正しく変換されるようになり、隣接用例構築学習の問題点を解決することができた。

0062

上記に示したように、本特許により従来技術の単語学習や隣接用例構築学習では解決できなかった問題点を解決することができた。

0063

また、本実施形態例のかな漢字変換ステップでは、用例構築学習や用例が適用されると、単語学習などの情報が適用されないように説明されているが、用例構築学習や用例だけでは候補を決定できない時には、他の情報を利用することも可能である。

0064

[第2実施形態例]第1実施形態例では、用例構築学習する組み合わせを決定する情報として、用例または用例構築学習が適用された組み合わせを対象としていたが、本実施形態例では係り受け関係を含む文法的な情報が適用された組み合わせも対象とする。

0065

ここで、係り受け関係を含む文法的な情報の適用とは、単語辞書(図16)に格納されたそれぞれの単語が持つ文法情報や、文節候補を抽出した時に得られる情報が考えられる。

0066

本実施形態例では、説明を簡単にするため、それぞれの単語は、「主語になる」「述語になる」「どちらにもならない」の情報を持ち、「主語→述語」の係り受け関係が成立する組み合わせだけに適用するものとして行う。

0067

基本的には、用例の適用が、係り受け関係を含む文法的な情報の適用に置き換えられただけであり、図2のかな漢字変換ステップのステップS204の用例適用が、図15のステップS1504の係り受け適用に置き換わっただけなので、変更点を中心に説明する。

0068

第1実施形態例で説明したものと同じ文字列「おゆがとてもあつい」が入力されると、ステップS1504までは、第1実施形態例に実行される(図7)。

0069

ステップS1504では、抽出された文節候補「暑い」「熱い」「厚い」のすべてが「述語になり」、変換結果の「お湯が」が「主語になる」ので、「主語→述語」の関係が成立し、適用される。

0070

ところが、これだけでは文節候補を1つに決定できないため、ステップS1507ではたまたま最初に抽出された「暑い」に変換結果が決定され、ステップS1508でそれぞれが関係があるものとして、文節情報が作成される(図17)。

0071

更に、第1実施形態例と同じように同音語変更ステップ、変更結果学習ステップが実行されるが、本実施形態例では上記のようにかな漢字変換ステップで関係が認められたので、用例構築学習される(図18)。

0072

また、本実施形態例のかな漢字変換ステップでは、用例構築学習や係り受け関係を含む文法的な情報が適用されると、単語学習などの情報が適用されないように説明されているが、用例構築学習や係り受け関係を含む文法的な情報だけでは候補を決定できない時には、他の情報を利用することも可能である。

0073

更に、本実施形態例では、第1実施形態例の用例適用を置き換えているが、両方適用することも可能である。

0074

[第3実施形態例]第1実施形態例では、用例構築学習する組み合わせを決定する情報として、用例または用例構築学習が適用された組み合わせを対象としていたが、本実施形態例では上記以外の共に変換されやすいという共起関係の情報が適用された組み合わせも対象とする。

0075

ここで、共起関係の情報とは、用例のように実際に変換される文例があるわけでもなく、係り受け関係のように文法的に得られるものではないが、一方の単語が変換されると他方の単語が変換されやすくなる傾向があるものの関係を示した情報である。

0076

逆に言えば、用例や係り受け関係は、共起関係の一部であるとも言える。

0077

本実施形態例では、単語辞書(図5)とは別に、一方が変換されることで変換されやすくなる単語群をまとめた共起辞書図20)を用いるものとして説明している。

0078

基本的には、用例の適用が、共起関係の情報の適用に置き換えられただけなので、図2のかな漢字変換ステップのステップS204の用例適用が、図19のステップS1904の共起関係適用に置き換わっただけなので、変更点を中心に説明する。

0079

第1実施形態例で説明したものと同じ文字列「おゆがとてもあつい」が入力されると、ステップS1904までは、第1実施形態例と同様に実行される(図7)。

0080

ステップS1904では、共起辞書(図20)を参照して、抽出された文節候補のうち「暑い」「熱い」が、変換結果の「お湯」と共に共起関係にあるので適用される。

0081

ところが、これだけでは文節候補を1つに決定できないため、ステップS1907ではたまたま最初に抽出された「暑い」に変換結果が決定され、ステップS1908でそれぞれが関係があるものとして、文節情報が作成される(図17)。

0082

更に、第1実施形態例と同じように同音語変更ステップ、変更結果学習ステップが実行されるが、本実施形態例では上記のようにかな漢字変換ステップで関係が認められたので、用例構築学習される(図18)。

0083

また、本実施形態例のかな漢字変換ステップでは、用例構築学習や共起関係の情報が適用されると、単語学習などの情報が適用されないように説明されているが、用例構築学習や共起関係の情報だけでは候補を決定できない時には、他の情報を利用することも可能である。

0084

更に、本実施形態例では、第1実施形態例の用例適用を置き換えているが、両方適用することも可能であり、第2実施形態例の係り受け関係を含む文法情報の適用も組み合わせることも可能である。

0085

[第4実施形態例]上記第1〜第3実施形態例において、学習時の条件と異なる状況では、前に行った学習を適用しないと、用例構築学習データが増加し、処理時間の増加と、記憶するためのメモリサイズが増大する。

0086

第4の実施形態例について、実施形態例1の動作と共通の部分が多いので、図2図4のフローチャートと図5図12および図21図22を用いて説明する。

0087

図2のフローチャートにおいて、図7図8に示したように、「夏はとても暑い」と変換される。この変換結果を変更したいとき、変更したい部分を指定して図3の同音変更ステップが実行される。これは、図9を用いて前に実施形態例1のところで説明した。

0088

また、同じ文字列が入力されたとき、上記の変更結果となるようにするため、図4に示す変更結果学習ステップが起動されることも同様である。

0089

このため、また同じ文字列「なつはとてもあつい」を入力すると、学習結果を反映して、「夏はとても熱い」と変換される。

0090

さて、変換結果を変更して学習結果と違う順序で入力された場合について、入力文字「あついなつ」を用いて説明する。ここで前回と同様に説明を簡略にするために、「暑い」は既に変換されているものとする。ただし、「暑い」は候補が1つに決定されたわけではなく、別に「熱い」「厚い」の候補が存在する(図21)。

0091

かな漢字変換のステップを起動すると、ステップS202までは前回と同様に進むが、ステップS202で用例構築学習を参照すると(図9)、文節候補「夏」が変換結果「熱い」と共に組み合わされて用例構築学習されているので、変換結果としてとして決定され出力される(図11)。この際に、変更結果を学習したときの組み合わせの順序は「夏は熱い」であり、今回の変換結果「熱い夏」とは異なるが、組み合わせの順序は適用の際に考慮していないので、順序が異なっても適用ができる。このように、変換結果を学習し学習したときと異なる順序で入力されたときでも、用例構築学習が適用され、正しい結果が得られる。

0092

[第5実施形態例]作成された用例構築学習データの組み合わせの順序が変わっても適用されるようにすると、用例構築学習したときの組み合わせを構成する単語の順序やそれらの関係と、実際に適用して変換結果を決定するときの組み合わせと構築する単語の順序やそれらの関係が異なっているときに問題がある。

0093

例えば、文字列「あきがたくさんある」が入力された場合、用例「空きがある」を参照して「空きがたくさんある」に決定される。この変換結果をユーザーが「空きがたくさん有る」に変更して学習すると、「空きが有る」が用例構築学習される。ここで、文字列「あるあきのひに」が入力された場合、用例構築学習データ「空きが有る」が順序を逆にして適用されてしまい、「有る空きの日に」と誤変換を起こしてしまい、用例構築学習による悪影響を招いてしまう。これは、用例構築学習でーたに、組み合わせを構成する部分の順序やそれぞれの部分の間の関係を明確に考慮してなかったためである。

0094

この実施形態例では、作成された用例構築学習データの悪影響による誤変換をさけることを目的としている。

0095

第5実施形態例も、第1実施形態例と同様の部分が多いので、図2図4のフローチャート及び図23図24のフローチャート、図25図36を参照して説明する。

0096

まず、用例構築学習することで誤変換を起こす入力文字列「あるあきのひに」を用いて、第5実施形態例を説明する。ここで、説明を簡単にするため、単語辞書には図25で示した10の単語だけが格納され、用例辞書には図26で示したただ2つの組み合わせだけが格納され、単語学習および用例構築学習はされておらず、データは存在していないものとする。また、本特許を説明するのに必要ない前半の「ある」はすでに変換されているものとする。ただし、「ある」は候補が1つに決定されたわけではなく、別に「有る」の候補が存在する(図27)。

0097

図2のかな漢字変換ステップが起動されると、まだ変換されていない部分「あきのひに」が解析される。ステップS201では、入力文字列の一部「あきの」と同じ入力読みを持つ単語を単語辞書(図25)を参照し、文節候補「の」「空きの」が抽出される。続いて、ステップS202では用例構築学習データを参照して、学習されている組み合わせがあればそれを変換結果として決定するのだが、まだ学習されていないのでステップS204に進む。ステップS204では、用例辞書(図26)を参照し、「空き」と「ある」の組み合わせが見つかり変換結果にも「ある」と「空き」が存在するが、関係を規定する規定情報は「空き→ある」の順序固定であり順序が異なるため、用例は適用されず、ステップS206に進む。ステップS206では、単語学習データを参照して、学習されている単語があればそれを変換結果として決定するのだが、まだ学習されていないのでステップS207に進む。ステップS207では、文節候補「秋の」「空きの」のどれかに決定し、変換結果を出力する。この場合には、用例構築学習も、用例も、単語学習も適用されていないので、たまたま先に抽出された「秋の」が変換結果として出力される。続いて、ステップS208で変換結果の情報が作成され、出力される。この場合、文節情報のNoは2番目なので2となり、入力は「あきの」で、変換結果が「秋の」で、変更の有無はただ変換されただけなので「なし」で、他の文節との関係は用例構築学習も、用例も適用されていないので、「なし」となり、関係を規定する条件も関係自体が「なし」なので「なし」になる。このように入力文字列すべてを解析し、変換結果を決定したものが図28である。

0098

次に、上記では適用されなかった用例、「空き→ある」が適用されるような文字列「あきがたくさんある」が入力された場合について説明する。ここで、前回と同様に説明を簡単にするために、「秋がたくさん」はすでに変換されているものとする。ただし、「秋が」は候補が1つに決定されたわけではなく、別に「空きが」の候補が存在する(図29)。

0099

図2のかな漢字変換ステップが起動されると、ステップS201で文節候補「ある」「有る」が抽出され、まだ用例構築学習されていないのでステップS2−4まで進む。そこで、用例辞書(図26)を参照すると、文節候補「ある」「空き」の組み合わせが、規定情報が順序固定として見つかり、しかも変換結果に「空きが」が存在し、その順序も「空き→ある」を満たしているので、用例が適用され、ステップS207で変換結果「空きがたくさんある」に決定される。続いてステップS208では、「空き」と「ある」に用例が適用されたので、「あきが」の文節情報として「空きが」が決定され、関係の項目に「ある」の文節情報データのNoの「3」が格納され、逆に「ある」の関係の項目には「空きが」の文節情報のNoの「1」が格納される。この場合、文節情報Noの1には1−1と1−2があるが、この時点では特定する必要はないので「1」となる。

0100

また、上記の関係を規定する情報として、用例辞書で示されるように「順序固定」をそれぞれの項目のところに格納する。

0101

この変換結果を変更したい時、変更したい部分を指定して図3の同音語変更ステップが起動される。まず、ステップS301では、かな漢字変換ステップの時と同様に、変更したい部分の入力「ある」から、文節候補「ある」「有る」が抽出される。続いて、ステップS302でそれらの候補が表示され、ステップS303で候補の変更が指示された場合、ステップS305で変更結果が出力され、ステップS306で変換結果の情報が変更され、変更の有無が「あり」になる(図30)。

0102

ここで、同じ文字列が入力された時に、上記の変更結果になるようにするために、図4の変更結果学習ステップが起動される。まず、ステップS402では文節情報データの項目「変更」を参照して、変更「あり」の部分を探す。この場合、文節情報No.3の、入力「ある」、結果「有る」が変更のあった部分である。続いてステップS403では、文節情報データの項目「関係」を参照して、関係のある文節との用例構築学習の対象となる組み合わせを探す。ここで、関係のある文節Noが「1」と記されているので、ステップS405に進み、図24の用例構築学習組み合わせ記憶ステップが起動される。ステップS2401では上記で見つかった組み合わせの単語コードを記憶し、続いてステップS2402で文節情報データの規定の項目を参照して、変換された時に適用された関係の規定情報を記憶する。この場合、組み合わせの一方「空き」の単語コードは単語辞書(図25)から「1」であり、もう一方の「有る」の単語コードは「5」であり、用例が適用された時の規定情報は「順序固定」なので、図13のように用例構築学習データが作成される。

0103

そこで、以前に用例が適用されなかった文字列「あるあきのひに」を入力して、かな漢字変換ステップを起動すると、ステップS202までは前回と同様に進み、図23の用例構築学習適用ステップが起動される。ステップS2301では、文節候補の「秋の」か「空きの」を持つ用例構築学習データが抽出される。この場合、上記(図31)で作成された「空きの有る」が抽出され、ステップS2303に進む。ステップS2303では、上記で抽出された用例構築学習データの持つ規定情報を参照して、用例構築学習データを適用する時の関係が規定されている場合、実際に抽出された文節候補を含む変換結果がその関係を満たしているかどうか判断される。この場合、抽出された「空きの有る」は、その順序が規定されている。これに対して、実際の変換結果は「有る空きの」となっており、その順序を満たしていないので、関係が不成立となり、用例構築学習の適用が不可能になり、ステップS204以降を続行し、以前の変換結果「ある秋の日に」になる(図28)。このように、「有る空きの日に」と誤変換を起こしてしまうような悪影響が解決された。

0104

上記では、用例構築学習データの組み合わせの順序を逆にした時の悪影響を避けた例を説明したが、次に順序を逆にして適用しても良い例として、文字列「なつはとてもあつい」が入力された場合について説明する。ここで、前回と同様に説明を簡単にするために、「夏はとても」はすでに変換されているものとする(図32)。

0105

ステップS204で用例データ「夏は暑い」が適用されるので、最終的に図15の変換結果が得られる。ここで、文節情報データの[関係]の項目は「夏は」「厚い」のお互いに示すようにセットされ、[規定]の項目は用例が適用された時の条件の規定情報「順序自由」がセットされる(図33)。

0106

その後、同音語変換ステップで「暑い」を「熱い」に変更し、変更結果学習ステップで変更結果を学習すると図34のように「夏は熱い」が用例構築学習される。ここで作成された用例構築学習データの規定情報は、かな漢字変換ステップで用例が適用された時の規定情報の「順序自由」がセットされる。

0107

次に、上記の用例構築学習データの順序を逆にしたような文字列「あついなつ」が入力された場合について説明する。ここで前回の同様に説明を簡単にするために、「暑い」はすでに変換されているものとする。ただし、「暑い」は候補が1つに決定されたわけではなく、別に「熱い」の候補が存在する(図35)。

0108

図2のかな漢字変換ステップが起動され、文節候補「夏」に対してステップS202で用例構築学習が適用される。その結果、上記(図34)で作成された用例構築学習データ「夏が熱い」が抽出され、文節候補「夏」を含んだ変換結果と順序が異なるが、規定情報によれば「順序自由」なので、用例構築学習が適用され、「熱い夏」と変換される(図36)。このように、作成された用例構築学習の組み合わせの順序が自由の場合には、入力された文字列の順序が用例構築学習データと逆であっても適用され、正しい変換結果を得ることができる。

0109

このように、作成された用例構築学習データが、組み合わせの順序を逆にして適用してはいけない時には適用せず、適用して良い時だけ適用することで、用例構築学習の悪影響を避けながら、効果を得ることを可能にした。

0110

[第6実施形態例]第5実施形態例では、用例構築学習データの持つ規定情報として、組み合わせを構成する単語の順序が固定か、自由かということで適用を制限したが、それぞれの組み合わせを構成する単語の係り受け関係を含む文法的な関係を規定情報として持つことも考えられる。基本的には、第1実施形態例と同じなので詳細については説明しないが、例えば「主語」と「述語」の関係において作成された用例構築学習データは、「主語」と「述語」の関係が可能な場合にだけ適用するというものが考えられる。また、第1実施形態例で説明した順序の情報と両方を組み合わせることも考えられる。

0111

[第7実施形態例]第5実施形態例では、用例構築学習データの持つ規定情報として、組み合わせを構成する単語の順序が固定か、自由かということで適用を制限したが、それぞれの組み合わせを構成する単語に後続する文字列を規定情報として持つことも考えられる。基本的には、第1実施形態例と同じなので詳細については説明しないが、例えばどのような文字列も後続しないで作成された「結奈江」のような用例構築学習データは、「結城が奈江」のように「が」後続した場合には適用せずに、正しく「勇気が萎え」と変換されるようにすることも考えられる。また、第1実施形態例で説明した順序の情報や、第2実施形態例で説明した係り受け関係を含む文法的な条件とも組み合わせることも考えられる。

0112

[第8実施形態例]入力文字列「なつはとてもあつい」を用いて、本発明の実施形態例を説明する。ここで、説明を簡単にするため、単語辞書には図25で示した10の単語だけが格納され、用例辞書には図38で示した、ただ2つの組み合わせだけが格納され、単語学習および用例構築学習はされておらず、データは存在しないものとする。また、本発明を説明するのに必要ない前半の「なつはとても」は既に変換されているものとする。

0113

図2のかな漢字変換ステップが起動されると、まだ変換されていない部分「あつい」が解析される。ステップS201では、入力文字列の一部「あつい」と同じ入力読みを持つ単語を単語辞書(図25)を参照し、文節候補「暑い」「熱い」が抽出される。続いて、ステップS202では、用例構築学習データを参照して、学習されている組み合わせがあればそれを変換結果として決定するのだが、まだ学習されていないのでステップS204に進む。ステップS204では、用例辞書(図38)を参照し、文節候補「暑い」と「夏」の組み合わせが見つかり変換結果にも「夏」が存在するので用例が適用され、ステップS206の単語学習の適用を行わずに、ステップS207に進む。ステップS207では、文節候補「暑い」「熱い」のどれかに決定し、変換結果を出力する。この場合には、用例が適用されたので、「暑い」が変換結果として出力される。続いて、ステップS208で変換結果の情報が作成され、出力される。この場合、文節情報のNo.は3番目なので3となり、入力は「あつい」で、変換結果が「暑い」で、変更の有無はただ変換されただけなので「なし」で、他の文節との関係は用例が適用されたので、適用された用例の組み合わせのもう一方の「夏は」の文節情報のNo.の1がセットされる。このように入力文字列の全てを解析し、変換結果を決定したものが図11である。

0114

この変換結果を変更したい時、変更したい部分を指定して図3の同音語変更ステップが起動される。まず、ステップS301では、かな漢字変換ステップの時と同様に、変更したい部分の入力「あつい」から、文節候補「暑い」「熱い」が抽出される。続いて、ステップS302でそれらの候補が表示され、ステップS303で候補の変更が指示された場合、ステップS305で変更結果が出力され、ステップS306で変換結果の情報が変更され、変更の有無が「あり」になる(図39)。

0115

ここで、同じ文字列が入力された時に、上記の変更結果になるようにするために、図4の変更結果学習ステップが起動される。まず、ステップS401では文節情報データの項目「変更」を参照して、変更「あり」の部分を探す。この場合、文節情報No.3の、入力「あつい」、結果「熱い」が変更のあった部分である。続いてステップS403では、文節情報データの項目「関係」を参照して、関係のある文節との用例構築学習の対象となる組み合わせを探す。ここで、関係のある文節No.が「1」と記されているので、ステップS405に進み、図37の用例構築学習の組み合わせ記憶ステップが起動される。ステップS3701では、これから記憶しようとする組み合わせ「夏は熱い」が既に用例構築学習されていないかどうかチェックする。この場合には、まだ何も用例構築学習されていないので、ステップS3703に進み、組み合わせの単語コードを記憶し、続いて、ステップS3704で用例構築学習データを適用する時の条件である規定情報を格納する。この場合、組み合わせの一方「夏」の単語コードは単語辞書(図25)から「8」であり、もう一方の「熱い」の単語は「3」であり、学習される組み合わせの順番と変更結果の組み合わせの順番が同じなので、規定情報に「順序正方向」をセットとして作成される(図39)。

0116

ここで再び、文字列「なつはとてもあつい」を入力すると、ステップS202までは前回と同様に進み、図23の用例構築学習適用ステップが起動される。ステップS2301では、文節候補の「暑い」か「熱い」を持つ用例構築学習データが抽出される。この場合、上記図39で作成された「夏は熱い」が抽出され、ステップS2303に進む。ステップS2303では、上記で抽出された用例構築学習データの持つ規定情報を参照して、用例構築学習データを適用する時の関係が規定されている場合、実際に抽出された文節候補を含む変換結果がその関係を満たしてかどうか判断される。この場合、抽出された「夏は熱い」は、その順序が規定されているが、実際の変換結果も「夏は熱い」となっており、その順序を満たしているので、関係が成立し、用例構築学習が適用されて変換される(図40)。

0117

次に、上記の用例構築学習データの順序を逆にしたような文字列「あついなつ」が入力された場合について説明する。ここで前回と同様に説明を簡単にするために、「暑い」は既に変換されているものとする。ただし、「暑い」は候補が1つに決定されたわけではなく、別に「熱い」の候補が存在する(図41)。

0118

図2のかな漢字変換ステップが起動され、文節候補「夏」に対してステップS202で用例構築学習が適用される。その結果、上記図44で作成された用例構築学習データ「夏が熱い」が抽出される。ここで、規定情報を参照すると「順序正方向」であり、変換結果は逆の「熱い夏」なので用例構築学習は適用されず、ステップS204に進む。ステップS204では、用例辞書(図38)を参照して抽出された「夏は暑い」が「順序両方向」なので、適用された変換結果が適用される(図42)。

0119

この変換結果を変更したい時、変更したい部分を指定して図3の同音語変更ステップが起動され、前回同様に変更される(図43)。

0120

ここで、同じ文字列が入力された時に、上記の変更結果になるようにするために、図4の変更結果学習ステップが起動される。まず、ステップS401では文節情報データの項目「変更」を参照して、変更「あり」の部分を探す。この場合、文節情報No.1の、入力「あつい」、結果「熱い」が変更のあった部分である。続いてステップS403では、文節情報データの項目「関係」を参照して、関係のある文節との用例構築学習の対称となる組み合わせを探す。ここで、関係のある文節Mo.が「2」と記されているので、ステップS405に進み、図37の用例構築学習組み合わせ記憶ステップが起動される。ステップS601では、これから記憶しようとしている組み合わせ「熱い夏」が既に用例構築学習されていないかどうかチェックする。この場合には、以前(図39)に「夏は熱い」と学習されており、その組み合わせが記憶されているので、ステップS605に進み、用例構築学習データを適用する時の条件である規定情報を更新する。

0121

この場合、記憶されている組み合わせの順番と変更結果の組み合わせの順番が逆なので、順序を逆にしても用例構築学習の適用がされることになり、規定情報に「順序両方向」をセットして作成される(図43)。

0122

ここで、再び、文字列「あついなつ」を入力すると、ステップS202までは前回と同様に進み、図5の用例構築学習適用ステップが起動される。ステップS501では、文節候補の「夏」を持つ用例構築学習データが抽出される。この場合、上記(図39図43)で作成され更新された「夏は熱い」が抽出され、ステップS503に進む。ステップS503では、上記で抽出された用例構築学習データの持つ規定情報を参照して、用例構築学習データを適用する時の関係が規定されている場合、実際に抽出された文節候補を含む変換結果がその関係を満たしているかどうか判断される。この場合、抽出された「夏は熱い」の順序は両方向可能なので、実際の変換結果は「熱い夏」だが関係は成立し、用例構築学習が適用されて変換される(図44)。

0123

このように、以前に作成された用例構築学習データが、これから学習しようとしている用例構築学習データと順序が逆の場合、正方向と逆方向での用例構築学習の適用が可能と判断して、以前に作成された用例構築学習データの適用を制限する規定情報を、順序が両方向可能なものとして更新することで、順序正方向と順序逆方向の二重のデータを持つ必要がなくなり、用例構築学習データの増加を抑えることができた。また、用例構築学習データの増加による、処理時間の増大とメモリサイズの増大も同時に避けることができた。[第9実施形態例]第8実施形態例では、用例構築学習データの持つ規定情報として、組み合わせを構成する単語の順序が正方向か、逆方向か、あるいは両方向かということで適用を制限したが、それぞれの組み合わせを構成する単語の係り受け関係を含む文法的な関係を規定情報として持つことも考えられる。基本的には、第8実施形態例と同じなので詳細については説明しないが、例えば「主語」と「述語」の関係において作成された用例構築学習データは、「主語」と「述語」の関係が可能な場合にだけ適用するというものが考えられる。あるいは、単語に後続する文字列による文法的な関係の変化に着目し、単語に後続するに文字列またはその種類を規定し、例えば「〜は」というように格助詞「は」で組み合わされた場合にだけ適用するというものも考えられる。また、第8実施形態例で説明した順序の情報と両方を組み合わせることも考えられる。

0124

[第10実施形態例]第8実施形態例では、用例構築学習データの持つ規定情報として、組み合わせを構成する単語の順序が正方向か、逆方向か、あるいは両方向かということで適用を制限したが、それぞれの組み合わせを構成する単語に後続する文字列を規定情報として持つことも考えられる。基本的には、第8実施形態例と同じなので詳細については説明しないが、例えばどのような文字列も後続しないで作成された「結城奈江」のような用例構築学習データは、「結城が奈江」のように「が」が後続した場合には適用せずに、正しく「勇気が萎え」と変換されるようにすることも考えられる。また、第8実施形態例で説明した順序の情報や、第9実施形態例で説明した係り受け関係を含む文法的な条件とも組み合わせることも考えられる。

発明の効果

0125

以上説明したように本発明によれば、最初に変換された結果から変更された部分を見つけ、上記の部分と何らかの関係がある他の部分との組み合わせを知り、上記の関係のある部分の組み合わせを記憶し、上記で記憶された部分の組み合わせを参照して変換結果を決定することで、従来技術の単語学習や用例構築学習を組み合わせだけでは、避けられなかった誤変換や、学習の効果が出なくなるという問題点を解決できる。

0126

また、最初に変換された結果から変更された部分を見つけ、上記の部分と何らかの関係がある他の部分との組み合わせを知り、上記の関係のある部分の組み合わせを記憶し、上記で記憶された部分の組み合わせを、組み合わせを構成する部分の順序を無視して参照して変換結果を決定することで、組み合わせを構成する部分の順序が学習時と同じ場合にしか適用しない場合の用例構築学習データ数の増大と、処理時間の増大と、保存のためのメモリサイズの増大を避けることができる。

0127

最初に変換された結果から変更された部分を見つけ、上記の部分と何らかの関係がある他の部分との組み合わせを知り、上記の関係のある部分の組み合わせと、組み合わせを構成する部分の順序やそれぞれの部分の間の関係を記憶し、上記で記憶された部分の組み合わせを参照して、上記で記憶された順序や関係が成立するかどうか判断して変換結果を決定することで、変更結果の学習時に作成された用例構築学習データが、作成された時とは異なる組み合わせの順序や関係の入力文字列に対して適用されることで、誤変換を起こすような悪影響を避けることができる。

0128

最初に変換された結果から変更された部分を見つけ、上記の部分と何らかの関係がある他の部分との組み合わせを知り、上記の関係のある部分の組み合わせが既に記憶されているかされているか判断し、以前に記憶されていない組み合わせの場合には、上記の関係のある部分の組み合わせと、組み合わせを構成する部分の順序やそれぞれの部分の間の関係を記憶し、以前に記憶されている組み合わせの場合には、組み合わせを構成する部分の順序やそれぞれの部分の間の関係の記憶を更新し、上記で記憶された部分の組み合わせを参照して、上記で記憶された順序や関係が成立するかどうか判断して変換結果を決定することで、用例構築学習しようとしている組み合わせの順序やその他の条件が異なったとしても、それぞれ別の用例構築学習データが作成されることを避けられ、用例構築学習データの増加を抑えることができる。また、用例構築学習データの増加による、処理時間の増大と、メモリサイズの増大も同時に避けることができる。

0129

さらに、上記の記憶される関係のある組み合わせとして、変換された時に成立していたものを用いることで、新たに関係を見つける必要がなく、処理が簡略化される。

0130

記憶される組み合わせの情報として、組み合わせを構成する単語の単語コードを用いることで、単語そのものをデータとして持つよりもメモリが節約される。

図面の簡単な説明

0131

図1本実施形態例の文書処理装置の概略構成を示すブロック図である。
図2第1実施形態例のかな漢字変換ステップを示すフローチャートである。
図3第1実施形態例の同音語変更ステップを示すフローチャートである。
図4第1実施形態例の変換結果学習ステップを示すフローチャートである。
図5第1実施形態例の単語辞書の一例を示す図である。
図6第1実施形態例の用例辞書の一例を示す図である。
図7第1実施形態例でのかな漢字変換途中での解析対象の入力文字と、それまでに変換された変換結果と、それまでに作成された文節情報データの一例を示す図である。
図8第1実施形態例でのかな漢字変換後の変換結果と、文節情報データの一例を示す図である。
図9第1実施形態例での同音語変更の変更結果と、文節情報データの変更結果と、記憶された単語学習データの一例を示す図である。
図10第1実施形態例でのかな漢字変換途中での解析対象の入力文字と、それまでに変換された変換結果と、それまでに作成された文節情報データの一例を示す図である。
図11第1実施形態例でのかな漢字変換後の変換結果と、文節情報データの一例を示す図である。
図12第1実施形態例での同音語変更の変更結果と、文節情報データの変更結果と、記憶された用例構築学習データの一例を示す図である。
図13第1実施形態例でのかな漢字変換途中での解析対象の入力文字と、それまでに変換された変換結果と、それまでに作成された文節情報データの一例を示す図である。
図14第1実施形態例でのかな漢字変換後の変換結果と、文節情報データの一例を示す図である。
図15第2実施形態例のかな漢字変換ステップを示すフローチャートである。
図16第2実施形態例の単語辞書の一例を示す図である。
図17第2実施形態例でのかな漢字変換後の変換結果と、文節情報データの一例を示す図である。
図18第2実施形態例での同音語変更の変更結果と、文節情報データの変更結果と、記憶された用例構築学習データの一例を示す図である。
図19第3実施形態例のかな漢字変換ステップを示すフローチャートである。
図20第3実施形態例の共起辞書の一例を示す図である。
図21第4実施形態例でのかな漢字変換途中での解析対象の入力文字と、それまでに変換された変換結果と、それまでに作成された文節情報データの一例を示す図である。
図22第4実施形態例でのかな漢字変換後の変換結果と、文節情報データの一例を示す図である。
図23第5実施形態例の用例構築学習適用ステップを示すフローチャートである。
図24第5実施形態例の用例構築学習組み合わせ記憶ステップを示すフローチャートである。
図25第5実施形態例の単語辞書の一例を示す図である。
図26第5実施形態例の用例辞書の一例を示す図である。
図27第5実施形態例でのかな漢字変換途中での解析対象の入力文字と、それまでに変換された変換結果と、それまでに作成された文節情報データの一例を示す図である。
図28第5実施形態例でのかな漢字変換後の変換結果と、文節情報データの一例を示す図である。
図29第5実施形態例でのかな漢字変換途中での解析対象の入力文字と、それまでに変換された変換結果と、それまでに作成された文節情報データの一例を示す図である。
図30第5実施形態例でのかな漢字変換後の変換結果と、文節情報データの一例を示す図である。
図31第5実施形態例での同音語変更の変更結果と、文節情報データの変更結果と、記憶された用例構築学習データの一例を示す図である。
図32第5実施形態例でのかな漢字変換途中での解析対象の入力文字と、それまでに変換された変換結果と、それまでに作成された文節情報データの一例を示す図である。
図33第5実施形態例でのかな漢字変換後の変換結果と、文節情報データの一例を示す図である。
図34第5実施形態例での同音語変更の変更結果と、文節情報データの変更結果と、記憶された用例構築学習データの一例を示す図である。
図35第5実施形態例でのかな漢字変換途中での解析対象の入力文字と、それまでに変換された変換結果と、それまでに作成された文節情報データの一例を示す図である。
図36第5実施形態例でのかな漢字変換後の変換結果と、文節情報データの一例を示す図である。
図37第8実施形態例の用例構築学習組み合わせ記憶ステップを示すフローチャートである。
図38第8実施形態例の用例辞書の一例を示す図である。
図39第8実施形態例での同音語変更の変更結果と、文節情報データの変更結果と、記憶された用例構築学習データの一例を示す図である。
図40第8実施形態例でのかな漢字変換後の変換結果と、文節情報データの一例を示す図である。
図41第8実施形態例でのかな漢字変換途中での解析対象の入力文字と、それまでに変換された変換結果と、それまでに作成された文節情報データの一例を示す図である。
図42第8実施形態例でのかな漢字変換後の変換結果と、文節情報データの一例を示す図である。
図43第8実施形態例での同音語変更の変更結果と、文節情報データの変更結果と、記憶された用例構築学習データの一例を示す図である。
図44第8実施形態例でのかな漢字変換後の変換結果と、文節情報データの一例を示す図である。

--

0132

101中央演算処理装置
102キーボード
102aポインティングデバイス
103 表示部
104プログラムメモリ
105 RAM
105a単語辞書
105b用例辞書
105c 単語学習
105d 用例構築学習
106ハードディスク
107フロッピーディスク
108 プリンタ

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ