図面 (/)

技術 異体字入力支援システム及び異体字入力支援プログラム

出願人 パーソナルメディア株式会社
発明者 松為彰
出願日 2015年5月22日 (6年0ヶ月経過) 出願番号 2015-104546
公開日 2016年12月22日 (4年5ヶ月経過) 公開番号 2016-218842
状態 特許登録済
技術分野 文書処理装置
主要キーワード 各実行段階 明朝フォント 込文字 差異部分 分解情報 共通要素 文字部品 推進機構
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2016年12月22日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

多数の異体字の中から目的の漢字検索して選択、確定する操作を効率良く行うことができる異体字入力支援システム及び異体字入力支援プログラムを提供する。

解決手段

漢字Vに関する複数の異体字Vnが予め登録された異体字データベース1と、異体字Vnの文字全体字形を複数の文字部品に分解した文字部品分解情報が予め登録された文字部品分解データベース2と、入力手段から受付けた漢字Vに関する複数の異体字Vnを異体字データベース1から検索する検索処理手段31と、検索結果の各異体字Vnの文字部品分解情報を文字部品分解データベースから取得し、各異体字Vnの文字分解部品情報に共通に含まれる要素を除いた文字部品の集合である異体字差異部品Dxを検出する異体字差異部品検出手段33と、異体字差異部品検出手段33により検出された異体字差異部品を表示し、絞込文字部品P1を含む異体字を目的字候補として絞り込む。

概要

背景

電子政府電子自治体システムや、名簿作成、名簿管理機能を含む各種の業務システムでは、人名、地名用の漢字を正確に短時間で効率良く入力する必要がある。
人名、地名などには偏(へん)や旁(つくり)の一部が微妙に異なる多数の異体字で構成された漢字を含むものがある。例えば、「渡邊」の「邊」では、図11に示すように100字以上の異体字が存在する。

このような多くの異体字を含む人名や地名をパーソナルコンピュータ(以下、パソコン)で扱う場合、例えば2000年代前半のWindows(登録商標)XPパソコンでは1点しんにょうの「辻」と2点しんにょうの「辻」を区別して扱うことができなかった。しかし、2012年発売のWindows(登録商標)8搭載パソコンでは、Unicode IVS(Ideographic Variation Sequence: 異体字シーケンス)と呼ばれる機能が導入され、例えば、このIVSに対応した独立行政法人情報処理推進機構(IPA)の「IPAmj明朝フォント」を利用することで、パソコン上においても、外字の利用や文字の画像化を行うことなく多数の異体字を系統的に扱える環境が整ってきた。この環境であれば、1点しんにょうの「辻」と2点しんにょうの「辻」も区別して扱うことができる。

しかし、人名用の漢字には多数の異体字があり、その中には字形の僅かな差異目視により判別しなければならない場合があるため、短時間で異体字の識別や同定、入力を行うことが困難なことがあった。

一方、漢字を入力するために、その漢字の字形を構成する偏(へん)や旁(つくり)などの部品検索キーとして指定し、指定した部品を含む漢字を検索する漢字検索入力用のツールとして、下記の非特許文献に開示されたものがある。

概要

多数の異体字の中から目的の漢字を検索して選択、確定する操作を効率良く行うことができる異体字入力支援システム及び異体字入力支援プログラムを提供する。漢字Vに関する複数の異体字Vnが予め登録された異体字データベース1と、異体字Vnの文字全体の字形を複数の文字部品に分解した文字部品分解情報が予め登録された文字部品分解データベース2と、入力手段から受付けた漢字Vに関する複数の異体字Vnを異体字データベース1から検索する検索処理手段31と、検索結果の各異体字Vnの文字部品分解情報を文字部品分解データベースから取得し、各異体字Vnの文字分解部品情報に共通に含まれる要素を除いた文字部品の集合である異体字差異部品Dxを検出する異体字差異部品検出手段33と、異体字差異部品検出手段33により検出された異体字差異部品を表示し、絞込文字部品P1を含む異体字を目的字候補として絞り込む。

目的

しかし、上記のようなツールは、一般的な文字検索には有用であっても、複数の異体字からの文字の選択を目的としたものではなく、短時間で効率良く異体字の識別や同定、入力を行うことはできない。例えば、検索キーとして指定する部首や部品は、操作者が自ら見つけて入力しなければならない。また、部首一覧表示から選択する方法はあるものの、この場合の部首一覧表示は、検索、入力したい漢字とは無関係に表示される一律のリストであり、選択できる部首の数も200以上と非常に多いため、少数選択肢から短時間で効率良く選択できるわけではない。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

漢字Vに関する複数の異体字Vnが予め登録された異体字データベースと、前記異体字Vnのそれぞれについて文字全体字形を偏(へん)や旁(つくり)などの複数の文字部品に分解した文字部品分解情報が予め登録された文字部品分解データベースと、キーボード等の入力手段から受付けた漢字Vに関する複数の異体字Vnを前記異体字データベースから検索する検索処理手段と、検索結果の各異体字Vnについて文字部品分解情報PVtを前記文部品分解データベースから取得し、その取得した文字部品分解情報の要素の和集合から、各異体字Vnに対するそれぞれの文字分解部品情報のすべてに共通に含まれる要素を除いた文字部品の集合である異体字差異部品Dxを検出する異体字差異部品検出手段と、当該異体字差異部品検出手段により検出された異体字差異部品を表示する表示手段と、表示された異体字差異部品の1つを絞込文字部品P1として操作者に選択させる異体字差異部品選択手段と、前記異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち前記異体字差異部品選択手段により選択された絞込文字部品P1を含む異体字のみを目的字候補として絞り込む処理を、 当該目的字候補が1文字になるまで、各実行段階の目的字候補を前記表示手段に順次表示しながら繰り返し実行する、 または前記表示手段に目的字が表示されたことを操作者が目視確認したことを示す確定操作が行われるまで実行する異体字絞込検索手段と を備えることを特徴とする異体字入力支援システム

請求項2

前記異体字差異部品選択手段を前記表示手段に表示された前記異体字差異部品のうちの複数の絞込文字部品P1,P2・・・Psを同時に操作者に選択させる構成とし、前記異体字絞込検索手段を前記異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち前記異体字差異部品選択手段により選択された絞込文字部品P1,P2・・・Psの全てを含む異体字のみを目的字候補の絞込対象として絞り込む処理を実行する構成としたことを特徴とする請求項1に記載の異体字入力支援システム。

請求項3

前記異体字差異部品選択手段において操作者が絞込文字部品P1の選択を確定する前に、操作者が前記確定操作とは異なる別の指示操作暫定絞込文字部品P1を指示する異体字差異部品暫定指示手段と、前記異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち当該暫定絞込文字部品P1を含む異体字のみを目的字暫定絞込候補として絞込み、前記表示手段に表示させる異体字暫定絞込検索手段をさらに備えることを特徴とする請求項1又は2のいずれか1に記載の異体字入力支援システム。

請求項4

漢字Vに関する複数の異体字Vnが予め登録された異体字データベースと、前記異体字Vnのそれぞれについて文字全体の字形を偏(へん)や旁(つくり)などの複数の文字部品に分解した文字部品分解情報が予め登録された文字部品分解データベースとをアクセス可能に構成されたコンピュータを、キーボード等の入力手段から受付けた漢字Vに関する複数の異体字Vnを前記異体字データベースから検索する検索処理手段と、検索結果の各異体字Vnについて文字部品分解情報PVtを前記文字部品分解データベースから取得し、その取得した文字部品分解情報の要素の和集合から、各異体字Vnに対するそれぞれの文字分解部品情報のすべてに共通に含まれる要素を除いた文字部品の集合である異体字差異部品Dxを検出する異体字差異部品検出手段と、当該異体字差異部品検出手段により検出された異体字差異部品を表示する表示手段と、表示された異体字差異部品の1つを絞込文字部品P1として操作者に選択させる異体字差異部品選択手段と、前記異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち前記異体字差異部品選択手段により選択された絞込文字部品P1を含む異体字のみを目的字候補として絞り込む処理を、 当該目的字候補が1文字になるまで、各実行段階の目的字候補を前記表示手段に順次表示しながら繰り返し実行する、 または前記表示手段に目的字が表示されたことを操作者が目視確認したことを示す確定操作が行われるまで実行する異体字絞込検索手段として機能させることを特徴とする異体字入力支援プログラム

請求項5

前記異体字差異部品選択手段を前記表示手段に表示された前記異体字差異部品のうちの複数の絞込文字部品P1,P2・・・Psを同時に操作者に選択させる手段として機能させ、前記異体字絞込検索手段を前記異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち前記異体字差異部品選択手段により選択された絞込文字部品P1,P2・・・Psの全てを含む異体字のみを目的字候補の絞込対象として絞り込む処理を実行する手段として機能させることを特徴とする請求項4に記載の異体字入力支援プログラム。

請求項6

前記異体字差異部品選択手段において操作者が絞込文字部品P1の選択を確定する前に、操作者が前記確定操作とは異なる別の指示操作で暫定絞込文字部品P1を指示する異体字差異部品暫定指示手段と、前記異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち当該暫定絞込文字部品P1を含む異体字のみを目的字暫定絞込候補として絞込み、前記表示手段に表示させる異体字暫定絞込検索手段としてさらに機能させることを特徴とする請求項4又は5のいずれか1に記載の異体字入力支援プログラム。

技術分野

0001

本発明は、多数の異体字を含む漢字入力操作支援するための異体字入力支援システム及び異体字入力支援プログラムに関するものである。

背景技術

0002

電子政府電子自治体システムや、名簿作成、名簿管理機能を含む各種の業務システムでは、人名、地名用の漢字を正確に短時間で効率良く入力する必要がある。
人名、地名などには偏(へん)や旁(つくり)の一部が微妙に異なる多数の異体字で構成された漢字を含むものがある。例えば、「渡邊」の「邊」では、図11に示すように100字以上の異体字が存在する。

0003

このような多くの異体字を含む人名や地名をパーソナルコンピュータ(以下、パソコン)で扱う場合、例えば2000年代前半のWindows(登録商標)XPパソコンでは1点しんにょうの「辻」と2点しんにょうの「辻」を区別して扱うことができなかった。しかし、2012年発売のWindows(登録商標)8搭載パソコンでは、Unicode IVS(Ideographic Variation Sequence: 異体字シーケンス)と呼ばれる機能が導入され、例えば、このIVSに対応した独立行政法人情報処理推進機構(IPA)の「IPAmj明朝フォント」を利用することで、パソコン上においても、外字の利用や文字の画像化を行うことなく多数の異体字を系統的に扱える環境が整ってきた。この環境であれば、1点しんにょうの「辻」と2点しんにょうの「辻」も区別して扱うことができる。

0004

しかし、人名用の漢字には多数の異体字があり、その中には字形の僅かな差異目視により判別しなければならない場合があるため、短時間で異体字の識別や同定、入力を行うことが困難なことがあった。

0005

一方、漢字を入力するために、その漢字の字形を構成する偏(へん)や旁(つくり)などの部品検索キーとして指定し、指定した部品を含む漢字を検索する漢字検索入力用のツールとして、下記の非特許文献に開示されたものがある。

先行技術

0006

「超漢字検索」 http://www.chokanji.com/ckk

発明が解決しようとする課題

0007

しかし、上記のようなツールは、一般的な文字検索には有用であっても、複数の異体字からの文字の選択を目的としたものではなく、短時間で効率良く異体字の識別や同定、入力を行うことはできない。例えば、検索キーとして指定する部首や部品は、操作者が自ら見つけて入力しなければならない。また、部首一覧表示から選択する方法はあるものの、この場合の部首一覧表示は、検索、入力したい漢字とは無関係に表示される一律のリストであり、選択できる部首の数も200以上と非常に多いため、少数選択肢から短時間で効率良く選択できるわけではない。

0008

本発明の目的は、多数の異体字の中から入力すべき目的の漢字を検索して選択、確定する操作を短時間で効率良く行うことができ、名簿の作成や電子政府の端末操作などにおいて、特に人名を入力する場合における作業負荷の軽減や作業時間の短縮、誤入力の防止を支援することができる異体字入力支援システム及び異体字入力支援プログラムを提供することにある。

課題を解決するための手段

0009

上記目的を達成するために、請求項1に係る異体字入力支援システムは、漢字Vに関する複数の異体字Vnが予め登録された異体字データベースと、前記異体字Vnのそれぞれについて文字全体の字形を偏(へん)や旁(つくり)などの複数の文字部品に分解した文字部品分解情報が予め登録された文字部品分解データベースと、キーボード等の入力手段から受付けた漢字Vに関する複数の異体字Vnを前記異体字データベースから検索する検索処理手段と、検索結果の各異体字Vnについて文字部品分解情報PVtを前記文字部品分解データベースから取得し、その取得した文字部品分解情報の要素の和集合から、各異体字Vnに対するそれぞれの文字分解部品情報のすべてに共通に含まれる要素を除いた文字部品の集合である異体字差異部品Dxを検出する異体字差異部品検出手段と、当該異体字差異部品検出手段により検出された異体字差異部品を表示する表示手段と、表示された異体字差異部品の1つを絞込文字部品P1として操作者に選択させる異体字差異部品選択処理手段と、前記異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち前記異体字差異部品選択手段により選択された絞込文字部品P1を含む異体字のみを目的字候補として絞り込む処理を、当該目的字候補が1文字になるまで、各実行段階の目的字候補を前記表示手段に順次表示しながら繰り返し実行する、または前記表示手段に目的字が表示されたことを操作者が目視確認したことを示す確定操作が行われるまで実行する異体字絞込検索手段とを備えることを特徴とする。

0010

また、請求項2に係る異体字入力支援システムは、請求項1に記載の、前記異体字差異部品選択処理手段を前記表示手段に表示された前記異体字差異部品のうちの複数の絞込文字部品P1,P2・・・Psを同時に操作者に選択させる構成とし、前記異体字絞込検索手段を前記異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち前記異体字差異部品選択処理手段により選択された絞込文字部品P1,P2・・・Psの全てを含む異体字のみを目的字候補の絞込対象として絞り込む処理を実行する構成としたことを特徴とする。

0011

また、請求項3に係る異体字入力支援システムは、請求項1又は2のいずれか1に記載の、前記異体字差異部品選択手段において操作者が絞込文字部品P1の選択を確定する前に、操作者が前記確定操作とは異なる別の指示操作暫定絞込文字部品P1を指示する異体字差異部品暫定指示手段と、前記異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち当該暫定絞込文字部品P1を含む異体字のみを目的字暫定絞込候補として絞込み、前記表示手段に表示させる異体字暫定絞込検索手段をさらに備えることを特徴とする。

0012

また、請求項4に係る異体字入力支援プログラムは、漢字Vに関する複数の異体字Vnが予め登録された異体字データベースと、前記異体字Vnのそれぞれについて文字全体の字形を偏(へん)や旁(つくり)などの複数の文字部品に分解した文字部品分解情報が予め登録された文字部品分解データベースとをアクセス可能に構成されたコンピュータを、キーボード等の入力手段から受付けた漢字Vに関する複数の異体字Vnを前記異体字データベースから検索する検索処理手段と、検索結果の各異体字Vnについて文字部品分解情報PVtを前記文字部品分解データベースから取得し、その取得した文字部品分解情報の要素の和集合から、各異体字Vnに対するそれぞれの文字分解部品情報のすべてに共通に含まれる要素を除いた文字部品の集合である異体字差異部品Dxを検出する異体字差異部品検出手段と、当該異体字差異部品検出手段により検出された異体字差異部品を表示する表示手段と、表示された異体字差異部品の1つを絞込文字部品P1として操作者に選択させる異体字差異部品選択処理手段と、前記異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち前記異体字差異部品選択処理手段により選択された絞込文字部品P1を含む異体字のみを目的字候補として絞り込む処理を、当該目的字候補が1文字になるまで、各実行段階の目的字候補を前記表示手段に順次表示しながら繰り返し実行する、
または前記表示手段に目的字が表示されたことを操作者が目視確認したことを示す確定操作が行われるまで実行する異体字絞込検索手段として機能させることを特徴とする。

0013

また、請求項5に係る異体字入力支援プログラムは、請求項4に記載の、前記異体字差異部品選択処理手段を前記表示手段に表示された前記異体字差異部品のうちの複数の絞込文字部品P1,P2・・・Psを同時に操作者に選択させる手段として機能させ、前記異体字絞込検索手段を前記異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち前記異体字差異部品選択処理手段により選択された絞込文字部品P1,P2・・・Psの全てを含む異体字のみを目的字候補の絞込対象として絞り込む処理を実行する手段として機能させることを特徴とする。

0014

また、請求項6に係る異体字入力支援プログラムは、請求項4又は5のいずれか1に記載の、前記異体字差異部品選択処理手段において操作者が絞込文字部品P1の選択を確定する前に、操作者が前記確定操作とは異なる別の指示操作で暫定絞込文字部品P1を指示する異体字差異部品暫定指示手段と、前記異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち当該暫定絞込文字部品P1を含む異体字のみを目的字暫定絞込候補として絞込み、前記表示手段に表示させる異体字暫定絞込検索手段としてさらに機能させることを特徴とする。

発明の効果

0015

本発明によれば、キーボード等の入力手段から受付けた漢字Vに関する複数の異体字Vnを異体字データベースから検索し、その検索結果の各異体字Vnについて文字部品分解情報PVtを文字部品分解データベースから取得する。そして、取得した文字部品分解情報の要素の和集合から、各異体字Vnに対するそれぞれの文字分解部品情報のすべてに共通に含まれる要素を除いた文字部品の集合である異体字差異部品Dxを検出し、検出された異体字差異部品を表示し、表示された異体字差異部品の1つを絞込文字部品P1として操作者に選択させる。すなわち、漢字Vに関する複数の異体字Vnの中から入力を意図した異体字である目的字を短時間で効率良く見つけるために、各異体字の字形を構成する偏(へん)や旁(つくり)などの部品のうち、異体字間で差異のあるもののみを異体字差異部品として抽出して一覧表示し、操作者が異体字差異部品の1つまたは複数を絞込文字部品として指定することにより、その部品を含む異体字のみを目的字の候補として残す絞込検索を行い、目的字候補の数を減らして、目的字を短時間で見つけ出すことが可能になる。

0016

例えば、「邊」の異体字の場合、図11に例示するように、1点しんにょうを含む異体字と2点しんにょうを含む異体字、「口」を含む異体字と含まない異体字、「方」を含む異体字と含まない異体字などが多数存在するが、これら1点しんにょう、2点しんにょう、「口」、「方」などの異体字差異部品の1つまたは複数を絞込文字部品として指定することにより、その部品を含む異体字のみを目的字の候補として残す絞込検索を行い、目的字候補の数を減らして、目的字を効率良く見つけ出すことができる。

0017

異体字差異部品は異体字の字形の差異部分を反映して抽出、表示されるため、操作者はこの一覧を見ることにより、異体字の字形の差異部分を把握することが容易になる。例えば、「邊」の異体字には、1点しんにょうと2点しんにょうの部分のみに差異があり、他の部分の字形は同一の異体字があるが、この2文字の「邊」の異体字を比べて識別するよりも、字形の差異部分である1点しんにょうと2点しんにょうを比べて識別する方が容易であるため、「邊」の異体字を直接選択するよりも、「邊」の字形を構成する部品である1点しんにょうと2点しんにょうを選択する方が容易であり、短時間で効率よく目的字を見つけ出すことができる。

0018

一方、目的字の候補として残っている異体字すべてに共通に含まれる部品は、異体字差異部品ではないため、絞込文字部品として表示されない。特に、異体字差異部品の表示、絞込文字部品の選択、および目的字候補の絞り込みの手順を複数回繰り返す場合、目的字の候補の絞り込みが進むにしたがって、異体字差異部品の数も減少する。このため、操作者に不要な選択肢を与えることがなく、短時間で効率よく目的字を見つけ出すことができる。

0019

なお、異体字データベースから検索した漢字Vに関する複数の異体字Vnのうち操作者により選択された絞込文字部品P1を含む異体字のみを目的字候補として絞り込む処理を実行する場合、(1)目的字候補が1文字になるまで、各実行段階の目的字候補を表示手段に順次表示しながら繰り返し実行する、(2)または表示手段に目的字が表示されたことを操作者が目視確認したことを示す確定操作が行われるまで実行する。

0020

また、請求項2に記載のように、複数の絞込文字部品P1,P2・・・Psを同時に操作者に選択させる構成とし、漢字Vに関する複数の異体字Vnのうち異体字差異部品選択手段により選択された絞込文字部品P1,P2・・・Psの全てを含む異体字のみを目的字候補の絞込対象として絞り込む処理を実行する構成とした場合、複数の絞込文字部品P1,P2・・・Psで絞り込むため、目的字を見つけ出すまでの時間が短くなる効果がある。

0021

また、請求項3に記載のように、異体字差異部品選択手段において操作者が絞込文字部品P1の選択を確定する前に、操作者が前記確定操作とは異なる別の指示操作で絞込文字部品P1を暫定指示し、漢字Vに関する複数の異体字Vnのうち当該絞込文字部品P1を含む異体字のみを目的字暫定絞込候補として絞込み、前記表示手段に表示させるようにした場合、絞込文字部品P1を指示した場合の絞込検索結果とは別の絞込文字部品P2を指示した場合の絞込検索結果との比較や、絞込文字部品P1を確定する前の試行錯誤を容易に行うことができるようになり、多数の異体字を識別して目的字を確定する操作をさらに効率良く行うことができるという効果がある。

図面の簡単な説明

0022

本発明の第1の実施形態を示すブロック構成図である。
異体字データベースの登録内容の例を示す図である。
文字部品分解データベースの登録内容の例を示す図である。
第1の実施形態の処理概要を示すフローチャートである。
図4のフローチャートにおけるステップ404の詳細を示すフローチャートである。
図4のフローチャートにおけるステップ407の詳細を示すフローチャートである。
本発明の第2の実施形態を示すブロック構成図である。
第2の実施形態の処理概要を示すフローチャートである。
図8のフローチャートにおけるステップ407の詳細を示すフローチャートである。
本発明の第3の実施形態を示すブロック構成図である。
「邊」の異体字の例を示す図である。
漢字Vとして「込」を指定した場合の異体字の例を示す図である。
「込」の異体字6文字に対する異体字差異部品の例を示す図である。
「込」の異体字6文字とそれに対する異体字差異部品5個を表示した状態で、マウスポインタ(図では人差し指で示す)を異体字差異部品の「2点しんにょう」の上に移動し(マウスオーバー)、「2点しんにょう」による絞込検索結果を暫定枠150,151,152でリアルタイムに表示した例を示す図である。
「込」の異体字6文字とそれに対する異体字差異部品5個を表示した状態で、マウスポインタ(人差し指)を異体字差異部品の「1点しんにょう」の上に移動し(マウスオーバー)、「1点しんにょう」による絞込検索結果を暫定枠161,162,163でリアルタイムに表示した例を示す図である。
「込」の異体字6文字とそれに対する異体字差異部品5個を表示した状態で、マウスポインタ(人差し指)を異体字差異部品の「人」の上に移動し(マウスオーバー)、「人」による絞込検索結果を暫定枠171,172でリアルタイムに表示した例を示す図である。
異体字差異部品暫定指示部36において、異体字差異部品を暫定的に指示し、その指示に従って絞込検索した結果を表示する処理を示すフローチャートである
「込」の異体字6文字の差異部分を強調表示した上で、具体的な部首名や、「人」、「入」といった字形を表わす特徴説明も合わせて表示した例を示す図である。
「込」の異体字を「2点しんにょう」で絞込検索して3文字になった後に、この3文字の差異部分を強調表示した例を示す図である。

実施例

0023

以下、添付の図面を参照しながら、本発明の実施の形態を説明する。
図1は、本発明に係る異体字入力支援システムの第1の実施形態を示すブロック構成図である。
この実施形態で示す異体字入力支援システムは、漢字Vに関する複数の異体字Vnが予め登録された異体字データベース1と、前記異体字Vnのそれぞれについて文字全体の字形を偏(へん)や旁(つくり)などの複数の文字部品に分解した文字部品分解情報が予め登録された文字部品分解データベース2とを備えている。
また、パソコン等のコンピュータで構成された異体字入力装置3と、キーボードやマウスポインティングデバイス)等で構成された入力部4と、液晶表示器等で構成された表示部5とを備えている。

0024

異体字入力装置3は、入力部4から入力された漢字Vに関する複数の異体字V1,V2,V3,・・・・・Vnを異体字データベース1から取得する異体字検索処理部31と、検索結果の各異体字Vn(n=1,2,3・・・・)を目的字候補として一時保持する目的字候補保持部32と、各目的字候補について文字部品分解情報Vt(t=1,2,3・・・・)を文字部品分解データベース2から取得し、その取得した文字部品分解情報の要素の和集合から、各異体字Vnに対するそれぞれの文字分解部品情報のすべてに共通に含まれる要素を除いた文字部品の集合である異体字差異部品Dx(x=1,2,3・・・・)を検出する異体字差異部品検出部33と、異体字差異部品検出部33により検出され、表示部5に表示された異体字差異部品の1つを絞込文字部品P1として操作者に選択させる異体字差異部品選択処理部34と、異体字データベース1から検索した漢字Vに関する複数の異体字Vnのうち異体字差異部品選択処理部34により選択された絞込文字部品P1を含む異体字のみを目的字候補として絞り込む処理を、当該目的字候補が1文字になるまで、各実行段階の目的字候補を表示部5に順次表示しながら繰り返し実行する、または表示部5に目的字が表示されたことを操作者が目視確認したことを示す確定操作が行われるまで実行する異体字絞込検索部35とを備えている。
これらの各部は、具体的にはそれぞれの機能に対応するコンピュータプログラムによって構成されている。

0025

図2は、異体字データベース1に登録された漢字Vに関する異体字の例を示す図である。
図示するように、漢字Vに対して、複数の異体字V1,V2,V3、V4,V5,V6が登録されている。

0026

図3は、文字部品分解データベース2に登録された文字部品分解情報PVの例を示す図である。
図示するように、漢字Vに対する複数の異体字のそれぞれについて文字全体の字形を偏(へん)や旁(つくり)などの複数の文字部品に分解した要素1、2,3・・・から成る文字部品分解情報PVが登録されている。
なお、情報処理システムOSバージョンなどの環境によって利用可能な漢字や異体字の範囲が異なることや、異体字にはいろいろな解釈があるという理由により、異体字データベース1や文字部品分解データベース2の具体的な内容は、本例とは異なる場合があり、「込」の異体字が常に例示した6文字になるとは限らない。本発明の範囲は「込」の異体字が6文字となるような特定の異体字データベースを持ったシステムに限定されるものではなく、異体字データベース1の具体的な内容が異なる情報処理システムであっても、本発明の範囲に含まれる。

0027

図4図6は、以上のように構成された異体字入力支援システムの動作を示すフローチャートである。
以下、これらのフローチャートを参照しながら実施形態の動作を説明する。
まず、キーボード等の入力部4から漢字Vの入力を受け付ける(ステップ401)。
次に、入力された漢字Vに関する複数の異体字V1,V2,V3・・・・Vnを異体字データベース1から取得する(ステップ402)。
次に、漢字Vの異体字の集合V1,V2,V3・・・Vnを得て、これを目的字の最初の候補として目的字候補保持部32に格納し、表示部5に表示する(ステップ403)。

0028

例えば、漢字Vとして「込」を指定した場合、その異体字は、図12に示すように、V1=「1点しんにょう+入」、V2=「1点しんにょう+人」、V3=「1点しんにょう+メ」、V4=「2点しんにょう+入」、V5=「2点しんにょう+人」、V6=「2点しんにょう+メ」の6文字であるので、この6文字を目的字の最初の候補として表示部5に表示し、操作者に提示する。

0029

次に、異体字差異部品検出部33において、目的字候補保持部32に格納された異体字の異体字差異部品D1,D2・・・Dxを検出する(ステップ404)。
この処理は、図5に詳細を示すように、まず、目的字候補保持部32に格納された異体字V1,V2,V3・・・Vtの個々の文字に対する文字部品分解情報PV1,PV2・・・PVtを文字部品分解データベース2から取得し(ステップ4041)、次にPV1,PV2・・・PVtの和集合Uを算出し(ステップ4042)、次にPV1,PV2・・・PVtのすべてに共通に含まれる要素Iを算出し(ステップ4043)、次に和集合Uの要素から共通要素Iを除いたものを異体字差異部品D1,D2・・・Dxとする(ステップ4044)。

0030

例えば、V1=「1点しんにょう」+「入」に対する文字部品分解情報は、PV1={「1点しんにょう」,「入」}、V2=「1点しんにょう」+「人」に対する文字部品分解情報は、PV2={「1点しんにょう」,「人」}、V3=「1点しんにょう」+「メ」に対する文字部品分解情報は、PV3={「1点しんにょう」,「メ」}、V4=「2点しんにょう」+「入」に対する文字部品分解情報は、PV4={「2点しんにょう」,「入」}、V5=「2点しんにょう」+「人」に対する文字部品分解情報は、PV5={「2点しんにょう」,「人」}、V6=「2点しんにょう」+「メ」に対する文字部品分解情報は、PV6={「2点しんにょう」,「メ」}となる。

0031

上記の例の場合、PV1,PV2・・・PVtのすべてに共通に含まれる文字部品は存在しないので、PV1,PV2・・・PVtの和集合がそのまま異体字差異部品D1,D2・・・Dxとなる。具体的には、D1=「人」、D2=「入」、D3=「1点しんにょう」、D4=「2点しんにょう」、D5=「メ」となる。
すなわち、「込」の異体字6文字に対する異体字差異部品は図13に示すようになる。
次に、異体字差異部品選択処理部34において、異体字差異部品D1,D2・・・Dxを表示部5に表示する(ステップ405)。

0032

次に、異体字差異部品選択処理部34において、表示した異体字差異部品D1,D2・・・Dxの1つを絞込文字部品P1として操作者に選択させる(ステップ406)。操作者は、目的字の字形と異体字差異部品D1,D2・・・Dxを見比べた後、目的字の候補を絞り込むために、D1,D2・・・Dxの1つを選択し、絞込文字部品P1とする。

0033

上記の例の場合、今回の目的字がV5=「2点しんにょう」+「人」であったとすると、操作者は、目的字の字形と異体字差異部品D1,D2・・・D5を見比べた後、目的字の候補を絞り込むために、D1=「人」またはD5=「2点しんにょう」を選択する。この例の説明では、たまたま後者のD5=「2点しんにょう」を絞込文字部品P1として選択したものとする。

0034

次に、異体字絞込検索部35により、目的字候補保持部32の保持する異体字V1,V2,V3・・・Vnのうち、操作者の選択した絞込文字部品P1を含む異体字のみを新しい目的字候補として目的字候補保持部32に残して再度表示し、他の文字は目的字候補から外す。ここで、V1,V2,V3・・・VnがP1を含むかどうかを判断するために、文字部品分解データベース2を参照する(ステップ407)。

0035

図6は、このステップ407の処理の詳細を示すフローチャートであり、まず、目的字候補保持部32に保持された異体字V1,V2,V3、・・・・Vtの個々の文字Vi(Vi=V1,V2,V3,Vt)に対して、以下の処理を行う(ステップ4071)。
すなわち、Viに対する文字部品分解情報PViを文字部品分解データベース2から取得し(ステップ4072)、異体字Viが絞込文字部品P1を含むか、すなわちP1がPViの要素の一つであるかを判定し(ステップ4073)、要素の一つである場合、Viを絞込検索した結果に含め(ステップ4074)、要素の一つでない場合、絞込検索した結果に含めない(ステップ4075)。

0036

上記の例の場合、V1,V2,V3・・・V6のうち、P1=D5=「2点しんにょう」を部品として含む異体字、すなわちV4=「2点しんにょう」+「入」、V5=「2点しんにょう」+「人」、V6=「2点しんにょう」+「メ」の3文字のみを目的字候補保持部32に残し、他の文字は目的字候補から外す。
この段階で、目的字の候補はP1を含むものに絞られたため、最初の段階での目的字の候補V1,V2,V3・・・Vnよりも数が減少しており、操作者がこの中から目視により直接目的字を見つけ出すことも、最初の段階よりも容易に、短時間で効率よくできるようになっている。この段階で、目的字の候補の数が十分少なければ、目視により直接目的字を見つけ出してもよい。

0037

上記の例の場合、最初の段階での目的字の候補はV1,V2,V3・・・V6の6文字であったが、絞込文字部品P1=D5=「2点しんにょう」で絞り込んだ後の段階では、目的字の候補がV4=「2点しんにょう」+「入」、V5=「2点しんにょう」+「人」、V6=「2点しんにょう」+「メ」の3文字となっており、目的字V5=「2点しんにょう」+「人」を目視で見つけ出すことも容易になっている。

0038

一方、目的字の候補がまだ多い場合には、上記の手順のうち、目的字候補保持部32に残っている目的字の候補に対する異体字差異部品の表示と操作者による選択、選択された絞込文字部品による異体字絞込検索の手順を繰り返し、さらに目的字の候補を減らすことができ、目的字の候補が1文字になるまでこの手順を続けることにより、最終的に目的字を確定する(ステップ409〜413)。

0039

上記の例の場合、残っている3文字の目的字の候補V4=「2点しんにょう」+「入」、V5=「2点しんにょう」+「人」、V6=「2点しんにょう」+「メ」の文字部品分解情報の和集合は、D1=「人」、D2=「入」、D4=「2点しんにょう」、D5=「メ」であるが、D4=「2点しんにょう」は残っている目的字の候補すべてに共通に含まれる文字部品であるため、絞込文字部品としては意味がなく、これを除いたD1=「人」、D2=「入」、D5=「メ」の3個が2回目の繰り返し手順における異体字差異部品となる。

0040

操作者は、目的字の字形と3個の異体字差異部品を見比べた後、目的字の部品に含まれるD1=「人」を選択し、2回目の繰り返し手順における絞込文字部品とする。すると、異体字絞込検索部35により、目的字候補保持部32に残っている目的字の候補に対する異体字絞込検索が再度行われ、D1=「人」を含むV5=「2点しんにょう」+「人」の1文字のみが目的字の候補として残る。目的字の候補が1文字になったので、この段階で目的字が確定したことになる(ステップ410、411)。

0041

次に、本発明の第2の実施形態について説明する。
図7は、本発明の第2の実施形態を示すブロック構成図であり、図1の第1の実施形態と異なる点は、異体字差異部品選択処理34において、操作者が複数の絞込文字部品P1,P2・・・Psをまとめて選択できることと、異体字絞込検索部35において、複数の絞込文字部品P1,P2・・・Psによる目的字候補の絞り込みを可能なように構成したことである。
複数の絞込文字部品をまとめて選択できることにより、異体字差異部品の表示と操作者による選択、選択された絞込文字部品による異体字絞込検索の手順の繰り返しの回数を減らすことができ、目的字を確定するまでの操作ステップや操作時間を短縮することができる。

0042

例えば、漢字Vとして「込」を指定した場合、その異体字は、V1=「1点しんにょう」+「入」、V2=「1点しんにょう」+「人」、V3=「1点しんにょう」+「メ」、V4=「2点しんにょう」+「入」、V5=「2点しんにょう」+「人」、V6=「2点しんにょう」+「メ」の6文字であるので、この6文字を目的字の最初の候補として操作者に表示する。
また、この6文字に対する異体字差異部品は、D1=「人」、D2=「入」、D3=「1点しんにょう」、D4=「2点しんにょう」、D5=「メ」であるので、これを表示し、操作者に絞込文字部品を選択させる。
今回の目的字がV5=「2点しんにょう」+「人」であったとすると、操作者は、目的字の字形と異体字差異部品D1,D2・・・D5を見比べた後、目的字の候補を絞り込むために、D1=「人」およびD5=「2点しんにょう」の2個を同時に選択する。

0043

異体字絞込検索部35においては、目的字候補保持部32の保持する異体字V1,V2,V3・・・V6に対して、D1=「人」およびD5=「2点しんにょう」の両方の部品による絞込検索が行われ、この2個の部品をともに含むV5=「2点しんにょう」+「人」の1文字が目的字の候補として残る。1回の手順で目的字の候補が1文字になったので、この段階で目的字が確定する。

0044

図8は、第2の実施形態における処理を示すフローチャートである。第1の実施形態と異なる点は、ステップ406において複数の絞込文字部品P1,P2・・・Psを選択できるようにしたことである。

0045

図9は、第2の実施形態において、図8のステップ407の処理の詳細を示すフローチャートであり、図6の第1の実施形態と異なる点は、ステップ4073bにおいて、異体字Viが絞込文字部品P1,P2・・・Psの全てを含むかを判定し、含む場合はViを絞込検索した結果に含め、P1,P2・・・Psのいずれかを含まない場合は検索結果に含めないとしたことである。

0046

次に、本発明の第3の実施形態について説明する。
図10は、本発明の第3の実施形態を示すブロック構成図であり、図1の第1の実施形態と異なる点は、異体字差異部品選択処理部34において、操作者が絞込文字部品P1を選択確定する前に、選択確定操作とは別の指示操作を用いて暫定絞込文字部品P1を指示することにより、異体字暫定絞込表示処理部37が暫定絞込文字部品P1による目的字候補の絞込検索結果を目的字暫定絞込候補として表示部5に表示し、操作者がそれを確認できるようにしたことである。

0047

暫定絞込文字部品P1による絞込はまだ確定していないため、操作者が目的字暫定絞込候補を確認してその内容が不適当だと判断した場合、例えば目的字暫定絞込候補の中に目的字が含まれていなかった場合には、暫定絞込文字部品P1の指示を中止し、別の暫定絞込文字部品P2を用いて、同様に目的字暫定絞込候補を確認することができるようにしたことである。
この機能により、暫定絞込文字部品P1を指示した場合の絞込検索結果とは別の暫定絞込文字部品P2を指示した場合の絞込検索結果との比較や、絞込文字部品P1を確定する前の試行錯誤を容易に行うことができるようになり、多数の異体字を識別して目的字を確定する操作をさらに効率良く行うことができる。

0048

異体字差異部品選択処理部34における絞込文字部品P1の選択確定の操作方法としては、マウスポインタをP1上に置いてクリックする方法がある。
一方、異体字差異部品暫定指示部36における選択確定とは別の指示方法としては、マウスポインタをP1の上に移動するだけでクリックしない、いわゆるマウスオーバーの操作方法がある。操作者から見ると、マウスを異体字差異部品D1,D2,D3・・・などの上に移動するだけで、D1,D2,D3・・・のそれぞれによる絞込検索結果を見ることができ、意図した絞込検索結果が得られることを確認した後に、その結果をもたらした異体字差異部品の上でマウスをクリックして選択確定するといった使い方ができ、目的字の候補の絞り込みの操作をさらに効率よく行うことができる。

0049

例えば、「込」の異体字6文字を目的字候補保持部32の保持する目的字の候補とし、それに対する異体字差異部品を「人」、「入」、「1点しんにょう」、「2点しんにょう」、「メ」の5個とした状態において、これらの5個の異体字差異部品の表示画面上にマウスを移動すると、マウスの指示する異体字差異部品を暫定絞込文字部品とした場合の絞込検索結果をリアルタイムに見ることができ、絞込文字部品を確定する前に、意図した絞込検索結果が得られるかどうかを確認できるようになる。

0050

図14は、「込」の異体字6文字とそれに対する異体字差異部品5個を表示した状態で、マウスポインタ(図では人差し指で示す)を異体字差異部品の「2点しんにょう」の上に移動し(マウスオーバー)、「2点しんにょう」による絞込検索結果を暫定枠140,141,142でリアルタイムに表示した図である。

0051

図15は、「込」の異体字6文字とそれに対する異体字差異部品5個を表示した状態で、マウスポインタ(人差し指)を異体字差異部品の「1点しんにょう」の上に移動し(マウスオーバー)、「1点しんにょう」による絞込検索結果を暫定枠151,152,153でリアルタイムに表示した図である。

0052

図16は、「込」の異体字6文字とそれに対する異体字差異部品5個を表示した状態で、マウスポインタ(人差し指)を異体字差異部品の「人」の上に移動し(マウスオーバー)、「人」による絞込検索結果を暫定枠161,162でリアルタイムに表示した図である。

0053

図17は、異体字差異部品暫定指示部36において、異体字差異部品を暫定的に指示し、その指示に従って絞込検索した結果を表示する処理を示すフローチャートである。
第1の実施形態と異なる点は、ステップ414以降である。すなわち、異体字差異部品を表示した後、操作者によって異体字差異部品の1つが絞込文字部品として選択された場合、指定された絞込文字部品で絞込検索し、結果を表示する(図17のステップ418〜図4のステップ407)。しかし、絞込文字部品の選択操作ではなく、他の指示操作(例えばマウスオーバー)であった場合、そのマウスポインタが指示している異体字差異部品による絞込検索結果を目的字暫定絞込候補として操作者に提示した後、ステップ405の処理に戻る。
すなわち、異体字差異部品暫定指示部36において表示されている異体字差異部品D1〜Dxの1つを暫定絞込文字部品P1として操作者の選択指示により受け付ける(確定操作とは別の指示操作)(ステップ415)。
次に、異体字暫定絞込検索部37において目的字候補保持部32に格納された異体字に対して暫定絞込文字部品P1で絞込検索する(ステップ416)。ここで、V1,V2,V3,・・・・・VnがP1を含むかどうかを判断するために、文字部品分解データベース2を参照する。
次に、異体字暫定絞込検索部37において上記で絞込検索した結果を目的字暫定絞込候補として表示する(ステップ417)。
ここで、暫定絞込文字部品で検索した結果は、表示部5に表示されるだけであり、目的字候補保持部32に保持された異体字には影響しない。この点がステップ408の処理とは異なるところであり、絞込文字部品P1を確定する前の試行錯誤を容易に行うことができる。

0054

なお、入力を意図している目的字の候補を保持して操作者に表示する目的字候補保持部32において、目的字の候補となる複数の異体字を表示する際、それらの間で差異のある部分を強調表示するように構成してもよい。差異部分の強調表示により、操作者が容易に目的字の候補間の字形の差異を識別できるようになり、操作者が入力を意図した異体字を効率よく目的字として確定する作業をさらに効率良く行うことができる。

0055

前記の差異のある部分の強調表示の具体的な方法としては、それぞれの文字を複数の部首や部品に分解し、部首として異なる部分には弱い識別表示を、実際に字形の異なる部分には強い識別表示を行う方法がある。弱い識別表示としては薄い背景色を付ける方法や色の異なる枠線を付ける方法があり、強い識別表示としては色の異なる濃い背景色を付ける方法や、その部分を点滅表示させる方法がある。

0056

また、漢字の部首の知識などから連想できる特定の部首については、具体的な部首名や、新字体か旧字体かといった文字の属性情報を表示して、異体字の差異の意味や理由を分かりやすく表現してもよい。さらに、点画の数や向き、接触の有無、跳ねと留めの違いといった字形の特徴の説明を加えてもよい。これらの方法を併用することにより、目的字を見つけ出す作業をさらに効率よく行えるようになる。

0057

例えば、「込」の異体字6文字を目的字候補保持部32の保持する目的字の候補としている場合、各異体字の「1点しんにょう」、「2点しんにょう」、「人」、「入」、「メ」の部分に差異があるので、強調表示を行う。その方法の一例として、「1点しんにょう」と「2点しんにょう」の部分は、部首として差異のある部分なので、部首であるしんにょう全体を弱い識別表示として薄い背景色を付ける。しんにょうの中の点の部分は、「1点しんにょう」と「2点しんにょう」で実際に字形の異なる部分なので、強い識別表示として、色の濃い背景色を付ける。また、「人」、「入」、「メ」の部分も字形の異なる部分なので、強い識別表示として、色の濃い背景色を付ける。これに加えて、「1点しんにょう」と「2点しんにょう」といった具体的な部首名を表示したり、「人」、「入」といった字形を表わす特徴説明を表示してもよい。

0058

図18は、「込」の異体字6文字の差異部分を強調表示した上で、具体的な部首名や、「人」、「入」といった字形を表わす特徴説明も合わせて表示した例を示す図である。
「込」の異体字6文字を「2点しんにょう」で絞込検索し、目的字候補保持部32の保持する目的字の候補が3文字になった場合、しんにょうの部分はすべて共通の「2点しんにょう」であるので差異はなく、「人」、「入」、「メ」の部分にのみ差異があるので、この部分のみ強調表示を行い、しんにょうの部分の強調表示は消える。差異のある部分のみを強調して表示することにより、目的字を見つけ出すための注目点を明示し、目的字を見つけ出す作業をさらに効率良く行えるようになる。

0059

図19は、「込」の異体字を「2点しんにょう」で絞込検索して3文字になった後に、この3文字の差異部分を強調表示した図である。この3文字に絞った場合には、しんにょうの部分に差異がないため、図18と比較してしんにょうの部分の識別表示は消えている。
以上、本発明の実施形態を説明してきたが、具体的な構成はこれら実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲における変更や追加があっても本発明に含まれる。

0060

また、本発明の実施形態は、動作するハードウェアやOS、システム構成を限定するものではなく、本発明がどのようなハードウェアやOS、システム構成上で実施されるものであっても本発明に含まれる。
例えば、Windows(登録商標)、Linux(登録商標)、MacOS、Android、iOSなどの上で動作するネイティブアプリとして本発明を実施することも可能であるし、Internet Explorer、Firefox、Chrome、Safariなどのブラウザ上で動作するWebアプリとして本発明を実施することも可能である。
また、スタンドアローンで動作するプログラムとして本発明を実施することも可能であるし、ネットワーク経由のサーバクライアント構成で動作するプログラムとして本発明を実施することも可能である。
また、異体字データベース1および文字部品分解データベースと異体字入力支援装置とは直接接続しているが、インターネット等の通信回線を介して接続される構成にしてもよい。

0061

1異体字データベース
2文字部品分解データベース
3異体字入力装置
4 入力部
5 表示部
31異体字検索処理部
32 目的字候補保持部
33 異体字差異部品検出部
34 異体字差異部品選択処理部
35 異体字絞込検索部
36 異体字差異部品暫定指示部
37 異体字暫定絞込検索部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ