図面 (/)

技術 階層型分布図表示方式及びプログラムを記録したコンピュータ読み取り可能な記録媒体

出願人 三菱電機株式会社
発明者 水谷茂近藤誠一
出願日 1999年3月30日 (20年3ヶ月経過) 出願番号 1999-087626
公開日 2000年10月13日 (18年9ヶ月経過) 公開番号 2000-285184
状態 特許登録済
技術分野 検索装置 デジタル計算機のユーザインターフェイス 伝票、表計算処理 デジタル計算機のユーザインターフェイス
主要キーワード 特異データ 階層表 表記方式 注目範囲 バブルチャート 集計計算 メニュー表 分類集計
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2000年10月13日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

階層構造を導入し、外れ値を含む全データの分布を把握でき、着目した領域を指定して下位階層の傾向を把握できる階層型分布図表示方式を実現する。

解決手段

データ集合区分けして階層化を行うとともに、各階層の区分けされたデータ集合の数を求める階層化処理部1と、区分けされた複数のデータ集合をそれぞれ複数の四角形を用いて示し、上記複数のデータ集合の数を表示する格子状分布図表示部2と、階層化されたデータ集合間の移動を指示する格子状分布図操作部3と、個々のデータをドット状の分布図で表示させるドット状分布図表示部4と、階層化されるデータ集合と階層化処理部1により計算された階層ごとのデータ集合の数を記録する記録部5とを備える。

概要

背景

従来の、ある2種類の数値データの集合相関関係視覚的に把握するための統計処理方式として、それぞれのデータをX軸、Y軸にとり、数値を該当する値の交差点に置く分布図を表示する方式が取られていた。図21は、従来の分布図の表示の一例である。例えば、統計ツールとして市販されているS−PLUSでは、図21に示すような分布図(散布図とも言う)が表示される。

しかし、この散布図による表現では、データ量が多くなると、例えば、数万件以上乃至数百万件になると、(1)表示に時間がかかる、(2)ドットが重なった部分の数の把握ができない、という問題が発生する。また、(1),(2)の問題を解消するために、大量データの中からサンプリング(たとえば、100万件のデータから1000件を抽出して、全体状況を把握する)をすると、通常値から離れた外れ値が抽出からもれる、正確に状況が把握できないという問題が発生した。

特開平7−200772号公報の「地図編集方法およびシステム」は、地図を活用した分布状況を容易に把握するための技術であり、地域と言った意味のある境界を分割、統合によって集計単位を変えているが、データの分布の分析というあらかじめ境界やデータの特徴が分からないデータ群には適用できる技術ではない。

特開平9−69107号公報の「レコード検索方法抽出方法及びレコード抽出装置」は、全体表示から注目範囲への絞り込みを行っている。だが、分布図を見て検索対象対話的に指定することにより、その指定範囲のデータを検索するので、実行時の処理時間は考慮されていない。

特開平10−40400号公報の「マトリックスグラフ表記方式」では、マトリックスグラフ描画でデータの分布に偏り特異データが存在した場合に、注目点を把握しやすいように表示している。だが、データに偏りがあった場合に、その密度をもとにX軸、Y軸のスケールを調整して、全体表示するので、スケールの調整によりデータの全体が、均一の密度で表示されない場合があることが考えられる。

概要

階層構造を導入し、外れ値を含む全データの分布を把握でき、着目した領域を指定して下位階層の傾向を把握できる階層型分布図表示方式を実現する。

データ集合区分けして階層化を行うとともに、各階層の区分けされたデータ集合の数を求める階層化処理部1と、区分けされた複数のデータ集合をそれぞれ複数の四角形を用いて示し、上記複数のデータ集合の数を表示する格子状分布図表示部2と、階層化されたデータ集合間の移動を指示する格子状分布図操作部3と、個々のデータをドット状の分布図で表示させるドット状分布図表示部4と、階層化されるデータ集合と階層化処理部1により計算された階層ごとのデータ集合の数を記録する記録部5とを備える。

目的

この発明は上記のような問題点を解決するためになされたもので、対象区間を等分し、その区間(領域)にあるデータ数を表示し、ある領域に着目し、該当領域を指定して下位階層の傾向を把握できる階層型分布図表示方式を実現することを目的とする。また、この階層検索表示における集計機能に検索・分類集計エンジンを利用して高速化を図った階層型分布図表示方式を実現することを目的とする。また、本発明では、階層構造を導入し、外れ値をもらすことなく全データの分布を把握できる階層型分布図表示方式を実現することを目的とする。

効果

実績

技術文献被引用数
1件
牽制数
3件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

2種類の値を持つデータ集合を2種類それぞれの値毎に所定の範囲の値で区分けした上位階層のデータ集合に区分けし、かつ、上記2種類の値を持つデータ集合を上記所定の範囲の値よりも細分化された範囲の値で区分けした下位階層のデータ集合に区分けすることにより、上記2種類の値を持つデータ集合を階層化するとともに、各階層の区分けされたデータ集合の数を求める階層化処理部と、上記2種類の値を持つデータ集合をX軸,Y軸上に割り当てた四角形で表すとともに、上記四角形を上記階層化処理部により区分けされた下位階層のデータ集合をそれぞれ表す複数の四角形で格子状に区分けし、区分けした上記複数の四角形にそれぞれ対応する下位階層のデータ集合の数を表示する格子状分布図を表示する格子状分布図表示部とを備えたことを特徴とする階層型分布図表示方式。

請求項2

上記階層型分布図表示方式は、さらに、上記格子状分布図表示部が表示する複数の四角形のうち一つ以上の四角形を指定させて上位階層と下位階層とのうちいずれかの階層への移動を指示する格子状分布図操作部を備え、上記格子状分布図表示部は上記格子状分布図操作部により指示された階層の四角形を表示することを特徴とする請求項1に記載の階層型分布図表示方式。

請求項3

上記階層型分布図表示方式は、さらに、上記格子状分布図表示部が表示する複数の四角形のうち一つ以上の四角形を指定して、指定した四角形に属するデータ集合をドット状の分布図で表示させるドット状分布図表示部を備えたことを特徴とする請求項1、2いずれかに記載の階層型分布図表示方式。

請求項4

上記2種類の値を持つデータ集合は、上記2種類の値をデータ項目としてレコード内に含む明細データであり、上記階層化処理部は、上記明細データを区分けするための上記所定の範囲の値を階層データとして入力し、入力した階層データに従って上記明細データの階層ごとのデータ集合の数を計算して計算結果を保持することを特徴とする請求項1〜3いずれかに記載の階層型分布図表示方式。

請求項5

上記階層化処理部は、関係データベースリレーショナルデータベース)または多次元データベースの少なくともいずれか一方の集計機能を用いて実現されることを特徴とする請求項1〜4いずれかに記載の階層型分布図表示方式。

請求項6

請求項1から請求項5までのいずれかに記載の階層型分布図表示方式を実現するプログラムを記録したコンピュータ読み取り可能な記録媒体

技術分野

0001

この発明は、ある2種類の数値データの集合(たとえば、項目として2つの数値を含む関係データベースレコードの集合)の相関関係(たとえば、身長と体重、計算機CPU稼働率メモリ使用率など)を視覚的に把握するための統計処理結果表示方法操作方法に関するものである。特に、分布図を階層的に表示する階層型分布図表示方式に関するものである。

背景技術

0002

従来の、ある2種類の数値データの集合の相関関係を視覚的に把握するための統計処理方式として、それぞれのデータをX軸、Y軸にとり、数値を該当する値の交差点に置く分布図を表示する方式が取られていた。図21は、従来の分布図の表示の一例である。例えば、統計ツールとして市販されているS−PLUSでは、図21に示すような分布図(散布図とも言う)が表示される。

0003

しかし、この散布図による表現では、データ量が多くなると、例えば、数万件以上乃至数百万件になると、(1)表示に時間がかかる、(2)ドットが重なった部分の数の把握ができない、という問題が発生する。また、(1),(2)の問題を解消するために、大量データの中からサンプリング(たとえば、100万件のデータから1000件を抽出して、全体状況を把握する)をすると、通常値から離れた外れ値が抽出からもれる、正確に状況が把握できないという問題が発生した。

0004

特開平7−200772号公報の「地図編集方法およびシステム」は、地図を活用した分布状況を容易に把握するための技術であり、地域と言った意味のある境界を分割、統合によって集計単位を変えているが、データの分布の分析というあらかじめ境界やデータの特徴が分からないデータ群には適用できる技術ではない。

0005

特開平9−69107号公報の「レコード検索方法抽出方法及びレコード抽出装置」は、全体表示から注目範囲への絞り込みを行っている。だが、分布図を見て検索対象対話的に指定することにより、その指定範囲のデータを検索するので、実行時の処理時間は考慮されていない。

0006

特開平10−40400号公報の「マトリックスグラフ表記方式」では、マトリックスグラフ描画でデータの分布に偏り特異データが存在した場合に、注目点を把握しやすいように表示している。だが、データに偏りがあった場合に、その密度をもとにX軸、Y軸のスケールを調整して、全体表示するので、スケールの調整によりデータの全体が、均一の密度で表示されない場合があることが考えられる。

発明が解決しようとする課題

0007

この発明は上記のような問題点を解決するためになされたもので、対象区間を等分し、その区間(領域)にあるデータ数を表示し、ある領域に着目し、該当領域を指定して下位階層の傾向を把握できる階層型分布図表示方式を実現することを目的とする。また、この階層検索表示における集計機能に検索・分類集計エンジンを利用して高速化を図った階層型分布図表示方式を実現することを目的とする。また、本発明では、階層構造を導入し、外れ値をもらすことなく全データの分布を把握できる階層型分布図表示方式を実現することを目的とする。

課題を解決するための手段

0008

この発明の階層型分布図表示方式は、2種類の値を持つデータ集合を2種類それぞれの値毎に所定の範囲の値で区分けした上位階層のデータ集合に区分けし、かつ、上記2種類の値を持つデータ集合を上記所定の範囲の値よりも細分化された範囲の値で区分けした下位階層のデータ集合に区分けすることにより、上記2種類の値を持つデータ集合を階層化するとともに、各階層の区分けされたデータ集合の数を求める階層化処理部と、上記2種類の値を持つデータ集合をX軸,Y軸上に割り当てた四角形で表すとともに、上記四角形を上記階層化処理部により区分けされた下位階層のデータ集合をそれぞれ表す複数の四角形で格子状に区分けし、区分けした上記複数の四角形にそれぞれ対応する下位階層のデータ集合の数を表示する格子状分布図を表示する格子状分布図表示部とを備えたことを特徴とする。

0009

上記階層型分布図表示方式は、さらに、上記格子状分布図表示部が表示する複数の四角形のうち一つ以上の四角形を指定させて上位階層と下位階層とのうちいずれかの階層への移動を指示する格子状分布図操作部を備え、上記格子状分布図表示部は上記格子状分布図操作部により指示された階層の四角形を表示することを特徴とする。

0010

上記階層型分布図表示方式は、さらに、上記格子状分布図表示部が表示する複数の四角形のうち一つ以上の四角形を指定して、指定した四角形に属するデータ集合をドット状の分布図で表示させるドット状分布図表示部を備えたことを特徴とする。

0011

上記2種類の値を持つデータ集合は、上記2種類の値をデータ項目としてレコード内に含む明細データであり、上記階層化処理部は、上記明細データを区分けするための上記所定の範囲の値を階層データとして入力し、入力した階層データに従って上記明細データの階層ごとのデータ集合の数を計算して計算結果を保持することを特徴とする。

0012

上記階層化処理部は、関係データベース(リレーショナルデータベース)または多次元データベースの集計機能を用いて実現されることを特徴とする。

0013

この発明のプログラムを記録したコンピュータ読み取り可能な記録媒体は、2種類の値を持つデータ集合を2種類それぞれの値毎に所定の範囲の値で区分けした上位階層のデータ集合に区分けし、かつ、上記2種類の値を持つデータ集合を上記所定の範囲の値よりも細分化された範囲の値で区分けした下位階層のデータ集合に区分けすることにより、上記2種類の値を持つデータ集合を階層化するとともに、各階層の区分けされたデータ集合の数を求める階層化処理部と、上記2種類の値を持つデータ集合をX軸,Y軸上に割り当てた四角形で表すとともに、上記四角形を上記階層化処理部により区分けされた下位階層のデータ集合をそれぞれ表す複数の四角形で格子状に区分けし、区分けした上記複数の四角形にそれぞれ対応する下位階層のデータ集合の数を表示する格子状分布図を表示する格子状分布図表示部とを備えた階層型分布図表示方式を実現するプログラムを記憶することを特徴とする。

発明を実施するための最良の形態

0014

実施の形態1.この実施の形態では、外れ値をもらすことなく全データの分布を把握するために、階層構造を導入し、階層間の移動、階層ごとの計算値の保持、階層の作り方に特徴を持つ階層型分布図表示方式について説明を行う。

0015

図1は、この発明の実施の形態の階層型分布図表示方式の構成図の一例である。図において、1はデータ集合を区分けして階層化を行うとともに、各階層の区分けされたデータ集合の数を求める階層化処理部、2は区分けされた複数のデータ集合をそれぞれ複数の四角形を用いて示し、上記複数の四角形に対応して、上記階層化処理部により求められた上記複数のデータ集合の数を表示する格子状分布図表示部、3は階層化されたデータ集合間の移動を指示する格子状分布図操作部、4は一つの四角形に対応するデータ集合に属する個々のデータをドット状の分布図で表示させるドット状分布図表示部、5は階層化されるデータ集合と階層化処理部1により計算された階層ごとのデータ集合の数を記録する記録部である。6は格子状分布図や、ドット状分布図を表示する表示部である。

0016

階層化処理部1は、例えば、既存のリレーショナルデータベースの集計機能等を用いて実現され、指定された範囲をカテゴライズして、それぞれの部分に出現するデータ集合の個数を集計する。格子状分布図表示部2は、階層化処理部1による集計結果を格子状分布図に累計値として表示する。格子状分布図操作部3は、表示された格子状分布図から注目点をユーザに指定させる。ドット状分布図表示部4は指定された注目点のデータ集合のドットによる表示を行う。階層化処理部1が行う集計処理では、(a)あらかじめ階層のすべてのレベル,すべての要素,を集計しておくことにより、階層を移動するとき高速な応答速度を実現する方法と、(b)必要とする部分のみを集計して、最初の分布図の表示速度を速くし、かつ、表示した結果のみをワークに保持することにより記憶容量を節約する方法との2種類がある。

0017

図2は、この発明の階層型分布図表示方式を実行するパーソナルコンピュータハードウェアの構成の一例を示す図である。図において、300aは情報を表示する表示部となるディスプレイ装置、300bは文字や数値を入力するキーボード、300cはディスプレイ装置の任意の位置を指定することができるマウス、300dはマウスパッド、300eはパーソナルコンピュータの本体装置である。記録部5は、例えば、本体装置300eに内蔵されるディスク装置などにより構成される。

0018

次に、この発明の階層型分布図表示方式の概要を図を用いて説明する。図3は、この発明の階層型分布図表示方式の概要を示す図である。
(1)まず、2種類の値のデータ集合を上限値と下限値の範囲(たとえば、0〜100,100〜200,200〜300,300〜400,400〜...)でそれぞれのデータ集合毎に区分けした2次元の格子状の構造を設定する。設定された格子状の構造のそれぞれの格子に所属するデータ集合の累計個数を計算する。計算した累計個数を図3の20に示すように、そのデータ集合が所属する格子の中に表示する。これが、第1階層(上位階層)の格子状分布図である。
(2)次に、格子状の表から、さらに詳しく分布を見たい部分の格子(ここでは、21)を選択する。
(3)選択された格子に属する値(1080)をさらに詳細に区分けし、区分けした格子に属するデータ集合の累計個数を求め、区分けした格子からなる表に累計個数を表示する(図3の22)。これが、第2階層(下位階層)の格子状分布図である。
(4)(1)から(3)を階層の深さに応じて繰り返し、注目したい部分を絞り込み、ドットによる分布図24を表示する。

0019

なお、図3では、データ集合の階層が2階層の場合を示しているが、2階層に限らず、3階層、4階層でも構わない。データの件数が多い場合など、必要に応じて、多階層とすることができるものとする。

0020

このように、分布図を階層的に表示するので、(1)外れ値を含む全体の分布図が把握できる、(2)注目点に関して、ドットによる詳細分布図を見ることができる、(3)数百万件以上という膨大なデータに関しても短時間で表示することができるという点が、効果としてあげられる。

0021

次に、この発明の構成要素について、さらに説明する。格子状分布図表示部2は、2種類の値の集合をX軸、Y軸の四角形で示し、そこに属するレコードの数を表示する。操作者は、格子状分布図表示部操作部3により、四角形をマウスなどのポインティングデバイスでひとつまたは、複数の四角形でより大きな四角形を指定して、次の3種類の操作をメニューまたはキーボードなどの入力装置で指定する。

0022

3種類の操作とは、「上位レベルへの移動」、「下位レベルへの移動」、「ドット状分布図の表示」である。「上位レベルへの移動」とは、現在、表示している階層の上位レベルへの移動である。従って、表示中の階層が最上位であるときは、上位レベルへの移動を指定することはできない。「下位レベルへの移動」とは、指定された範囲に関する階層の下位レベルへの移動である。従って、表示中の階層が最下位の階層であるときは指定することはできない。「ドット状分布図の表示」とは、指定された範囲に属するレコード(データ集合の個々のデータ)をドット状の分布図で表示することである。最下位の階層など、データの累計件数が絞り込まれてから、ドット状分布図を表示することで、大量データの場合、ドットが重なってみにくいという欠点を回避することができる。また、あらかじめ指定された個数以上のドット表示が指示された場合は、確認のメッセージを表示する機能を持つ。これにより、操作者に、最適な表示でないことを警告したり、表示に時間がかかることに同意を求めたりできる。

0023

ドット状分布図表示部は、格子状分布図操作部において、「ドット状分布図の表示」を指定した場合に、ドット状の分布図を表示する。

0024

階層化処理部は、データ集合を分類、集計する分類・集計エンジンである。具体的には、2種類の数値データをデータ項目としてレコード内に含む明細データと、それぞれの数値データの階層データを入力として、階層ごとのレコードの出現値を計算するエンジンと結果を保持する記憶装置を持つ。例えば、関係データベース(リレーショナルデータベース)または多次元データベースの集計機能を用いると以下のようになる。

0025

ここからは、関係データベース(リレーショナルデータベース)または多次元データベースの集計機能を用いる場合について、図3に示した階層表示に対応する具体例を用いて説明する。図4は、明細データの一例を示す図である。明細データ30は、データ項目A31、データ項目B32、データ項目C33、データ項目D34、...を持つ。ここでは、データ項目A31、データ項目B32が分類集計の対象となる数値データであり、データ項目A31が、格子のX軸に対応し、データ項目B32が格子のY軸に対応する。例えば、36に示すデータは前述した図3の格子25に所属する。また、38に示すデータは前述した図3の格子21に所属する。従って、格子21の下位階層を表示する格子22にも所属すると同時に、格子22の詳細レベルでは、格子23に所属する。

0026

図5は、図4に示した明細データのうち、図3の格子23に属する明細データを示す図である。この明細データの件数が50件である。この50件の内訳図6に示す。

0027

図6は、図5に示した明細データを更に小さい範囲で区切った累計件数を示す図である。図3では、格子23を選択して、格子23に所属するデータのドット表示を行う場合を示しているが、格子23を選択した際にドット表示を行わず、図6に示す下位の階層の格子状分布図を表示してもよい。そして、表示した図6の格子状分布図から1つの格子を選択させドット表示を行ってもよい。

0028

図7は、データ項目Aの階層データの一例を示す図である。階層データAT40は、データ項目AL41,データ項目AU42,データ項目AL1(43),データ項目AL2(44)を持つ。ALはデータ項目Aの値の範囲の下限、AUはデータ項目Aの値の範囲の上限である。AL1は下位の階層構造を示し、AL2は上位の階層構造を示している。

0029

図8は、図7に示したAの階層データATが定義する階層構造を示す図である。46は図7の44に示す上位の階層、48は図7の43に示す下位の階層である。

0030

図9は、データ項目Bの階層データの一例を示す図である。階層データBT50は、データ項目BL51,データ項目BU52,データ項目BL1(53),データ項目BL2(54)を持つ。BLはデータ項目Bの値の範囲の下限、BUはデータ項目Bの値の範囲の上限である。BL1は下位の階層構造を示し、BL2は上位の階層構造を示している。

0031

図10は、図9に示したBの階層データBTが定義する階層構造を示す図である。56は図9の54に示す上位の階層、58は図9の53に示す下位の階層である。AL2,BL2は図3の20の格子状分布図(上位階層)に対応している。AL1,BL1は下位階層を示している。例えば、図3の22の格子状分布図(下位階層)の範囲に対応している。図3の22では、Aの値として、10〜20、Bの値として、1000〜2000が選択されているので、図7の45に示すAL1の範囲にAの値があり、かつ、図9の55に示すBL1の範囲にBの値があるデータ集合を示すことになる。

0032

すべての階層の組み合わせの発生件数は、明細データ(MEIAI)、階層データ(AT,BT)を用いて、図11に示すSQL(StructuredQuery Language)文で集計処理することができる。すなわち、データ集合の件数を求める集計計算自体は、既存の公知の技術を用いて行う。図11は、この発明の実施の形態の階層化処理部が行う集計計算の実現方法の一例を示す図である。

0033

図12図13は、図11に示す集計計算で求められるデータ集合を表す図である。61は図3の20に対応する上位階層の集計である。63は、図12の26に示すデータ集合の集計計算である。65は、図13の28に示すデータ集合の集計計算である。67は図3の22に対応する下位階層の集計である。これらのSQL文が実行されると、その結果、以下のように、階層ごとに属するレコードの件数が計算される。計算した値を、例えば、リレーショナルデータベースの表などの形式で記憶しておく。

0034

図14図17は、図11に示す計算方法で計算した計算結果を保持する表の例を示す図である。図14は、図11の61に示したSQL文の実行結果であり、図3の20に対応している。図14の614に示すカウント数(COUNT(*))が、累計数として格子の中に表示されている数字である。図15は、図11の63に示したSQL文の実行結果であり、図12の26に対応している。ここでは、図示を省略するが、下位階層の格子状分布図には、図15の634のカウント数が表示される。図16は、図11の65に示したSQL文の実行結果であり、図13の28に対応している。図13の28を注目点とすると、図15と同様に、図16のカウント数654に保持される値が下位階層の格子状分布図に表示される。図17は、図11の67に示したSQL文の実行結果であり、図3の22に対応している。図17のカウント数674の内で675に示す範囲が、図3の22のAの値10〜20、Bの値1000〜1200及び1200〜1400の格子に表示されている。この処理は、縦1列すべて、横1列すべてを選択して下位層を表示する場合の最適化のためのものであり、67で求めた個々のものを利用するように置き換えることができる。このように、格子状分布図表示部は、これらの計算結果(SQL文の実行結果)をもとに、格子状分布図を表示する。

0035

次に、この実施の形態の階層型分布図表示方式の基本型の処理の流れについて、図18を用いて説明する。図18は、この実施の形態の階層型分布図表示方式の基本型の処理の流れ図である。まず、S10において、分類・集計エンジン(階層化処理部)にて、明細表、階層表を入力とするSQL文を実行して、すべての階層の組み合わせの集計表を作成し、記憶装置に記録する。計算及び記録方式は、前述するように、公知の関係データベースおよび多次元データベースの少なくともいずれかを用いて実現することができる。

0036

次に、S20において、図3の20に示すように、AL2(10きざみ)とBL2(1000きざみ)の集計データをもとに、格子状の分布図を表示する。

0037

次に、S30において、表示された分布図から四角形を選択する(図3の21)。そして、次の操作を指示する。四角形の選択だけではなく、メニュー表示、例えば、プルダウンメニューから次の操作を選択してもよい。その指示に従って、次の処理に分岐する。ここでは、図3の21に示すようにAL2として10−20、BL2として1000−2000を選択するものとする。

0038

S41では、AL2,BL2の場合は最上位の階層であり、これよりも上位の階層は存在しないので何もしない。かりに、AL1,BL1のレベル(下位階層)が表示されていた場合は、AL2,BL2のレベル(その上位階層)の格子状分布図を表示する。

0039

S42では、AL2として10−20、BL2として1000−2000が選択されていたとき、AL1として、10−12,12−14,14−16,16−18,18−20、BL1として1000−1200,1200−1400,1400−1600,1600−1800,1800−2000を目盛りとする格子状分布図(図3の22)を表示する。

0040

S43では、指定された範囲内のレコードを明細データから選択して、その数値データを元にドットを置き、ドット状分布図(図3の24)を表示する。たとえば、図3の23に示すように、AL1として、12−14が、BL1として、1200−1400が選択されていた場合は、
SELECT A,B
FROM MEISAI
HERE A >= 12 AND A <14 AND B >= 1200 AND B < 1400
というSQL文を発行して得られた(A,B)を座標としてドットを置いたドット分布図を表示する。

0041

次に、分類・集計エンジン(階層化処理部)では、指定された部分のみ計算して記録しない場合の処理の流れについて、図19を用いて説明する。図19は、この実施の形態の階層型分布図表示方式の他の処理の流れ図である。まず、S110では、分類・集計エンジン(階層化処理部)にて、明細表、階層表を入力とするSQL文を実行して、最上位の階層のみ(図3では20、図11では61に対応するAL2とBL2)の集計表を作成し、記憶装置に記録する。計算・記録方式は、前述するように、公知の関係データベース、多次元データベースを用いて実現することができる。記憶装置に記録される集計表は図14に示した集計表となる。

0042

次に、S120において、図14に示したAL2(10きざみ)とBL2(1000きざみ)の集計データをもとに、格子状の分布図を図3の20に示すように、表示する。

0043

次に、S130において、表示された分布図から四角形を選択する。ここでは、図3の21に示すように、AL2として10−20をBL2として1000−2000を選択するものとする。

0044

S141では、AL2,BL2の場合は最上位の階層であり、これよりも上位の階層は存在しないので何もしない。かりに、AL1,BL1のレベル(下位階層)が表示されていた場合は、AL2,BL2のレベル(その上位階層)の格子状分布図を予め計算した集計値をもとに表示する。

0045

S142では、AL2として10−20、BL2として1000−2000が選択されていたとき、AL1として、10−12,12−14,14−16,16−18,18−20、BL1として1000−1200,1200−1400,1400−1600,1600−1800,1800−2000を目盛りとする格子状分布図を図3の22に示すように表示する。あらかじめ計算がなされていない場合は、次のSQL文を自動生成して実行し、結果を記録すると同時に、格子状分布図を表示する。
SELECT AL1,MAX(AL2),BL1,MAX(BL2),COUNT(*)
FROM MEISAI,AT,BT
WHERE A>=AL AND A<AU AND B>=BL AND B<BU AND
A >= 10 AND A < 20 AND B >= 1000 ANDB < 2000
GROUP BY AL1,BL1

0046

S143では、指定された範囲内のレコードを選択して、その数値データを元にドットを置く。たとえば、AL1として、12−14が、BL1として、1600−1800が選択されていた場合は、
SELECT A, B
FROM MEISAI
WHERE A >= 12 AND A < 14 AND B >= 1600 AND B < 1800
というSQL文を発行して得られた(A,B)を座標としてドットを置いたドット分布図を表示する。

0047

次に、この実施の形態の階層型分布図表示方式の階層作成(データを元に階層を作成する)処理の流れについて、図20を用いて説明する。図20は、この実施の形態の階層型分布図表示方式の階層作成処理の流れ図である。まず、S11において、入力パラメータとして、レベル数、レベルの要素数、均等/対数を指定する。レベル数とは、階層の深さである。レベルの要素数とは、ひとつの階層の分割数である。均等/対数とは、分割数に対して、分割する値の範囲の上限(最大値)下限(最小値)を求める時のパラメータとなる。均等にすれば、データの値を等分することになる。次に、S12で、MIN,MAX関数を用いたSELECT文を発行して求める。次に、S13で入力パラメータと、最大値、最小値をもとに、図7図9に示したような階層表を生成する。たとえば、均等の場合は、(レベルの要素数)をレベル数でべき乗した値で、(最大値−最小値)を割った数で、間隔を求めて、階層表を作成する。階層表を作成した後の処理については、前述した、図18図19の場合と同様であるので、説明を省略する。

0048

以上のように、この実施の形態では、階層的に分布を把握する階層型分布図表示方式について説明した。この実施の形態によれば、対象区間を等分して、その区間(領域)にあるデータ数を表示し、表示したデータ数のうち、特定の領域に着目し、着目した領域を指定することにより、対話的に対象を絞り込んで、下位階層の傾向を把握することができる。また、逆に、上位階層に戻って、全体の傾向を把握することも対話的に行える。このように、階層構造をとるので、大量データの処理にも対応できる。また、このように、データ集合の持つ値を等分するので、全体的な傾向を偏りなく把握できるという効果がある。また、階層構造化を行う時の、集計機能にリレーショナルデータベースの検索・分類・集計エンジンを利用すれば、処理の高速化が図れる。

0049

なお、階層表示する際に、件数表示バブルチャート表示、色の変化や3D棒グラフなどの表現を用いてもよい。また、一番下のレイヤ最下位階層)では、明細検索機能を持たせ、図4に示したデータ項目A,データ項目Bの表示だけでなく、データ項目C,データ項目D等、分布(相関関係)を把握したい数値データ以外のデータ項目を表示させてもよい。これは、全体の傾向を把握する際の外れ値の詳細を見る場合などに効果的である。また、下位レイヤの分布外れ値に対して、色変え表示やブリンク表示などの特殊表示を行ってもよい。

0050

なお、前述した実施の形態では、最下位の階層から選択した四角形に属するデータ集合をドット状分布図で表示する場合について説明したが、ドット状分布図で表示するデータ集合は、最下位の階層に限らず、任意の階層の四角形を選択させてドット状分布図で表示しても良い。また、詳細データ(明細データ)の表示方法として、ドット状分布図でなく他の表示方法を採用しても構わない。

発明の効果

0051

この発明によれば、データ量が多くても、表示に時間がかからない階層型分布図表示方式を実現できる。また、この発明によれば、外れ値を抽出からもらすことなく、データの全体状況を時間をかけずに把握できる。また、この発明によれば、任意の階層に移動して、所望のデータの相関性を表示させることができる。また、この発明によれば、所望のデータの詳細を表示させることができる。また、この発明によれば、計算結果を保持するので、表示に時間がかからない。また、この階層検索表示における集計機能に検索・分類・集計エンジンを利用して高速化を図った階層型分布図表示方式を実現することができる。

図面の簡単な説明

0052

図1この発明の階層型分布図表示方式の構成図の一例である。
図2この発明の階層型分布図表示方式を実行するハードウェアの構成の一例を示す図である。
図3この発明の階層型分布図表示方式の動作の概要を示す図である。
図4明細データの一例を示す図である。
図5図4に示す明細データのうち、図3の格子23に属する明細データを示す図である。
図6図5に示した明細データを更に小さい範囲で区切った累計件数を示す図である。
図7データ項目Aの階層データの一例を示す図である。
図8図7に示したAの階層データATが定義する階層構造を示す図である。
図9データ項目Bの階層データの一例を示す図である。
図10図9に示したBの階層データBTが定義する階層構造を示す図である。
図11この発明の実施の形態の階層化処理部が行う集計計算の実現方法の一例を示す図である。
図12図11に示す集計計算で求められるデータ集合を表す図である。
図13図11に示す集計計算で求められるデータ集合を表す図である。
図14図11に示す計算方法で計算した計算結果を保持する表の例を示す図である。
図15図11に示す計算方法で計算した計算結果を保持する表の例を示す図である。
図16図11に示す計算方法で計算した計算結果を保持する表の例を示す図である。
図17図11に示す計算方法で計算した計算結果を保持する表の例を示す図である。
図18この実施の形態の階層型分布図表示方式の基本型の処理の流れ図である。
図19この実施の形態の階層型分布図表示方式の他の処理の流れ図である。
図20この実施の形態の階層型分布図表示方式の階層作成処理の流れ図である。
図21従来の分布図の表示の一例である。

--

0053

1階層化処理部、2格子状分布図表示部、3 格子状分布図操作部、4ドット状分布図表示部、5 記録部、6 表示部。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ