図面 (/)

技術 要素集合間関係性表示方法

出願人 株式会社日立ソリューションズ
発明者 武藤勇山下巌
出願日 2001年12月3日 (19年2ヶ月経過) 出願番号 2001-369253
公開日 2003年6月13日 (17年8ヶ月経過) 公開番号 2003-168066
状態 特許登録済
技術分野 伝票、表計算処理 デジタル計算機のユーザインターフェイス デジタル計算機のユーザインターフェイス
主要キーワード 比較要素 Y座標 総要素数 表示模様 要素関係 関係性情報 グラフ形状 問い合わせプログラム
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2003年6月13日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

要素集合間の関係性を1枚の表に表示し、これら要素集合間の関係性をより容易に判定できる表示方法を提供する。

解決手段

要素集合間関係性を要素集合に含まれる全要素間の関係性を総当り定量化し、その結果を集計し、スプレッドシートで表示する。また、定量化された要素間関係性に閾値を与え、スプレッドシート上に表示する際に色・パターンを変え、スプレッドシートを数値化された要素間関係性によりソートする。このようにして、要素集合間の関係性を1枚の表に表示し、その関係性をより容易に判定できるように表示する。

概要

背景

近年、分子生物学における実験手法の進歩により、遺伝子配列を含む生体高分子に関する迅速なデータ決定、収集が可能となった。これらの生体高分子情報を電子計算機によって処理することで、ある生体高分子のある生体高分子集合に対する、相同性等の関係性定量化が行われている。

概要

要素集合間の関係性を1枚の表に表示し、これら要素集合間の関係性をより容易に判定できる表示方法を提供する。

要素集合間関係性を要素集合に含まれる全要素間の関係性を総当りで定量化し、その結果を集計し、スプレッドシートで表示する。また、定量化された要素間関係性に閾値を与え、スプレッドシート上に表示する際に色・パターンを変え、スプレッドシートを数値化された要素間関係性によりソートする。このようにして、要素集合間の関係性を1枚の表に表示し、その関係性をより容易に判定できるように表示する。

目的

前述の、生体高分子の相同性等の関係性定量化は1対1もしくは1対多の関係性で行われている。ここで、生体高分子集合の生体高分子集合に対する関係性の定量化を表示したい場合がある。1対1の関係性は容易に2次元平面上へのプロットとしてあらわすことができる。1対多の関係性は、結果の列記であらわすことができる。しかしながら、多対多の関係性は、これら従来の方法では表すことが非常に困難である。本発明の第1の目的は、要素集合間の関係性を1枚の表に表示することである。本発明の第2の目的は、これら要素集合間の関係性をより容易に判定できる表示方法を提供することである。

効果

実績

技術文献被引用数
1件
牽制数
4件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

第1の要素集合と第2の要素集合を対象として、前記第1の要素集合中の要素と前記第2の要素集合中の要素との関係性を全ての要素対に関して定量化し、前記第1の要素集合中の要素を行方向に並べ前記第2の要素集合中の要素を列方向に並べた1枚のスプレッドシートの各セルに、対応する要素間の関係性を表示することを特徴とする要素集合間関係性表示方法

請求項2

請求項1に記載の要素集合間関係性表示方法において、前記定量化された関係性の大小に従って行方向の要素の並び順を変更する操作と、前記定量化された関係性の大小に従って列方向の要素の並び順を変更する操作を、前記定量化された関係性が予め設定された閾値以上であるセルを固定しながら隣接する行及び列に対して順次交互に反復して行い、得られた結果を表示することを特徴とする要素集合間関係性表示方法。

請求項3

請求項1に記載の要素集合間関係性表示方法において、各行又は各列について前記定量化された関係性の平均値、又は予め設定した閾値以上もしくは以下のセル数を算出し、算出された値の降順又は昇順に行又は列の要素を並び替えて表示することを特徴とする要素集合間関係性表示方法。

請求項4

請求項1又は2に記載の要素集合間関係性表示方法において、前記定量化された関係性に閾値を設定し、定量化された関係性が閾値より高いセル、低いセルをそれぞれ異なる表示方式で表示することを特徴とする要素集合間関係性表示方法。

請求項5

請求項4に記載の要素集合間関係性表示方法において、前記定量化された関係性のヒストグラムを表示し、そのヒストグラム上で閾値を設定することを特徴とする要素集合間関係性表示方法。

請求項6

請求項1又は2に記載の要素集合間関係性表示方法において、前記定量化された関係性の値に応じて色のグラデーションをつけて表示することを特徴とする要素集合間関係性表示方法。

請求項7

請求項1又は2に記載の要素集合間関係性表示方法において、複数種類の定量化された関係性に対して各々異なる色を指定し、その平均の色を表示することを特徴とする要素集合間関係性表示方法。

請求項8

請求項1〜7のいずれか1項に記載の要素集合間関係性表示方法において、前記第1の要素集合は生物種遺伝子配列群、前記第2の要素集合はゲノム配列であり、前記要素間の関係は配列間の相同性解析結果であることを特徴とする要素集合間関係性表示方法。

請求項9

請求項1〜7のいずれか1項に記載の要素集合間関係性表示方法において、前記第1の要素集合は遺伝子バイオチップスポットされた遺伝子配列群、前記第2の要素集合はバイオチップに対してハイブリッド形成反応を行う遺伝子配列群であり、前記要素間の関係は遺伝子間の相同性解析結果であることを特徴とする要素集合間関係性表示方法。

請求項10

請求項1〜7のいずれか1項に記載の要素集合間関係性表示方法において、前記第1の要素集合と前記第2の要素集合は、それぞれ異なる遺伝子バイオチップ上にスポットされた遺伝子配列群であり、前記要素間の関係は遺伝子間の相同性解析結果であることを特徴とする要素集合間関係性表示方法。

請求項11

請求項1〜7のいずれか1項に記載の要素集合間関係性表示方法において、前記第1の要素集合と前記第2の要素集合は同一遺伝子配列群であり、前記要素間の関係は遺伝子間の相同性解析結果であることを特徴とする要素集合間関係性表示方法。

技術分野

0001

本発明は、要素集合間の各要素の関係を分かりやすく表示する表示方法に関する。

背景技術

0002

近年、分子生物学における実験手法の進歩により、遺伝子配列を含む生体高分子に関する迅速なデータ決定、収集が可能となった。これらの生体高分子情報を電子計算機によって処理することで、ある生体高分子のある生体高分子集合に対する、相同性等の関係性定量化が行われている。

発明が解決しようとする課題

0003

前述の、生体高分子の相同性等の関係性定量化は1対1もしくは1対多の関係性で行われている。ここで、生体高分子集合の生体高分子集合に対する関係性の定量化を表示したい場合がある。1対1の関係性は容易に2次元平面上へのプロットとしてあらわすことができる。1対多の関係性は、結果の列記であらわすことができる。しかしながら、多対多の関係性は、これら従来の方法では表すことが非常に困難である。本発明の第1の目的は、要素集合間の関係性を1枚の表に表示することである。本発明の第2の目的は、これら要素集合間の関係性をより容易に判定できる表示方法を提供することである。

課題を解決するための手段

0004

本発明では、要素集合間関係性を要素集合に含まれる全要素間の関係性を総当りで定量化し、その結果を集計スプレッドシートで表示すること、定量化された要素間関係性に閾値を与え、スプレッドシート上に表示する際に色・パターンを変えること、スプレッドシートを数値化された要素間関係性によりソートすることで、要素集合間の関係性を1枚の表に表示することを実現し、その関係性をより容易に判定できるように表示することを実現する。

0005

本発明による要素集合間関係性表示方法は、第1の要素集合と第2の要素集合を対象として、第1の要素集合中の要素と第2の要素集合中の要素との関係性を全ての要素対に関して定量化し、第1の要素集合中の要素を行方向に並べ第2の要素集合中の要素を列方向に並べた1枚のスプレッドシートの各セルに、対応する要素間の関係性を表示することを特徴とする。

0006

定量化された関係性の大小に従って行方向の要素の並び順を変更する操作と、定量化された関係性の大小に従って列方向の要素の並び順を変更する操作を、定量化された関係性が予め設定された閾値以上であるセルを固定しながら隣接する行及び列に対して順次交互に反復して行い、得られた結果を表示するようにしてもよい。この方法によると、関係性の高い要素集合を視覚的に確認できるように表示することができる。各行又は各列について定量化された関係性の平均値、又は予め設定した閾値以上もしくは以下のセル数を算出し、算出された値の降順又は昇順に行又は列の要素を並び替えて表示するようにしてもよい。

0007

定量化された個々の関係性に関して、ある要素の要素集団に対する関係性の平均値を出すことで、平均値が高ければ、要素集合全体に対する関係性が比較的高い要素として認識することができる。逆に平均値が低ければ、要素集合全体に対する関係性が比較的低い要素として認識することができる。また、定量化された個々の関係性に関して、ある要素の要素集合に対する関係性が閾値以上の個数、閾値以下の個数を算出することで、該当要素が要素集合に、関係性の強い要素、関係性の弱い要素をいくつ持っているかを近似し、関係性の強い要素の個数順で要素を並び替えることで、要素集合内の要素に順位付けをすることができる。

0008

定量化された関係性に閾値を設定し、定量化された関係性が閾値より高いセル、低いセルをそれぞれ異なる表示方式で表示するようにすると、関係性の強弱強調表示することができる。異なる表示方式としては、例えば表示色や表示模様を変える方法がある。

0009

一例として、定量化された個々の関係性に関して、最大値に対して閾値を設定し、閾値を越えているか、いないかで関係性を二値化することが可能である。例えば、要素集団Xに対して、要素a、cは閾値を越える最大値をもち、要素bは閾値を越える最大値を持たない場合、要素a、cは要素集団Xに対して関係性をもち、要素bは関係性を持たないと判断することができる。

0010

また、閾値は複数設定することもできる。例えば、大小2つの閾値を設定し、定量化された関係性が、小さな方の閾値より低いセル、小さな方の閾値と大きな方の閾値の中間のセル、大きな方の閾値より高いセルをそれぞれ異なる表示方式で表示することで、関係性の強弱を強調表示することもできる。

0011

定量化された関係性のヒストグラムを表示し、そのヒストグラム上で閾値を設定するようにしてもよい。この方法によると、閾値の設定を容易に行うことができる。定量化された関係性の値に応じて色のグラデーションをつけて表示するようにしてもよい。この方法によると、関係性の強弱傾向を可視化して表示することができる。

0012

複数種類の定量化された関係性に対して各々異なる色を指定し、その平均の色を表示するようにしてもよい。この方法によると、1枚のスプレッドシートに複数種の関係性を同時に可視化して表示することができる。各関係性に対する色の指定方法は、閾値指定による強弱の強調表示であってもグラデーション表示であってもよい。前述の要素集合間関係性表示方法において、第1の要素集合を生物種の遺伝子配列群、第2の要素集合をゲノム配列とし、要素間の関係を配列間の相同性解析結果とすると、異種生物ゲノム間の比較を行うことができる。

0013

第1の要素集合を遺伝子バイオチップスポットされた遺伝子配列群、第2の要素集合をバイオチップに対してハイブリッド形成反応を行う遺伝子配列群とし、要素間の関係を遺伝子間の相同性解析結果とすると、バイオチップハイブリッド形成反応のシミュレーションを行うことができる。

0014

また、第1の要素集合と第2の要素集合を、それぞれ異なる遺伝子バイオチップ上にスポットされた遺伝子配列群とし、要素間の関係を遺伝子間の相同性解析結果とすると、異なるチップ間の関係性を導出することができる。更に、第1の要素集合と第2の要素集合を同一遺伝子配列群とし、要素間の関係を遺伝子間の相同性解析結果とすると、遺伝子クラスタリングを見やすく表示することができる。

発明を実施するための最良の形態

0015

以下、図面を参照して本発明の実施の形態を説明する。図1は、本発明による要素集合間関係性表示方法を実現するシステムの構成図である。本発明のシステムは、2要素間の関係性定量化、定量化関係性の集計、データの表示、ソート処理などを行う中央処理装置101、プログラムを格納したプログラムメモリ102、外部記憶装置103、データメモリ104、システムへの値の入力や選択の操作を行うためのポインティングデバイス151やキーボード152等からなる対話指示入力デバイス105、及び表示装置106を備えて構成される。

0016

プログラムメモリ102には、要素集合及び関係性定量化方法問合せプログラム121、要素間関係性計算プログラム122、要素間関係性集計計算プログラム123、要素集合比較表表示プログラム124、閾値設定問合せプログラム125、結果ソートプログラム126等のプログラムメモリ102が格納されている。外部記憶装置103には、試料中に存在する生体高分子集合の個々の情報を格納している要素集合情報131、生体高分子要素間関係性を定量化した情報を保持するための要素間関係情報132、結果表示時に利用する閾値及び表示色、グラデーション表示の有無等を保持するための閾値情報133が保持されている。データメモリ104には、生体高分子の各要素間の関係性を定量化する際に必要な関係性定量化パラメータ141、生体高分子間の関係性を関係性定量化パラメータ141に従って定量化した定量化要素間関係性データ142、生体高分子要素間の平均値、最大値、最小値、閾値以上個数、閾値以下個数などの関係性を集計した情報を保持するための要素間関係性集計済みデータ143が格納されている。表示装置106は、要素集合間関係性表示表を視覚化して表示するとともに、ユーザとのインタラクションを実現する。

0017

図2は、要素間関係性表示表の概念を示した図である。複数の要素A01、A02、A03、A04からなる要素集合A及び、複数の要素B01、B02、B03、B04からなる要素集合Bがあったとき、円201で囲んで示すように、これら要素集合の各要素間の関係性を総当りで定量化する。こうして得られた全結果を、スプレッドシート202にまとめて表示する。この表において、適当な閾値を指定し、色・パターンで見分けられるような表示の仕方を行う。また、スプレッドシート203に示すように、定量化した関係性によってソートを行うことで、より分かりやすい並び順で表示する。また、要素間関係性及び、表示に利用した閾値情報を保持しておくことで、同様の条件下でのソート結果再現することができる。

0018

図3は、図1の要素集合情報131に格納されたデータから要素集合間比較表を、図1の表示装置106に表示する処理フローを表している。まず、ステップ301において、使用する要素集合及び要素間関係性定量化方式を設定する。このステップによって、図2の要素集合A、要素集合B、及びこれらに含まれる要素間関係性を総当りで定量化する図2の201で使用されるアルゴリズムが設定される。使用する要素間関係性定量化方式の例として、BLASTアルゴリズムを利用したBlast2Sequence(Tatiana A. Tatusova, Thomas L.Madden 1999, "Blast2 sequenced - a new tool for comparing protein and nucleotide sequences", FEMS Microbiol Lett. 174:247-250)、グローバルアライメントアルゴリズムを利用したALIGN(Bill Pearson 1995)などが挙げられる。

0019

次に、図1の中央処理装置101によって、ステップ301で指定された要素間関係性の定量化が行われ、図1の定量化要素間関係性データ142が計算される(ステップ302)。このステップは、次のステップ303によって全ての要素間関係性が定量化されたと判断されるまで、繰り返し行われる。次に、ステップ302において定量化された個々の要素間関係性が集計され、図1の要素間関係性集計済みデータ143が計算される(ステップ304)。最後に、表示装置106に要素集合間比較表が表示される(ステップ305)。ステップ306においてユーザがソート等の操作を指示した場合には、ステップ305に戻り、指示されたソート結果を表示する。

0020

図4は、要素集合及び関係性定量化方法問合せプログラム121が、図3のステップ301で要素集合及び関係性定量化方法を問い合わせる際の処理フローを表している。まず、ステップ401において、要素集合数Sが1つなのか、2つなのかを問い合わせる。次に、ステップ402において要素集合1を問い合わせる。要素集合数Sが2つであれば、ステップ403からステップ404に進み、要素集合2を問い合わせる。要素集合数Sが1つの場合には、要素集合2の問い合わせは行わない。続いて要素集合関係性定量方法を問い合わせる(ステップ405)。このステップにおいて、どのアルゴリズムを実装している、どのプログラムによって、関係性を数値化するかを決定する。最後に、ステップ405で決定したアルゴリズム及びプログラムに必要な諸パラメータを設定する(ステップ406)。

0021

図5は、要素間関係性計算プログラム122が、図3のステップ302で要素間の関係性を計算する際の処理フローを表している。最初、図4のステップ402において指定された要素集合1のデータの読み込みを行う(ステップ501)。設定された要素集合Sが2つであれば、ステップ502からステップ503に進み、図4のステップ404で指定された要素集合2のデータ読込みを行う。要素集合Sが1つの場合には要素集合2の読込みは行わない。次のステップ504においては、図4のステップ406で設定された関係性定量化に必要な諸パラメータを読み込む。続いてステップ505に進み、図4のステップ405で設定された関係性の定量化方法で要素集合1と要素集合2の各要素、もしくは要素集合1の各要素同士に関して、総当りで関係性定量化を繰り返す。

0022

図6は、要素間関係性集計計算プログラム123が、図3のステップ304で要素間関係性を集計する際の処理フローを表している。ステップ601において、図5のステップ505で定量化された関係性のデータを全て読み込む。続くステップ603において、各要素における定量化された値の最大値、最小値、平均値、上限閾値以上の関係性を持つ要素数、下限閾値以下の関係性を持つ要素数等を算出する。

0023

図7は、要素集合比較表表示プログラム124が、図3のステップ305において、要素間関係性を表示する際の処理フローを表している。ステップ701において、図5のステップ505で定量化された関係性データを読込む。続くステップ702において、要素を読み込んだ順にスプレッドシート上に展開していく。この際、関係性値から該当セルを塗りつぶす必要があれば、ステップ703からステップ704に進んで関係性値を表示すると共に、セルの塗りつぶしを行う。塗りつぶす必要がなければ、ステップ703からステップ705に進み、関係性値の表示のみとする。塗りつぶしの際は、後述する閾値データテーブル1702(図17)を参照する。これらのステップを全要素の組み合わせに関して、表示が終わるまで繰り返す(ステップ706)。

0024

図8は、閾値設定問合せプログラム125のフローを示している。ステップ801において、図17の閾値データテーブル1702を参照する。続いてステップ802において、図5のステップ505において定量化された関係性のデータを読み込む。続くステップ803では、ステップ801、802で読込んだデータをもとに、関係性値のヒストグラムと同時に、閾値データの情報を表示する。次に、ステップ804において、図19,20に示されるようなダイアログを表示し、GUIを利用した閾値設定を行わせる。続くステップ805で、ユーザにより設定された閾値データを図17の閾値データテーブル1702に反映させる。

0025

図9は、図3のステップ306で、ユーザが相違要素集合間で比較したデータのソートを要求した際の、結果ソートプログラム126の処理フローを示している。Rをソート対象の行、Cをソート対象の列、Nを行方向に展開している要素数、Mを列方向に展開している要素数とする。ステップ901で、ソートの対象行が行方向に展開している要素数よりも小さければ、ソート対象行の要素関係性値キーにしてソートを行う。この際、ソート対象となる列は、ソート対象列とロックされている列とで比較し、より大きな列とする(ステップ903、904)。ここでいう、ロックされている列とは、すでにソートされている行において、上限閾値を越える関係性値が1つでもある列のことを指す。この操作によりR行目のソートは終了するため、Rは次の行となる(ステップ905)。続いて、ステップ906で、ソートの対象列が列方向に展開している要素数よりも小さければ、ソート対象列の要素関係性値をキーにしてソートを行う。この際、ソート対象となる行は、ソート対象行とロックされている行とで比較し、より大きな行とする(908、909)。ここでいう、ロックされている行とは、すでにソートされている列において、上限閾値を越える関係性値が1つでもある行のことを指す。この操作によりC列目のソートは終了するため、Cは次の列となる(910)。上記操作を、行、列、共に展開している最大行、最大列にいたるまで、繰り返す。

0026

図10は、図3のステップ306で、ユーザが同一要素集合内で比較したデータのソートを要求した際の、結果ソートプログラム126の処理フローを示している。Kをソート対象の要素位置、Nを総要素数とする。ステップ1001で、ソート対象要素位置と、要素ロック最大位置を比較し、ソート対象要素位置の方が大きければ、行・列共にソート対象位置の要素をキーに、ソート対象位置の要素以降をソートする(ステップ1002)。逆に要素ロック最大位置が大きければ、行・列共にソート対象位置の要素をキーに、要素ロック最大位置以降の要素をソートする(ステップ1003)。ここでいう、ロックされている要素とは、すでにソートされている要素において、上限閾値を越える関係性値が1つでもある行もしくは列に位置する要素を指す。この操作によりK列目のソートは終了するため、Kは次の要素となる(ステップ1004)。上記操作を、ソート対象要素位置が、総要素数にいたるまで繰り返す。同一要素集合内で比較したデータであっても、関係性がどちらの要素をキーにするかで変化する場合には、図9に示した方法でソートを行うものとする。

0027

図11は、相違要素のデータを上限閾値8としてソートを行った場合の例である。1101はソートする前のデータである。1102はa行をソート対象行として、A列以降をソートした結果である。ソートした結果aとDの関係性は閾値以上であるため、このセルはロックされる。1103はD列をソート対象列として、b行以降をソートした結果である。ソートした結果eとDの関係性は閾値以上であるため、このセルはロックされる。1104はe行をソート対象行として、C列以降をソートした結果である。ソートした結果eとEの関係性及びeとCの関係性は閾値を越えているため、これらのセルはロックされる。1105はE列をソート対象列として、c行以降をソートした結果である。ソートした結果dとEの関係性は閾値を越えているため、このセルはロックされる。1106はd行をソート対象行として、A列以降をソートした結果である。C列をソートの対象としないのは、1104において、eとCの関係性を示したセルがロックされているためである。1107はC列をソート対象列として、c行以降をソートした結果である。ソートした結果bとCの関係性は閾値を越えているため、このセルはロックされる。1108はb行をソート対象行として、A列以降をソートした結果である。ソートした結果bとAの関係性は閾値を越えているため、このセルはロックされる。1109はA列をソート対象列として、c行以降をソートした結果である。上記の操作により、行・列ともにソート対象行が行・列方向に展開している要素数と等しくなったため、ソート処理は終了する。

0028

図12は、図11と同様の方法で閾値を6に設定してソートを行った結果である。ロックされるセルが異なるため、1109と1209は異なるソート結果を示すことになる。

0029

図13は、同一要素のデータを上限閾値9としてソートを行った場合の例である。1301はソート前のデータである。1302は要素Aをソート対象としてソートを行った結果である。Aとの関係性が高い順に並べると、A、C、D、B、Eとなるため、行・列共に、A、C、D、B、Eの順にソートされる。この結果AとAの関係性は閾値以上であるため、このセルはロックされる。1303は要素CをキーにC以降の要素をソートした結果である。C以降の要素との関係性を高い順に並べると、C、E、D、Bとなるため、行・列共に、C以降はC、E、D、Bの順にソートされる。この結果CとCの関係性及びCとEの関係性、EとCの関係性は閾値を越えているので、これらのセルはロックされる。1304は要素EをキーにD以降の要素をソートした結果である。Eの要素をソート対象としないのは、1303において、EとC及びEとCの関係性を示すセルがロックされているからである。その結果、EとEの関係性が閾値以上であるため、該当セルはロックされる。1305は要素DをキーにD以降の要素をソートした結果である。その結果DとDの関係性は閾値を越えているので、該当セルはロックされる。上記の操作を行った結果、ソート対象位置が要素数と等しくなるので、ソート処理は終了する。

0030

図14は、同一要素のデータを上限閾値7としてソートを行った場合の例である。ロックされるセルが異なるため、1305と1405は異なるソート結果を示すことになる。ソート結果からクラスター化される要素群探すには、表左上から右下に向かう対角線上のセルから、上下方向、左右方向のセルを全て検索していく。関係性閾値以上のセルがあれば、そのセルの関係性を算出した要素は同一のクラスター所属するものとする。図13の結果をみると、要素Aのみからなるクラスター1306、要素CとEからなるクラスター1307、要素Dのみからなるクラスター1308、要素Bのみからなるクラスター1309が作成される。図14の結果を見ると、全ての要素が同一クラスター1406に所属することとなる。

0031

図15は、要素集合情報131を保持するデータスキーマ例を表している。要素集合テーブル1501は要素集合を管理し、要素集合を一意に認識するための要素集合ID及び、要素集合名のデータフィールドを有する。要素テーブル1502は要素集合内の要素を管理し、要素を一意に認識するための要素ID、要素が属する要素集合を一意に認識するための要素集合ID、要素名、要素のもつ生体高分子データの各データフィールドを有する。要素関係性集計テーブル1503は、集計対象の要素を識別するための要素ID、集計項目及び集計したデータのセットをN個有するテーブルである。図5のステップ501及び502で読み込まれた要素情報はこれらのテーブルに格納される。

0032

図16は、要素間関係性情報132を保持するデータスキーマ例を表している。要素間関係性テーブル1601は比較要素1及び2の要素ID、関係性を定量化するための各種パラメータ情報を保持する関係性定量化パラメータテーブルを一意に認識するための関係性定量化パラメータID、定量化した関係性の情報を保持する定量化関係性テーブルを一意に認識するための定量化関係性ID、閾値情報を保持する閾値データテーブルを一意に認識するための閾値データIDをもつ。要素テーブル1602、1603の保持する情報に関しては、図15と同様である。関係性定量化パラメータテーブル1604は関係性定量化パラメータを一意に認識するための関係性定量化パラメータID、関係性を定量化するための使用アルゴリズム・プログラム情報、関係性を定量化するためのパラメータ情報を保持する。定量化関係性テーブル1605は、定量化関係性テーブルを一意に認識するための定量化関係性ID、定量化した関係性の名称情報である定量化関係性名と、その関係性値である定量化関係性値を保持する。

0033

図17は、閾値情報133を保持するためのデータスキーマ例である。要素間関係性テーブル1701は閾値データIDを保持しており、この閾値データIDは閾値データテーブル1702を一意に認識する。閾値データテーブルには、閾値データID、閾値設定の有効・無効フラグ、グラデーション表示フラグ、上限閾値、下限閾値、及び、それら閾値以上、以下のときの色を表す上限表示色、下限表示色の情報を保持する。

0034

図18は、結果表示画面例である。表示画面1801に要素間関係性がスプレッドシートとして表示される。閾値を指定することで、要素間の関係性が強い組み合わせ、弱い組み合わせがそれぞれ、色・パターンを変えて表示される。1802には一方の要素集合の各要素名が表示され、1803にはもう一方の要素集合の各要素名が表示される。要素集合が関係性の高い生体高分子で構成されている場合には、関係性の弱い組み合わせを見ることで、関係性が低い要素の特定を行うことが可能である。画面1804はソート後の結果を示している。ソートを行うことで、ソート前には散在していた閾値以上のセルが、関係性の高いもの同士が集まって表示されるようになる。

0035

図19は、閾値指定補助ヒストグラムの画面例である。表示部1901には、横軸を関係性の値、縦軸を要素対の数(スプレッドシート中のセル数)としたヒストグラムが表示され、設定した閾値がライン1902及び1903で表示される。このラインを図1のポインティングデバイス151を利用してドラッグすることで、閾値を変更することが可能である。1904は現在設定している関係性を選択するためのリストである。1905、1906はそれぞれの閾値を越えた場合、閾値以下の場合の表示色・パターンを示している。1907、1908はそれぞれの閾値をポイントで表示したものである。この値は図1のキーボード152を利用することで、変更することができる。Graph Setting…ボタン1909はグラフY座標の上限、ヒストグラム算出単位グラフ形状などを変更するためのボタンである。

0036

図20は、グラデーション指定補助ヒストグラムの画面例である。画面2001にはヒストグラムが表示され、設定した閾値がライン2002及び2003で表示される。このラインを図1のポインティングデバイス151を利用してドラッグすることで、閾値を変更することが可能である。2004は現在設定している関係性を選択するためのリストである。2005は現在の設定におけるグラデーション状態である。2006、2007はそれぞれグラデーションの上限、下限の表示色を示している。2008、2009はそれぞれグラデーションの上限、下限の値をポイントで表示したものである。この値は図1のキーボード152を利用することで、変更することができる。Graph Setting…ボタン2010はグラフのY座標の上限、ヒストグラム算出単位、グラフ形状などを変更するためのボタンである。グラデーションを利用して表示することにより、閾値以上・以下という二値化により見逃されてしまう境界近傍のデータも表示することが可能となる。逆に閾値が明らかな場合にはグラデーション表示をせずに二値化した表示を行うことで、関係性の有無をより明確に表すことが可能である。

0037

定量化された複数の関係性を同時に表示する場合には、スプレッドシートの単一セル中に複数の関係性値を記述する。また、閾値を指定して表示色を変更する場合、及びグラデーション表示をする場合には、各関係性値における設定表示色をRGB値換算し、R、G、B各々を平均値とした色で表示する。例えば、配列の関係性を2種類以上のアルゴリズムにより算出し、アルゴリズム1で決定された関係性値が閾値以上であるセルの表示色を赤(R:255、G:0、B:0)、アルゴリズム2で決定された関係性値が閾値以上であるセルの表示色を青(R:0、G:0、B:255)とした場合、アルゴリズム1のみで関係性が閾値を越えているセルは赤(R:255、G:0、B:0)、アルゴリズム2のみで関係性が閾値を越えているセルは青(R:0、G:0、B:255)、両アルゴリズムで関係性が閾値を越えているセルはそれぞれのRGB値の平均をとった紫(R:127、G:0、B:127)で表示される。このように同時に表示することで、赤もしくは青で表示されている関係性は、一方のアルゴリズムでは探し出せない関係性であるか、もしくは、一方のアルゴリズムでは疑陽性の関係性を有意なものとして認識してしまったかの、いずれかであることが表される。また、関係性の有無が確実に分かっている要素集合があれば、関係性のあるセル全てが紫で表示されるように閾値を設定することで、複数アルゴリズムにおける関係性値算出の違いを吸収することが可能である。また、複数関係性同時表示時のソートでは複数のソートキーを指定することでソートを行う。

0038

上記方法を、一方の要素集合を生物種1の遺伝子配列の集合とゲノム配列、もう一方の要素集合を生物種2の遺伝子配列の集合とゲノム配列とし、関係性を相同性検索の相同性スコアとして実装することで、異なる生物種間の遺伝子配列レベルでの比較結果を表示することが可能となる。例えば、生物種1のある遺伝子配列が生物種2のある遺伝子配列と有意な相同性を示した場合には、生物種1と生物種2の該当遺伝子が似た機能を有すると推定される。生物種1のある遺伝子配列が生物種2のいずれの遺伝子配列とも有意な相同性を示さず、生物種2のゲノム配列と有意な相同性を示せば、生物種2では未発見の遺伝子候補として挙げることが可能である。生物種1のある遺伝子配列が、生物種2の遺伝子配列とも、ゲノム配列とも有意な相同性を示さなければ、生物種1と生物種2の差異に関わる遺伝子候補として挙げることが可能である。このような相同性検索を複数のアルゴリズムを利用し、結果を同時に表示することで、より精度を高めて、これらの解析を行うことができる。このような要素集合で表示を行う場合にはゲノム配列との相同性はソートの対象外としてソートを行うことで、表の左上に共通な遺伝子配列、右下に両生物種において異なる遺伝子配列が並ぶ傾向になる。

0039

遺伝子バイオチップに、スポットされている遺伝子配列に対して相補的な配列を有する遺伝子を反応に供した場合、相補的な配列を有する遺伝子はバイオチップ上の遺伝子と結合し、バイオチップ上に捕捉される。これら反応に供される遺伝子全てに色素等の検出可能な物質をつけておくことで、バイオチップ上にスポットされている遺伝子と相補的な遺伝子の検出を行うことができる。そこで、一方の要素集合を遺伝子バイオチップにスポットした遺伝子配列群、もう一方の要素集合を、このバイオチップに対して反応に供する遺伝子の配列群とする。この時、これら2つの要素集合の関係性を、遺伝子配列の相補鎖配列も加味した相同性検索のスコアとすることで、バイオチップ上のどのスポットに対して遺伝子が結合するかを、シミュレートすることが可能となる。バイオチップを製造する過程では、バイオチップ上に意図した遺伝子がスポットされているか否かの品質を判定する場合に、配列が明らかである遺伝子群を反応に供する場合がある。上記の方法で、結果を一覧表示することで、理論上、どのスポットに対して結合し、どのスポットに対して結合しないのか、一覧表示することが可能である。

0040

遺伝子バイオチップの全スポットの配列を指定し、オーダーメイドのバイオチップを作成することも可能であるが、配列を指定できない出来合いのバイオチップを利用することも可能である。往々にしてオーダーメイドのバイオチップは出来合いのバイオチップよりも高価な場合があるため、出来合いのバイオチップを利用できるのであれば、利用したいと考える研究者は多い。ここで、要素集合1をあるオーダーメイドのバイオチップ上の遺伝子配列群、要素集合2を出来合いのバイオチップ上の遺伝子配列群として、関係性を相同性検索の相同性スコアとして表示すると、オーダーメイドチップのうち、どのスポットが出来合いのチップでカバーできるか調べることが可能である。これにより、研究に関連する遺伝子のスポットがカバーされている出来合いのチップが見つかれば、オーダーメイドチップを利用せずに、出来合いのバイオチップで安価に研究を行うことが可能である。出来合いのバイオチップ同士においても同様に、それぞれの遺伝子配列群を要素とした要素集合として、相同性を関係性指標として表示し、チップ間の関係性から、自分の実験により適したセットを有するチップを探し出すことが可能となる。

0041

要素集合として、同一の要素を持つ集合を2つ設定し、要素間の関係性を総当りで算出、一覧表示を行った後に、要素を既述のアルゴリズムでソートすることで、表中の左上から右下にかけての対角線上に必ず各要素の最大値がくるように要素群がソートされる。ここで、基準値以上の値を持つセルが同一列もしくは同一行にあれば同じクラスターとする方法で、一覧表上に遺伝子クラスターを形成していくことが可能である。

0042

図21は、行方向に展開されている各要素に関して、列方向に展開されている各要素との定量化関係性が閾値以上である個数を算出し、この個数をもとに行方向に降順ソートを行った例である。より上の行にある要素が列方向に展開されている要素集合と比較的強い関係性を持つものと考えることができる。2101がソート前、2102がソート後の結果表示例である。

0043

図22は、行方向に展開されている各要素に関して、列方向に展開されている各要素との定量化関係性の平均値を算出し、この平均値をもとに行方向に降順ソートを行った例である。より上の行にある要素が列方向に展開されている要素集合と比較的強い関係性を持つものと考えることができる。2201がソート前、2202がソート後の結果表示例である。

発明の効果

0044

以上説明したように、本発明によれば、2つの要素集合を対象として、各要素集合の定量化された関係性を1枚の表に表示することが可能である。また、それら要素集合間の関係性をより容易に理解できる形で表現することが可能となる。

図面の簡単な説明

0045

図1本発明による要素集合間関係性表示方法を実現するシステムの構成図。
図2要素集合から各要素間関係性を表示する概念図。
図3要素集合情報に格納されたデータから要素集合間比較表を表示する処理フローの図。
図4要素集合及び関係性定量方法問い合わせプログラムの処理フローを示す図。
図5要素間関係性計算プログラムの処理フローを示す図。
図6要素間関係性集計計算プログラムの処理フローを示す図。
図7要素集合比較表表示プログラムの処理フローを示す図。
図8閾値設定問い合わせプログラムの処理フローを示す図。
図9相違要素集合間比較時の結果ソートプログラムの処理フローを示す図。
図10同一要素集合間比較時の結果ソートプログラムの処理フローを示す図。
図11要素集合が2つの場合の結果ソート例を示す図。
図12要素集合が2つの場合の結果ソート例を示す図。
図13要素集合が1つの場合の結果ソート例を示す図。
図14要素集合が1つの場合の結果ソート例を示す図。
図15要素集合上のデータスキーマ例を示す図。
図16要素間関係性情報のデータスキーマ例を示す図。
図17閾値情報のデータスキーマ例を示す図。
図18結果表示画面例を示す図。
図19閾値指定補助ヒストグラムを示す図。
図20グラデーション指定補助ヒストグラムを示す図。
図21要素間関係性集計データによるソート例を示す図。
図22要素間関係性集計データによるソート例を示す図。

--

0046

101:中央処理装置
102:プログラムメモリ
103:外部記憶装置
104:データメモリ
105:対話指示入力デバイス
106:表示装置

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ