図面 (/)

技術 コンピュータを利用して解析対象核酸塩基配列から最適なオリゴ核酸配列の候補を設計するためのコンピュータソフトウエアプログラム及びその方法

出願人 株式会社ダイナコム
発明者 青木良晃石川充仁
出願日 2002年6月20日 (17年9ヶ月経過) 出願番号 2002-180593
公開日 2003年4月4日 (16年11ヶ月経過) 公開番号 2003-099438
状態 拒絶査定
技術分野 検索装置 突然変異または遺伝子工学 特定用途計算機
主要キーワード 先頭部位 設計許容範囲 抜き枠 類似判別 各解析対象 ポップアップ窓 PR値 プルダウンボックス
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2003年4月4日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (13)

課題

二本鎖結合温度GC含有量塩基配列長に関して高い精度を有するオリゴ核酸配列を一度に多数決定する。

解決手段

コンピュータソフトウエアプログラムであって、二本鎖結合温度、塩基配列長、GC含有量の各項目許容範囲の指定を受け付け且つ各項目の優先順位の情報をメモリに記憶させる第1の指令と、前記解析対象核酸塩基配列の中で部分配列を伸ばしながら、各長さで、前記第1の指令で受け付けた優先項目に基づいて各許容範囲に入るかを判断させ、入る場合には当該長さの部分配列を候補オリゴ核酸塩基配列として出力させる第2の指令と、前記第2の指令によって出力された候補オリゴ核酸配列について、前記優先順位に基づいて、各項目の値と共に表示させる第3の指令とを有する。

概要

背景

実験対象の遺伝子の細胞内での発現性解析する場合、一般的にDNAチップと称される素子が利用される。このDNAチップは、数千から数万個の異なる塩基配列情報を持つDNA断片やRNA断片をガラスシリコン基板上に配列してなるものである。

このDNAチップ上に配列された複数のDNA断片やRNA断片の核酸配列は、キャプチャーと称され、実験対象の特定の遺伝子と結合、つまりハイブリダイゼーションを起こさせるために適宜配置されたものである。このようなDNAチップによれば、例えば健康な細胞が病気の細胞に変化した際、この細胞中のどの遺伝子がハイブリダイゼーションを起こすかを調べることによって、病気の原因になる発現遺伝子を突き止めることが可能になる。

ここで、上記キャプチャーとして使用されるDNA断片の核酸配列は、一般にライブラリから選択される。ライブラリとは、細胞などから取得した遺伝子の断片をクローニングして作られたDNAのサンプルの集合体や、cDNAのサンプルの集合体である。ここで、cDNA(complementary DNA)とは、メッセンジャーRNAの全ての塩基に結合できるDNA配列の塩基、つまり、メッセンジャーRNAに相補的に合成されたDNAである。

しかし、研究者がこれらのキャプチャーとなる実際のサンプルを入手するのは、実在するDNA断片を細胞から入手したりする必要があり、時間、費用、技術の面でも困難である。そのため、最近では、既に配列情報が読み取られたゲノムの配列情報やEST(Expressed Sequence Tag)と呼ばれるメッセンジャーRNAのポリA配列端末ポリAとは、−AAAAOH というRNAの端末に存在する配列)の配列情報を同定した配列情報を用いて、数十塩基長程度のオリゴ塩基配列を決定し、それを化学合成して基盤上に載せる方法が使われているようになってきている。ここで、オリゴ核酸とは、比較的短い塩基配列(例えば、約200ベースペア)を有した核酸を称する。

従来、適切なオリゴ核酸配列の決定は、研究者がライブラリ内の遺伝子や実験対象の遺伝子を部分的に抜き出し、これらの配列を目視で比較・対比をして、配列に存在する相違点と共通点を探索することで成されていた。しかし、近年DNAチップやDNAアレイ集積度上がり、より多数の核酸断片集積されるようになってきている。このような探索を目視で行う事は現実的ではない。そこで、基板上に配列する核酸断片の塩基配列を決定するにあたり、コンピュータを使用することがより一般的になってきている。

この様な技術として、従来、例えば特許第3055942号に開示されたように、遺伝子配列データソースのデータを利用したコンピュータ処理により共通プローブ特異的プローブの設計を行えるオリゴプローブ設計ステーションがある。

しかし、このような現在のコンピュータによる処理技術は、ハイブリダイゼーション強度モデリングを計算し、それに基づいてユーザーが適切なプローブを選択するに過ぎないものであり、プローブの結合温度の精度を上げるようなものではない。

すなわち、DNAチップ等用の多数の異なったプローブを設計する際、これらの全てのプローブは同じ二本鎖結合温度を保持する必要がある。二本鎖結合温度条件は、Tm値の温度によって与えられる。ここで、Tm値の温度とは、50パーセント二重結合が二本鎖に存在する時の温度であるが、これは、GC含有量などによって決定される。ところが、GC含有量は、塩基配列とその長さによって変化する。そのため、合成条件として決めた塩基長で固有の配列を持ち、適切な温度条件になる配列を決定する際、これら全ての必要条件を満たす配列を決定するのはかなり困難である。

上記特許第3055942号に開示された技術では、候補オリゴ核酸配列と特定遺伝子とのハイブリダイゼーション強度を二本鎖結合温度により求め、その情報をユーザーに提示することで、最適温度条件になるプローブの選択を容易にするものである。しかし、この技術で用いる候補のオリゴ核酸配列は、二本鎖結合温度条件を考慮せずに決定された物であるから、上記のようにしても候補オリゴ核酸配列の二本鎖結合温度に関する分散度を自体は小さくすることが出来ない。このため、候補オリゴ核酸配列から多くのプローブを得ようとするとその分散度がかなり大きくなってしまう。発明者等の分析によれば、従来の方法で求めたオリゴ核酸塩基配列の二本鎖結合温度の誤差範囲は±20度にも達してしまう。また、この誤差範囲を小さくしようとすると十分な数のオリゴ核酸塩基配列が得られないという問題が生じてしまう。

一方、オリゴ核酸配列を決定する必然性のある他の用途として、PCR法ポリメラーゼチェインリアクション法)等の遺伝子増幅手段を目的としたプローブの設計がある。PCR法において、固有の塩基配列部分を探してその部分を増幅することを目的として、その増幅部の両端側開始位置に相当する数十塩基長のプローブの塩基配列を設計しなければならない。キャプチャーの塩基配列設計の場合と同様に、この用途においても、該当部位以外での二本鎖結合をしないような固有の配列部分を設計しなければならない。また、二本鎖結合温度に関しても同じ温度条件である必要がある。

上記の目的のため、設計したプローブは対象となる遺伝子や混在する核酸に対して希望の部分だけを増幅するような、固有の配列である必要がある。また、複数の配列対象を同時に増幅する場合もあり、この際、それらの所望の結合部分に関する適切な配列と二本鎖結合温度の条件をそれぞれが満足している必要がある。

上記公報には、このPCR法においてのプローブ設計に関する技術も開示されているが、上述の理由で、適宜な二本鎖結合温度条件を満たすような解決策を提供していない。

また、コンピュータによる処理では、一度に膨大な数の核酸塩基配列同士を相互に比較して解析対象の核酸塩基配列にのみ固有な配列部分を特定することが効率良く行なえる。しかし、比較対象の核酸塩基配列にオリゴプローブ設計対象の核酸塩基配列と同一の配列が含まれている場合には、固有部分の特定が不可能になりプローブを設計することができない。このような場合には、このような重複塩基配列を特定して除去した後で再度上記の比較を行なって設計をしなおさなければならず、時間と手間がかかるばかりかコンピュータに負荷がかかり全体の処理速度を低下させる原因となっていた。

概要

二本鎖結合温度、GC含有量、塩基配列長に関して高い精度を有するオリゴ核酸配列を一度に多数決定する。

コンピュータソフトウエアプログラムであって、二本鎖結合温度、塩基配列長、GC含有量の各項目許容範囲の指定を受け付け且つ各項目の優先順位の情報をメモリに記憶させる第1の指令と、前記解析対象核酸塩基配列の中で部分配列を伸ばしながら、各長さで、前記第1の指令で受け付けた優先項目に基づいて各許容範囲に入るかを判断させ、入る場合には当該長さの部分配列を候補オリゴ核酸塩基配列として出力させる第2の指令と、前記第2の指令によって出力された候補オリゴ核酸配列について、前記優先順位に基づいて、各項目の値と共に表示させる第3の指令とを有する。

目的

この発明は、このような事情に鑑みて成されたものであり、二本鎖結合温度、GC含有量、塩基配列長に関して高い精度を有するオリゴ核酸配列を一度に多数決定することができるシステム及び方法を提供することを目的とする。

この発明のさらに詳しい目的は、オリゴ核酸配列を決定する際に、所望の設計許容範囲及び優先項目を指定して、その条件を満たすオリゴ核酸配列を決定し表示することができるシステム及び方法を提供することにある。

また、この発明のさらに別の詳しい目的は、比較対象の核酸塩基配列として解析対象核酸塩基配列と同一の配列が重複して登録されている場合でも、相同性比較を最初からやり直さずにオリゴ核酸塩基配列の決定を行えるシステム及び方法を提供することにある。

効果

実績

技術文献被引用数
0件
牽制数
1件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

コンピュータを利用して、解析対象核酸塩基配列から最適なオリゴ核酸塩基配列の候補を設計するためのコンピュータソフトウエアプログラムであって、二本鎖結合温度、塩基配列長、GC含有量の各項目許容範囲の指定を受け付け且つ各項目の優先順位の情報をメモリに記憶させる第1の指令と、前記解析対象核酸塩基配列の中で部分配列を伸ばしながら、各長さで、前記第1の指令で受け付けた優先項目に基づいて各許容範囲に入るかを判断させ、入る場合には当該長さの部分配列を候補オリゴ核酸塩基配列として出力させる第2の指令と、前記第2の指令によって出力された候補オリゴ核酸配列について、前記優先順位に基づいて、各項目の値と共に表示させる第3の指令とを有することを特徴とするプログラム

請求項2

請求項1のプログラムにおいて、前記第2の指令は、解析対象核酸塩基配列と他の複数の核酸塩基配列との相同比較に基づき、当該解析対象核酸塩基配列に固有配列部分を含むように前記部分配列を伸ばしていくものであり、前記全ての相同比較結果はメモリに記憶されており、このプログラムはさらに前記相同比較結果のうち任意の比較結果を前記メモリ内で無効にして前記メモリ内の比較結果を更新する第4の指令を有するものであるを有することを特徴とするコンピュータソフトウエアプログラム。

請求項3

請求項1のプログラムにおいて、さらに、任意もしく全ての解析対象核酸塩基配列についての候補オリゴ核酸配列の出力が終了した場合に特定のユーザにそのことを通知させる第5の指令を有することを特徴とするプログラム。

請求項4

コンピュータを利用して、登録された複数の核酸塩基配列同士の相同比較を実行させ、この比較結果に基づいて特定の解析対象核酸塩基配列に最適なオリゴ核酸配列の候補を設計するためのコンピュータソフトウエアプログラムであって、全ての核酸塩基配列同士の比較結果をメモリに記憶させる第1の指令と、前記比較結果のうち任意の比較結果を前記メモリ内で無効にして前記比較結果を更新する第2の指令とを有することを特徴とするコンピュータソフトウエアプログラム。

請求項5

請求項4記載のプログラムにおいて、前記更新された比較結果に基づいて特定の解析対象核酸塩基配列に最適なオリゴ核酸配列の候補を設計させる第3の指令をさらに有することを特徴とするプログラム。

請求項6

請求項4記載のプログラムにおいて、第2の指令は、前記比較結果を前記メモリから取り出し、各比較対象の配列との相同部位を前記解析対象塩基配列と所定の形式で並べて画面上に表示させる指令と、画面上で無効にしたい塩基配列を選択することでこの塩基配列との比較結果を無効にする指令とを含むことを特徴とするプログラム。

請求項7

請求項4記載のプログラムにおいて、前記メモリ内の比較結果に基づいて前記複数の核酸塩基配列に解析対象核酸塩基配列と同一の核酸塩基配列が重複登録されていることを検出させる第4の指令をさらに有し、前記第2の指令は、前記第4の指令に基づいて検出された重複する核酸塩基配列間の比較結果をメモリ内で無効にすることで前記比較結果を更新するものであることを特徴とするコンピュータソフトウエアプログラム。

請求項8

請求項4記載のプログラムにおいて、さらに、二本鎖結合温度、塩基配列長、GC含有量の各項目の許容範囲の指定を受け付け且つ各項目のいずれを優先させるかの情報をメモリに記憶させる第5の指令と、前記比較結果に基づき、前記第5の指令で受け付けた許容範囲及び優先項目に基づいて解析対象核酸塩基配列に最適なオリゴ核酸配列の候補を設計させる第6の指令と、前記第6の指令によって設計された複数の候補オリゴ核酸配列を前記優先順序で表示させる第7の指令とを有することを特徴とするプログラム。

請求項9

コンピュータを利用して、解析対象核酸塩基配列から最適なオリゴ核酸塩基配列の候補を設計するための処理方法であって、二本鎖結合温度、塩基配列長、GC含有量の各項目の許容範囲の指定を受け付け且つ各項目の優先順位の情報をメモリに記憶させる第1の工程と、前記解析対象核酸塩基配列の中で部分配列を伸ばしながら、各長さで、前記第1の指令で受け付けた優先項目に基づいて各許容範囲に入るかを判断させ、入る場合には当該長さの部分配列を候補オリゴ核酸塩基配列として出力させる第2の工程と、前記第2の指令によって出力された候補オリゴ核酸配列について、前記優先順位に基づいて、各項目の値と共に表示させる第3の工程とを有することを特徴とする方法。

請求項10

請求項9の方法において、前記第2の工程は、解析対象核酸塩基配列と他の複数の核酸塩基配列との相同比較に基づき、当該解析対象核酸塩基配列に固有の配列部分を含むように前記部分配列を伸ばしていくものであり、前記全ての相同比較結果はメモリに記憶されており、このプログラムはさらに前記相同比較結果のうち任意の比較結果を前記メモリ内で無効にして前記メモリ内の比較結果を更新する第4の工程を有するものであるを有することを特徴とする方法。

請求項11

請求項9の方法において、さらに、任意もしく全ての解析対象核酸塩基配列についての候補オリゴ核酸配列の出力が終了した場合に特定のユーザにそのことを通知させる第5の工程を有することを特徴とする方法。

請求項12

コンピュータを利用して、登録された複数の核酸塩基配列同士の相同比較を実行させ、この比較結果に基づいて特定の解析対象核酸塩基配列に最適なオリゴ核酸配列の候補を設計するための処理方法であって、全ての核酸塩基配列同士の比較結果をメモリに記憶させる第1の工程と、前記比較結果のうち任意の比較結果を前記メモリ内で無効にして前記比較結果を更新する第2の工程とを有することを特徴とする方法。

請求項13

請求項12記載の方法において、前記更新された比較結果に基づいて特定の解析対象核酸塩基配列に最適なオリゴ核酸配列の候補を設計させる第3の工程をさらに有することを特徴とする方法。

請求項14

請求項12記載の方法において、第2の工程は、前記比較結果を前記メモリから取り出し、各比較対象の配列との相同部位を前記解析対象塩基配列と所定の形式で並べて画面上に表示させる工程と、画面上で無効にしたい塩基配列を選択することでこの塩基配列との比較結果を無効にする工程とを含むことを特徴とする方法。

請求項15

請求項12記載の方法において、前記メモリ内の比較結果に基づいて前記複数の核酸塩基配列に解析対象核酸塩基配列と同一の核酸塩基配列が重複登録されていることを検出させる第4の工程をさらに有し、前記第2の工程は、前記第4の工程に基づいて検出された重複する核酸塩基配列間の比較結果をメモリ内で無効にすることで前記比較結果を更新するものであることを特徴とする方法。

請求項16

請求項12記載の方法において、さらに、二本鎖結合温度、塩基配列長、GC含有量の各項目の許容範囲の指定を受け付け且つ各項目のいずれを優先させるかの情報をメモリに記憶させる第5の工程と、前記比較結果に基づき、前記第5の指令で受け付けた許容範囲及び優先項目に基づいて解析対象核酸塩基配列に最適なオリゴ核酸配列の候補を設計させる第6の工程と、前記第6の工程によって設計された複数の候補オリゴ核酸配列を前記優先順序で表示させる第7の工程とを有することを特徴とする方法。

技術分野

0001

この発明は、解析対象核酸塩基配列から最適なオリゴ核酸配列の候補を設計するためのコンピュータソフトウエアプログラムおよび方法に関するものである。

背景技術

0002

実験対象の遺伝子の細胞内での発現性解析する場合、一般的にDNAチップと称される素子が利用される。このDNAチップは、数千から数万個の異なる塩基配列情報を持つDNA断片やRNA断片をガラスシリコン基板上に配列してなるものである。

0003

このDNAチップ上に配列された複数のDNA断片やRNA断片の核酸配列は、キャプチャーと称され、実験対象の特定の遺伝子と結合、つまりハイブリダイゼーションを起こさせるために適宜配置されたものである。このようなDNAチップによれば、例えば健康な細胞が病気の細胞に変化した際、この細胞中のどの遺伝子がハイブリダイゼーションを起こすかを調べることによって、病気の原因になる発現遺伝子を突き止めることが可能になる。

0004

ここで、上記キャプチャーとして使用されるDNA断片の核酸配列は、一般にライブラリから選択される。ライブラリとは、細胞などから取得した遺伝子の断片をクローニングして作られたDNAのサンプルの集合体や、cDNAのサンプルの集合体である。ここで、cDNA(complementary DNA)とは、メッセンジャーRNAの全ての塩基に結合できるDNA配列の塩基、つまり、メッセンジャーRNAに相補的に合成されたDNAである。

0005

しかし、研究者がこれらのキャプチャーとなる実際のサンプルを入手するのは、実在するDNA断片を細胞から入手したりする必要があり、時間、費用、技術の面でも困難である。そのため、最近では、既に配列情報が読み取られたゲノムの配列情報やEST(Expressed Sequence Tag)と呼ばれるメッセンジャーRNAのポリA配列端末ポリAとは、−AAAAOH というRNAの端末に存在する配列)の配列情報を同定した配列情報を用いて、数十塩基長程度のオリゴ塩基配列を決定し、それを化学合成して基盤上に載せる方法が使われているようになってきている。ここで、オリゴ核酸とは、比較的短い塩基配列(例えば、約200ベースペア)を有した核酸を称する。

0006

従来、適切なオリゴ核酸配列の決定は、研究者がライブラリ内の遺伝子や実験対象の遺伝子を部分的に抜き出し、これらの配列を目視で比較・対比をして、配列に存在する相違点と共通点を探索することで成されていた。しかし、近年DNAチップやDNAアレイ集積度上がり、より多数の核酸断片集積されるようになってきている。このような探索を目視で行う事は現実的ではない。そこで、基板上に配列する核酸断片の塩基配列を決定するにあたり、コンピュータを使用することがより一般的になってきている。

0007

この様な技術として、従来、例えば特許第3055942号に開示されたように、遺伝子配列データソースのデータを利用したコンピュータ処理により共通プローブ特異的プローブの設計を行えるオリゴプローブ設計ステーションがある。

0008

しかし、このような現在のコンピュータによる処理技術は、ハイブリダイゼーション強度モデリングを計算し、それに基づいてユーザーが適切なプローブを選択するに過ぎないものであり、プローブの結合温度の精度を上げるようなものではない。

0009

すなわち、DNAチップ等用の多数の異なったプローブを設計する際、これらの全てのプローブは同じ二本鎖結合温度を保持する必要がある。二本鎖結合温度条件は、Tm値の温度によって与えられる。ここで、Tm値の温度とは、50パーセント二重結合が二本鎖に存在する時の温度であるが、これは、GC含有量などによって決定される。ところが、GC含有量は、塩基配列とその長さによって変化する。そのため、合成条件として決めた塩基長で固有の配列を持ち、適切な温度条件になる配列を決定する際、これら全ての必要条件を満たす配列を決定するのはかなり困難である。

0010

上記特許第3055942号に開示された技術では、候補オリゴ核酸配列と特定遺伝子とのハイブリダイゼーション強度を二本鎖結合温度により求め、その情報をユーザーに提示することで、最適温度条件になるプローブの選択を容易にするものである。しかし、この技術で用いる候補のオリゴ核酸配列は、二本鎖結合温度条件を考慮せずに決定された物であるから、上記のようにしても候補オリゴ核酸配列の二本鎖結合温度に関する分散度を自体は小さくすることが出来ない。このため、候補オリゴ核酸配列から多くのプローブを得ようとするとその分散度がかなり大きくなってしまう。発明者等の分析によれば、従来の方法で求めたオリゴ核酸塩基配列の二本鎖結合温度の誤差範囲は±20度にも達してしまう。また、この誤差範囲を小さくしようとすると十分な数のオリゴ核酸塩基配列が得られないという問題が生じてしまう。

0011

一方、オリゴ核酸配列を決定する必然性のある他の用途として、PCR法ポリメラーゼチェインリアクション法)等の遺伝子増幅手段を目的としたプローブの設計がある。PCR法において、固有の塩基配列部分を探してその部分を増幅することを目的として、その増幅部の両端側開始位置に相当する数十塩基長のプローブの塩基配列を設計しなければならない。キャプチャーの塩基配列設計の場合と同様に、この用途においても、該当部位以外での二本鎖結合をしないような固有の配列部分を設計しなければならない。また、二本鎖結合温度に関しても同じ温度条件である必要がある。

0012

上記の目的のため、設計したプローブは対象となる遺伝子や混在する核酸に対して希望の部分だけを増幅するような、固有の配列である必要がある。また、複数の配列対象を同時に増幅する場合もあり、この際、それらの所望の結合部分に関する適切な配列と二本鎖結合温度の条件をそれぞれが満足している必要がある。

0013

上記公報には、このPCR法においてのプローブ設計に関する技術も開示されているが、上述の理由で、適宜な二本鎖結合温度条件を満たすような解決策を提供していない。

0014

また、コンピュータによる処理では、一度に膨大な数の核酸塩基配列同士を相互に比較して解析対象の核酸塩基配列にのみ固有な配列部分を特定することが効率良く行なえる。しかし、比較対象の核酸塩基配列にオリゴプローブ設計対象の核酸塩基配列と同一の配列が含まれている場合には、固有部分の特定が不可能になりプローブを設計することができない。このような場合には、このような重複塩基配列を特定して除去した後で再度上記の比較を行なって設計をしなおさなければならず、時間と手間がかかるばかりかコンピュータに負荷がかかり全体の処理速度を低下させる原因となっていた。

発明が解決しようとする課題

0015

上述したように、従来の技術によれば、合成条件として決めた塩基長で固有の配列を持ち、適切な温度条件になる配列を決定する際、これら全ての必要条件を満たす配列を決定するのはかなり困難であるという問題があった。

0016

また、従来の技術によれば、比較対象の核酸塩基配列として解析対象核酸塩基配列と同一の配列が重複して登録されている場合には、候補オリゴ核酸塩基配列の設計ができない。このため、重複する登録を削除した上で相同性比較をやり直す必要があった。

0017

この発明は、このような事情に鑑みて成されたものであり、二本鎖結合温度、GC含有量、塩基配列長に関して高い精度を有するオリゴ核酸配列を一度に多数決定することができるシステム及び方法を提供することを目的とする。

0018

この発明のさらに詳しい目的は、オリゴ核酸配列を決定する際に、所望の設計許容範囲及び優先項目を指定して、その条件を満たすオリゴ核酸配列を決定し表示することができるシステム及び方法を提供することにある。

0019

また、この発明のさらに別の詳しい目的は、比較対象の核酸塩基配列として解析対象核酸塩基配列と同一の配列が重複して登録されている場合でも、相同性比較を最初からやり直さずにオリゴ核酸塩基配列の決定を行えるシステム及び方法を提供することにある。

課題を解決するための手段

0020

上記課題を解決するため、この発明の第1の主要な観点によれば、コンピュータを利用して、解析対象核酸塩基配列から最適なオリゴ核酸塩基配列の候補を設計するためのコンピュータソフトウエアプログラムであって、二本鎖結合温度、塩基配列長、GC含有量の各項目許容範囲の指定を受け付け且つ各項目の優先順位の情報をメモリに記憶させる第1の指令と、前記解析対象核酸塩基配列の中で部分配列を伸ばしながら、各長さで、前記第1の指令で受け付けた優先項目に基づいて各許容範囲に入るかを判断させ、入る場合には当該長さの部分配列を候補オリゴ核酸塩基配列として出力させる第2の指令と、前記第2の指令によって出力された候補オリゴ核酸配列について、前記優先順位に基づいて、各項目の値と共に表示させる第3の指令とを有することを特徴とするプログラムが提供される。

0021

このような構成によれば、入力された二本鎖結合温度、塩基配列長、GC含有量の許容範囲に基づき、始点及び長さを変えながらこの条件を満たすようなオリゴ核酸配列を求めていくことができる。このことにより、上記許容範囲を満たすオリゴ核酸塩基配列を多数決定・出力することができる。

0022

ここで、この発明の1の実施形態によれば、前記プログラムにおいて、前記第2の指令は、解析対象核酸塩基配列と他の複数の核酸塩基配列との相同比較に基づき、当該解析対象核酸塩基配列に固有の配列部分を含むように前記部分配列を伸ばしていくものであり、前記全ての相同比較結果はメモリに記憶されており、このプログラムはさらに前記相同比較結果のうち任意の比較結果を前記メモリ内で無効にして前記メモリ内の比較結果を更新する第4の指令を有するものであることが好ましい。

0023

また、このプログラムは、さらに、任意もしく全ての解析対象核酸塩基配列についての候補オリゴ核酸配列の出力が終了した場合に特定のユーザにそのことを通知させる第5の指令を有することが好ましい。

0024

この発明の第2の主要な観点によれば、コンピュータを利用して、登録された複数の核酸塩基配列同士の相同比較を実行させ、この比較結果に基づいて特定の解析対象核酸塩基配列に最適なオリゴ核酸配列の候補を設計するためのコンピュータソフトウエアプログラムであって、全ての核酸塩基配列同士の比較結果をメモリに記憶させる第1の指令と、前記比較結果のうち任意の比較結果を前記メモリ内で無効にして前記比較結果を更新する第2の指令とを有することを特徴とするコンピュータソフトウエアプログラムが提供される。

0025

このような構成によれば、例えば、解析対象核酸塩基配列と同一の配列の核酸塩基配列が参照用配列として比較対象に含まれている場合であっても、その比較結果を簡単に無効にすることができる。従って、相同性比較を最初からやり直さなくてもオリゴ核酸塩基配列の設計を続行できる。

0026

ここで、1の実施形態によれば、このプログラムは、前記更新された比較結果に基づいて特定の解析対象核酸塩基配列に最適なオリゴ核酸配列の候補を設計させる第3の指令をさらに有する。

0027

また、別の実施形態によれば、前記プログラムにおいて、第2の指令は、前記比較結果を前記メモリから取り出し、各比較対象の配列との相同部位を前記解析対象塩基配列と所定の形式で並べて画面上に表示させる指令と、画面上で無効にしたい塩基配列を選択することでこの塩基配列との比較結果を無効にする指令とを含む。

0028

また、更なる別の1の実施形態によれば、前記プログラムは、前記メモリ内の比較結果に基づいて前記複数の核酸塩基配列に解析対象核酸塩基配列と同一の核酸塩基配列が重複登録されていることを検出させる第4の指令をさらに有し、前記第2の指令は、前記第4の指令に基づいて検出された重複する核酸塩基配列間の比較結果をメモリ内で無効にすることで前記比較結果を更新するものである。

0029

また、前記プログラムは、さらに、二本鎖結合温度、塩基配列長、GC含有量の各項目の許容範囲の指定を受け付け且つ各項目のいずれを優先させるかの情報をメモリに記憶させる第5の指令と、前記比較結果に基づき、前記第5の指令で受け付けた許容範囲及び優先項目に基づいて解析対象核酸塩基配列に最適なオリゴ核酸配列の候補を設計させる第6の指令と、前記第6の指令によって設計された複数の候補オリゴ核酸配列を前記優先順序で表示させる第7の指令とを有する。

0030

この発明の第3の主要な観点によれば、コンピュータを利用して、解析対象核酸塩基配列から最適なオリゴ核酸塩基配列の候補を設計するための処理方法であって、二本鎖結合温度、塩基配列長、GC含有量の各項目の許容範囲の指定を受け付け且つ各項目の優先順位の情報をメモリに記憶させる第1の工程と、前記解析対象核酸塩基配列の中で部分配列を伸ばしながら、各長さで、前記第1の指令で受け付けた優先項目に基づいて各許容範囲に入るかを判断させ、入る場合には当該長さの部分配列を候補オリゴ核酸塩基配列として出力させる第2の工程と、前記第2の指令によって出力された候補オリゴ核酸配列について、前記優先順位に基づいて、各項目の値と共に表示させる第3の工程とを有することを特徴とする方法が提供される。

0031

このような構成によれば、前記第1の観点にかかるプログラムで実行される処理方法が提供される。

0032

この発明の第4の主要な観点によれば、コンピュータを利用して、登録された複数の核酸塩基配列同士の相同比較を実行させ、この比較結果に基づいて特定の解析対象核酸塩基配列に最適なオリゴ核酸配列の候補を設計するための処理方法であって、全ての核酸塩基配列同士の比較結果をメモリに記憶させる第1の工程と、前記比較結果のうち任意の比較結果を前記メモリ内で無効にして前記比較結果を更新する第2の工程とを有することを特徴とする方法が提供される。

0033

このような構成によれば、前記第2の観点にかかるプログラムで実行される処理方法が提供される。

0034

なお、この発明の他の特徴及び顕著な効果は、次の発明の実施の形態の項の記載を図面と共に参照することで当業者にとって明確に理解することができる。

発明を実施するための最良の形態

0035

以下、本発明の一実施例を図に示しながら説明する。図は発明を実施する形態の一例に過ぎないものである。また、説明中の用語は特に述べない限り、この発明の属する分野において当業者が通常用いるものを意味するものとする。

0036

図1は、この実施形態に係るシステム説明するための全体構成図である。

0037

このシステムは、CPU1、RAM2、キーボードマウス等の入力機器3、ディスプレイプリンタ等の出力機器4、モデム5が接続されてなるバス7に、データ記憶部8とプログラム記憶部9が接続されてなる。

0038

データ記憶部8には、この発明に関係する構成のみ挙げると、オリゴ核酸配列決定条件11と、解析対象核酸塩基配列ファイル12と、参照専用塩基配列ファイル15と、解析対象核酸塩基配列の類似性判別結果13と、オリゴ核酸配列候補14とが格納されるようになっている。

0039

オリゴ核酸配列決定条件11には、少なくとも、二本鎖結合温度16とオリゴ核酸の長さ条件17と、低グレードしきい値18と、GC含有量19が格納される。この実施形態では、二本鎖結合温度16は、所望の二本鎖結合温度Tmを基準として、例えば上限許容温度Tmu=Tm+3℃、下限許容温度Tml=Tm−3℃からなる範囲が設定される。また、長さ条件17及びGC含有量は、ミスハイブリダイゼーションを有効に防止する目的でそれぞれ例えば50〜100塩基(最低50塩基長、最長100塩基長)の範囲、40〜60%の範囲が設定される。

0040

また、低グレードしきい値18は、候補オリゴ核酸配列中に含まれることが許容される非固有部分の配列の数を、同じ候補オリゴ核酸配列中に含まれる固有部分の配列の数に対する比として表したものである。この実施形態では例えば50%に設定される。そして、非固有部分の配列を一部に含む候補オリゴ核酸配列は「低グレード」として出力され、固有部分のみからなる候補オリゴ核酸配列とは区別される。

0041

解析対象核酸塩基配列ファイル12は、ユーザが収集した興味のある複数の核酸塩基配列を含むデータである。前記参照専用塩基配列ファイル15は、cDNA/ESTデータベース等の外部データベースから任意に追加・設定された参照専用の塩基配列である。これらの配列ファイル12、15は、前記モデム5を介して接続した1又は2以上の特定の外部データベース19からダウンロードしてなるデータであっても良い。

0042

前記類似性判別結果13は、前記解析対象核酸塩基配列同士、解析対象核酸配列と参照専用塩基配列同士の類似性を判別することで、各解析対象塩基配列について固有の配列部分と非固有の配列部分とを識別したものである。そして、前記オリゴ核酸配列候補14は、前記類似性判別結果13と前記オリゴ核酸配列決定条件11とに基づいて算出された様々な塩基長のオリゴ核酸配列候補である。

0043

一方、プログラム記憶部9には、同じくこの発明に関係する構成のみ挙げると、大きく分けて、オリゴ核酸塩基配列決定条件入力部20と、固有部分配列フィルタ部21と、二本鎖結合温度条件フィルタ部22と、オリゴ核酸塩基配列決定結果表示部23と、類似性判別結果表示部24と、処理終了/エラー通知部25とが格納されている。

0044

これらの構成要素20〜25は実際には、ハードディスク等の記録媒体に確保された一定の領域若しくはその領域に格納されたコンピュータソフトウエアの1又は2以上のプログラム命令からなり、前記CPU1によってRAM2上に呼び出されて適宜実行されることでこの発明の機能を奏するようになっている。以下、上記構成要素の詳しい構成及び機能を、このシステムにより実行される実際のオリゴ核酸塩基配列決定手順と共に説明する。

0045

前記オリゴ核酸塩基配列決定条件入力部20は、例えば、前記ディスプレイ(出力機器4)上にユーザ用の条件入力画面を表示する。この画面は、例えば図2に示すようなもので、解析対象核酸塩基配列ファイル名の入力ボックス26、二本鎖結合温度の上限値・下限値の各入力ボックス27a、27b、配列長さ条件の最小値及び最大値の各入力ボックス28a、28b、GC含有量の最小値及び最大値の各入力ボックス29a、29b、優先項目入力用プルダウンボックス30、外部データベース名の指定のための入力ボックス32を含む。ユーザが各入力ボックス16〜32に値を入力若しくは選択した後OKボタン31を押すことで、核酸塩基配列ファイル12,15(外部データベース19)が指定されると共に、前記オリゴ核酸配列決定条件11が前記データ記憶部8に格納される。

0046

また、前記固有部分配列フィルタ部21は、解析対象核酸塩基配列ファイル12及び参照専用塩基配列ファイル15から各核酸塩基配列情報を読み込み、各塩基配列間の類似性を評価する機能を有する。類似性は塩基に対応する文字列同士を単純比較することによって行う。ここで、適宜な配列を選択するのに塩基配列の正確な1対1の相違比較が要求されるため、遺伝子配列検索で頻繁に用いられる挿入欠失を加味したホモロジー検索は適していない。あくまでも挿入欠失を想定しないで配列比較を行うことが好ましい。そのためにギャップに対応していない検索手段が適している。

0047

BLAST法を使用する場合には、ギャップ対応前のものを用いデータベースサイズに依存して変化する期待値E-valueをかなりゆるく設定(高く設定)し、小さな部分一致でも取出せるようにする。ここで、E-valueとは、特定のサイズのデータベースを検索したときに、実験対象の遺伝子の断片が見つかる期待値である。さらに、それらで見つかった断片のスコアを参照し、しきい値で与えたスコア以上のものを類似配列とする。ここで、スコアとは比較対象の一致度(一致する配列の長さ若しくは類似度)に対応する量である。

0048

図3は、解析対象核酸塩基配列のうちの1本を取り出して示したものである。この図では、説明の便宜のため、1本の解析対象核酸塩基配列を折り返して複数行に亘って表示している。また、核酸の塩基情報A、C、G、T(U)はすべて四角形で示されている。

0049

上記固有配列フィルタ部21は、上述したBLAST法によるホモロジー検索により、他の解析対象核酸塩基配列若しくは参照専用塩基配列に部分一致したものを非固有部分配列(または、共通部分配列)として登録していく。この図3では黒で塗りつぶして表示した部分(図に33で示す)が非固有部分配列を示している。したがって、白抜きのままの部分(図に34で示す)は固有部分配列となる。

0050

なお、BLAST法を用いない場合でも、適切な配列幅を決めて、それを窓幅としながら、ずらして比較する文字列一致検索の手法も利用できる。

0051

このような方法で、所望のしきい値以上で相互に一致する部分を検索し、ヒットした結果を非固有部分配列(33)として前記類似性判別結果13に登録していく。このとき、一致文字列長を基本とするスコアと、一致した位置情報も登録する。また必要に応じて、繰返しの配列部分を非固有部分配列として除くことが好ましい。

0052

そして、この固有部分配列フィルタ部21は、すべての解析対象核酸配列を比較した後で、その比較によって得られた結果(一致性/類似性の高い部分)を解析対象核酸塩基配列毎に集計する。このことで、その類似性の高い非固有配列部分33を消去した残りの配列部分が、フィルタリングされた固有部分配列(または、相違部分配列)として出力されることになる(図に34で示す部分)。図3は、このようにしてフィルタリングされた結果である。このような類似判別後の塩基配列が、前記類似性判別結果13としてデータ記憶部8内に格納される。

0053

二本鎖結合温度条件フィルタ部22は、前記類似性判別結果13として得られた核酸塩基配列から、指定された二本鎖結合温度条件に入る長さのオリゴ核酸配列を決定する機能を奏する。

0054

この二本鎖結合温度条件フィルタ部22は、図1に示すように、始点設定処理部35と、長さ設定部36と、二本鎖結合温度算出部37と、候補オリゴ核酸配列決定部38とからなる。

0055

二本鎖結合温度算出部37は、前記始点設定部35で設定された始点から始まり前記長さ設定部36で設定された長さを有するオリゴ塩基配列の二本鎖結合温度の算出を実行する。二本鎖結合温度の算定方法として、例えば、36塩基以下のものについては、Nearest-Neighbor法(SantaLucia, J. Jr. Proc. Natl. Acad. Sci. USA, 95, 1460-1465, 1998)を用い、37塩基以上のものについては、J.Sambrook, E. F. Fritsch, T, Molecular Cloning, p11.46: a laboratory Manual, Cold Spring Harbor Laboratory Press, 1989に記載された方法を用いることが現時点では好ましい。しかし、他の方法であっても当然構わない。

0056

前記候補オリゴ核酸配列決定部38は、前記二本鎖結合温度算出部37が二本鎖結合温度を算出する度に、この算出結果を受取る。そして、前記オリゴ核酸配列決定条件11として入力した二本鎖結合温度範囲、GC含有量及び長さ範囲に入るオリゴ核酸配列を候補として出力する。このような処理を、前記始点ずらし配列長さを伸ばしながら行なうことで、所望の二本鎖結合温度条件に入る様々な長さのオリゴ核酸塩基配列の候補が得られることになる。

0057

以下、図4図6を用い、解析対象核酸塩基配列のひとつと、それから温度を推定しながらオリゴ核酸塩基配列の候補を取出す手順を詳細に説明する。

0058

図4は、この手順を示す模式図である。

0059

図中41は、図3と同様の類似性判別結果である。この類似性判別結果の配列中、先頭の固有配列部分34の中の先頭部位(n=1)から逐次配列を伸ばしながらGC含有量及び二本鎖結合温度を計算する。そして、あらかじめ指定されている範囲の長さ、GC含有量、温度に入ったら、42に示すようにオリゴ核酸塩基配列の候補として保存する。そして、上限温度Tmuを超える点まで伸張しながら候補として残していく。

0060

この例では図示を簡略化するため、前記条件で設定した長さ17よりも短いものを候補として表示しているが、実際には、上記設定した長さを満たす塩基配列が候補として残される。そして上限Tmuに達したら、先頭位置をひとつずらし、新たな先頭部位から逐次配列を伸ばしながら二本鎖結合温度を同様に計算する。このことにより、図に43で示すように別の候補群が得られる。

0061

なお、固有部分配列の部分34が短く、この固有部分配列内では前記二本鎖結合温度を満たす長さの候補が十分な数得られない場合には、スコアの小さい非固有配列部分の塩基を徐々に加えて二本鎖結合温度条件を満たす長さまで伸長し、得られたオリゴ核酸塩基配列の低グレードの候補として表示する。具体的には、前記低グレードしきい値18を参照し、前記被固有領域の部分がこのしきい値18を超えるまで配列を伸ばし、超えたならば、先頭位置をずらすようにする。

0062

なお、候補として出力するオリゴ核酸塩基配列の長さとしては、50塩基長以上で、100塩基以内が望ましい。この実施形態では、特定の長さ、60以上で70以下などの値をしきい値として与えることによって、対象とする解析対象核酸塩基配列以外のサンプルは確率的にプローブにハイブリダイズを起こしずらくなり、ノイズを減らすことができる。

0063

次に、図5フローチャートを参照し、このシステムによる実際の処理手順を説明する。

0064

以下の説明及びフローチャートにおいて、各定数及び変数は以下のように定義されているものとする。

0065

n…各塩基核酸塩基配列の先頭からの配列番号(図4に示す1,2,3,4…)
nm…各塩基核酸塩基配列の最終塩基番号
PR(n)…固有配列部分の場合=1;非固有配列部分の場合=0
ip…二本鎖結合温度を求めるオリゴ核酸配列の先頭位置
ep…二本鎖結合温度を求めるオリゴ核酸配列の最終位置
Tm(ip,ep)…先頭位置ipと終了位置epとの間の配列の二本鎖結合温度
Tmu…許容二本鎖結合温度の上限値
Tml…許容二本鎖結合温度の下限値
Ls…配列長さの下限値
Ll…配列長さの上限値
Ln…低グレードしきい値(固有配列部分に対する許容非固有領域長さの割合)
GC(ip,ep)…先頭位置ipと終了位置epとの間のGC含有量
GCu…許容GC含有量の上限値
GCl…許容GC含有量の下限値

0066

まず、工程S1で、n=1からn=nmまでスキャンしながら順次PR値を設定していく。このことで、解析対象配列の各塩基について、それが固有部分配列領域に存在するならばPR(n)=1(図2白抜き部分34)、非固有部分配列領域に存在するならばPR(n)=0(図2の黒塗りの部分33)が設定されていく。

0067

次に、工程S2で、先頭位置番号ipと終了位置番号epの初期値として、ip=1、ep=1を設定する。次の工程S3では、終了位置番号が対象核酸塩基配列の最終塩基番号nmに達しているかが判断され達していない場合には、次の工程S4でipとep間の部分配列の長さが前記配列長さの上限値Llを超えているかが判断される。

0068

超えている場合には先頭位置をずらす工程S12(後で説明する)に移行し、超えていない場合には、工程S5で、前記低グレードしきい値Lnに基づき、ipとep間の配列の中の固有配列部分と非固有部分配列の比がLnよりも大きいかがチェックされる。この例では、Lnは50%である。したがって、ipとep間の配列において、PR(n)=1を有する塩基の数の、PR(n)=0を有する塩基の数に対する比が50%よりも大きいかをチェックする。

0069

もし大きければ、先頭位置をずらす工程S14に進み、小さければ二本鎖結合温度を求める工程S6に進む。工程S6では、ipとep間の配列の二本鎖結合温度Tm(ip,ep)値を計算して、工程S7に進む。工程S7においては、Tm(ip、ep)値が二本鎖結合温度の上限値Tmuよりも大きいかを判断する。もし大きければ、この配列を候補として残すことをせず前記先頭をずらすための工程S12に進み、小さければ次の工程S8に進む。一般に、配列がより長ければTm値はより高くなるため、Tm(ip、ep)値がTmuよりも高いときには、これ以上部分塩基配列を伸ばしても意味のないためである。

0070

次に、工程S8において、Tm(ip、ep)値がTmlよりも高いかをチェックする。高ければ、この配列の二本鎖結合温度は上限値Tmuと下限値Tmlの間に入っていると判断され、次の工程S9に進む。

0071

工程S9では、ipとep間の配列のGC含有量=GC(ip,ep)を計算する。そして、工程S10で、GC(ip,ep)が許容GC含有量の下限値GClより高く、上限値GCuよりも低いかをチェックする。その範囲内にあれば、工程S11に進む。

0072

この工程S11では、この配列の長さが下限値Lsを上回っているかが判断され、上回っている場合には、この配列(ip、ep)は候補オリゴ核酸配列と決定され前記データ記憶部8に格納される。また、この候補オリゴ核酸配列の一部に非固有配列部分が含まれる場合には(工程S5の比が1以上の場合)、当該配列には低グレードのフラグが立てられた状態で保存される(工程S12)。

0073

工程S8で二本鎖結合温度が下限値よりも低いと判断され、若しくは工程S11で配列長さが短いと判断された場合には、工程S13に進んで、前記最終位置番号を一つ増やす(ep=ep+1)。そして、前記工程S3〜S12を繰り返す。ここで、前記二本鎖結合温度Tm(ip、ep)の計算は、一般に前回計算結果Tm(ip、ep−1)を利用することで積み上げ的にかつ高速に行える。

0074

このような工程を繰り返すことで、上記始点を基点とする様々な長さの塩基配列が候補として保存されていくことになる。

0075

一方、前記工程S4、S5及びS7で条件外と判断された場合には、工程S14で先頭位置をずらす処理を行う。このため、S14では、(1)先頭位置を一つシフトし、ここでは先頭位置番号ipを一つ増やす(ip=ip+1)、(2)終了位置番号epをこの先頭位置番号ipに合わせる(ep=ip)。このことで、先頭位置がずらされ長さもリセットされる。そして、上記工程S3〜S12を繰り返すことで、先頭位置をずらしたオリゴ核酸配列が候補として逐次出力されていくことになる。

0076

なお、先頭位置が非固有領域33に入った場合には、前記工程S5でLnが100%と判断されるから、この非固有領域を抜けるまで上記二本鎖結合温度は計算されないことになる。このことで、非固有領域はスキップされることになる。つまり、非固有部分配列領域を飛ばしながら、二本鎖結合温度がTmlとTmuの間にあるような部分塩基配列だけを記憶保存していくことができる。

0077

そして、先頭位置ipがこの解析対象核酸塩基配列の最終位置nmにまで移動したならば、前記工程S3でこのことが検知され、全ての工程が終了する。

0078

このような処理によれば、二本鎖結合温度を基準とし、オリゴ核酸塩基配列の長さを可変にして候補を決定していくことができるから、二本鎖結合温度をより狭い範囲に入るように設計する場合でも多数のオリゴ核酸配列を得ることができる。

0079

このようにして得られたオリゴ核酸塩基配列の候補は、前記データ記憶部8から、オリゴ核酸塩基配列決定結果表示部23によって取り出され、ディスプレイ(出力機器4)上に表示される。

0080

この設計結果は、基本的に、各解析対象核酸塩基配列毎に表示される。また、図1に示す優先順序処理決定部が図2で選択した優先項目に基づいて最も適当なオリゴ核酸塩基配列の候補を表示するようになっている。図8は、この設計結果の表示例である。この表示例は一覧表形式になっており、各行に解析対象核酸塩基配列81と、それに対する最適のオリゴ核酸塩基配列82が対応して表示されている。

0081

なお、この図に示す設計結果の3行目の塩基配列S155553.L6には、オリゴ核酸塩基配列が全く示されておらず、適切な設計が実行できなかったことが分かる。この実施形態では、S155553.L6の部分をマウスでクリックすることで、前記類似性判別結果表示部24が起動され、この解析対象塩基配列に対する類似判別結果13を前記データ格納部8から取り出して図9に示すようにマルチプルアライメント表示する。

0082

この実施形態では、解析対象塩基配列と重複すると判断された配列が図に90で示すように水色の帯で示されるようになっている。この実施例のシステムでは、解析対象塩基核酸配列と90パーセント以上一致する塩基配列を、重複する配列であると判断して上述したように水色で表示する。また、マウスのポインタを重複する核酸塩基配列上に合わせダブルクリックすると、図10に示す画面が開かれ、この画面の情報からもこの核酸塩基配列が重複登録されたものであることを確認できる。

0083

このように重複する核酸塩基配列が登録されている場合、解析対象塩基核酸配列について固有の部分が特定できないから、適切なオリゴ核酸塩基配列の設計が行えないことになる。したがって、この実施形態のシステムでは、このように重複すると判断した塩基配列との間の類似判別結果を自動的に無効にしてオリゴ核酸塩基配列を設計する。したがって、この実施形態においてオリゴ核酸塩基配列が適切に設計できない場合とは、このシステムによって重複すると判断されなかった配列の中に実際にはかなりの部分(90パーセント以下)で重複する塩基配列があるということになる。

0084

上記マルチプルアライメント表示では、一致率が90パーセント以下の配列部分は図に91で示すように灰色の帯で表される。オペレータは、このマルチアライメント表示を見ながら灰色の帯のうち、かなり一致率が高いものを目視で選別手動によって無効にする。具体的には、マウスのポインタを重複する核酸塩基配列上に合わせ右クリックすると、前記類似性判別結果表示部24に設けられていた類似性判別結果無効化処理部92がこの図に93で示すようなポップアップ窓を開き、ここで、Ignoreボタン94を選択することでこの塩基配列に関する類似性判別結果を無効にすることができる。無効にされた結果は図に95で示すように白抜き枠で表示されることになる。なお、このように一旦判別結果を無効にしたとしても、この白抜き枠で示された類似判別結果をクリックすることで、図11に示すように、有効に戻すためのポップアップ窓111が開かれて元に戻すことが可能になる。

0085

ついで、図8の設計結果画面に戻ろうとすると、前記無効化処理部92が、当該解析対象塩基配列についての演算処理指令を前記二本鎖結合温度条件フィルタ部22に発する。このことで、このフィルタ部22は、上記で無効化処理された類似判別結果を用いないでオリゴ核酸配列の設計をやり直す。このことで、図12に示されたように、当該3行目の解析対象塩基核酸配列に対しても最適のオリゴ核酸配列が演算されて表示されることになる。なお、この最適のオリゴ核酸配列は、前記マルチプルアライメント画面では、図11に112で示すように青色の帯で示される。

0086

なお、設計結果の表示方法はこの方法に限るものではなく、必要であれば、たとえば、オリゴ核酸塩基配列の長さ別にソート分類)したり、2次構造のとりやすさを評価し、2次構造のとりにくいものを優先的に表示することが望ましい。

0087

また、この実施形態では、設計が終了すると、図1に示す処理終了/エラー通知部25が、終了したことを示すE−mailを生成してユーザに送信するようになっている。このことで、ユーザは、コンピュータの前で処理が終了するまで待つ必要がない。オリゴ核酸塩基配列の設計には一般にかなりの時間を要するが、その間、安心して他の仕事を処理することが可能になる。また、この実施形態では、何らかの原因で処理にエラーが生じ、処理が中止された場合等にも同様の通知をするように構成されている。

0088

図6は、本実施例で決定したオリゴ核酸塩基配列を実装したオリゴ核酸アレイ71である。このオリゴ核酸アレイ71は、ポリLリジン72をコートしてなるガラス基板73上に、スポット装置を使用して上記オリゴ核酸塩基配列の候補から絞られた配列を所定の区画74にそれぞれ実装してなるものである。このようなオリゴ核酸アレイ71によれば、それぞれの区画74ごとにオリゴ核酸塩基配列の長さが異なっているが、それぞれのスポットが適正な二本鎖結合温度範囲に入っているため、ミスハイブリダイゼーションのない非常に使いやすく安定した結果を得ることができる。

0089

なお、この実施形態ではガラス基板73上にオリゴ核酸塩基配列を実装する例を示したが、基板はガラス以外の樹脂などを利用することも可能である。また、メンブレンにスポットしたアレイや、各オリゴ核酸塩基配列が個別のエリアに存在するように区画化された領域に埋め込まれた2次元状のアレイであれば、同様の効果を得ることが可能である。

0090

また、この発明は上述した一実施形態に限定されるものではなく、発明の要旨を変更しない範囲で種々変形可能である。

0091

例えば、上記一実施形態では、二本鎖結合温度を求める前に、ステップS5を実行することで非固有領域をスキップしていたがこの方法に限定されるものではない。すなわち、この方法では、候補オリゴ核酸塩基配列の先頭は常に固有配列部分になるが、非固有部分から開始されるものであっても良い。このため、例えば図7に示すように前記ステップS5を前記一実施形態のステップS9の後に実行するようにしても良い。

0092

このような構成によれば、先頭の塩基が固有配列部分であるか非固有配列部分であるかを問わず、配列全体として、固有配列部分と非固有部分配列の比がLn(例えば50%)よりも小さければ候補として保存されることになる。なお、このようにして一部に非固有配列部分を含む候補は低グレードの候補として出力されることになる(ステップS10)。このようにすることで、条件を満たす候補の数をできるだけ増やすことが可能になる。

0093

また、上記一実施形態では、前記システムは、類似性判別の結果、解析対象核酸塩基配列との間の一致率の高い比較対象の核酸塩基配列を自動的に重複登録されたものとして自動的に無効にしていたがこれに限定されるものではない。システムが自動的に無効にするのではなく、マルチプルアライメント画面を通して全て手動で無効にするようになっていても良い。また、類似判別結果後、前記一致率を任意に変動させることで、無効にする核酸塩基配列の範囲を動かし、オリゴ核酸塩基配列の設計を成功させるように構成されていても良い。

発明の効果

0094

以上、説明したように本発明によれば、高い精度を有するオリゴ核酸配列を一度に多数決定することができるシステム及び方法を得ることができる。

図面の簡単な説明

0095

図1この発明の一実施形態を示すシステム構成図。
図2解析対象核酸塩基配列を示す模式図
図3解析対象塩基配列から候補オリゴ核酸配列を決定する手順を説明するための模式図。
図4オリゴ核酸配列決定条件を入力するための入力画面を示す図。
図5オリゴ核酸配列決定手順を説明するためのフローチャート。
図6この実施形態により得られたオリゴ核酸アレイを示す正面図。
図7他の実施形態に係るオリゴ核酸配列決定手順を説明するためのフローチャート。
図8オリゴ核酸塩基配列の設計結果画面を示す図。
図9類似判別結果のマルチプルアライメント画面を示す図。
図10核酸塩基配列の情報画面を示す図。
図11類似判別結果のマルチプルアライメント画面を示す図。
図12再設計結果の画面を示す図。

--

0096

1…CPU
2…RAM
3…入力機器
4…出力機器
5…モデム
7…バス
8…データ記憶部
9…プログラム記憶部
11…オリゴ核酸配列決定条件
12…解析対象核酸塩基配列ファイル
13…類似性判別結果
14…オリゴ核酸配列候補
19…外部データベース
20…オリゴ核酸塩基配列決定条件入力部
21…固有部分配列フィルタ部
22…二本鎖結合温度条件フィルタ部
23…オリゴ核酸塩基配列決定結果表示部
26…入力ボックス
33…始点設定部
34…長さ設定部
35…二本鎖結合温度算出部
36…候補オリゴ核酸配列決定部
71…オリゴ核酸アレイ
73…ガラス基板
74…区画

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社ソケッツの「 検索装置および方法」が 公開されました。( 2019/09/19)

    【課題】同一の感性ワードで加重的に絞り込み検索を行えるようにする。【解決手段】同一の感性ワードで加重的に絞り込み検索を行う場合、類似・関連ワード抽出部319が、感性ワードに類似・関連する別のワードを検... 詳細

  • ヤフー株式会社の「 情報処理装置、情報処理方法、及び情報処理プログラム」が 公開されました。( 2019/09/12)

    【課題】ユーザの移動の妨害に応じた適切な対応を可能にする。【解決手段】本願に係る情報処理装置は、取得部と、決定部とを有する。取得部は、ユーザの位置情報と、ユーザが位置するエリアにおいて発生する事象のう... 詳細

  • ヤフー株式会社の「 情報処理装置、情報処理方法、及び情報処理プログラム」が 公開されました。( 2019/09/12)

    【課題】類似のコンテンツを適切に抽出する。【解決手段】本願に係る情報処理装置は、取得部と、検索部とを有する。取得部は、複数のコンテンツの各々に対応する複数のノードが、複数のコンテンツの類似性に応じて連... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ