図面 (/)

技術 遺伝子情報分析装置、遺伝子情報分析方法、遺伝子情報分析プログラムおよび記録媒体

出願人 株式会社理研ジェネシス
発明者 藤井卓河原三紀郎津矢田明泰赤堀正和杉山学
出願日 2016年6月8日 (5年0ヶ月経過) 出願番号 2016-114797
公開日 2017年12月14日 (3年5ヶ月経過) 公開番号 2017-220066
状態 特許登録済
技術分野 特定用途計算機
主要キーワード 原点決定 角度関数 統計図 プロット群 微小区画 Y座標 デジタル測定 プロット数
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2017年12月14日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (14)

課題

遺伝子情報分析において、分析結果を一元的かつ網羅的に可視化することができる遺伝子情報分析装置、遺伝子情報分析方法、遺伝子情報分析プログラムおよび記録媒体を提供する。

解決手段

遺伝子情報分析装置は、複数のサンプルデータを取得し、直交座標平面に前記複数のサンプル点プロットし、直交座標平面から極座標平面に座標変換し、極座標の角度軸に沿ったサンプル点の頻度を示すヒストグラム情報を生成する。

概要

背景

近年、第3世代のPCRを利用した手法として、DNAを限界希釈して、デジタル測定する手法が開発されている。この手法は、デジタルPCR(dPCRとも記載)と呼ばれ、サンプルを多数の溶液分画した後、各画分において個別にPCR反応を行い、PCR反応物が確認された画分の数から、サンプル中のターゲット遺伝子DNA分子)の分子数計測する方法である(非特許文献1〜4)。

例えば、ドロップレットデジタルPCR(Droplet Digital PCR、ddPCR)の場合、まず、例えば、約20μLのPCR Mixから約20,000個のドロップレット(1ドロップレット=約1nL)を調製することによって、サンプルDNAを各Dropletにランダム分配する。続いて、各ドロップレットについて、ドロップレットリーダーにより終点蛍光発光値を読み取る。サンプル内に存在するターゲット遺伝子の増幅は、当該蛍光発光値の2次元(2D)プロット分布域)データから評価することができ、当該データから、サンプルにおけるターゲット遺伝子の存在量を推定できる。

デジタルPCR解析によって得られるデータ数は、通常、約15,000〜16,000もの多数の蛍光発光値からなる。また、例えば、あるターゲット遺伝子の野生型および変異型それぞれに対するプローブを互いに異なる種類の蛍光物質によって標識し、これらの蛍光物質の蛍光発光値をそれぞれx、yとして、2次元直交座標(x,y)の2Dプロットを作成する。当該プロットから、ターゲット遺伝子の増幅の状況を読み取ることができる(非特許文献5)。ターゲット遺伝子の野生型および変異型のプロットを、2次元直交座標(x,y)のX軸方向(野生型の蛍光発光値)とY軸方向(変異型の蛍光発光値)とに分けて表示し、各領域に分布するプロットの個数を計測することによって、遺伝子変異の有無(定性)またはその変異の割合(定量)を極少量のサンプルから感度良く確認することができる。

概要

遺伝子情報分析において、分析結果を一元的かつ網羅的に可視化することができる遺伝子情報分析装置、遺伝子情報分析方法、遺伝子情報分析プログラムおよび記録媒体を提供する。遺伝子情報分析装置は、複数のサンプルデータを取得し、直交座標平面に前記複数のサンプル点をプロットし、直交座標平面から極座標平面に座標変換し、極座標の角度軸に沿ったサンプル点の頻度を示すヒストグラム情報を生成する。

目的

本発明は、前記の問題点に鑑みてなされたものであり、遺伝子情報分析において、分析結果を一元的かつ網羅的に可視化することができる遺伝子情報分析装置、遺伝子情報分析方法、遺伝子情報分析プログラムおよび記録媒体を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

遺伝子情報に関する第1の特性値と第2の特性値とを有する複数のサンプルデータを取得するサンプルデータ取得部と、前記第1の特性値を表すx座標軸および前記第2の特性値を表すy座標軸を有する直交座標平面上にプロットされた、前記複数のサンプルデータの各々に対応する複数のサンプル点を示すプロットデータを生成するプロットデータ生成部と、前記プロットデータに対して、前記直交座標平面から、極座標平面に座標を変換することによって、前記複数のサンプル点について前記第1の特性値および前記第2の特性値から極座標を算出する座標変換部と、前記座標変換部が算出した前記極座標の角度軸に沿った前記サンプル点の頻度を示すヒストグラム情報を生成するヒストグラム生成部と、を備えることを特徴とする遺伝子情報分析装置

請求項2

前記プロットデータを参照して、前記複数のサンプル点を、各サンプル点同士の近接度に応じて複数のクラスター分類するクラスタリング部をさらに備え、前記座標変換部は、前記複数のクラスターに囲まれた位置を前記極座標平面の原点として前記変換を行うことを特徴とする請求項1に記載の遺伝子情報分析装置。

請求項3

前記座標変換部は、前記複数のクラスターの各々の中心点の重心を、前記極座標平面の原点として前記変換を行うことを特徴とする請求項2に記載の遺伝子情報分析装置。

請求項4

前記ヒストグラム情報を参照して、前記ヒストグラム情報が示す少なくとも一つのピークについて、前記極座標上の中央値および信頼区間を算出する中央値および信頼区間算出部をさらに備えることを特徴とする請求項1〜3の何れか一項に記載の遺伝子情報分析装置。

請求項5

前記第1の特性値および前記第2の特性値は、遺伝子の変異に関する特性値であり、前記少なくとも1つのピークの各々について、前記中央値および信頼区間算出部が算出した前記信頼区間内に存在する前記サンプル点を計数し、計数結果と所定の閾値とを比較することにより、前記遺伝子の変異の有無を判定する変異判定部をさらに備えることを特徴とする請求項4に記載の遺伝子情報分析装置。

請求項6

前記第1の特性値および前記第2の特性値は、互いに異なるプローブを用いて検出したデジタルPCR産物検出値を示すことを特徴とする請求項1〜5の何れか一項に記載の遺伝子情報分析装置。

請求項7

遺伝子情報を分析するために遺伝子情報分析装置が実施する遺伝子情報分析方法であって、遺伝子情報に関する第1の特性値と第2の特性値とを有する複数のサンプルデータを取得するサンプルデータ取得工程と、前記第1の特性値を表すx座標軸および前記第2の特性値を表すy座標軸を有する直交座標平面上にプロットされた、前記複数のサンプルデータの各々に対応する複数のサンプル点を示すプロットデータを生成するプロットデータ生成工程と、前記プロットデータに対して、前記直交座標平面から、極座標平面に座標を変換することによって、前記複数のサンプル点について前記第1の特性値および前記第2の特性値から極座標を算出する座標変換工程と、前記座標変換工程が算出した前記極座標の角度軸に沿ったサンプル点の頻度を示すヒストグラム情報を生成するヒストグラム生成工程と、を包含することを特徴とする遺伝子情報分析方法。

請求項8

請求項1に記載の遺伝子情報分析装置としてコンピュータを機能させるための遺伝子情報分析プログラムであって、上記サンプルデータ取得部、上記プロットデータ生成部、上記座標変換部および上記ヒストグラム生成部としてコンピュータを機能させるための遺伝子情報分析プログラム。

請求項9

請求項8に記載の遺伝子情報分析プログラムを記録したコンピュータ読み取り可能な記録媒体

技術分野

0001

本発明は、対象遺伝子情報を分析するために実施される遺伝子情報分析装置、遺伝子情報分析方法、遺伝子情報分析プログラムおよび記録媒体に関する。

背景技術

0002

近年、第3世代のPCRを利用した手法として、DNAを限界希釈して、デジタル測定する手法が開発されている。この手法は、デジタルPCR(dPCRとも記載)と呼ばれ、サンプルを多数の溶液分画した後、各画分において個別にPCR反応を行い、PCR反応物が確認された画分の数から、サンプル中のターゲット遺伝子DNA分子)の分子数計測する方法である(非特許文献1〜4)。

0003

例えば、ドロップレットデジタルPCR(Droplet Digital PCR、ddPCR)の場合、まず、例えば、約20μLのPCR Mixから約20,000個のドロップレット(1ドロップレット=約1nL)を調製することによって、サンプルDNAを各Dropletにランダム分配する。続いて、各ドロップレットについて、ドロップレットリーダーにより終点蛍光発光値を読み取る。サンプル内に存在するターゲット遺伝子の増幅は、当該蛍光発光値の2次元(2D)プロット分布域)データから評価することができ、当該データから、サンプルにおけるターゲット遺伝子の存在量を推定できる。

0004

デジタルPCR解析によって得られるデータ数は、通常、約15,000〜16,000もの多数の蛍光発光値からなる。また、例えば、あるターゲット遺伝子の野生型および変異型それぞれに対するプローブを互いに異なる種類の蛍光物質によって標識し、これらの蛍光物質の蛍光発光値をそれぞれx、yとして、2次元直交座標(x,y)の2Dプロットを作成する。当該プロットから、ターゲット遺伝子の増幅の状況を読み取ることができる(非特許文献5)。ターゲット遺伝子の野生型および変異型のプロットを、2次元直交座標(x,y)のX軸方向(野生型の蛍光発光値)とY軸方向(変異型の蛍光発光値)とに分けて表示し、各領域に分布するプロットの個数を計測することによって、遺伝子変異の有無(定性)またはその変異の割合(定量)を極少量のサンプルから感度良く確認することができる。

先行技術

0005

X. Shi et al., Electrophoresis,31, 528 (2010).
E. A. Ottesen et al., Science, 314, 1464 (2006).
B. Vogelstein et al., Proc. Natl. Acad. Sci. USA, 96,9236 (1999)
S. Dube et al.,PLOS One, 3, e2876(2008)
Hindson et. al., Anal. Chem. 2011, 83, 8604-8610 (2011)

発明が解決しようとする課題

0006

しかしながら、2Dプロットから変異型の発生頻度視覚的に把握するのは容易ではない。また、もし仮に2Dプロットを、X軸またはY軸の何れか一方の軸に沿ってヒストグラム化したとしても、変異型の発生頻度を視覚的に把握するのは容易ではない。なぜなら、野生型および変異型の各領域をX軸側から見た場合は、ネガティブコントロール域のプロットと変異型域のプロットとが重なり、変異型域の正確なプロットを確認することは困難である。同様にY軸側から見た場合のヒストグラムは、ネガティブコントロール域のプロットと野生型域のプロットとが重なってしまうため、正確な野生型域のプロットが見えなくなってしまう。さらに、ddPCRでは、野生型および変異型の両方が分画されるダブルポジティブ(Double Positive)と呼ばれるサンプルも存在する場合、野生型および変異型の領域のプロットとダブルポジティブ領域のプロットとが重なってしまう。したがって、X軸側またはY軸側からヒストグラム化することによる変異発生頻度可視化は困難である。

0007

本発明は、前記の問題点に鑑みてなされたものであり、遺伝子情報分析において、分析結果を一元的かつ網羅的に可視化することができる遺伝子情報分析装置、遺伝子情報分析方法、遺伝子情報分析プログラムおよび記録媒体を提供することにある。

課題を解決するための手段

0008

上記の課題を解決するために、本発明の一態様に係る遺伝子情報分析装置は、遺伝子情報に関する第1の特性値と第2の特性値とを有する複数のサンプルデータを取得するサンプルデータ取得部と、前記第1の特性値を表すx座標軸および前記第2の特性値を表すy座標軸を有する直交座標平面上にプロットされた、前記複数のサンプルデータの各々に対応する複数のサンプル点を示すプロットデータを生成するプロットデータ生成部と、前記プロットデータに対して、前記直交座標平面から、極座標平面に座標を変換することによって、前記複数のサンプル点について前記第1の特性値および前記第2の特性値から極座標を算出する座標変換部と、前記座標変換部が算出した前記極座標の角度軸に沿った前記サンプル点の頻度を示すヒストグラム情報を生成するヒストグラム生成部と、を備える。

0009

上記構成によれば、第1の特性値と第2の特性値とを有する複数のサンプルデータに対応するサンプル点を、第1の特性値を表すx座標軸および第2の特性値を表すy座標軸を有する直交座標平面上にプロットした後に、極座標変換することによって、極座標の角度軸に沿ったサンプル点の頻度を示すヒストグラム情報を生成することができる。このようなヒストグラムによれば、サンプル点の分布を好適に表すことができる。これにより、遺伝子情報分析において、分析結果を、一元的かつ網羅的に可視化することができる。

0010

本発明の一態様に係る遺伝子情報分析装置では、前記プロットデータを参照して、前記複数のサンプル点を、各サンプル点同士の近接度に応じて複数のクラスター分類するクラスタリング部をさらに備え、前記座標変換部は、前記複数のクラスターに囲まれた位置を前記極座標平面の原点として前記変換を行ってもよい。

0011

上記構成によれば、極座標の角度軸に沿ったサンプル点の頻度を示すヒストグラム情報において、複数のクラスターが重なって示されることを好適に抑制することができる。これにより、遺伝子情報分析において、分析結果を、好適に、一元的かつ網羅的に可視化することができる。

0012

本発明の一態様に係る遺伝子情報分析装置では、前記座標変換部は、前記複数のクラスターの各々の中心点の重心を、前記極座標平面の原点として前記変換を行ってもよい。

0013

上記構成によれば、極座標の角度軸に沿ったサンプル点の頻度を示す第1のヒストグラム情報において、複数のクラスターが重なって示されることをより好適に抑制することができる。これにより、遺伝子情報分析において、分析結果を、より好適に、一元的かつ網羅的に可視化することができる。

0014

本発明の一態様に係る遺伝子情報分析装置では、前記ヒストグラム情報を参照して、前記ヒストグラム情報が示す少なくとも一つのピークについて、前記極座標上の中央値および信頼区間を算出する中央値および信頼区間算出部をさらに備えていてもよい。

0015

上記構成によれば、第1の特性値および第2の特性値の両方が一元的に示されているヒストグラム情報を参照して、ピークの中央値および信頼区間を算出することにより、より精度高く遺伝子情報を分析することができる。

0016

本発明の一態様に係る遺伝子情報分析装置では、前記第1の特性値および前記第2の特性値は、遺伝子の変異に関する特性値であり、前記少なくとも1つのピークの各々について、前記中央値および信頼区間算出部が算出した前記信頼区間内に存在する前記サンプル点を計数し、計数結果と所定の閾値とを比較することにより、前記遺伝子の変異の有無を判定する変異判定部をさらに備えていてもよい。

0017

上記構成によれば、変異の有無について高精度かつ容易に判定を行うことができる。

0018

本発明の一態様に係る遺伝子情報分析装置では、前記第1の特性値および前記第2の特性値は、互いに異なるプローブを用いて検出したデジタルPCR産物検出値を示すものであってもよい。

0019

上記構成によれば、デジタルPCR産物のデータ分析を好適に行うことができる。

0020

また、本発明の一態様に係る遺伝子情報分析方法は、遺伝子情報を分析するために遺伝子情報分析装置が実施する遺伝子情報分析方法であって、遺伝子情報に関する第1の特性値と第2の特性値とを有する複数のサンプルデータを取得するサンプルデータ取得工程と、前記第1の特性値を表すx座標軸および前記第2の特性値を表すy座標軸を有する直交座標平面上にプロットされた、前記複数のサンプルデータの各々に対応する複数のサンプル点を示すプロットデータを生成するプロットデータ生成工程と、前記プロットデータに対して、前記直交座標平面から、極座標平面に座標を変換することによって、前記複数のサンプル点について前記第1の特性値および前記第2の特性値から極座標を算出する座標変換工程と、前記座標変換工程が算出した前記極座標の角度軸に沿ったサンプル点の頻度を示すヒストグラム情報を生成するヒストグラム生成工程と、を包含する。

0021

上記構成によれば、本発明の一態様に係る遺伝子情報分析装置と同等の効果を奏する。

0022

本発明の一態様に係る遺伝子情報分析装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記遺伝子情報分析装置が備える各部(ソフトウェア要素)として動作させることにより上記遺伝子情報分析装置をコンピュータにて実現させる遺伝子情報分析装置の遺伝子情報分析プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

発明の効果

0023

本発明の一態様によれば、遺伝子情報分析において、分析結果を、一元的かつ網羅的に可視化することができる。

図面の簡単な説明

0024

本発明の一実施形態に係る遺伝子情報分析方法を実行するコンピュータ等の概略図である。
本発明の一実施形態に係る遺伝子情報分析方法のフローを示す図である。
本発明の一実施形態に係る横軸を第1の特性値x、縦軸を第2の特性値yとする2次元直交座標平面におけるサンプル点の散布図である。
本発明の一実施形態に係る原点を極座標のための位置へ移動させたときの、原点および各サンプル点のプロットの移動を示している。
本発明の一実施形態に係るクラスターが3つの場合の、極座標の原点を各クラスターの中央値を頂点とする3角形の重心とする場合の直交座標上の座標を示している。
本発明の一実施形態に係る極座標と極座標ヒストグラムとの対応関係を示す図である。
本発明の一実施形態に係る2次元直交座標を極座標へ変換したときの各座標点の変換を示す図である。
本発明の一実施形態に係る2次元直交座標から極座標に変換するときの各象限における補正を示す図である。
本発明の一実施形態に係る極座標におけるクラスターの中央値および信頼区間とプロットの分散との対応関係を示す図である。
本発明の一実施形態に係る極座標ヒストグラムを示す図である。
本発明の一実施形態に係る極座標から得られた各クラスターにおける各信頼区間のプロット数を示す図である。
本発明の一実施形態に係る極座標における閾値の設定を示す図である。
本発明の一実施形態に係る極座標ヒストグラム作成から変異の判定までの処理フローを示す図である。

0025

本発明の実施の形態について説明すれば、以下の通りである。なお、本発明は、これに限定されるものではない。

0026

〔用語等の定義〕
本明細書において、「遺伝子情報」は、遺伝子を特定するための情報を指し、「遺伝子配列情報」とも換言できる。具体的には、遺伝子の塩基配列および遺伝子から転写される転写産物アミノ酸配列情報などを包含している。

0027

本明細書において、「ポリヌクレオチド」は、「核酸」または「核酸分子」とも換言でき、ヌクレオチド重合体を意図している。また、「塩基配列」は、「核酸配列」または「ヌクレオチド配列」とも換言でき、特に言及のない限り、デオキシリボヌクレオチドの配列またはリボヌクレオチドの配列を意図している。また、一本鎖または二本鎖のポリヌクレオチドを包含している。

0028

本明細書において、「サンプル」は、「検体」とも換言でき、当該分野において標本調製物同義で用いられ、供給源としての生物材料(例えば、個体、体液細胞株組織培養物もしくは組織切片)から得られる、任意の調製物が意図される。

0029

本明細書において「陽性」は、対象の配列が判定対象となる真の変異を有していることを意味する。

0030

本明細書において「偽陽性」は、対象の配列が判定対象となる真の変異を有していないにもかかわらず、変異を有すると判断されることを意味する。

0031

本明細書において「陰性」は、対象の配列が対象となる変異を有していないことを意味する。

0032

本明細書において「偽陰性」は、対象の配列が判定対象となる真の変異を有しているのにもかかわらず、変異を有していないと判断されることを意味する。

0033

本明細書において「NTC」とは、PCRにおいてテンプレートとなるDNAを含んでいないコントロールを指す。

0034

本明細書において「被検体」とは、ヒト被検体並びにヒトではない被検体、例えば、哺乳類無脊椎動物脊椎動物菌類酵母、細菌、ウイルスおよび植物などを指す。本明細書の実施例はヒト被検体に関しているが、本発明の概念はヒト以外の任意の動物または植物等の生物由来ゲノムに適用でき、医療獣医学および動物科学等の分野において有用である。

0035

〔遺伝子情報分析装置および遺伝子情報分析方法〕
本発明の一実施形態に係る遺伝子情報分析方法は、対象となる遺伝子情報を分析するために実施される方法であって、例えば、図1に示すコンピュータ(遺伝子情報分析装置)50によって実施され得る。

0036

図1に示すように、コンピュータ50は、入力部11、処理部10、表示部20、記憶部30および結果出力部40を備えており、記憶部30に記憶されている遺伝子情報分析プログラム100を処理部10が実行することにより、本実施形態に係る分析方法が実施される。詳細には、処理部10は、特性値算出部(サンプルデータ取得部)12、2次元直交座標作成部(プロットデータ生成部)13、クラスタリング部14、極座標原点決定部15、座標変換部16、ヒストグラム作成部(ヒストグラム生成部)17、中央値および信頼区間算出部18、ならびに変異判定部19として機能する。

0037

また、コンピュータ50は、核酸増幅装置(図示せず)等に接続されている。核酸増幅装置の一例はdPCR装置などのPCR装置である。

0038

コンピュータ50には、分析に供するサンプルデータが入力されるようになっている。なお、一実施形態において、コンピュータ50は、dPCRデータの解析を行うようになっており、本実施形態に係る遺伝子情報分析方法は、データの解析完了後のランに対してさらに実行するようになっていてもよい。

0039

分析対象となるデータについて>
本発明の分析方法の対象となるサンプルデータは、遺伝子情報に関するサンプルデータであって、遺伝子情報に関する第1の特性値と第2の特性値とを有する複数のサンプルデータである。一実施形態において、かかるサンプルデータは、例えば、生体成分測定装置を用いた測定によって得られたデータであり得る。ここで、特性値とは、シグナル強度蛍光強度吸光度リテンションタイム)、発色度輝度放射線量、磁力陽イオンもしくは陰イオン、pH、電圧または電流、温度、湿度、重量および長さなどの特性に関する値が挙げられるがこれらに限定されない。また、各サンプル点の有する特性値の数は、2個以上である。なお、複数の特性値は単一の特性に関するものであってもよく、複数の異なる特性に関するものであってもよい。

0040

より具体的には、本発明に係る分析方法の対象となる複数のサンプルデータとしては、デジタルPCR(例えば、ddPCR)、フローサイトメトリー、デジタル等温核酸増幅(例えば、デジタルNASBAおよびデジタルLAMP)、デジタルタンパク質検出(例えば、デジタルELISA)、デジタル一分子測定、および他の形態のデジタル測定をはじめとするデジタル測定で得られた遺伝子情報のデータが挙げられる。

0041

dPCRでは、標的ポリヌクレオチド分子を含有する希釈溶液が、ピコリットルナノリットル単位の極めて少量の試験サンプルに細分化されている。よって、サンプルにおける大部分において、これらのサンプルは、標的ポリヌクレオチド分子を収容するものであるか、標的ポリヌクレオチド配列分子を全く含まないものであるかのいずれかである。

0042

ここで、分析対象となるデータの一例は、デジタルPCRによるPCR産物であって、特性値として2種類以上の異なる蛍光標識についての蛍光発光値を有するデータである。また、例えば、データがddPCRのデータである場合、サンプル点は、ddPCRの1ドロップレットの結果である。
<データ分析フロー>
以下、本発明の一実施形態に係る遺伝子情報分析方法のフロー(データ分析フロー)の一例を詳細に説明する。以下では、対象遺伝子としてEGFR遺伝子を用い、EGFR遺伝子の所定の変異を検出するためのコントロールゲノムを用いてddPCRを行ったデータを用い、分析をおこなったものを例示しながら説明する。
データ例では、野生型検出用プローブとしてHEX(Hexachloro-Fluorescein)またはVIC(商標)、および変異型検出用プローブとしてFAM(Fluorescein-Amidite)を用いた。

0043

以下は、本実施形態において用いたddPCRデータ例を得るために行ったddPCRの実施条件について示す。なお、ddPCRの条件等はこれに限定されるものではない。

0044

まず、5x T790M PPMix(4.5μMフォワードプライマー、4.5μMリバースプライマー、1.25μMVICまたはHEX標識野生型検出用プローブ、1.25μMFAM標識変異型検出用プローブ)を4.4μL、ddPCR(商標)Supermix for Probes((NodUTP)、Bio Rad)を11μL、Nuclease-free water(Merck Millipore)を1.6μL、コントロールゲノムDNAを5μLで合計22μLのPCR溶液を調製した。

0045

次に、調製したPCR溶液20μLとDroplet generator oil for Probes(Bio Rad)70μLを用いてドロップレットの作製を行った。

0046

ドロップレット作製装置はQX200(登録商標)Droplet Generator(Bio Rad)を用いた。
そして、作製したドロップレットはVeriti(商標)96−wellサーマルサイクラー(Thermo Fisher)を用いてPCRを行った。

0047

PCR条件は、全てのステップにおいてRamp Rateを50%に設定したうえで、95℃で10分熱変性後、94℃で30秒、58℃で1分を40サイクル繰り返し、98℃で10分熱変性後、4℃に維持とした。

0048

最後に、各ドロップレットのFAMおよびVICまたはHEXの蛍光値を、QX200(商標)Droplet Reader(Bio Rad)を用いて測定し記録した。

0049

記録したデータはQuantaSoft(Bio Rad)を用いてCSV形式テキストファイルで出力した。

0050

以下にデータ分析フローを記載するが、本発明の方法に係るフローはこれに限定されない。

0051

(工程1.サンプルデータ入力処理
上記遺伝子情報分析装置50を用い分析を実行する方法を、図1および図2を参照しつつ説明する。

0052

図1は、本発明の一実施形態に係る遺伝子情報分析方法を実行するコンピュータ等の概略図である。また、図2は、本発明の一実施形態に係る遺伝子情報分析方法のフローを示す図である。

0053

まず、ステップS101において、入力部11は、分析に供するサンプルデータの入力を受け付ける。本発明の解析に用いられる入力データは、核酸増幅装置等の実効後に出力されるデータを用いることができる。

0054

一実施形態において、入力部11に入力されるデータは、デジタルPCRのPCR結果のデータであり得る。データの形式は限定されず、コンピュータが処理可能な形式であればよい。一例では、デジタルPCRを実行後に出力されるPCR結果ファイルを用いることが可能である。当該結果ファイルを読み出すことによって、サンプルデータを入力部11に入力する。ある実施形態では、dPCR装置から出力されるdPCR結果ファイルを使用している。

0055

(工程2.特性値算出処理
続いて、ステップS102において、処理部10は、特性値算出部12において、入力部11が受け付けた複数のサンプルデータについて各々のサンプルデータの有する特性値に基づき第1の特性値と第2の特性値とを取得する。

0056

一実施形態において、第1の特性値および第2の特性値は、互いに異なるプローブを用いて検出したデジタルPCR産物の検出値を示すものである。本実施形態では、dPCRによって得られた野生型(VICまたはHEX)の蛍光発光値を第1の特性値として用い、変異型(FAM)の蛍光発光値を第2の特性値として用いている。

0057

(工程3.2次元直交座標作成(プロットデータ生成)処理)
続いて、ステップS103において、2次元直交座標作成部(プロットデータ生成部)13は、第1の特性値を表すx座標軸および第2の特性値を表すy座標軸を有する直交座標平面(xy座標平面)上にプロットされた、各サンプルデータに対応するサンプル点を示すプロットデータを生成する。

0058

図3は、横軸を第1の特性値x、縦軸を第2の特性値yとする2次元直交座標平面におけるサンプル点を示す散布図である。図3において1つの点は、1つのサンプル点を示す。本実施形態では、1つのサンプル点は、ddPCRの1ドロップレット(droplet)のデータに相当するように設定されている。

0059

ここで、図3のAに示される領域は、変異型(Mt)域、図3のBに示される領域は、テンプレートのDNAが含まれていないNTC域(No Template control Zone)、図3のCに示される領域は、野生型(Wt)域、および図3のDに示される領域は、野生型および変異型の両方のシグナルを生じている、ダブルポジティブ域を示す。ここで、Dの領域は野生型と変異型両方のDNAを含むプロットの領域を示しており、実施形態によっては、存在する場合と存在しない場合がある。

0060

つまり、サンプル点の分類として、例えば、検出する蛍光色素の種類(FAM、HEXおよびVIC等)および蛍光検出の有無の他に、増幅なしまたは不確定を含み得る。

0061

本発明の分析方法に供されるデータは、野生型および変異型の両方のシグナルを生じさせるダブルポジティブ域のデータを予め排除したものであってもよい。

0062

(工程4.クラスタリング処理
次に、ステップS104において、クラスタリング部14は、プロットデータを参照して、直交座標平面にプロットした複数のサンプル点をクラスタリングする。なお、本明細書において、「クラスタリング」とは、各々のサンプル点同士の近接度に応じて、複数のクラスター(サンプル点の群)に分類する処理を指す。

0063

クラスタリング部14において実行されるクラスタリングとしては、具体的には、階層的クラスタリングまたは非階層的クラスタリング等の公知のクラスタリング手法が挙げられる。階層的クラスタリングの例示としては、最短距離法、最長距離法、群平均法、重心法メジアン法およびward法等が挙げられる。非階層的クラスタリングは、あらかじめクラスターの数を決定しておき、その数に従ってサンプル点を振り分ける手法である。非階層的クラスタリングの例示としては、k-means法参照文献:H. Steinhaus, (French). Bull. Acad. Polon. Sci., 4 (12), 801(1957)、E. W. Forgy, Biometrics, 21, 768-769 (1965)、J. B. MacQueen, “Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability", Berkeley, University of California Press, 1, 281-297 (1967).)等が挙げられる。クラスタリングの手法としては、非階層的クラスタリングがより好ましく、k-means法であることがさらに好ましい。

0064

また、クラスターの数が未知の場合は、最適クラスター数について、Jain-Dubes法、x-means 法、およびUpper-Tail法などの方法にしたがって自動的に決定することができる。また、別の実施形態において、クラスター数は、2次元直交座標作成部13が生成した2Dプロットデータを示す画像を、表示部20に表示させ、作業者からのクラスター数の入力を受け付け、入力されたクラスター数に基づいて決定してもよい。

0065

図3に示すように、クラスタリング部14は、直交座標において、クラスターの分割境界を、円状または楕円状に形成する。本実施形態では、複数のサンプル点が4つのクラスタ(A〜D)のいずれかに分類する。

0066

プロット群として形成されるクラスターの数は、特に限定されないが、1〜4個であり、例えば、2つ、3つまたは4つである。また、全領域からあらかじめD領域のプロットを排除してもよい。

0067

(工程5.極座標原点決定(原点移動)処理)
次のステップS105において、極座標原点決定部15は、サンプル点を極座標で表示するために必要となる原点(x0,y0)を、上述の工程4で得られたクラスタリング情報を参照して、上述の工程3で作成した直交座標平面上に決定する。図4は、極座標のための原点の位置へ原点を移動させたときの、原点および各サンプル点の移動を示している。図4の(a)は、2次元直交座標平面上で原点を極座標のための原点の位置へ移動させたときの、原点および各サンプル点の移動を示している。図4の(b)は、極座標へ原点およびサンプル点を移動したときの、横軸を(γ)、縦軸を(θ)としたときの散布図である。

0068

ここで、極座標原点決定部15は、極座標平面の原点を、各クラスターの中心が原点から見て、各中心同士の仰角が互いに相対的に最も大きくなるような点に決定することが理想的であり、複数のクラスター群同士で、各クラスター群の中心からの距離(r)および角度(θ)が可能な限り均等に離散する位置に設定することがより好ましい。一実施形態では、極座標原点決定部15は、前記複数のクラスターに囲まれた位置を前記極座標の原点として決定する。別の実施形態において、分析に供するクラスターとして選択したクラスターが3個以上の場合、極座標原点決定部15は、各クラスターの中心点(セントロイド;centroid)の重心を原点の位置として決定する。また、別の実施形態において、分析に供するクラスターとしてのクラスターが2個の場合、極座標原点決定部15は、各クラスターの中心点同士を結ぶ直線の中点を原点の位置として決定する。

0069

一例では、極座標原点決定部15は、各クラスターの中心点を、各クラスターの中央値に一致させる。各クラスターの中央値は、図9にも示すように各クラスターの(γ)及び(θ)のヒストグラム情報を参照して算出される中央値であり得る。

0070

ある実施形態において、極座標原点決定部15は、各クラスターの中央値の決定を、k-means法に従うか、参照用のデータに基づいて行う。別の実施形態では、極座標原点決定部15は、2次元直交座標作成部13が生成した2Dプロットデータを示す画像を、表示部20に表示させ、作業者からの原点の位置またはクラスターの中心点の入力を受け付け、入力された原点または中心点の位置を、原点として決定してもよい。

0071

極座標原点決定部15は、クラスターがn個(n≧3)の場合、n個の各クラスターの中心点の重心G(x,y)を原点として決定する。

0072

一例として、クラスターが3個(3極)の場合は、3極の中心点を結ぶ3角形の重心を原点とする。

0073

図5は、クラスターが3つの場合の、極座標の原点を、各クラスターの中央値の重心とする場合の直交座標上の座標を示している。

0074

3角形の重心座標は、2次元直交座標系で見た場合、座標上の点A(x1,y1)、B(x2,y2)およびC(x3,y3)を頂点とする3角形ABCの重心をG(x,y)とすると,このときのG(x,y)は、以下の式から算出する。
x=(x1+x2+x3)/3
y=(y1+y2+y3)/3
(工程6.座標変換処理
次のステップS106において、座標変換部16は、2次元直交座標から極座標へ座標変換して前記第1の特性値および前記第2の特性値から極座標を算出する。直交座標上の複数のサンプル点について、各々のサンプル点の第1の特性値xi及び第2の特性値yiを、極座標の原点(x0,y0)からサンプル点までの距離riおよび原点(x0,y0)からサンプル点への向きを示す角度θiに座標変換する(i=1〜n;nはサンプル数)。

0075

図6は、クラスターが3個の場合の、座標変換後の極座標と極座標ヒストグラムとの対応関係を示す図である。このように、極座標による全方位ヒストグラム表示では一元的に網羅的に各領域の分布状況が重なることなく量的および位置的関係が把握できる。なお、ヒストグラム表示に関しては、以下の項目(工程7.ヒストグラム作成処理)にて詳述する。

0076

図7は、2次元直交座標を極座標へ変換したときの各座標点の変換を示しており、座標変換部16は、各直交座標平面上の座標点(x,y)の極座標平面上の座標点(r,θ)への変換を以下の式に従って実行する。
(r)=SQRT(X2+Y2)
(θ)=DEGRES(ATAN(Y/X))
<各象限における座標変換の補正条件
ここで、各群のプロットをX,Y座標(2次元直交座標(x,y))で表示した場合、プロットは、以下の4通りが存在する。
(1)第1象限に存在する値の場合、すなわち、XおよびYの値がともに正(+)>0、
(2)第2象限に存在する値の場合、すなわち、Xの値が負(−)<0であり、Yの値が正(+)≧0、
(3)第3象限に存在する値の場合、すなわち、XおよびYの値がともに負(−)<0、
(4)第4象限に存在する値の場合、すなわち、Xの値が正(+)>0であり、Yの値が負(−)<0。

0077

Microsoft(登録商標)EXCELでの3角関数角度関数)はRADIANSで表される。そのため、各象限に対応して、上記(1)〜(4)に対し、以下の補正を行う。

0078

(1)の場合、第1象限でATAN(Y(+)/X(+))値は正(+)のRADIAN(+)になるため、反時計回り(Counterclockwise direction)にそのまま角度(DEGREES)に変換する。

0079

(2)の場合、第2象限でATAN(Y(+)/X(−))値は負(−)のRADIAN(−)になり、時計回り(Clockwise direction)の角度表示のため角度(DEGREES)変換は+180°(π)の補正を行う。

0080

(3)の場合、第3象限でATAN(Y(−)/X(−))値は正(+)のRADIAN(+)であるが、角度(DEGREES)変換は+180°(π)の補正が必要となる。また(4)の場合は、第4象限でATAN(Y(−)/X(+))値は負(−)のRADIAN(−)になり時計回り(Clockwise direction)の角度表示であるため、角度(DEGREES)変換は+360°(2π)の補正を行う。

0081

ただし、XおよびYの0値の扱いについては、EXCELのATAN関数を使用する場合は、分子であるY値については0を含むか含まないか(0以上(Y≧0)か0未満(Y<0)かの表現)はプロットの分布状況を見る場合いずれの象限に含めるかは大きな問題ではないことから、重複を避けるため、仮に各Yの値が0であった場合、正のRADIANSに含めることとし、0以上(Y≧0)および0未満(Y<0)に分類する。

0082

また、分母であるX値については、X=0の場合は、特別に、以下の通り、象限とは別にDEGREES値を設定し、入力する。
X=0であり、Y=0の場合は、DEGREES値を0°(0π)
X=0であり、Y>0の場合は、90°(0.5π)
X=0でY<0の場合は、270°(1.5π)。

0083

したがって計算式では第1象限〜第4象限の各象限におけるX,Yプロット(2次元直交座標(x,y))について、以下の(1)〜(7)の換算(補正)を行う。
(1)第1象限(X>0かつY≧0の範囲)の角度(0°−360°表示)
θ(1)=DEGREES(ATAN(Y(+)/X(+)))
(2)第2象限(X<0かつY≧0の範囲)の角度(0°−360°表示)
θ(2)=DEGREES(ATAN(Y(+)/X(−)))+180
(3)第3象限(X<0かつY<0の範囲)の角度(0°−360°表示)
θ(3)=DEGREES(ATAN(Y(−)/X(−)))+180
(4)第4象限(X>0かつY<0の範囲)の角度(0°−360°表示)
θ(4)=DEGREES(ATAN(Y(−)/X(+)))+360
(5)特別変換1(X=0かつY=0)の角度(0°−360°表示)
θ(5)=0
(6)特別変換2(X=0かつY>0の範囲)の角度(0°−360°表示)
θ(6)=90
(7)特別変換3(X=0かつY<0の範囲)の角度(0°−360°表示)
θ(7)=270
なお、座標変換部16は、これらの計算を、例えばEXCELマクロを用いて実行する。図8は、上述した2次元直交座標から極座標に変換するときの各象限における補正を示す図である。

0084

(工程7.ヒストグラム作成処理)
続いて、ステップS107に示す通り、ヒストグラム作成部17は、上述の工程で得られた極座標値に基づいて算出した極座標の角度軸に沿ったサンプル点の頻度を示すヒストグラム情報を作成する。図9は、極座標とヒストグラムとの対応関係を示す図である。図10は、本発明の一実施形態に係るヒストグラムを示す図である。

0085

ヒストグラムは、例えば図10に例示される通り、横軸を角度(Range)、縦軸を頻度(Frequency)として示されるものであり得る。図10の(a)は、極座標(θ)ヒストグラムの一例である。図10の(b)は、図10の(a)は、極座標(θ)ヒストグラムの頻度軸(縦軸)を拡大した図である。

0086

上述の工程1〜7によれば、すべてのプロットの位置とその個数が計算でき視覚的に距離(r)と角度(θ)によって、陽性(Mt)域および陰性(Wt)域の数値化ができ、かつヒストグラムにより量的分布を一元的かつ網羅的に示すことができる。さらに、極座標に基づき作成した極座標ヒストグラムは、各領域の分布状況が重なることなく、各領域の量的および位置的関係を把握することができる。そのため、例えば、図10の(b)からも明らかなように、視覚的にどのサンプル点の範囲が陽性か、あるいは陰性かを容易に示すことが可能となり、後述する変異陽性および変異陰性の判定に供することができる。また、プロットを計測することによって微量サンプルの定量も可能となる。

0087

<変異判定フロー
別の実施形態に係る本発明の方法は、変異の有無を判定する工程をさらに包含する。ここで、図13は、極座標ヒストグラム作成から変異の判定までの処理フローを示す図である。

0088

以下、工程8〜工程11は、遺伝子の変異の有無を判定する場合の、極座標ヒストグラム作成後の各工程について説明している。各工程について、図13を参照しながら説明する。

0089

まず、図13のステップS201において、ヒストグラム作成部17は、極座標ヒストグラムを作成する。本工程は図2のステップS107の工程と同一である。

0090

(工程8.中央値および信頼区間算出処理)
次に、図13のステップS202として、中央値および信頼区間算出部18は、ヒストグラム情報を参照して、ヒストグラム情報が示す一つ以上のピーク(例えば、図10に示すMtArea、NTCおよびWtAreaのピーク)について、中央値を算出する。

0091

図13のステップS203において、上述の工程で得られた各ピークについての中央値に基づき、中央値および信頼区間算出部18は、ヒストグラム情報を参照して、90%、95%または99%等の所望の範囲の信頼区間を算出し、各ピーク領域分布範囲を推定する。

0092

ここで中央値および信頼区間算出部18は、信頼区間の数値を、目的に応じて決定するが、数値が高いほど、後述する変異判定において、信頼度の高い真の陽性の判定を行うことができる。例えば、90%、95%および99%にすることにより、より信頼性の高い判定を行うことが可能である。

0093

上記のヒストグラムのデータに、所望の統計学的処理を行うことによって、種々の情報を得ることができる。例えば、rおよびθのそれぞれについて各サンプル群の上限値および下限値の範囲内の平均値、90%、95%または99%等の信頼区間の上限値、中央値および下限値、ならびに、各領域の上限値および下限値の範囲内の標準偏差を算出する。

0094

平均値の算出には、EXCEL関数のAVERAGEを使用することができる。また、標準偏差の算出には、EXCEL関数のSTDEVを使用することができる。さらに、90%、95%または99%等の信頼区間の上限値、中央値および下限値の算出には、EXCEL関数のNORMDIST(=NORMDIST(x,平均(μ),標準偏差(σ),関数形式)))およびNormInv(=NORMINV(累積確率,平均(μ),標準偏差(σ)))を使用することができる。中央値は、例えば、各クラスター領域の信頼区間の範囲の50%の値を用いることができる。NORMDIST(=NORMDIST(x,平均(μ),標準偏差(σ),関数形式)))で示される関数は、平均値μ標準偏差σ正規分布において、確率変数がx以下になる確率を計算する確率密度関数(正規分布確率密度関数)である。NormInvは、正規分布確率密度関数の逆関数を求めるEXCEL関数である。

0095

中央値および信頼区間算出部18は、中央値を、2次元極座標(r,θ)について、距離(r)と角度(θ)とのそれぞれにおけるヒストグラムに基づき、正規分布確率密度関数NORMDISTから算出するものであってもよく、基準範囲から算出するものであってもよい。基準範囲とは、中央値を中心にプロットの実個数の累積数で表した範囲を意味している。ただし、作業効率の観点から、EXCELのNORMDIST関数を利用することが好ましい。

0096

また、一実施形態において、中央値および信頼区間算出部18は、中央値を、角度θ(0°〜360°)のヒストグラムから、各領域のピークを検出し、ピークの両裾野の範囲の平均値をθの中心値とし、θに関するNORMDISTで算出される99%範囲に含まれるプロットの各r値の重心((Σr)/n:平均値)から算出したものをrの中心値とするものであり得る。

0097

一例では、中央値および信頼区間算出部18は、極座標変換後の角度θ(0°〜360°)に関するヒストグラムから、EXCEL MACROにて自動的にピークを検出し、そのピークの両裾野範囲内の平均値および分散を算出する。中央値および信頼区間算出部18は、それらの平均値および分散の値から正規分布確率密度関数であるEXCELNORMDISTを推定し、各ピークの中央値および各ピークの各信頼区間(90%、95%および99%)の幅(角度θ)をNormInvで算出する。中央値および信頼区間算出部18は、さらに、その算出結果から各領域内のプロットの個数を計数する。

0098

このように中央値および信頼区間算出部18は、EXCEL MACROプログラムによって、ピークの検出から、確率密度関数を用いた中央値および信頼区間の算出ならびに分布個数の計数まですべて自動で算出する。

0099

中央値を算出する確率密度関数の式を以下に示す。

0100

0101

(μ:平均、σ:標準偏差)
このようにして得られた極座標における各ピークの中央値および信頼区間とプロットの分散との対応関係を図9に示す通りである。

0102

図11は、極座標から得られた各ピークにおける各信頼区間のプロット数を示す図である。

0103

また別の態様として、上述の信頼区間の算出以外の方法によって閾値を設定して、プロットのカットオフに用いてもよい。さらに、上述の信頼区間の算出に、これらの閾値によるカットオフを組み合わせて用いてもよい。

0104

例えば、中央値および信頼区間算出部18は、コントロールサンプルを用いてあらかじめ得た陽性また陰性の領域に基づいて適切な信頼区間を定めるという、従来の手法を実行するものであってもよい。すなわち、NTCのある一点を原点としてFAM(y)軸方向に存在するプロット群までの直線方向と、HEX(x)軸方向に存在するプロット群までの直線方向とが、NTC領域内のある一点を原点として90°前後の角度でモデル的に分布している場合、入力部11が、作業者による、直交座標上のX軸およびY軸にそれぞれ平行な直線X=aおよびY=bならびにX=cおよびY=dの入力を受け付けて、陽性(Mt)域をFAM(y)≧aかつHEX(x)≦bとする。ここで、a、b、cおよびdの値を閾値(カットオフ値)とする。そして、以下の工程10に示す変異判定処理において陰性(Wt)域をHEX(x)≧cかつFAM(y)≦dとして、変異判定部19は、プロット群が当該範囲内に含まれるか否かで変異判定を行う。

0105

なお、NTC領域内のある一点を原点としてFAM(y)軸方向に存在するプロット群までの直線方向と、HEX(x)軸方向に存在するプロット群までの直線方向とが、NTC領域内のある一点を原点として90°未満の角度(例えば60°または70°)で鋭角的に分布している場合、a、b、cおよびdの直交性を保った設定が困難となる。よって、座標変換部16は、90°未満の角度(例えば60°等の角度)を90°に拡大する座標系の変換を行う。続いて、上述したように、入力部11が、作業者による、直交座標上のX軸およびY軸にそれぞれ平行な直線X=aおよびY=bならびにX=cおよびY=dの入力を受け付けて、陽性(Mt)域をFAM(y)≧aかつHEX(x)≦bとする。ここで、a、b、cおよびdの値は陰性(Wt)域をHEX(x)≧cかつFAM(y)≦dとする。変異判定部19は、a、b、cおよびdの値を閾値(カットオフ値)とする。

0106

上述の角度を拡大する変換について、拡大前の角度を60°とし、拡大後の角度を90°とした時の座標変換部16が実行する例示的な式を以下に示す。変換後の座標をX’,Y’とし、拡大前の角度をθ2、拡大後の角度をθ1、とする。
X’=r×COS(ATAN(Y/X)×(θ1/θ2))
Y’=r×SIN(ATAN(Y/X)×(θ1/θ2))
(r)=SQRT(X2+Y2),θ1=90°、θ2=60°
上述の極座標における閾値の設定を図12に示す。図12の(a)は、NTC領域内のある一点を原点としてFAM(y)軸方向に存在するプロット群までの直線方向と、HEX(x)軸方向に存在するプロット群までの直線方向とが、NTC領域内のある一点を原点として90°前後の角度でモデル的に分布している場合の閾値の設定を示している。図12の(b)は、NTC領域内のある一点を原点としてFAM(y)軸方向に存在するプロット群までの直線方向と、HEX(x)軸方向に存在するプロット群までの直線方向とが、NTC領域内のある一点を原点として90°未満の角度で鋭角的に分布している場合の角度の変換による閾値の設定を示している。

0107

(工程9.2次元直交座標(x,y)への再変換処理
続いて、図13のステップS204に示す通り、座標変換部16は、上述の工程で得られた極座標を2次元直交座標へ再変換する。すなわち、極座標の原点(x0,y0)を2次元直交座標の原点へ移動し、極座標の原点(x0,y0)から全てのサンプル点までの距離riおよび極座標原点(x0,y0)からサンプル点への向きを示す角度θiを、第1の特性値xiおよび第2の特性値yiに座標変換する(i=1〜n;nはサンプル数)。

0108

再変換に用いる式は以下の通りである。
X(HEX)=r×COS(RADIANS(θ))
Y(FAM)=r×SIN(RADIANS(θ))
座標を再変換することによって、各領域内に存在するプロットの元の特性値xおよびyの値を得ることができる。

0109

(工程10.変異の判定処理)
一実施形態において、第1の特性値および第2の特性値が、遺伝子の変異に関する特性値である場合、以上の工程で得られた結果に基づき、図13のステップS205において、変異判定部19は、遺伝子の変異判定を行ってもよい。

0110

ある実施形態において、変異判定部19は、上述の工程8において算出された信頼区間内に存在するものとして計数されたプロット数の計測結果を、あらかじめ算出された陽性コントロールの検体および陰性コントロールの検体を用いて得られた陽性域及び陰性域の各ピーク領域の分布範囲に含まれるプロット数のデータと比較することによって、遺伝子の変異の有無を判定する。

0111

ここで、ある実施形態における変異判定部19における変異判定の詳細なフローについて説明する。

0112

まず、実サンプルについて上述の工程8において中央値および信頼区間算出部18は、算出した信頼区間から推定された各ピーク領域の分布範囲に含まれるプロット数を計数する。次に、変異判定部19は、コントロールの検体および陰性コントロールの検体を用いてあらかじめ算出されている陽性域及び陰性域の各ピーク領域の分布範囲に含まれるプロット数を閾値として設定する。変異判定部19は、この閾値と、実サンプルの計数したプロット数とを比較することによって陽性域および陰性域それぞれについて、閾値を超えているか否かで変異陽性、変異陰性の判定を行う。

0113

この時、変異判定部19は、陽性領域または陰性領域からそれぞれ外れている実サンプルのプロット数に基づいて、偽陽性または偽陰性であるか否かを統計的に推定する。

0114

一実施形態において、変異判定部19は、上述の工程8において算出された信頼区間内に存在するものとして計数されたプロット数の計測結果を、好適な分布モデルにあてはめ、算出された所定の閾値と比較することによって、遺伝子の変異の有無を判定する。例えば、閾値は、ROC(Receiver Operating Characteristic)曲線から算出されたものであってもよい。

0115

(工程11.結果のグラフ化処理)
さらに、ステップS206に示す通り、表示部20は上述の工程で得られた分析データ(例えば、各領域内のサンプル点の計数結果)を表示する。ここで、表示部20におけるグラフ表示処理部21において、上述の工程で得られた分析データをグラフに変換して表示する。

0116

グラフの例としては、2次元グラフ、3次元グラフ、統計図表、円グラフチャート棒グラフ、フローチャート、散布図、折れ線グラフおよび三角グラフなど、ならびにこれらの組み合わせが挙げられる。

0117

データをグラフ化することにより、結果が可視化されて、ユーザにとってデータの選択、判定および認識等が容易となる。

0118

以上の工程7のヒストグラム作成から工程11の結果表示までの処理フローをまとめると以下の通りである。

0119

工程7において、ヒストグラム作成部17が極座標θのヒストグラムをEXCELマクロにより作成し、グラフ表示する。そしてヒストグラムの各ピークをEXCELマクロにより自動検出する。工程8で、中央値および信頼区間算出部18は、ヒストグラム情報を参照して、ヒストグラム情報が示す一つ以上のピークについて、中央値を算出する。さらに、各ピークについての中央値に基づき、中央値および信頼区間算出部18は、ヒストグラム情報を参照して、90%、95%または99%等の所望の範囲の信頼区間を算出する。算出された値から、各ピーク領域の分布範囲を推定し、各領域内のサンプル点の個数を計数する。工程9で、座標変換部16は、EXCELマクロにより上述の工程で得られた極座標を2次元直交座標へ再変換する。工程10で、変異判定部19は、計数されたサンプル点に基づいて遺伝子の変異判定を行う。工程11で、表示部20は分析結果のデータを表示する。また、表示部20におけるグラフ表示処理部21において、上述の工程で得られた分析データをグラフに変換して表示する。

0120

最後に、結果出力部40は、得られたヒストグラム、グラフデータ、変異の判定結果等の分析結果を出力する。例えば、結果出力部40は、Webブラウザに対してHTML形式で結果を出力してもよい。また、結果出力部40は、遺伝子情報分析結果または変異の判定結果をテキスト形式レポートとして出力してもよい。また、結果出力部40は、データをサムネイル画像として表示することもできる。

0121

以上のように、従来技術では、一般的に、2次元直交座標上で陽性(Mt)および陰性(Wt)の判定を行う場合、コントロールサンプルによって発生するデータ領域を元に適切な信頼区間を定め、実サンプルを測定することにより陽性(Mt)および陰性(Wt)の判定を行っていた。これに対し、本発明の方法による2次元極座標(r,θ)を用いた変異の判定方法では、2次元極座標(r,θ)への座標変換を行うことによって、すべてのサンプル点の位置および各領域内に存在する個数が計算でき、視覚的に距離(r)と角度(θ)の2値により陽性(Mt)域および陰性(Wt)域の数値化ができる。さらに、ヒストグラムによりすべてのサンプル点の量的分布を一元(網羅)的に示すことができる。

0122

<変形例>
一変形例において、コンピュータ50は、クラスタリング部14を備えていなくともよく、この場合、極座標原点決定部15は、プロットデータが示す散布図を表示部20に表示させ、入力部11が、作業者による極座標平面の原点の入力を受け付けるようになっていてもよい。また、極座標原点決定部15は、極座標平面の原点を予め定められた位置に決定してもよい。また、極座標原点決定部15は、プロットデータが示す全サンプル点に基づいて、極座標平面の原点を決定してもよい。

0123

<コンピュータ(遺伝子情報分析装置)およびプログラム>
遺伝子情報分析装置50の制御ブロック(特に処理部10)は、集積回路ICチップ)等に形成された論理回路ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。

0124

後者の場合、コンピュータ(遺伝子情報分析装置)50の処理部10は、各機能を実現するソフトウェアであるプログラム(プログラム100を含む)の命令を実行するCPU(Central Processing Unit)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。コンピュータ50の記憶部30は、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)を備えている。そして、コンピュータ50(または処理部10)が上記プログラムを記憶部30から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形媒体」、例えば、テープディスクカード半導体メモリプログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体通信ネットワーク放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。上記プログラムの形式としては、EXCELのVBAなどの形式が挙げられる。

0125

本実施形態に係る遺伝子情報分析プログラムは、特に限定されないが、例えば、プラグインスタンドアローンアプリケーションミドルウェアまたはライブラリ等の形態で提供され得る。

0126

本実施形態に係る遺伝子情報分析プログラムを記憶する記録媒体の例としては、読取り専用メモリ(ROM)、フロッピー(登録商標)ディスク、ハードディスク等の磁気メディア光ディスク光磁気ディスクCD−ROM、CD−R、DVDROM、ブルーレイディスク、等の光学メディアが挙げられる。

0127

また、コンピュータ50は、表示手段にグラフィック情報を処理および出力するためのグラフィックボードを1つ以上含むこともできる。上記コンポーネントはコンピュータ50内のバスにより適切に相互接続できる。コンピュータ50はさらに、外部サーバとの通信のための通信部の他、モニタキーボードマウスプリンタネットワーク等の汎用外部コンポーネントと通信するための好適なインタフェースを含み得る。

0128

<分析対象となる遺伝子情報について>
本発明の遺伝子情報分析装置および分析方法は、各種の遺伝子情報の分析に使用され得る。

0129

分析対象となる遺伝子情報は、核酸、遺伝子、オリゴヌクレオチド、分子、タンパク質、バイオマーカー、血中循環腫瘍細胞(CTC)をはじめとする各種細胞などの、あらゆる生体成分に由来する遺伝子情報が挙げられるが、これらに限定されない。

0130

(対象となる核酸由来の遺伝子情報に関するデータについて)
本発明に適用可能な対象となる遺伝子情報に関するデータは、上述の生体成分に由来するデータであり、例えば、核酸データであり得る。核酸データは、分析のターゲットとなる核酸を増幅することによって得られたデータであり得る。本明細書において「増幅」とは、ある核酸配列のコピー生産することを指す。核酸はポリメラーゼ連鎖反応(PCR)または当該技術分野において知られているその他の技術を用いて増幅されたものであり得る。核酸の増幅反応は、核酸分子を増幅する当該技術分野において公知の任意の増幅反応、例えば、PCR、デジタルPCR、ネステッドPCR、リガーゼ連鎖反応リガーゼ検出反応、鎖置換増幅、転写ベース増幅システム、核酸配列ベースの増幅、ローリングサークル増幅および超分岐ローリングサークル増幅対立遺伝子特異的PCR、非対称PCR、ライゲーション媒介PCR、多重PCR、qPCR、ゲノムウォーキング、およびブリッジPCR等であり得る。本発明の方法は、特にデジタルPCRのデータ分析に適している。

0131

dPCRは、サンプルを微小区画に分割し、各区画のPCRサンプルを検出および解析することによって核酸の定量を行う方法である。デジタルPCRの種類としては、具体的には、ddPCRが挙げられる。ddPCRは、微小区画として、微小な液滴(droplet)を作成する方法であり、液滴は、例えば油中水型エマルジョンであり得る。液滴の平均容量は、例えば、数ピコリットル〜数マイクロリットルである(レインダンス社製のddPCR装置等)。

0132

また、核酸データは任意の好適なプライマーセットを用いたPCRによって増幅されたPCR産物であってもよい。PCRに用いられるプライマーセットは、PCRを行う際に目的のDNA分子または遺伝子を増幅可能なフォワードプライマーとリバースプライマーとのセットである。また、本発明のPCRデータの生成に用いられるプライマーとしては、目的遺伝子を特異的に検出することができるものであれば特に限定されないが、例えば、10bp〜50bp好ましくは18bp〜24bpからなるオリゴヌクレオチドである。オリゴヌクレオチド塩基配列は、対象遺伝子の配列情報に基づいて決定する。

0133

また、大腸菌を用いた系で増幅およびクローニングされたプラスミドを分析対象としてもよい。また、本発明に係る分析対象の核酸データは分析の標的とする遺伝子配列以外に、一定量のコンタミネーションを含んでいてもよい。

0134

本発明に適用される核酸データは、特に限定されず、蛍光による検出、陽イオンもしくは陰イオンの検出、pHの検出、電圧による検出または電流による検出等によって検出したデータが挙げられる。

0135

核酸データに含まれるポリヌクレオチド配列は、細胞内に存在する配列由来であってもよく、無細胞(cell-free)系のポリヌクレオチド配列であってもよい。一実施形態において、核酸データは、生体サンプルから抽出し、調製されたポリヌクレオチド配列を含有する。また、本発明の分析対象となる核酸には、例えば、血中浮遊腫瘍DNA(circulating tumor DNA、ctDNA)も含まれている。また、ポリヌクレオチド配列は、一本鎖であってもよく、二本鎖であってもよく、または一本鎖領域を有する二本鎖(例えば、環状およびループ構造)であってもよい。

0136

本発明の一実施形態において、本発明に係る分析方法に適用する核酸データは、例えば、組織、体液および細胞のような生体サンプルから調製されるものであり、好ましくは体液から調製されるものである。生体サンプルは被験者から採取される。また、生体サンプルからポリヌクレオチド配列を得る場合、従来公知の方法を用いて生体サンプルから核酸を精製または分離すればよい。なお、生体液としては、限定しないが、生体サンプルとしては、例えば、細胞サンプル、組織サンプル、体液サンプルなどが挙げられ、中でも体液サンプルが好ましい。体液サンプルとしては、血液サンプルリンパ液サンプル、髄液サンプル等が挙げられるが、血液サンプルが好ましく、特に末梢血サンプルが好ましい。末梢血サンプルは、例えば指先への穿刺等によって容易に採取が可能であるため、被験者の負担が少ない。同様に、生体サンプルは、生検綿棒または塗抹等から採取することも可能である。また、血液サンプルを用いる場合は、採取した血液から分離した血清または血漿を核酸データの生成に用いることが好ましい。

0137

また、生体サンプルは、必要に応じて凍結保存等の生体サンプルの種類に適した方法で保存されたものであってもよい。

0138

核酸データは公知の核酸配列情報ソースから入手したものでもよい。複数個の異なる個体、正常個体、特定の個体における疾患の異なる段階などで採取したサンプル、または病理学素因を有する個体等の個体から採取した生体サンプルから調製されたものであり得る。

0139

<プローブ>
一実施形態では、分析対象となるデータは、上述のPCRによって増幅されたポリヌクレオチド配列などの標的の遺伝子を、検出可能に標識されたプローブを使用して検出した結果のデータである。特定の実施形態において、検出可能に標識されたプローブは、光学的に標識されたプローブが挙げられ、例えば、蛍光色素で標識されたプローブである。蛍光色素の例としては、FAM、VIC(登録商標)、HEX等が挙げられる。なかでも、dPCRによって増幅されたポリヌクレオチド配列の好ましい蛍光色素としては、FAM、VICおよびHEXが挙げられる。

0140

また、例えば分子ビーコン、Solarisプローブ、スコーピオンプローブおよびハイブリダイゼーションによる標的配列の特異的認識によって機能し、当該ターゲット配列の増幅により蛍光増加を生じさせる任意の他のプローブ等のプローブも適用可能である。さらにプローブ配列中にBNAを導入したプローブ、Taqman(登録商標)プローブなどの加水分解プローブおよびE(登録商標)プローブ等も好適に用いることができる。

0141

<分析対象となる遺伝子配列>
本発明の分析方法を適用する遺伝子配列は特に限定されないが、一例としては、特定の疾患関連遺伝子の配列である。疾患関連遺伝子配列としては、これに限定するものではないが、例えば、癌関連遺伝子配列などが挙げられる。癌関連遺伝子としては、これに限定するものではないが、例えば上皮成長因子受容体(epidermal growth factor receptor,EGFR)遺伝子、ALK(anaplastic lymphoma kinase)融合遺伝子などが挙げられる。本発明は、例えば、このような遺伝子を対象とすることによって、遺伝子診断およびモニタリングに適用することができる。

0142

<用途>
本発明に係る装置、方法およびプログラムは、種々の遺伝子情報の分析を必要とする分野において利用され得る。とりわけ、あらゆる特定のポリヌクレオチド配列検出を必要とする分野における、種々の核酸検出用途において利用され得る。例えば、遺伝子診断、多重dPCR、ウイルスの検出、遺伝子型の決定、配列決定の検証、突然変異の検出、遺伝子組換え生物の検出、およびコピー数多型等の用途において利用可能である。

0143

診断への応用>
上述した通り、本明細書中に記載の装置、方法およびプログラムは、様々な分野で使用することができ、中でも、いくつかの実施形態の方法およびプログラムは、遺伝子障害に関連する疾病、疾患または状態の診断、検出、同定、予測、評価または診断のための方法に用いることができる。遺伝子障害に関連する疾病、疾患または状態とは、特定の遺伝子座において生じる遺伝的要因(変異、SNP、欠失、増幅、転座反転または任意の他の異常が含まれる)に起因するものであり得る。

0144

また、本発明の装置、方法およびプログラムを使用して、出生前遺伝子診断、すなわち、胎児が遺伝子異常(例えば、ダウン症候群胎児異数性など)を有するリスクを診断、検出、予測、同定または評価することができる。例えば、被検体が、ある遺伝子において、当該遺伝子障害に関連する疾患の治療用薬剤耐性を生じる変異を有するか否かの検出等にも用いることができる。

0145

本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

0146

ヒト被検体のがん組織中のEGFR遺伝子領域の変異に関するコントロールプラスミドを用いたサンプルを例として、ddPCRによって得られた野生型/HEX(x)および変異型/FAM(y)のデータについて、2次元直交座標(x,y)と2次元極座標(r,θ)との各領域のプロットの中央値、ならびに90%、95%および99%の信頼区間の範囲のプロットの個数の等分散性を比較検討した。等分散性の検証は、NTCおよび野生型(Wt)、および変異型(Mt)の各プラスミド管理用検体から得られたデータを用いて行った。

0147

(中央値の算出)
2次元直交座標(x,y)における野生型(Wt)、変異型(Mt)、およびNTCに関するプロット群の中心を以下の(1)および(2)の2種類の方法で求めた。
(1)EXCELの正規分布確率密度関数NORMDISTを用いて、プロット群の平均値および分散値から90%,95%および99%の信頼区間の範囲で求めた中央値(50%点)とする。
(2)中央値を中心に実個数の累積数で表した範囲を基準範囲として下端および上端の各5%、2.5%および0.5%を除外した90%、95%および99%範囲の中央値(50%点)とする。

0148

ddPCRで得られるプロットの分布正規性の検証(正規分布とみなすか否か)に関しては、EXCELのRANK.EQ関数による順位とその確率((順位−1/2)/n)およびNORMINV関数による期待値から求めた正規確率プロットで得られるグラフの直線性で検討した。

0149

その結果、正規性の目安として正規確率プロットの近似直線相関係数が0.9以上(R≧0.9)であった。このことから、上記(1)および(2)の分布はいずれも正規分布と判断し、中心点を求めるために、問題なくNORMDISTを適用可能であると結論付けた。

0150

また、基準範囲の内の各信頼区間の範囲内に含まれる個数と、NORMDISTで得られた信頼区間内のプロットの個数を比較したところ、個数は両者間で99%以上の一致率を示した。このことからNORMDISTで求めた各極の中心点を変異有無の判定に影響を及ぼすことなく用いることができることを確認した。

0151

2次元直交座標において、野生型(Wt)、変異型(Mt)およびNTCのHEX(x)軸のヒストグラム情報を参照してHEX軸中央値を、FAM(y)軸のヒストグラム情報を参照してFAM軸中央値をそれぞれ求め、2次元的に中央値を(x,y)で求めた。また同様に、2次元極座標(r,θ)については、距離(r)および角度(θ)についてそれぞれのヒストグラム情報を参照して2次元直交座標(x,y)と同様に正規分布確率密度関数NORMDISTからと基準範囲からの両方から求めた中央値をそれぞれ算出した。また距離(r)については各プロットの距離(r)を角度(θ)の中央値からの差の角度で補正し、すべて中心の角度(θ)と同じ方向の直線上に投影した距離で分布を補正して求めた中央値についても比較検討した。

0152

補正式は以下のものを用いた。
r’=r*COS(RADIANS(θ−θ中央値))
rおよびr’から得られる統計値の比較については、標準偏差を除いて最小値最大値および平均値において99%以上の一致率を示すことから、またr群の重心を中央値とすることを考慮すれば、補正なしのrで中央値を求めることが適切と考えられる。したがって、rで中央値を算出することとした。

0153

(中央値の比較)
2次元極座標(r,θ)で求めた各領域(Mt、NTCおよびWt)の中央値について、2次元直交座標(x,y)に原点移動および再変換し、その数値で比較検討を行った。再変換は以下の式に基づいて行った。
x=r*COS(RADIANS(θ))
y=r*SIN(RADIANS(θ))
その結果、2次元直交座標(x,y)から求めた中央値と2次元極座標(r,θ)から求めた中央値とはいずれも99%以上の一致率を示した。したがって、2次元極座標(r,θ)で中央値を推定し、90%、95%または99%等の信頼区間を算出して各陽性域、陰性域の分布範囲を推定することは妥当と考えられた。また中央値の求め方については、NORMDIST関数から求める方法および基準範囲から求める方法のいずれの方法を用いることも可能であるが、EXCELのNORMDIST関数を利用した方が作業効率がよいと考えられた。

0154

(各分布範囲に含まれるプロット数の比較)
各座標において、EXCELの正規分布確率密度関数NORMDISTから求めた分布の90%、95%および99%の範囲に含まれるプロット数と、基準範囲の概念から下端と上端の各5%、2.5%および0.5%を棄却した90%、95%および99%の範囲に含まれるプロット数とを比較したところ、いずれも99%以上の一致率を示すことが分かった。

実施例

0155

以上の結果から、2次元極座標(r,θ)によって各領域の90%、95%または99%の分布範囲の推定を行うことは妥当であることが示された。また、信頼区間の範囲を求める作業の効率を考慮すると、EXCELの正規分布確率密度関数NORMDISTを用いて各領域の分布状態を推定する方法がより効率的であると考えられた。

0156

本発明は、種々の遺伝子情報の分析を行う分野において利用され得る。とりわけ、あらゆる特定のポリヌクレオチド配列検出を必要とする分野における、種々の核酸検出における遺伝子情報分析用途において利用され得る。具体的には、癌をはじめとする種々の遺伝子関連疾患検査、予測もしくは診断、または出生前の遺伝子診断等に利用することができる。

0157

10 処理部
11 入力部
12特性値算出部(サンプルデータ取得部)
13 2次元直交座標作成部(プロットデータ生成部)
14クラスタリング部
15極座標原点決定部(座標変換部)
16 座標変換部
17ヒストグラム作成部(ヒストグラム生成部)
18中央値および信頼区間算出部
19 変異判定部
20 表示部
21グラフ表示処理部
30 記憶部
40結果出力部
50コンピュータ(遺伝子情報分析装置)
100 分析プログラム

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 神田智一の「 機材管理システム」が 公開されました。( 2021/02/15)

    【課題・解決手段】異なる場所に設置された多数のコーティング液生成装置(1)をそれぞれ個別に管理することができ、各コーティング液生成装置(1)の稼働状況を離れた場所で一元管理することが可能なシステムを提... 詳細

  • 株式会社村田製作所の「 ハンガーラック用リーダ装置、ハンガーラック、及び衣料品の商品管理システム」が 公開されました。( 2019/12/05)

    【課題】ハンガーパイプに吊り下げられた複数の衣料品のRFIDタグをより確実に読み取ることができるハンガーパイプ用リーダ装置を提供する。【解決手段】本発明に係るハンガーパイプ用リーダ装置は、複数のハンガ... 詳細

  • 株式会社AiCTの「 ロッカーシステム」が 公開されました。( 2019/10/31)

    【課題】荷物を収納するロッカーの通信が断絶した場合や、停電時でも荷物の受け渡しが可能であり、かつ、ロッカーに収納した荷物を盗難されるおそれを軽減してセキュリティ効果を高めたロッカーシステムを提供する。... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ