図面 (/)

技術 無細胞DNAについての体細胞起源または生殖系列起源の識別

出願人 ガーダントヘルス,インコーポレイテッドデイナファーバーキャンサーインスティチュート,インコーポレイテッド
発明者 ランマン,リチャードビー.オックスナード,ジェフリーアール.
出願日 2018年5月16日 (2年9ヶ月経過) 出願番号 2019-563118
公開日 2020年7月27日 (6ヶ月経過) 公開番号 2020-521442
状態 未査定
技術分野 酵素、微生物を含む測定、試験
主要キーワード ノイズ範囲 予測信頼度 非揮発性記憶媒体 分割内 中心粒 ガウス近似 伝達データ 識別用タグ
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2020年7月27日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (17)

課題・解決手段

本開示は、無細胞DNA(cfDNA)から体細胞変異体または生殖系列変異体を検出するためのシステムおよび方法を提供する。上記方法は、前記対象由来のcfDNAからシーケンシング情報を受け取るステップであって、前記シーケンシング情報が前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードを含むステップと、前記複数のゲノム遺伝子座のそれぞれについての定量的対立遺伝子画分AF)値を前記cfDNAシーケンシングリードに基づいて決定するステップと、前記AF値のそれぞれについて標準偏差STDEV)を決定するステップと、STDEV閾値およびAF閾値を提供するステップと、前記AF値のそれぞれのSTDEVが前記STDEV閾値を上回るかまたは下回るかを決定するステップと、前記AF値のそれぞれが前記AF閾値を上回るかまたは下回るかを決定するステップとを含み得る。

概要

背景

背景
対象のゲノム参照ゲノム(例えば、GRCh38.p4)の比較により、一般には、塩基の約0.01%に差異遺伝子変異)が示される。生殖系列遺伝子変異体は、通常の遺伝または生殖細胞突然変異によって伝達されるSNPであり得る。変異は、ホモ接合性形態またはヘテロ接合性形態で存在する。

がんなどのある特定の病理学的状態は、生殖系列ゲノムと比較した病的細胞のゲノムの遺伝子変異を特徴とする。これらの変異は、体細胞性突然変異に起因し、体細胞突然変異と称される。

体細胞突然変異を有するポリヌクレオチドは、無細胞DNA(cfDNA)において検出することができ、cfDNAでは体細胞突然変異を有するポリヌクレオチドは生殖系列ゲノムを有する細胞由来のDNAと混在する。cfDNA中に大きなバックグラウンド(生殖系列)が存在する場合、コンピュータにより実行されるプロセスでは生殖系列変異体と体細胞突然変異を自動的に弁別することができない。その代わりに、従来のシステムは、体細胞突然変異を生殖系列突然変異と区別するために、個々のヒト専門家または専門家の共同体(いずれの場合もTumor Boardと称される)の専門知識に依拠している。

ノイズおよび偏りが存在しない場合、生殖系列変異体は、対立遺伝子画分が50%(ヘテロ接合性(het)遺伝子座の場合)または100%(ホモ接合性(homo)遺伝子座の場合)のものになる。しかし、実際には、システムにノイズおよび偏りが存在することにより、これらの明快数字が不明確になる。言い換えれば、hetまたはhomo遺伝子座は、正確に50%または100%では検出されないが、その代わりに、hetカテゴリーおよびhomoカテゴリーのそれぞれについて信頼度上下限の間で検出される。例えば、het遺伝子座は40%〜60%の範囲であり得、一方、homo遺伝子座は98%〜100%の範囲であり得る。

概要

本開示は、無細胞DNA(cfDNA)から体細胞変異体または生殖系列変異体を検出するためのシステムおよび方法を提供する。上記方法は、前記対象由来のcfDNAからシーケンシング情報を受け取るステップであって、前記シーケンシング情報が前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードを含むステップと、前記複数のゲノム遺伝子座のそれぞれについての定量的対立遺伝子画分(AF)値を前記cfDNAシーケンシングリードに基づいて決定するステップと、前記AF値のそれぞれについて標準偏差STDEV)を決定するステップと、STDEV閾値およびAF閾値を提供するステップと、前記AF値のそれぞれのSTDEVが前記STDEV閾値を上回るかまたは下回るかを決定するステップと、前記AF値のそれぞれが前記AF閾値を上回るかまたは下回るかを決定するステップとを含み得る。

目的

一態様では、本開示は、対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードを含む、ステップと、前記複数のゲノム遺伝子座のそれぞれについての定量的対立遺伝子画分(AF)値(quantitative allele fraction (AF) measure)を前記cfDNAシーケンシングリードに基づいて決定するステップと、前記AF値(AF measure)のそれぞれについて標準偏差(STDEV)を決定するステップと、STDEV閾値およびAF閾値を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

対象由来無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードを含む、ステップと、前記複数のゲノム遺伝子座のそれぞれについての定量的対立遺伝子画分AF)値を前記cfDNAシーケンシングリードに基づいて決定するステップと、前記AF値のそれぞれについて標準偏差STDEV)を決定するステップと、STDEV閾値およびAF閾値を提供するステップと、前記AF値のそれぞれのSTDEVが前記STDEV閾値を上回るかまたは下回るかを決定するステップと、前記AF値のそれぞれが前記AF閾値を上回るかまたは下回るかを決定するステップと、STDEVが前記STDEV閾値を下回り、かつAF値が前記AF閾値を下回る各遺伝子座を、体細胞起源であると分類するステップとを含む方法。

請求項2

対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて生殖系列起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードを含む、ステップと、前記複数のゲノム遺伝子座のそれぞれについての定量的対立遺伝子画分(AF)値を前記cfDNAシーケンシングリードに基づいて決定するステップと、前記AF値のそれぞれについて標準偏差(STDEV)を決定するステップと、STDEV閾値およびAF閾値を提供するステップと、前記AF値のそれぞれのSTDEVが前記STDEV閾値を上回るかまたは下回るかを決定するステップと、前記AF値のそれぞれが前記AF閾値を上回るかまたは下回るかを決定するステップと、STDEVが前記STDEV閾値を下回り、かつAF値が前記AF閾値を上回る各遺伝子座を、生殖系列起源であると分類するステップとを含む方法。

請求項3

ゲノム遺伝子座についてのAF値が前記STDEV閾値を下回ることにより、前記ゲノム遺伝子座に関して低いコピー数多型(CNV)が示される、請求項1または2に記載の方法。

請求項4

ゲノム遺伝子座についてのAF値が前記STDEV閾値を上回ることにより、関連するゲノム遺伝子座に関して高いコピー数多型(CNV)が示される、請求項1または2に記載の方法。

請求項5

前記AF閾値が、経験的に決定される、請求項1または2に記載の方法。

請求項6

がんを有する対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源であると識別するための方法であって、がん治療薬を用いた処置前の第1の時点で前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードの第1のセットを含む、ステップと、がん治療薬を用いた処置後の第2の時点で前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードの第2のセットを含む、ステップと、前記複数のゲノム遺伝子座のそれぞれについての定量的対立遺伝子画分(AF)値を、前記第1の時点の前記cfDNAシーケンシングリード、および前記第2の時点の前記cfDNAシーケンシングリードに基づいて決定するステップと、前記第1の時点の前記AF値と前記第2の時点の前記AF値を比較するステップであって、前記がんが、前記がん治療薬に対して応答性である、ステップと、ゲノム遺伝子座のAF値が前記第1の時点と前記第2の時点の間に低減する場合、前記ゲノム遺伝子座を体細胞起源であると識別するステップとを含む方法。

請求項7

がんを有する対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて生殖系列起源であると識別するための方法であって、がん治療薬を用いた処置前の第1の時点で前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードの第1のセットを含む、ステップと、がん治療薬を用いた処置後の第2の時点で前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードの第2のセットを含む、ステップと、前記複数のゲノム遺伝子座のそれぞれについての定量的対立遺伝子画分(AF)値を、前記第1の時点の前記cfDNAシーケンシングリード、および前記第2の時点の前記cfDNAシーケンシングリードに基づいて決定するステップと、前記第1の時点の前記AF値と前記第2の時点の前記AF値を比較するステップであって、前記がんが、前記がん治療薬に対して応答性である、ステップと、ゲノム遺伝子座からのAF値が前記第1の時点と前記第2の時点の間に低減しない場合、前記ゲノム遺伝子座を生殖系列起源であると識別するステップとを含む方法。

請求項8

対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源または生殖系列起源であると識別するための方法であって、第1の時点で集められた前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、第1のcfDNAシーケンシングリードを含む、ステップと、前記複数のゲノム遺伝子座からの配列情報を提供するステップと、前記複数のゲノム遺伝子座のそれぞれのビニングを実施するステップであって、前記ビニングが、前記複数のゲノム遺伝子座内の各ゲノム遺伝子座に最初の分類を割り当てることを含み、前記最初の分類が、a)推定体細胞起源;b)推定生殖系列起源;またはc)起源不確定からなる群から選択され、それにより、推定体細胞起源であるゲノム遺伝子座を含む第1のビン、推定生殖系列起源であるゲノム遺伝子座を含む第2のビン、および起源不確定であるゲノム遺伝子座を含む第3のビンを生成するステップと、前記第1のビン、前記第2のビン、および前記第3のビン内の前記ゲノム領域のそれぞれについて、定量的対立遺伝子画分(AF)値が前記第1のcfDNAシーケンシングリードに基づき、それぞれ第1のAFセット、第2のAFセット、および第3のAFセットを生成するステップと、前記第1のAFセットに基づく第1の度数分布および前記第2のAFセットに基づく第2の度数分布を生成するステップであって、前記第1の度数分布と前記第2の度数分布の間に重複が存在しない、ステップと、AF閾値を前記第1および第2の度数分布に基づいて識別するステップであって、このAF閾値が、(i)前記第1のAFセットの中で最大の定量的AF値以上かつ(ii)前記第2のAFセットの中で最小の定量的AF値以下である、ステップと、前記ゲノム遺伝子座の第3のビンのそれぞれに最終的な分類を割り当てるステップであって、この最終的な分類が、(A)前記ゲノム遺伝子座の定量的AF値が前記AF閾値以下の場合、推定体細胞起源であり、または(B)前記ゲノム領域の定量的AF値が前記AF閾値以上の場合、推定生殖系列起源である、ステップとを含む方法。

請求項9

対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源または生殖系列起源であると識別するための方法であって、第1の時点で集められた前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、第1のcfDNAシーケンシングリードを含む、ステップと、前記複数のゲノム遺伝子座からの配列情報を提供するステップと、前記複数のゲノム遺伝子座における前記複数のゲノム遺伝子座のそれぞれのビニングを実施するステップであって、前記ビニングが、前記複数のゲノム遺伝子座内の各ゲノム遺伝子座に最初の分類を割り当てることを含み、前記最初の分類が、a)推定体細胞起源;b)推定生殖系列起源;またはc)起源不確定からなる群から選択され、それにより、推定体細胞起源であるゲノム遺伝子座を含む第1のビン、推定生殖系列起源であるゲノム遺伝子座を含む第2のビン、および起源不確定であるゲノム遺伝子座を含む第3のビンを生成するステップと、前記第1のビン、前記第2のビン、および前記第3のビン内の前記ゲノム領域のそれぞれについて、定量的対立遺伝子画分(AF)値が前記第1のcfDNAシーケンシングリードに基づき、それぞれ第1のAFセット、第2のAFセット、および第3のAFセットを生成するステップと、前記第1のAFセットに基づく第1の度数分布および前記第2のAFセットに基づく第2の度数分布を生成するステップであって、前記第1の度数分布と前記第2の度数分布の間に重複が存在する、ステップと、第1のAF閾値を前記第1および第2の度数分布に基づいて識別するステップであって、この第1のAF閾値が、前記第1のAFセットの中で最大の定量的AF値である、ステップと、第2のAF閾値を前記第1および第2の度数分布に基づいて識別するステップであって、この第2のAF閾値が、前記第2のAFセットの中で最小の定量的AF値である、ステップと、前記複数のゲノム遺伝子座のそれぞれに最終的な分類を割り当てるステップであって、前記最終的な分類が、(A)前記ゲノム領域の定量的AF値が前記第1のAF閾値以下の場合、推定体細胞起源であり、(B)前記ゲノム領域の定量的AF値が前記第2のAF閾値以上の場合、推定生殖系列起源であり、または(C)前記ゲノム領域の定量的AF値が前記第1のAF閾値を超え、かつ前記第2のAF閾値未満の場合、不明確である、ステップとを含む方法。

請求項10

対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードのセットを含む、ステップと、定量的対立遺伝子画分(AF)値の第1のセットを決定するステップであって、前記AF値の第1のセットが、前記cfDNAシーケンシングリードに基づく前記複数のゲノム遺伝子座のそれぞれについてのAF値を含む、ステップと、AF値の第2のセットを提供するステップであって、前記AF値の第2のセットが、1つまたは複数の既知体細胞変異体のそれぞれについてのAF値を含む、ステップと、前記AF値の第1のセット由来のゲノム遺伝子座からのAF値と前記AF値の第2のセット由来のAF値を比較するステップと、ゲノム遺伝子座についての前記AF値の第1のセット由来の前記AF値と前記AF値の第2のセット由来の前記AF値の差異が10%またはそれ未満である場合、ゲノム遺伝子座を体細胞起源であると識別するステップとを含む方法。

請求項11

前記AF値の第2のセットが、前記cfDNAシーケンシングリードに基づく第2の複数のゲノム遺伝子座のAF値を含む、請求項10に記載の方法。

請求項12

前記AF値の第2のセットが、複数の対照の対象由来のcfDNAからの複数のゲノム遺伝子座からのAF値を含む、請求項10に記載の方法。

請求項13

対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて生殖系列起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードのセットを含む、ステップと、定量的対立遺伝子画分(AF)値の第1のセットを決定するステップであって、前記AF値の第1のセットが、前記cfDNAシーケンシングリードに基づく前記複数のゲノム遺伝子座のそれぞれについてのAF値を含む、ステップと、AF値の第2のセットを提供するステップであって、前記AF値の第2のセットが、1つまたは複数の既知の体細胞変異体のそれぞれについてのAF値を含む、ステップと、前記AF値の第1のセット由来のゲノム遺伝子座のAF値と前記AF値の第2のセット由来のAF値を比較するステップと、ゲノム遺伝子座についての前記AF値の第1のセット由来の前記AF値と前記AF値の第2のセット由来の前記AF値の差異が10%を超える場合、ゲノム遺伝子座を生殖系列起源であると識別するステップとを含む方法。

請求項14

前記AF値の第2のセットが、前記cfDNAシーケンシングリードに基づく第2の複数のゲノム遺伝子座からのAF値を含む、請求項13に記載の方法。

請求項15

前記AF値の第2のセットが、複数の対照の対象由来のcfDNAからの複数のゲノム遺伝子座からのAF値を含む、請求項13に記載の方法。

請求項16

対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて生殖系列起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードのセットを含む、ステップと、定量的対立遺伝子画分(AF)値の第1のセットを決定するステップであって、前記AF値の第1のセットが、前記cfDNAシーケンシングリードに基づく前記複数のゲノム遺伝子座のそれぞれについてのAF値を含む、ステップと、AF値の第2のセットを提供するステップであって、前記AF値の第2のセットが、1つまたは複数の既知の生殖系列変異体のそれぞれについてのAF値を含む、ステップと、前記AF値の第1のセット由来のゲノム遺伝子座のAF値と前記AF値の第2のセット由来のAF値を比較するステップと、ゲノム遺伝子座についての前記AF値の第1のセット由来の前記AF値と前記AF値の第2のセット由来の前記AF値の差異が10%またはそれ未満である場合、ゲノム遺伝子座を生殖系列起源であると識別するステップとを含む方法。

請求項17

前記AF値の第2のセットが、前記cfDNAシーケンシングリードに基づく第2の複数のゲノム遺伝子座のAF値を含む、請求項16に記載の方法。

請求項18

前記AF値の第2のセットが、複数の対照の対象由来のcfDNAからの複数のゲノム遺伝子座からのAF値を含む、請求項16に記載の方法。

請求項19

対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードのセットを含む、ステップと、定量的対立遺伝子画分(AF)値の第1のセットを決定するステップであって、前記AF値の第1のセットが、前記cfDNAシーケンシングリードに基づく前記複数のゲノム遺伝子座のそれぞれについてのAF値を含む、ステップと、AF値の第2のセットを提供するステップであって、前記AF値の第2のセットが、1つまたは複数の既知の生殖系列変異体のそれぞれについてのAF値を含む、ステップと、前記AF値の第1のセット由来のゲノム遺伝子座のAF値と前記AF値の第2のセット由来のAF値を比較するステップと、ゲノム遺伝子座についての前記AF値の第1のセット由来の前記AF値と前記AF値の第2のセット由来の前記AF値の差異が10%を超える場合、ゲノム遺伝子座を体細胞起源であると識別するステップとを含む方法。

請求項20

前記AF値の第2のセットが、前記cfDNAシーケンシングリードに基づく第2の複数のゲノム遺伝子座のAF値を含む、請求項19に記載の方法。

請求項21

前記AF値の第2のセットが、複数の対照の対象由来のcfDNAの複数のゲノム遺伝子座からのAF値を含む、請求項19に記載の方法。

請求項22

前記ゲノム遺伝子座の1つまたは複数が、BRCA遺伝子座である、前記請求項のいずれか一項に記載の方法。

請求項23

a)cfDNA分子配列リードのセットを提供するステップであって、前記配列リードが、参照ゲノムの選択されたゲノム領域(例えば、遺伝子、エクソンイントロン、遺伝子の一部分(例えば、少なくとも100ヌクレオチド、少なくとも500ヌクレオチド、または少なくとも1000ヌクレオチド))にマッピングされる、ステップと、b)前記ゲノム領域内の複数の遺伝子変異体(例えば、参照配列とは異なるヌクレオチド)を含むセットの対立遺伝子頻度を決定するステップであって、前記セットが、目的の変異体を含む、ステップと、c)前記セット内の前記遺伝子変異体の前記対立遺伝子頻度の変動性値(例えば、標準偏差または分散)を決定するステップと、d)変動性値閾値および対立遺伝子頻度閾値を提供するステップと、e)前記変動性値が前記変動性閾値を下回るかどうかを決定するステップと、f)前記変動性値が前記変動性閾値を下回る場合、(i)前記目的の変異体の前記対立遺伝子頻度が前記対立遺伝子頻度閾値を上回る場合には前記目的の変異体が生殖系列起源を有するとコールし、(ii)前記目的の変異体の前記対立遺伝子頻度が前記対立遺伝子頻度閾値を下回る場合には前記目的の変異体が体細胞起源を有するとコールするステップとを含む、方法。

技術分野

0001

相互参照
本出願は、その全体が参照により本明細書に組み込まれる、2017年5月16日出願の米国仮出願第62/507,127号の利益を主張するものである。

背景技術

0002

背景
対象のゲノム参照ゲノム(例えば、GRCh38.p4)の比較により、一般には、塩基の約0.01%に差異遺伝子変異)が示される。生殖系列遺伝子変異体は、通常の遺伝または生殖細胞突然変異によって伝達されるSNPであり得る。変異は、ホモ接合性形態またはヘテロ接合性形態で存在する。

0003

がんなどのある特定の病理学的状態は、生殖系列ゲノムと比較した病的細胞のゲノムの遺伝子変異を特徴とする。これらの変異は、体細胞性突然変異に起因し、体細胞突然変異と称される。

0004

体細胞突然変異を有するポリヌクレオチドは、無細胞DNA(cfDNA)において検出することができ、cfDNAでは体細胞突然変異を有するポリヌクレオチドは生殖系列ゲノムを有する細胞由来のDNAと混在する。cfDNA中に大きなバックグラウンド(生殖系列)が存在する場合、コンピュータにより実行されるプロセスでは生殖系列変異体と体細胞突然変異を自動的に弁別することができない。その代わりに、従来のシステムは、体細胞突然変異を生殖系列突然変異と区別するために、個々のヒト専門家または専門家の共同体(いずれの場合もTumor Boardと称される)の専門知識に依拠している。

0005

ノイズおよび偏りが存在しない場合、生殖系列変異体は、対立遺伝子画分が50%(ヘテロ接合性(het)遺伝子座の場合)または100%(ホモ接合性(homo)遺伝子座の場合)のものになる。しかし、実際には、システムにノイズおよび偏りが存在することにより、これらの明快数字が不明確になる。言い換えれば、hetまたはhomo遺伝子座は、正確に50%または100%では検出されないが、その代わりに、hetカテゴリーおよびhomoカテゴリーのそれぞれについて信頼度上下限の間で検出される。例えば、het遺伝子座は40%〜60%の範囲であり得、一方、homo遺伝子座は98%〜100%の範囲であり得る。

課題を解決するための手段

0006

要旨
本開示の単に例示的な実施形態が示され、説明されている以下の詳細な説明から本開示の追加的な態様および利点が当業者には容易に明らかになろう。理解される通り、本開示は、他の異なる実施形態でも可能であり、そのいくつかの詳細は全て本開示から逸脱することなく種々の明白な点で改変可能である。したがって、図および説明は、実際に例示的であり、限定的なものではないとみなされるべきである。

0007

一態様では、本開示は、対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードを含む、ステップと、前記複数のゲノム遺伝子座のそれぞれについての定量的対立遺伝子画分(AF)値(quantitative allele fraction (AF) measure)を前記cfDNAシーケンシングリードに基づいて決定するステップと、前記AF値(AF measure)のそれぞれについて標準偏差STDEV)を決定するステップと、STDEV閾値およびAF閾値を提供するステップと、前記AF値のそれぞれのSTDEVが前記STDEV閾値を上回るかまたは下回るかを決定するステップと、前記AF値のそれぞれが前記AF閾値を上回るかまたは下回るかを決定するステップと、STDEVが前記STDEV閾値を下回り、かつAF値が前記AF閾値を下回る各遺伝子座を、体細胞起源であると分類するステップとを含む方法を提供する。

0008

一態様では、本開示は、対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて生殖系列起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードを含む、ステップと、前記複数のゲノム遺伝子座のそれぞれについての定量的対立遺伝子画分(AF)値を前記cfDNAシーケンシングリードに基づいて決定するステップと、前記AF値のそれぞれについて標準偏差(STDEV)を決定するステップと、STDEV閾値およびAF閾値を提供するステップと、前記AF値のそれぞれのSTDEVが前記STDEV閾値を上回るかまたは下回るかを決定するステップと、前記AF値のそれぞれが前記AF閾値を上回るかまたは下回るかを決定するステップと、STDEVが前記STDEV閾値を下回り、かつAF値が前記AF閾値を上回る各遺伝子座を、生殖系列起源であると分類するステップとを含む方法を提供する。

0009

一部の実施形態では、ゲノム遺伝子座についてのAF値が前記STDEV閾値を下回ることにより、前記ゲノム遺伝子座に関して低いコピー数多型(CNV)が示される。

0010

一部の実施形態では、ゲノム遺伝子座についてのAF値が前記STDEV閾値を上回ることにより、関連するゲノム遺伝子座に関して高いコピー数多型(CNV)が示される。

0011

一部の実施形態では、AF閾値は、経験的に決定される。

0012

一態様では、本開示は、がんを有する対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源であると識別するための方法であって、がん治療薬を用いた処置前の第1の時点で前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードの第1のセットを含む、ステップと、がん治療薬を用いた処置後の第2の時点で前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードの第2のセットを含む、ステップと、前記複数のゲノム遺伝子座のそれぞれについての定量的対立遺伝子画分(AF)値を、前記第1の時点の前記cfDNAシーケンシングリード、および前記第2の時点の前記cfDNAシーケンシングリードに基づいて決定するステップと、前記第1の時点の前記AF値と前記第2の時点の前記AF値を比較するステップであって、前記がんが、前記がん治療薬に対して応答性である、ステップと、ゲノム遺伝子座のAF値が前記第1の時点と前記第2の時点の間に低減する場合、前記ゲノム遺伝子座を体細胞起源であると識別するステップとを含む方法を提供する。

0013

一態様では、本開示は、がんを有する対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて生殖系列起源であると識別するための方法であって、がん治療薬を用いた処置前の第1の時点で前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードの第1のセットを含む、ステップと、がん治療薬を用いた処置後の第2の時点で前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードの第2のセットを含む、ステップと、前記複数のゲノム遺伝子座のそれぞれについての定量的対立遺伝子画分(AF)値を、前記第1の時点の前記cfDNAシーケンシングリード、および前記第2の時点の前記cfDNAシーケンシングリードに基づいて決定するステップと、前記第1の時点の前記AF値と前記第2の時点の前記AF値を比較するステップであって、前記がんが、前記がん治療薬に対して応答性である、ステップと、ゲノム遺伝子座のAF値が前記第1の時点と前記第2の時点の間に低減しない場合、前記ゲノム遺伝子座を生殖系列起源であると識別するステップとを含む方法を提供する。

0014

一態様では、本開示は、対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源または生殖系列起源であると識別するための方法であって、第1の時点で集められた前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、第1のcfDNAシーケンシングリードを含む、ステップと、前記複数のゲノム遺伝子座からの配列情報を提供するステップと、前記複数のゲノム遺伝子座のそれぞれのビニングを実施するステップであって、前記ビニングが、前記複数のゲノム遺伝子座内の各ゲノム遺伝子座に最初の分類を割り当てることを含み、前記最初の分類が、a)推定体細胞起源;b)推定生殖系列起源;またはc)起源不確定からなる群から選択され、それにより、推定体細胞起源であるゲノム遺伝子座を含む第1のビン、推定生殖系列起源であるゲノム遺伝子座を含む第2のビン、および起源不確定であるゲノム遺伝子座を含む第3のビンを生成する、ステップと、前記第1のビン、前記第2のビン、および前記第3のビン内の前記ゲノム領域のそれぞれについて、定量的対立遺伝子画分(AF)値を前記第1のcfDNAシーケンシングリードに基づいて決定して、それぞれ第1のAFセット、第2のAFセット、および第3のAFセットを生成するステップと、前記第1のAFセットに基づく第1の度数分布および前記第2のAFセットに基づく第2の度数分布を生成するステップであって、前記第1の度数分布と前記第2の度数分布の間に重複が存在しない、ステップと、AF閾値を前記第1および第2の度数分布に基づいて識別するステップであって、AF閾値が、(i)前記第1のAFセットの中で最大の定量的AF値以上かつ(ii)前記第2のAFセットの中で最小の定量的AF値以下である、ステップと、前記ゲノム遺伝子座の第3のビンのそれぞれに最終的な分類を割り当てるステップであって、最終的な分類が、(A)前記ゲノム遺伝子座の定量的AF値が前記AF閾値以下の場合、推定体細胞起源であり、または(B)前記ゲノム領域の定量的AF値が前記AF閾値以上の場合、推定生殖系列起源である、ステップとを含む方法を提供する。

0015

一態様では、本開示は、対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源または生殖系列起源であると識別するための方法であって、第1の時点で集められた前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、第1のcfDNAシーケンシングリードを含む、ステップと、前記複数のゲノム遺伝子座からの配列情報を提供するステップと、前記複数のゲノム遺伝子座における前記複数のゲノム遺伝子座のそれぞれのビニングを実施するステップであって、前記ビニングが、前記複数のゲノム遺伝子座内の各ゲノム遺伝子座に最初の分類を割り当てることを含み、前記最初の分類が、a)推定体細胞起源;b)推定生殖系列起源;またはc)起源不確定からなる群から選択され、それにより、推定体細胞起源であるゲノム遺伝子座を含む第1のビン、推定生殖系列起源であるゲノム遺伝子座を含む第2のビン、および起源不確定であるゲノム遺伝子座を含む第3のビンを生成する、ステップと、前記第1のビン、前記第2のビン、および前記第3のビン内の前記ゲノム領域のそれぞれについて、定量的対立遺伝子画分(AF)値を前記第1のcfDNAシーケンシングリードに基づいて決定して、それぞれ第1のAFセット、第2のAFセット、および第3のAFセットを生成するステップと、前記第1のAFセットに基づく第1の度数分布および前記第2のAFセットに基づく第2の度数分布を生成するステップであって、前記第1の度数分布と前記第2の度数分布の間に重複が存在する、ステップと、第1のAF閾値を前記第1および第2の度数分布に基づいて識別するステップであって、第1のAF閾値が、前記第1のAFセットの中で最大の定量的AF値である、ステップと、第2のAF閾値を前記第1および第2の度数分布に基づいて識別するステップであって、第2のAF閾値が、前記第2のAFセットの中で最小の定量的AF値である、ステップと、前記複数のゲノム遺伝子座のそれぞれに最終的な分類を割り当てるステップであって、前記最終的な分類が、(A)前記ゲノム領域の定量的AF値が前記第1のAF閾値以下の場合、推定体細胞起源であり、(B)前記ゲノム領域の定量的AF値が前記第2のAF閾値以上の場合、推定生殖系列起源であり、または(C)前記ゲノム領域の定量的AF値が前記第1のAF閾値を超え、かつ前記第2のAF閾値未満の場合、不明確である、ステップとを含む方法を提供する。

0016

一態様では、本開示は、対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードのセットを含む、ステップと、定量的対立遺伝子画分(AF)値の第1のセットを決定するステップであって、前記AF値の第1のセットが、前記cfDNAシーケンシングリードに基づく前記複数のゲノム遺伝子座のそれぞれについてのAF値を含む、ステップと、AF値の第2のセットを提供するステップであって、前記AF値の第2のセットが、1つまたは複数の既知体細胞変異体のそれぞれについてのAF値を含む、ステップと、前記AF値の第1のセット由来のゲノム遺伝子座のAF値と前記AF値の第2のセット由来のAF値を比較するステップと、ゲノム遺伝子座についての前記AF値の第1のセット由来の前記AF値と前記AF値の第2のセット由来の前記AF値の差異が10%またはそれ未満である場合、ゲノム遺伝子座を体細胞起源であると識別するステップとを含む方法を提供する。

0017

一部の実施形態では、前記AF値の第2のセットは、前記cfDNAシーケンシングリードに基づく第2の複数のゲノム遺伝子座のAF値を含む。

0018

一部の実施形態では、前記AF値の第2のセットは、複数の対照の対象由来のcfDNAの複数のゲノム遺伝子座のAF値を含む。

0019

一態様では、本開示は、対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて生殖系列起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードのセットを含む、ステップと、定量的対立遺伝子画分(AF)値の第1のセットを決定するステップであって、前記AF値の第1のセットが、前記cfDNAシーケンシングリードに基づく前記複数のゲノム遺伝子座のそれぞれについてのAF値を含む、ステップと、AF値の第2のセットを提供するステップであって、前記AF値の第2のセットが、1つまたは複数の既知の体細胞変異体のそれぞれについてのAF値を含む、ステップと、前記AF値の第1のセット由来のゲノム遺伝子座のAF値と前記AF値の第2のセット由来のAF値を比較するステップと、ゲノム遺伝子座についての前記AF値の第1のセット由来の前記AF値と前記AF値の第2のセット由来の前記AF値の差異が10%を超える場合、ゲノム遺伝子座を生殖系列起源であると識別するステップとを含む方法を提供する。

0020

一部の実施形態では、前記AF値の第2のセットは、前記cfDNAシーケンシングリードに基づく第2の複数のゲノム遺伝子座のAF値を含む。

0021

一部の実施形態では、前記AF値の第2のセットは、複数の対照の対象由来のcfDNAの複数のゲノム遺伝子座のAF値を含む。

0022

一態様では、本開示は、対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて生殖系列起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードのセットを含む、ステップと、定量的対立遺伝子画分(AF)値の第1のセットを決定するステップであって、前記AF値の第1のセットが、前記cfDNAシーケンシングリードに基づく前記複数のゲノム遺伝子座のそれぞれについてのAF値を含む、ステップと、AF値の第2のセットを提供するステップであって、前記AF値の第2のセットが、1つまたは複数の既知の生殖系列変異体のそれぞれについてのAF値を含む、ステップと、前記AF値の第1のセット由来のゲノム遺伝子座のAF値と前記AF値の第2のセット由来のAF値を比較するステップと、ゲノム遺伝子座についての前記AF値の第1のセット由来の前記AF値と前記AF値の第2のセット由来の前記AF値の差異が10%またはそれ未満である場合、ゲノム遺伝子座を生殖系列起源であると識別するステップとを含む方法を提供する。

0023

一部の実施形態では、前記AF値の第2のセットは、前記cfDNAシーケンシングリードに基づく第2の複数のゲノム遺伝子座のAF値を含む。

0024

一部の実施形態では、前記AF値の第2のセットは、複数の対照の対象由来のcfDNAの複数のゲノム遺伝子座のAF値を含む。

0025

一態様では、本開示は、対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて体細胞起源であると識別するための方法であって、前記対象由来の前記cfDNAからのシーケンシング情報を受け取るステップであって、前記シーケンシング情報が、前記複数のゲノム遺伝子座由来のcfDNAシーケンシングリードのセットを含む、ステップと、定量的対立遺伝子画分(AF)値の第1のセットを決定するステップであって、前記AF値の第1のセットが、前記cfDNAシーケンシングリードに基づく前記複数のゲノム遺伝子座のそれぞれについてのAF値を含む、ステップと、AF値の第2のセットを提供するステップであって、前記AF値の第2のセットが、1つまたは複数の既知の生殖系列変異体のそれぞれについてのAF値を含む、ステップと、前記AF値の第1のセット由来のゲノム遺伝子座のAF値と前記AF値の第2のセット由来のAF値を比較するステップと、ゲノム遺伝子座についての前記AF値の第1のセット由来の前記AF値と前記AF値の第2のセット由来の前記AF値の差異が10%を超える場合、ゲノム遺伝子座を体細胞起源であると識別するステップとを含む方法を提供する。

0026

一部の実施形態では、前記AF値の第2のセットは、前記cfDNAシーケンシングリードに基づく第2の複数のゲノム遺伝子座のAF値を含む。

0027

一部の実施形態では、前記AF値の第2のセットは、複数の対照の対象由来のcfDNAの複数のゲノム遺伝子座のAF値を含む。

0028

一部の実施形態では、前記ゲノム遺伝子座の1つまたは複数は、BRCA遺伝子座である。

0029

一態様では、本開示は、a)cfDNA分子配列リードのセットを提供するステップであって、前記配列リードが、参照ゲノムの選択されたゲノム領域(例えば、遺伝子、エクソンイントロン、遺伝子の一部分(例えば、少なくとも100ヌクレオチド、少なくとも500ヌクレオチド、または少なくとも1000ヌクレオチド))にマッピングされる、ステップと、b)ゲノム領域内の複数の遺伝子変異体(例えば、参照配列とは異なるヌクレオチド)を含むセットの対立遺伝子頻度を決定するステップであって、セットが、目的の変異体を含む、ステップと、c)セット内の遺伝子変異体の対立遺伝子頻度の変動性値(measure of variability)(例えば、標準偏差または分散)を決定するステップと、d)変動性値閾値および対立遺伝子頻度閾値を提供するステップと、e)変動性値が変動性閾値を下回るかどうかを決定するステップと、f)変動性値が変動性閾値を下回る場合、(i)目的の変異体の対立遺伝子頻度が対立遺伝子頻度閾値を上回る場合には目的の変異体を、生殖系列起源を有するとコールし、(ii)目的の変異体の対立遺伝子頻度が対立遺伝子頻度閾値を下回る場合には目的の変異体が、体細胞起源を有するとコールするステップとを含む方法を提供する。

0030

参照による組込み
本明細書において言及されている全ての刊行物、特許および特許出願は、個々の刊行物、特許、または特許出願が、具体的にかつ個別に参照により組み込まれることが示されたものと同じく参照により本明細書に組み込まれる。参照により組み込まれている刊行物および特許または特許出願が本明細書に含有される本開示と矛盾する限りでは、本明細書は、あらゆるそのような矛盾する材料に取って代わり、かつ/またはそれに優先するものとする。

0031

本開示の新規の特徴は、添付の特許請求の範囲において詳細に記載されている。本開示の原理が利用される例示的な実施形態が記載されている以下の詳細な説明およびその付属図を参照することにより、本開示の特徴および利点のよりよい理解が得られる。

図面の簡単な説明

0032

図1は、本明細書で提供される方法を実行するようにプログラミングされたまたは他のやり方で設定されたコンピュータ制御システムを示す図である。

0033

図2Aは、生殖系列T790M突然変異(201−黒色ドット)が体細胞T790M突然変異(202−灰色のドット)と同様の濃度であるが、より高い対立遺伝子画分(AF)で存在することを示すグラフである。

0034

図2Bは、処置時の患者4名において体細胞EGFR突然変異の濃度は低下するが、生殖系列EGFRT790Mの濃度は一定のままであることを示すグラフである(203はEGFRドライバー突然変異を表し、204はEGFR T790Mを表す)。

0035

図2Cは、950事例に関する血漿NGS結果にわたるEGFRT790M(下のプロット)についてのAF分布が、EGFRドライバー突然変異(上のプロット)でも見られる体細胞性ピーク、ならびに共通のSNP(EGFR Q787Q、真ん中のプロット)でもより明白に見られるヘテロ接合性ピーク(矢印)を含むことを示すグラフである。

0036

図3Aは、全て生殖系列EGFRT790M陽性である、最初の3事例由来の処置前および処置時の血漿検体についての血漿NGSを示すグラフである。3群の変異体が、検出された全てのコード変異体および非コード変異体の間で明白であり、これは、ホモ接合性変異体、ヘテロ接合性変異体、および腫瘍由来変異体の予測AFに対応する。腫瘍由来群の変異体は、治療時に応答したが、ホモ接合性群およびヘテロ接合性群の変異体ではAFは比較的一定のままであった。

0037

図3Bは、追加で102事例、合計で105事例についての血漿NGS結果を示すグラフである。105事例にわたって検出された全てのコード変異体および非コード変異体について、0%付近おそらく腫瘍由来)、49%付近(おそらくヘテロ接合性)、および100%付近(おそらくホモ接合性)にピークを有する3峰性分布が見られた。

0038

図3Cは、ミスセンス変異体およびナンセンス変異体に関して、腫瘍由来変異体が見いだされると予測される低AFで富化が見られた(矢印)ことを示すグラフである。対照的に、良性生殖系列多型を反映する可能性がある同義の変異体はおよそ50%AFおよび100%AFで富化された。

0039

図4Aは、EGFR突然変異について陽性の105事例の血漿NGSにおいて見いだされた全ての変異体のAFを、EGFRドライバー突然変異AFが低い方から順に示し(401−黒色のドット)、それと共に共通のEGFR SNPを示す(402−より大きな灰色のドット)グラフである。

0040

図4Bは、25%から75%の間の変異体AFに関して、標準偏差および事例と集団平均の間の絶対的な差異が、EGFRドライバーAFが増加するにつれて増大することを示すグラフである。

0041

図5は、低いコピー数多型を有する事例におけるヘテロ接合性コード変異体と腫瘍由来コード変異体の間の区別を示すグラフである。図5は、より低いコピー数多型が存在する場合、いずれの事例の生殖系列EGFRT790M(501)が生殖系列である可能性が高いかを視覚的に区別することが可能であることも示す。

0042

図6Aは、NGS結果により、31,414名の固有のがん患者のデータベースからの48名(0.15%)のがん患者が、生殖系列EGFRT790M突然変異を有し、これらの患者では非扁平上皮非小細胞肺がん(NSCLC)が優性診断になることが見いだされたことが明らかになることを示す表である。

0043

図6Bは、参照コホートにおける生殖系列EGFRT790Mの集団有病率と比較して(0.008%)、非扁平上皮NSCLCを有する対象における有病率は高い(0.34%)が、他のがんを有する対象では高くなく(0.03%、p=0.06)、これにより、生殖系列EGFR T790Mが肺がんリスク変異体であることが示唆されることを示すグラフである。

0044

図7は、3つの時点で検出されたコード変異体および非コード変異体のAFプロット(時点2におけるTP53突然変異のAFを0%とした)を示すグラフである。EGFRT790M突然変異が共通のSNP(EGFR Q787Q)を含む変異体のバンド内に見られ、これは偶発的に検出された生殖系列EGFR T790Mの疑いがある。

0045

図8Aは、外れ値が存在するが、曲線を標準偏差に当てはめることができることを示すグラフである。

0046

図8Bは、外れ値が存在するが、曲線を平均値に当てはめることができることを示すグラフである。

0047

図9は、低いコピー数多型および高AFのEGFRT790Mを有するものと示される血漿NGSの11事例(コホートA)(左側)の中で、11事例全てが生殖系列であることが確認された(100%陽性的中率)ことを示すグラフである。高いコピー数多型および高AFのEGFR T790Mを有する10事例(コホートB)の中では(右側)、1事例が生殖系列T790M突然変異について陽性であった。

0048

詳細な説明
本明細書で使用される節の見出しは、単に組織化する目的のものであり、記載されている主題を多少なりとも限定するものとは解釈されない。

0049

この種々の実施形態の詳細な説明では、説明のために、多数の特定の詳細を記載して、開示される実施形態の詳細な理解を提供する。しかし、これらの種々の実施形態はこれらの特定の詳細を用いても用いなくても実施できることが当業者には理解されよう。他の場合では、構造およびデバイスブロック図の形態で示されている。さらに、当業者は、方法が提示され実施されている特定の順序は例示的なものであり、その順序は、変動させることができ、それでもなお、本明細書に開示される種々の実施形態の主旨および範囲内に留まることが意図されていることを容易に理解することができる。

0050

これだけに限定されないが、特許、特許出願、論文書籍専門書、およびインターネットウェブページを含めた、本出願において引用されている文献および類似した材料は全て、あらゆる目的に関して明白にその全体が参照により組み込まれる。別段の記載がなければ、本明細書において使用される全ての科学技術用語は、本明細書に記載の種々の実施形態が属する当業者に一般に理解されている意味を有する。

0051

本教示において考察されている温度、濃度、時間、塩基の数、カバレッジなどの前には含意的に「約」が存在し、したがって、軽微なほんのわずかな等価物が本教示の範囲内に入ることが理解されよう。本出願では、単数の使用は、他に特に指定がなければ複数を含む。また、「含む(comprise)」、「含む(comprises)」、「含む(comprising)」、「含有する(contain)」、「含有する(contains)」、「含有する(containing)」、「含む(include)」、「含む(includes)」、および「含む(including)」の使用は、限定するものではない。前述の一般的な説明および以下の詳細な説明はどちらも、単に例示的かつ説明的なものであり、本教示を制限するものではないことが理解されるべきである。

0052

本明細書で使用される場合、「1つの(a)」または「1つの(an)」は、「少なくとも1つの(at least one)」または「1つまたは複数の(one or more)」も指す場合がある。また、「または(or)」の使用は包括的なものであり、したがって、「AまたはB(A or B)」というは、「A」が真の場合、「B」が真の場合、または「A」および「B」の両方が真の場合に、真である。

0053

さらに、文脈により必要とされない限り、単数の用語は、複数を含むものとし、複数の用語は、単数を含むものとする。一般に、本明細書に記載の細胞および組織培養分子生物学、ならびにタンパク質およびオリゴヌクレオチドまたはポリヌクレオチド化学およびハイブリダイゼーションに関連して利用される命名法、およびそれらの技法は、当技術分野で周知であり、一般に使用されるものである。標準の技法は、例えば、核酸の精製および調製、化学的分析組換え核酸、およびオリゴヌクレオチド合成のために使用される。酵素反応および精製技法は、製造者仕様書に従って、または当技術分野において一般に実現される通りまたは本明細書に記載の通り実施される。本明細書に記載の技法および手順は、一般に、当技術分野で周知であり、また、本明細書全体を通して引用され、考察されている種々の一般的なおよびより詳細な参考文献に記載されている通り従来の方法に従って実施される。例えば、Sambrookら、Molecular Cloning: A Laboratory Manual(第3版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、N.Y. 2000年)を参照されたい。本明細書に関連して利用される命名法、および本明細書に記載の実験手順および技法は、当技術分野で周知であり、一般に使用されるものである。

0054

「システム」とは、全体を構成する実際のまたは抽象的な構成要素のセットであって、全体の中で各構成要素が少なくとも1つの他の構成要素と相互作用するまたは関連する、構成要素のセットを説明する。

0055

生体分子」は、タンパク質、多糖、脂質、および核酸(DNAおよびRNA)などの大きなポリマー分子、ならびに一次代謝産物二次代謝産物、および他の天然物などの小分子を含めた、生物学的な生物体によって産生される任意の分子を指し得る。

0056

本明細書で使用される場合、「シーケンシング」という用語は、生体分子、例えば、DNAまたはRNAなどの核酸の配列を決定するために使用されるいくつもの技術のうちのいずれかを指す。例示的なシーケンシング法としては、これだけに限定されないが、標的化シーケンシング、単一分子リアルタイムシーケンシング、エクソンシーケンシング、電子顕微鏡に基づくシーケンシング、パネルシーケンシング、トランジスタ媒介性シーケンシング、ダイレクトシーケンシング、ランダムショットガンシーケンシング、サンガージデオキシターミネーションシーケンシング、全ゲノムシーケンシング、ハイブリダイゼーションによるシーケンシング、パイロシーケンシングキャピラリー電気泳動ゲル電気泳動、2重鎖シーケンシング、サイクルシーケンシング、一塩基伸長シーケンシング、固相シーケンシング、ハイスループットシーケンシング、大規模並列処理シグネチャーシーケンシング、エマルジョンPCR、低変性温度での共増幅−PCR(COLD−PCR)、多重PCR、可逆的ダイターミネーターによるシーケンシング、ペアエンドシケンシング短期シーケンシング、エキソヌクレアーゼシーケンシング、ライゲーションによるシーケンシング、ショートリードシーケンシング、単一分子シーケンシング、合成によるシーケンシング、リアルタイムシーケンシング、リバースターミネーターシーケンシング、ナノポアシーケンシング、454シーケンシング、Solexa Genome Analyzerシーケンシング、SOLiD(商標)シーケンシング、MS−PETシーケンシング、およびこれらの組合せが挙げられる。一部の実施形態では、シーケンシングは、例えば、IlluminaまたはApplied Biosystemsから市販されている遺伝子分析機器などの遺伝子分析機器によって実施することができる。

0057

「次世代シーケンシング」またはNGSという句は、従来のサンガー法に基づく手法およびキャピラリー電気泳動に基づく手法と比較してスループットが増大しており、例えば、何十万の比較的小さな配列リードを一度に生成する能力を有するシーケンシング技術を指す。次世代シーケンシング技法のいくつかの例として、これだけに限定されないが、合成によるシーケンシング、ライゲーションによるシーケンシング、およびハイブリダイゼーションによるシーケンシングが挙げられる。

0058

「シーケンシング実行」という句は、少なくとも1つの生体分子(例えば、DNAまたはRNAなどの核酸分子)に関するいくつかの情報を決定するために実施されるシーケンシング実験の任意のステップまたは部分を指す。

0059

DNA(デオキシリボ核酸)は、4種のヌクレオチド;アデニン(A)、チミン(T)、シトシン(C)、およびグアニン(G)を含むヌクレオチドの鎖である。RNA(リボ核酸)は、4種のヌクレオチド;A、ウラシル(U)、G、およびCを含むヌクレオチドの鎖である。ある特定のヌクレオチドの対は、互いと相補的に特異的に結合する(相補塩基対合と称される)。DNAでは、アデニン(A)とチミン(T)が対になり、シトシン(C)とグアニン(G)が対になる。RNAでは、アデニン(A)とウラシル(U)が対になり、シトシン(C)とグアニン(G)が対になる。第1の核酸鎖が、第1の鎖内のヌクレオチドと相補的なヌクレオチドで構成される第2の核酸鎖と結合する場合、これらの2つの鎖が結合して二本鎖を形成する。本明細書で使用される場合、「核酸シーケンシングデータ」、「核酸シーケンシング情報」、「核酸配列」、「ヌクレオチド配列」、「ゲノム配列」、「遺伝子配列」、もしくは「断片配列」、または「核酸シーケンシングリード」は、DNAまたはRNAなどの核酸の分子(例えば、全ゲノム、全トランスクリプトームエキソーム、オリゴヌクレオチド、ポリヌクレオチド、または断片)内のヌクレオチド塩基(例えば、アデニン、グアニン、シトシン、およびチミンまたはウラシル)の順序を示すあらゆる情報またはデータを示す。本教示は、これだけに限定されないが、キャピラリー電気泳動、マイクロアレイ、ライゲーションに基づくシステム、ポリメラーゼに基づくシステム、ハイブリダイゼーションに基づくシステム、直接または間接的なヌクレオチド識別システム、パイロシーケンシング、イオンに基づくまたはpHに基づく検出システム、および電子署名に基づくシステムを含めた全ての利用可能な様々な技法、プラットフォームまたは技術を使用して得られた配列情報を意図していることが理解されるべきである。

0060

「ポリヌクレオチド」、「核酸」、または「オリゴヌクレオチド」は、ヌクレオシド間連結によって接合したヌクレオシド(デオキシリボヌクレオシドリボヌクレオシド、またはその類似体を含む)の直鎖状ポリマーを指す。一般には、ポリヌクレオチドは、少なくとも3つのヌクレオシドを含む。オリゴヌクレオチドは、多くの場合、サイズが数単量体単位、例えば3〜4から、数百単量体単位までにわたる。ポリヌクレオチドが「ATGCCTG」などの文字の配列で表されるときは必ず、特に断りのない限り、ヌクレオチドは左から右に5’→3’の順であること、および「A」はデオキシアデノシンを示し、「C」はデオキシシチジンを示し、「G」はデオキシグアノシンを示し、および「T」はチミジンを示すことが理解されよう。文字A、C、G、およびTは、当技術分野における標準である通り、塩基自体、ヌクレオシド、または塩基を含むヌクレオチドを指すために使用することができる。

0061

アダプター(単数または複数)(adaptor(s))」、「アダプター(単数または複数)(adapter(s))」および「タグ(単数または複数)」という用語は、本明細書全体を通して同義に使用される。アダプターまたはタグは、「タグ付けされる」ポリヌクレオチド配列に、ライゲーション、ハイブリダイゼーション、または他の手法を含めた任意の手法によってカップリングすることができる。

0062

本明細書で使用される場合、一般的な変異体は少なくとも5%のGMAF(全マイナー対立遺伝子頻度)を有し、一方、低頻度変異体は約0.1〜5%のGMAFを有し、稀な変異体は0.5%またはそれ未満のGMAFを有し、ここで、GMAFは、所与の集団内で最小の共通対立遺伝子が存在する頻度である。

0063

本明細書で使用される場合、「遺伝子型」は、1つまたは複数の生殖系列染色体上の遺伝子座における対立遺伝子の同一性を指す。これは、遺伝子座(「対立遺伝子の名称」)におけるホモ接合性またはヘテロ接合性の決定を含め、完全な遺伝子型(全ての染色体上の対立遺伝子の同一性)、部分的な遺伝子型(少なくとも1つの染色体上の対立遺伝子の同一性)およびヌル遺伝子型(1つまたは複数または全ての染色体上に存在しない対立遺伝子(単数または複数))を含む。

0064

本明細書で使用される場合、体細胞変異体とは、供給源がん性組織であるものを示す。本明細書で使用される場合、体細胞起源の遺伝子変異体とは、体細胞において最初に生じ、生殖系列において生じたものではない遺伝子変異体を指す。これは、正常な細胞が供給源である生殖系列変異体とは対照的である。変異は有糸分裂を通じて娘細胞に移り得る。その結果、生物体の残りの細胞との遺伝的差異を有する細胞の群が生じ得る。さらに、変異は生殖系列細胞では生じないので、突然変異は後代生物体に遺伝しない。

0065

SNPは、通常、生殖系列変異体に関して、集団における一塩基多型または変異を指し得るが、SNVは、一塩基変異体を指し得、SSNVは、体細胞一塩基変異体を指し得る(通常、がん関連変異体に関して使用される)。個体に対して、SNVという用語は、体細胞(がん性)cfDNAおよび生殖系列(正常な)cfDNAのどちらでも検出される変異に使用される。

0066

CNVは、コピー数変異体(遺伝子レベルコピー数突然変異、通常は重複事象に起因する)を指し得る。

0067

がんを有する対象由来の無細胞DNA(cfDNA)は、生殖系列ゲノムを有する細胞由来のDNA(例えば、「健康な細胞」由来)(「生殖系列DNA」)、および、一般には体細胞突然変異を有するがん細胞由来のDNA(「がんDNA」)の両方を含む。無細胞DNA試料中の生殖系列DNAおよびがんDNAの相対量は、がんがどのくらい進行しているかに依存する。初期では、ほんの少量のDNAが、がんDNAである。これは、例えば、総DNAの約1%〜5%であり得る。したがって、少量(例えば、試料中のcfDNAの約1%〜5%)の遺伝子変異体、マイナー対立遺伝子などの検出により、体細胞突然変異、したがって、がんDNAの存在が示され得る。しかし、疾患が進行し、腫瘍が増大するにつれ、無細胞DNA試料中のがんDNAの量が有意に、例えば総無細胞DNAの25%を超えるまでに増加し得る。遺伝子変異体を有するDNA分子のパーセンテージ高レベルに達すると、変異体ががん細胞に由来する体細胞突然変異を表すものなのか、または生殖系列DNAにおけるヘテロ接合性を表すものなのかが不明確になり得る。

0068

血漿cfDNAのゲノム解析は、ゲノムによる発見のため、および高精度のがん薬の送達補助するためのツールになり得るが、がん由来DNAの血漿への放出は、高度に変動し得、がんのステージ転移性拡散の程度、および、がんが応答するのかまたは進行するのかに依存する。さらに、体細胞性ゲノム変更の血漿中レベルは治療に応答して高度に動的であり得、時々2週間以内に検出不可能になる。結果として、多くの患者において、大多数の血漿cfDNAが生殖系列DNAであり、大部分は良性の造血細胞または内皮細胞から放出されるものである。本開示は、cfDNA次世代シーケンシング(NGS)プロファイル内で生殖系列変異体をがん由来の体細胞変異体と区別することができ、したがって、治療選択のための腫瘍の遺伝子型決定ならびに遺伝リスクを評価するための生殖系列の特徴付けの両方を単一のアッセイでもたらす手法を提供する。

0069

本開示によって提供される手法には、いくつもの適用がある。血漿NGSにより、時々、がん患者において、患者およびその家族に対して潜在的な臨床的意味がある偶発的な生殖系列突然変異が識別される。本明細書に記載のある特定の生殖系列EGFR突然変異は遺伝性がんリスクに関連すると考えられている稀なリスク対立遺伝子であり、また、本明細書に記載の手法を他の生殖系列突然変異に適用することもできる。他のがんに関連する遺伝子(例えば、TP53またはBRCA1/2およびミスマッチ修復遺伝子)も血漿NGSを用いてシーケンシングすることができ、これらの遺伝子の生殖系列突然変異は重大な臨床的意味を有し得る。本開示は、確認された生殖系列突然変異について、判定試験のための重要な診断能特性である陽性的中率が高く予測されたバイオインフォマテクスアルゴリズムを使用した、疑わしい生殖系列突然変異の存在について記載する。

0070

血漿cfDNA中の生殖系列と体細胞変異体の識別は、がん生物学の理解にも影響を及ぼし得る。腫瘍NGSでは、癌遺伝子における有意性が不明の変異体が潜在的なドライバー突然変異を表すものなのか、または生殖系列多型を表すものなのかを決定することが難しい場合がある。高いコピー数多型を伴わない血漿NGS事例では、本開示により、これらの2つの型のゲノム変更を単一の(血液)試料で弁別し、それにより、生殖系列多型が誤って治療標的とされるリスクを低下させることが可能になる。さらに、段階的な血漿遺伝子型決定を経時的に使用して治療に対する応答および抵抗性モニタリングする例では、血漿cfDNA中の生殖系列と体細胞変異体を区別できることにより、腫瘍DNAレベルの正確な追跡を容易にすることができる。

0071

腫瘍突然変異負荷量(TMB)は、免疫チェックポイント阻害剤に対する感受性および耐性を理解するための新興のバイオマーカーである。がん内の突然変異が多いほど、免疫賦活のための細胞表面新抗原がより多く導かれ得る。しかし、腫瘍NGSを使用して突然変異性負荷量を算出することは難しい可能性があり、これは、生殖系列多型が潜在的に抗原性の体細胞突然変異と間違えられる可能性があるからである。本開示は、この難題を克服し、それにより、生殖系列変異体と体細胞変異体をバイオインフォマティクスにより区別し、抗原性体細胞変異体をより明白に識別し、それにより、生殖系列多型が潜在的に抗原性の体細胞突然変異と間違えられることを減少させる能力を提供する。

0072

対象の生殖系列DNAは、いずれの遺伝子座においてもホモ接合性またはヘテロ接合性であり得る。遺伝子座における測定値は、試料中で対立遺伝子が観察される頻度を測定するものである対立遺伝子画分(AF)の形態をとり得る。種々の理由で(例えば、DNAシーケンシングのエラーを含む)、非がん対象のcfDNAから生成される配列リードのセットにおいて、対象がそれに関してホモ接合性である遺伝子座にマッピングされる対立遺伝子形態(例えば、SNV)についてのリード計数は正確に100%ではない可能性がある。同様に、対象がそれに関してヘテロ接合性である遺伝子座にマッピングされる対立遺伝子形態についてのリード計数は正確に50%ではない可能性がある。個体が生殖系列における遺伝子変異体に関してホモ接合性である場合(参照ゲノム内の対立遺伝子と一致しない、遺伝子変異体を有するベースコールのパーセンテージは、一般には、コールの100%と常に同一ではないがその付近になる。同様に、個体が生殖系列における遺伝子変異体についてヘテロ接合性である場合、遺伝子変異体を有するベースコールのパーセンテージは、一般には、50%付近になるが、例えば、30%から70%までにわたり得る。この範囲内の測定値は遺伝子座におけるヘテロ接合性と一致する。しかし、この測定値により決定が不明確になる可能性がある。この場合、遺伝子座における遺伝子型を、ある特定のレベルの信頼度または確率を伴ってヘテロ接合性またはホモ接合性とコールすることができる。

0073

したがって、対象ががんを有し、遺伝子座における遺伝子変異体がヘテロ接合性と一致する範囲に入ると測定される場合、変異体が体細胞突然変異に起因することの信頼度は、ホモ接合性とヘテロ接合性の間の範囲内の測定値と比較して低下し得る。例えば、測定値が5%〜20%の範囲内であることにより、遺伝子座が遺伝子変異体をホモ接合性によって説明されるには高すぎヘテロ接合性によって説明されるには低すぎる量で含有することが示され得る。したがって、測定値が体細胞突然変異の結果である可能性がある。対照的に、測定値が約40%であることにより、ヘテロ接合性が示され得る、または体細胞突然変異を含有するDNAの存在量が示され得る(例えば、その体細胞突然変異により、試料に対して大きな相対量のDNAを寄与した腫瘍が引き起こされた場合)。

0074

本開示は、とりわけ、無細胞DNA試料中で検出された遺伝子変異体の起源が生殖系列である(例えば、生殖系列におけるヘテロ接合性を表すものである)可能性が高いのか、または体細胞性(例えば、がん由来)である可能性が高いのかを決定する方法を提供する。特に、本開示は、AFを利用してこの決定を行う方法を提供する。

0075

一部の実施形態では、本開示は、遺伝子座における変異体が生殖系列起源であるのか、または体細胞起源であるのかを決定するために使用することができる1つまたは複数の閾値を用いて、対象由来の無細胞DNA(cfDNA)における複数のゲノム遺伝子座のそれぞれについて生殖系列であることまたは体細胞起源であることを識別するための方法を提供する。使用することができる1つの例示的な閾値は、標準偏差(STDEV)閾値である。例えば、当業者は、ゲノム遺伝子座についての定量的対立遺伝子画分(AF)を決定した後、AF値についてのSTDEVを決定することができる。コピー数多型(CNV)が増加するにつれ、STDEVも同様に増大すると予測される。したがって、低STDEVは低CNVを有すると仮定することができ、これにより、これらのデータを処理しやすくなる。STDEV閾値を使用して高CNVと低CNVを分離し、それにより、方法の予測力を増大させることができる。AFについての第2の閾値をCNV閾値と組み合わせてまたはその代わりに使用することができる。AF値は生殖系列由来の変異体において体細胞変異体よりも高くなることが予測されるので、AF閾値を上回るAF値を生殖系列由来に分類することができ、AF閾値を下回るAF値を体細胞由来に分類することができる。例示的なAF閾値としては、これだけに限定されないが、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、および約35%が挙げられる。一部の実施形態では、AF閾値は、経験的に決定される。

0076

本明細書に記載の方法は、cfDNA由来の遺伝子座が生殖系列起源のものであるのか、または体細胞起源のものであるのかを、処置に対する応答に基づいて決定するために使用することもできる。例えば、配列情報を、がんを有する対象から、がん治療薬を用いた処置前および処置後に得ることができる。がんががん治療薬に対して応答性であり、かつ、がん関連遺伝子座における変異体が体細胞起源のものである場合、そのAFは低下するはずである。したがって、AFを処置前および処置後に測定し、それらの値を比較して、体細胞起源であるのか、または生殖系列起源であるのかを決定することができる。AF値が低減する場合、変異体を体細胞起源のものであると識別することができる。AF値が低減しない(すなわち、同じままであるまたは増大する)場合、変異体を生殖系列起源のものであると識別することができる。

0077

一部の実施形態では、本明細書に記載の方法を使用して、遺伝子座を、推定体細胞起源、推定生殖系列起源、または起源不確定であるという最初の分類に従ってビニングすることにより、cfDNA由来の遺伝子座が生殖系列起源のものであるのか、または体細胞起源のものであるのかを決定することができる。次いで、各ビンの遺伝子座について定量的AF値を決定してAFセットを生成し、その後それを使用して、推定体細胞起源または生殖系列起源の遺伝子座についての度数分布を生成することができる。分布を使用して、AF閾値、例えば、「推定体細胞性」AFセットの中で最大の定量的AF値以上であり、かつ「推定生殖系列」AFセットの中で最小の定量的AF値以下である閾値を設定することができる。したがって、「起源不確定」遺伝子座を、遺伝子座のAFがAF閾値を上回る(したがって、生殖系列である)のか、またはAF閾値を下回る(したがって、体細胞性である)のかに基づいて、生殖系列または体細胞性に分類することができる。あるいは、「推定体細胞性」AF値についての度数分布と「推定生殖系列」AF値についての度数分布の間に重複がある場合、2つの閾値を決定することができ、したがって、第1のAF閾値は「推定体細胞性」AFセットの中で最大の定量的AF値であり、第2のAF閾値は「推定生殖系列」AFセットの中で最小の定量的AF値である。そのような実施形態では、定量的AF値が「推定体細胞性」閾値を下回る遺伝子座は体細胞性に分類され、定量的AF値が「推定生殖系列」閾値を上回る遺伝子座は生殖系列に分類され、定量的AF値が2つの閾値の間である遺伝子座は不明確に分類される。次いで、これらの不明確遺伝子座に、例えば、それらが生殖系列起源のものであるのか、または体細胞起源のものであるのかについての確率を、度数分布内のそれらのAF値の位置に基づいて割り当てることができる。

0078

一部の実施形態では、本開示は、cfDNAにおける体細胞起源であるかまたは生殖系列起源であるゲノム遺伝子座を、試料中のゲノム遺伝子座のAF値と既知の体細胞変異体または生殖系列変異体からの1つまたは複数のAF値を比較することによって識別するための方法を提供する。例えば、既知の体細胞変異体からのAF値を使用する場合、AF値が同様である(例えば、30%以内、25%以内、20%以内、15%以内、10%以内、9%以内、8%以内、7%以内、6%以内、5%以内、4%以内、3%以内、2%以内、1%以内、または0.1%以内である)ゲノム遺伝子座を体細胞起源であると分類することができ、AF値が同様でない(例えば、30%以内でない、25%以内でない、20%以内でない、15%以内でない、10%以内でない、9%以内でない、8%以内でない、7%以内でない、6%以内でない、5%以内でない、4%以内でない、3%以内でない、2%以内でない、1%以内でない、または0.1%以内でない)ゲノム遺伝子座を生殖系列起源であると分類することができる。同様に、既知の生殖系列変異体からのAF値を使用する場合、AF値が同様である(例えば、30%以内、25%以内、20%以内、15%以内、10%以内、9%以内、8%以内、7%以内、6%以内、5%以内、4%以内、3%以内、2%以内、1%以内、または0.1%以内である)ゲノム遺伝子座を生殖系列起源であると分類することができ、AF値が同様でない(例えば、30%以内でない、25%以内でない、20%以内でない、15%以内でない、10%以内でない、9%以内でない、8%以内でない、7%以内でない、6%以内でない、5%以内でない、4%以内でない、3%以内でない、2%以内でない、1%以内でない、または0.1%以内でない)ゲノム遺伝子座を体細胞起源であると分類することができる。既知の体細胞変異体または生殖系列変異体からのAF値は、試験される対象由来または複数の対照の対象由来のcfDNAシーケンシングリードからのものであってよい。

0079

一部の実施形態では、対象由来の無細胞DNAをシーケンシングし、1種または複数種の遺伝子変異体を検出し、数量化する。例えば、変異体を含有する遺伝子座にマッピングされる総リードの相対量(リード計数の数)を決定する。相対量がホモ接合性と一致する場合、変異体が生殖系列に存在することの高い信頼度を有し得る。そのような量は、例えば、95%を上回る、96%を上回る、97%を上回る、98%を上回る、99%を上回る、または100%のものであり得る。このコールを、確認のために、決定された遺伝子型と比較することができる。

0080

相対量が当該遺伝子座におけるホモ接合性遺伝子型またはヘテロ接合性遺伝子型と相反する場合、変異体が体細胞突然変異の結果であり、生殖系列には存在しないことの高い信頼度を有し得る。そのような量は、例えば、30%を下回る、25%を下回る、20%を下回る、15%を下回る、10%を下回る、9%を下回る、8%を下回る、7%を下回る、6%を下回る、5%を下回る、4%を下回る、3%を下回る、2%を下回る、または1%を下回るものであり得る。重ねて、このコールを、確認のために、決定された遺伝子型と比較することができる。

0081

あるいは、相対量は、当該遺伝子座におけるヘテロ接合性と一致し得る。そのような量は、例えば、30%から70%の間、例えば、40%から60%の間、45%から55%の間、46%から54%の間、47%から53%の間、48%から52%の間、または49%から51%の間であり得る。一部の実施形態では、当該遺伝子座における対象の推定される生殖系列遺伝子型(例えば、gDNAから得られる)を決定する。一部の実施形態では、遺伝子型を、無細胞DNAにおいて見いだされる変異体の同一性と比較する。ある特定の実施形態では、遺伝子型がホモ接合性である場合、変異体が体細胞突然変異を表すものであると高い信頼度で結論づけることができ、高量では最も可能性が高い。遺伝子型がヘテロ接合性であると決定され、変異体がヘテロ接合性対立遺伝子の一方と一致する場合、変異体は体細胞突然変異ではなく、生殖系列遺伝子型のヘテロ接合性を表すものであると結論づけることができる。

0082

一部の実施形態では、ホモ接合性遺伝子型は高い信頼度で除外することができるが、ヘテロ接合性遺伝子型は高い信頼度で決定することができず、その結果、潜在的に不明確な遺伝子型が生じる。例えば、変異体は、ゲノムDNAで範囲の最も端、例えば、30%で測定される場合がある。そのような場合では、cfDNAにおいて検出された変異体の量が体細胞突然変異または生殖系列ヘテロ接合性を表す可能性が高いのか、または表さない可能性が高いのかを高い信頼度で決定することができない可能性がある。そのような測定値は、例えば、迅速な腫瘍細胞成長に起因して試料中の体細胞突然変異を含有するDNAの存在量がある場合に生じ得る。いずれの測定されたレベルでも、ゲノムDNAにおいて検出される変異体がヘテロ接合性を表すものでない確率がいくらかあり得ることに留意するべきである。しかし、生殖系列において変異体が30%から70%の間で検出されることは、ヘテロ接合性を表すことが最も可能性が高く、cfDNAにおいて検出される変異体をこれに対して測定することができる。

0083

そのような場合では、他の情報をベイズ法様式で使用して、cfDNAにおける変異体が体細胞突然変異または生殖系列におけるヘテロ接合性を表す確率を上昇または低下させることができる。例えば、集団研究により、種々の群の生殖系列における変異体の有病率を、例えば、遺伝的祖先に基づいて示すことができる。したがって、例えば、個体におけるヘテロ接合性遺伝子型のコールの信頼度が低く、変異体が対象の遺伝的祖先を共有する人において高い発生率で見いだされる場合、当該人が、実際にヘテロ接合性であること、およびcfDNAにおける変異体が体細胞突然変異を表すものではないことを、より高い信頼度で決定することができる。逆に、変異体が対象の遺伝的祖先を共有する人において非常に低い発生率でしか見いだされない場合、当該人がヘテロ接合性ではないこと、およびcfDNAにおける変異体が体細胞突然変異を表すものであることを、より高い信頼度で決定することができる。

0084

本開示は、量(例えば、リード計数の量)がヘテロ接合性遺伝子型と一致するかまたは相反するかを決定するためのいくつかのやり方を意図している。一部の実施形態では、カットオフ値を使用する。例えば、遺伝子座における特定の遺伝子変異体の総リード計数の30%であるカットオフを設定することができる。一部の実施形態では、カットオフ量を下回る値は、体細胞突然変異を表すと推定される。一部の実施形態では、カットオフ量を上回り、かつ、一般には、ホモ接合性についてのカットオフを下回る値は、ヘテロ接合性と一致すると推定することができ、したがって、変異体を体細胞突然変異であるとコールする前に、さらなる分析が必要である。

0085

一部の実施形態では、確率関数(例えば、ベイズ関数)を使用して、量がヘテロ接合性を表す確率を算出する。ある特定のレベルを上回る確率により、比較遺伝子型が誘発され得る。

0086

一部の実施形態では、遺伝子型の決定は、分析の常套的部分として行われる。一部の実施形態では、変異体の存在量がヘテロ接合性の解釈と一致する場合にのみ、遺伝子型の決定を行う。

0087

一部の実施形態では、本開示の方法により、がんに関連する新規のゲノム変更を確実に検出するために必要なものよりも高い桁になり得るエラー率および偏りが低減する。一部の実施形態では、当該方法では、まず、遺伝子材料の供給源として体液試料(とりわけ、血液、唾液)を採取し、その後、材料のシーケンシングを行うことによって遺伝情報捕捉する。例えば、試料中のポリヌクレオチドのシーケンシングを行い、それにより、複数の配列リードを生じさせることができる。ポリヌクレオチドを含む試料中の腫瘍量を、試料から生成される配列リードの総数に対する変異体を有する配列リードの相対数として推定することができる。また、コピー数変異体の場合では、腫瘍量を、試験遺伝子座および対照遺伝子座における配列リードの総数の相対的過剰(遺伝子重複の場合)または相対的不足(遺伝子削減の場合)として推定することができる。したがって、例えば、実行により、癌遺伝子遺伝子座にマッピングされる1000個のリードが生じ得、そのうち900個が野生型に対応し、100個ががん突然変異体に対応し、これにより、この遺伝子におけるコピー数変異体が示される。次に、遺伝情報を処理し、遺伝子変異体を識別する。遺伝子変異体は、配列変異体、コピー数変異体およびヌクレオチド修飾変異体を含む。配列変異体は、遺伝学的なヌクレオチド配列における変異である。コピー数変異体は、ゲノムの一部分のコピー数の野生型からの偏差である。遺伝子変異体としては、例えば、一塩基変異(SNP)、挿入、欠失反転塩基転換転座遺伝子融合染色体融合、遺伝子短縮、コピー数多型(例えば、異数性、部分的異数性、倍数性遺伝子増幅)、核酸化学修飾の異常な変化、エピジェネティックパターンの異常な変化および核酸メチル化の異常な変化が挙げられる。次いで、プロセスにより、遺伝子材料を含有する試料中の遺伝子変異体の頻度を決定する。このプロセスはノイズが多いので、プロセスにより情報をノイズから分離する。

0088

シーケンシング法にはエラー率がある。例えば、IlluminaのmySeqシステムでは、1桁台前半のパーセントエラー率が生じる可能性がある。したがって、遺伝子座にマッピングされた配列リード1000個について、約50個のリード(約5%)がエラーを含むと予測することができる。WO2014/149134(TalasazおよびEltoukhy)に記載されているものなどのある特定の方法体系では、エラー率を有意に低下させることができる。エラーにより、試料中に低レベルで存在するがんからのシグナル不明瞭にし得るノイズが生じる。したがって、試料の腫瘍量が、およそシーケンシングシステムのエラー率、例えば、およそ0.1%〜5%のレベルである場合、がんに起因する遺伝子変異体に対応するシグナルをノイズに起因するものと区別することが難しい可能性がある。

0089

がんの診断は、ノイズの存在下であっても、遺伝子変異体を分析することによって行うことができる。この分析は、配列変異体の頻度またはCNVのレベルに基づくものであり、また、ノイズ範囲内の遺伝子変異体を検出するための診断信頼度指示またはレベルを確立することができる。次に、プロセスにより、診断信頼度を増大させる。これは、診断の信頼度を増大させるために複数の測定値を使用して行うこともでき、あるいは、がんが進行しているのか、寛解の状態にあるのか、または安定化しているのかを決定するために複数の時点での測定値を使用して行うこともできる。診断信頼度を使用して、病態を識別することができる。例えば、対象から取得した無細胞ポリヌクレオチドは、正常な細胞に由来するポリヌクレオチド、ならびにがん細胞などの患部細胞に由来するポリヌクレオチドを含み得る。がん細胞由来のポリヌクレオチドは、体細胞突然変異およびコピー数変異体などの遺伝子変異体を有し得る。対象由来の試料からの無細胞ポリヌクレオチドのシーケンシングを行う場合、これらのがんポリヌクレオチドは、配列変異体としてまたはコピー数変異体として検出される。無細胞ポリヌクレオチドの試料中の腫瘍ポリヌクレオチドの相対量は、「腫瘍量」と称される。

0090

パラメータの測定値、それらがノイズ範囲内に入るか否かは、信頼区間を用いて提示することができる。経時的に試験して、信頼区間を経時的に比較することにより、がんが進行しているのか、安定化しているのか、または寛解の状態にあるのかを決定することができる。信頼区間が重複しない場合、これにより、疾患の方向が示される。

0091

次に、プロセスにより、遺伝的報告/診断を生成する。プロセスにより、生殖系列SNPおよび体細胞性がん突然変異を受け取り、体細胞性がん突然変異に印を付け、報告を生成してヒト腫瘍委員会分析と同様の体細胞突然変異をアノテートし、研究所長により精査および認可された処置選択肢を提供する。

0092

ここで腫瘍委員会の推奨を生成するためのプロセスに目を向けると、一部の実施形態では、システムにGH2.7における68種の遺伝子についてのcBioポータルSNVからのデータを使用し、ここで、GH2.7は、Guardant Healthのパネルおよび2015年2月に公開された関連する試験プロセス(Guardant360 test)パネルである。cBioPortal for Cancer Genomics(http://cbioportal.org)により、多次元がんゲノミクスデータを探索、可視化、および解析するためのWebリソースが提供されている。ポータルにより、がん組織および細胞株からの分子プロファイリングデータを、容易に理解可能な遺伝学的事象、エピジェネティック事象、遺伝子発現事象、およびプロテオミクス事象にまとめる。クエリインタフェースカスタマイズされたデータ記憶の組合せにより、研究者が試料、遺伝子、および経路にわたって遺伝的変更相互作用的探究し、基礎をなすデータに利用可能な場合、これらを臨床転帰に関連付けることが可能になる。ポータルにより、多数のプラットフォームからの遺伝子レベルデータの図式的要約、ネットワーク可視化および解析、生存分析、患者中心のクエリ、およびソフトウェアプログラムアクセスがもたらされる。システムにより、管理者3が試験を徹底的に精査すべきかどうかの決定において変異体レベルのコールならびに試料レベルのコールがもたらされる。

0093

本明細書に記載の方法およびシステムを使用して多数のがんを検出することができる。がん細胞は、大多数の細胞と同様に、古い細胞が死に、新しい細胞で置き換えられるターンオーバーの速度によって特徴付けることができる。一般に、死細胞は、所与の対象における脈管構造と接触して、DNAまたはDNAの断片を血流中に放出し得る。これは、疾患の種々のステージの間のがん細胞にも当てはまる。がん細胞は、疾患の病期に応じて、コピー数多型ならびに突然変異などの種々の遺伝子異常によって特徴付けることもできる。この現象を、本明細書に記載の方法およびシステムを使用して個体にがんが存在するかしないかを検出するために使用することができる。

0094

一部の実施形態では、本開示の方法を、がんまたは炎症性の状態などの疾患または状態を診断するために使用することができる。「診断」という用語は、本明細書で使用される場合、患者が所与の疾患または状態に罹患しているか否かを当業者が推定および/または決定することができる方法を指す。一部の実施形態では、本開示の方法を、がんまたは炎症性の状態などの疾患または状態の予後判定において使用することができる。「予後判定」という用語は、本明細書で使用される場合、疾患または状態の再発を含めた、疾患または状態の増悪の可能性を指す。一部の実施形態では、本開示の方法を、がんまたは炎症性の状態などの疾患または状態が発症するリスクを評価するために使用することができる。一部の実施形態では、本開示の方法を、がんまたは炎症性の状態などの疾患または状態の処置の有効性を評価するために使用することができる。例えば、本開示の方法を、疾患または状態を有する患者を処置する前後(例えば、化学療法剤などの薬物を投与する前後)に使用することができる。一部の実施形態では、本開示の方法を、がんまたは炎症性の状態などの疾患または状態の増悪または退縮をモニタリングするために使用することができる。例えば、本開示の方法を異なる時点において実施して、増悪または退縮をモニタリングすることができる。一部の実施形態では、本開示の方法を、がんまたは炎症性の状態などの疾患または状態を好転させるまたは処置するための化合物を識別するために使用することができる。例えば、本開示の方法を、化合物を投与する前後に使用して、化合物により疾患が好転するまたは処置されるかどうかを決定することができる。

0095

本明細書で使用される場合、疾患または状態を「処置すること(treating)」は、臨床結果を含めた有益なまたは所望の結果を得るためのステップを取ることを指す。有益なまたは所望の臨床結果としては、これだけに限定されないが、疾患または状態に付随する1つまたは複数の症状の緩和または好転が挙げられる。本明細書で使用される場合、化合物または作用因子を対象に「投与すること(administering)」または化合物または作用因子の対象への「投与(administration)」は、当業者に公知の種々の方法のうちの1つを使用して行うことができる。例えば、化合物または作用因子を、静脈内に、動脈に、皮内に、筋肉内に、腹腔内に、静脈内に、皮下に、眼に、下に、経口的に(経口摂取によって)、鼻腔内に(吸入によって)、脊髄内に、脳内に、および経皮的に(例えば、皮膚管を通じた吸収によって)投与することができる。化合物または作用因子を、再装填可能もしくは生分解性ポリマーデバイスもしくは他のデバイス、例えば、パッチおよびポンプ、または、化合物または作用因子の長期の、緩徐な、または制御された放出をもたらす製剤によって適切に導入することもできる。投与することはまた、例えば、1回、複数回、および/または1つもしくは複数の長期間にわたって実施することができる。一部の態様では、投与は、自己投与を含めた直接投与、および、薬物を処方する行為を含めた間接投与のどちらも含む。例えば、本明細書で使用される場合、患者に、薬物を自己投与するように、もしくは別の人に薬物を投与してもらうよう指示する医師および/または患者に薬物を処方する医師が、薬物を患者に投与することになる。一部の実施形態では、化合物または作用因子を経口的に、例えば、対象に経口摂取によって、または静脈内に、例えば、対象に注射によって投与する。一部の実施形態では、経口投与される化合物または作用因子は、長期放出もしくは緩効性製剤である、または、そのような緩徐もしくは長期放出のためのデバイスを使用して投与される。

0096

一部の実施形態では、がんのリスクがある対象由来の血液を抜き出し、本明細書に記載の通り調製して、無細胞ポリヌクレオチドの集団を生成することができる。一例では、これは、無細胞DNAであり得る。本開示のシステムおよび方法を使用して、存在するある特定のがんに存在し得る突然変異またはコピー数多型を検出することができる。当該方法は、疾患の症状または他の特質が存在しないにもかかわらず体内のがん性細胞の存在を検出することに役立ち得る。

0097

本明細書で使用される場合、「がん」という用語は、これだけに限定されないが、種々の型の悪性新生物を含み、その大部分は、周囲の組織に浸潤する可能性があり、また、異なる部位に転移する可能性がある(例えば、その全体があらゆる目的に関して参照により本明細書に組み込まれるPDRMedical Dictionary、第1版(1995年)を参照されたい)。「新生物」および「腫瘍」という用語は、細胞増殖によって正常組織よりも急速に成長し、増殖を開始させる刺激が取り除かれた後にも成長し続ける異常な組織を指す。そのような異常な組織は、構造的組織化および正常な組織との機能的協調の部分的なまたは完全な欠如を示し、良性(例えば、良性腫瘍など)または悪性(例えば、悪性腫瘍など)であり得る。がんの一般的なカテゴリーの例としては、これだけに限定されないが、癌腫(例えば、一般形態の乳がん前立腺がん、肺がんおよび結腸がんなどの上皮細胞に由来する悪性腫瘍)、肉腫結合組織または間葉細胞に由来する悪性腫瘍)、リンパ腫(造血細胞に由来する悪性病変)、白血病(造血細胞に由来する悪性病変)、ならびに胚細胞性腫瘍精巣または卵巣において見いだされることが多い、成人における全能性細胞に由来する腫瘍;体の正中線、特に尾骨の先端に見いだされることが多い、胎児乳児および若年小児における全能性細胞に由来する腫瘍)、芽細胞腫瘍(一般には、未成熟または胚組織に似た悪性腫瘍)などが挙げられる。本開示に包含されることが意図されている新生物の型の例としては、これだけに限定されないが、神経組織血液形成組織、乳房、皮膚、骨、前立腺、卵巣、子宮子宮頸部肝臓、脳、喉頭胆嚢膵臓直腸副甲状腺甲状腺副腎、免疫系、頭頸部、結腸、気管支、および/または腎臓のがんに関連する新生物が挙げられる。特定の実施形態では、検出することができるがんの型および数としては、これだけに限定されないが、血液がん、脳がん、肺がん、皮膚がんのがん、咽喉がん、肝がん、骨がん、リンパ腫、膵がん、皮膚がん、腸がん、直腸がん、甲状腺がん膀胱がん腎がん口腔がん(mouth cancer)、胃がん固形状態の腫瘍、異種腫瘍、同種腫瘍などが挙げられる。

0098

一部の実施形態では、システムおよび方法を、がんを引き起こすまたはがんに起因する可能性がある任意の数の遺伝子異常を検出するために使用することができる。これらとしては、これだけに限定されないが、突然変異、突然変異、インデル、コピー数多型、塩基転換、転座、反転、欠失、異数性、部分的異数性、倍数性、染色体不安定性染色体構造変更、遺伝子融合、染色体融合、遺伝子短縮、遺伝子増幅、遺伝子重複、染色体病変、DNA病変、核酸化学修飾の異常な変化、エピジェネティックパターンの異常な変化、核酸メチル化の異常な変化、感染およびがんを挙げることができる。

0099

さらに、本明細書に記載のシステムおよび方法を、ある特定のがんの特徴付けを補助するために使用することもできる。本開示のシステムおよび方法によってもたらされる遺伝子データにより、実践者が特異的ながんの形態のより良好な特徴付けを補助することが可能になり得る。多くの場合、がんは、組成および病期分類のどちらも不均一である。遺伝子プロファイルデータにより、特定の亜型のがんの診断または処置において重要であり得る、当該特定の亜型を特徴付けることが可能になり得る。この情報により、対象または実践者に特定の型のがんの予後に関する手がかりももたらされ得る。

0100

一部の実施形態では、本明細書で提供されるシステムおよび方法を、特定の対象におけるあらかじめ分かっているがん、または他の疾患をモニタリングするために使用する。これにより、対象または実践者が疾患の進行に応じて処置選択肢を適合させることが可能になり得る。この例では、本明細書に記載のシステムおよび方法を、疾患の過程の特定の対象の遺伝子プロファイルを構築するために使用することができる。一部の例では、がんは、進行し、より侵攻性になり、遺伝的に不安定になる可能性がある。他の例では、がんは、良性、不活動性または休眠状態のまま留まる可能性がある。本開示のシステムおよび方法は、疾患増悪の決定において有用であり得る。

0101

さらに、本明細書に記載のシステムおよび方法は、特定の処置選択肢の有効性を決定することにおいて有用であり得る。一部の実施形態では、処置が上首尾の場合、より多くのがんが死滅し、DNAを放出し得るので、上首尾の処置選択肢により、対象の血液中で検出されるコピー数多型または突然変異の量が実際に増加し得る。他の実施形態では、これは起こらない可能性がある。一部の実施形態では、ある特定の処置選択肢は、がんの遺伝子プロファイルと経時的に相関する。この相関は、治療の選択において有用であり得る。さらに、がんが、処置後に寛解の状態になることが観察される場合、本明細書に記載のシステムおよび方法は、残留する疾患または疾患の再発のモニタリングにおいて有用であり得る。

0102

本明細書に記載の方法およびシステムは、がんだけに関連する突然変異およびコピー数多型の検出に限定されない。種々の他の疾患および感染により、早期検出およびモニタリングに適する可能性がある他の型の状態が生じ得る。例えば、ある特定の場合では、遺伝障害または感染症により、対象内である特定の遺伝的モザイク現象が引き起こされる可能性がある。この遺伝的モザイク現象により、観察することができるコピー数多型および突然変異が引き起こされる可能性がある。一部の実施形態では、本開示のシステムおよび方法を、体内の免疫細胞のゲノムをモニタリングするために使用することもできる。B細胞などの免疫細胞は、ある特定の疾患が存在すると迅速なクローン性増大を受ける可能性がある。クローン性増大を、コピー数多型の検出を使用してモニタリングすることができ、ある特定の免疫の状態をモニタリングすることができる。この例では、コピー数多型解析を経時的に実施して、特定の疾患がどのように進行し得るかのプロファイルを生成することができる。

0103

一部の実施形態では、本開示の方法は、自己免疫性または免疫関連疾患または状態に適用可能である。本明細書で使用される場合、「自己免疫性または免疫関連疾患または状態」とは、免疫系に影響を及ぼすまたは免疫系に関連する任意の疾患、障害、または状態を指し得る。自己免疫性または免疫関連疾患または状態の例としては、これだけに限定されないが、炎症、抗リン脂質症候群全身性エリテマトーデス関節リウマチ、自己免疫性血管炎小児脂肪便症、自己免疫性甲状腺炎輸血後免疫、母体胎児不適合輸血反応IgA欠損などの免疫欠損分類不能型免疫不全症薬剤誘発ループス真性糖尿病1型糖尿病2型糖尿病、若年発症糖尿病若年性関節リウマチ乾癬性関節炎多発性硬化症免疫不全アレルギー喘息乾癬アトピー性皮膚炎アレルギー性接触皮膚炎慢性皮膚疾患筋萎縮性側索硬化症化学療法誘発性傷害移植片対宿主病骨髄移植拒絶反応強直性脊椎炎アトピー性湿疹天疱瘡ベーチェット病慢性疲労症候群線維筋痛症、化学療法誘発性傷害、重症筋無力症糸球体腎炎アレルギー性網膜炎全身性硬化症亜急性皮膚エリテマトーデス凍瘡エリテマトーデスを含めた皮膚エリテマトーデス、シェーグレン症候群、自己免疫性腎炎、自己免疫性血管炎、自己免疫性肝炎、自己免疫性心炎、自己免疫性脳炎、自己免疫性媒介血液病、lc−SSc(限局皮膚硬化型の強皮症)、dc−SSc(びまん皮膚硬化型の強皮症)、自己免疫性甲状腺炎(AT)、グレーブス病GD)、重症筋無力症、多発性硬化症(MS)、強直性脊椎炎、移植片拒絶(transplant rejection)、免疫老化リウマチ性自己免疫疾患混合性結合組織病脊椎関節症、乾癬、乾癬性関節炎、筋炎、強皮症、皮膚筋炎、自己免疫性血管炎、混合性結合組織病、特発性血小板減少性紫斑病クローン病、ヒトアジュバント病変形性関節症若年性慢性関節炎、脊椎関節症、特発性炎症性筋疾患全身性血管炎、サルコイドーシス自己免疫性溶血性貧血、自己免疫性血小板減少症、甲状腺炎、免疫媒介性腎疾患中枢神経系または末梢神経系の脱髄性疾患、特発性脱髄性多発性神経障害ギランバレー症候群慢性炎症性脱髄性多発ニューロパチー肝胆道疾患感染性のまたは自己免疫性慢性活動性肝炎原発性胆汁性肝硬変肉芽腫性肝炎硬化性胆管炎炎症性腸疾患グルテン過敏性腸症ウィップル病、自己免疫性または免疫媒介性皮膚疾患水疱性皮膚症、多形性紅斑アレルギー性鼻炎、アトピー性皮膚炎、食物過敏症蕁麻疹、肺の免疫学的疾患好酸球肺炎特発性肺線維症過敏性肺臓炎移植関連疾患、移植片拒絶(graft rejection)または移植片対宿主病、乾癬性関節炎、乾癬、皮膚炎多発性筋炎/皮膚筋炎、中毒性表皮壊死融解症、全身性強皮症および硬化症、炎症性腸疾患に関連する応答、クローン病、潰瘍性大腸炎呼吸窮迫症候群、成人呼吸窮迫症候群(ARDS)、髄膜炎、脳炎、ぶどう膜炎、大腸炎、糸球体腎炎、アレルギー性状態、湿疹、喘息、T細胞の浸潤および慢性炎症性応答を伴う状態、アテローム性動脈硬化症、自己免疫性心筋炎白血球接着不全症アレルギー性脳脊髄炎サイトカインおよびTリンパ球によって媒介される急性過敏症および遅延型過敏症に関連する免疫応答結核、サルコイドーシス、ウェゲナー肉芽腫症を含めた肉芽腫症、顆粒球減少症、血管炎(ANCAを含む)、再生不良性貧血ダイアモンドブラックファン貧血、自己免疫性溶血性貧血(AIHA)を含めた免疫性溶血性貧血悪性貧血赤芽球ろう(PRCA)、第VIII因子欠乏症血友病A自己免疫性好中球減少症汎血球減少白血球減少症白血球漏出を伴う疾患、中枢神経系(CNS炎症性障害、多臓器傷害症候群、重症筋無力症、抗原抗体複合体媒介性疾患、抗糸球体基底膜抗体病、抗リン脂質抗体症候群、アレルギー性神経炎ベーチェット疾患、キャッスルマン症候群、グッドパスチャー症候群ランバート・イートン症候群、レイノー症候群、シェーグレン症候群、スティーブンスジョンソン症候群水疱性類天疱瘡、天疱瘡、自己免疫性多腺性内分泌障害ライター病スティフ・マン症候群、巨細胞性動脈炎免疫複合体腎炎IgA腎症IgM多発ニューロパチーまたはIgM媒介性ニューロパチー、特発性血小板減少性紫斑病(ITP)、血栓性血小板減少性紫斑病(TTP)、自己免疫性血小板減少症、自己免疫性精巣炎および卵巣炎を含めた精巣および卵巣の自己免疫疾患、原発性甲状腺機能低下症、自己免疫性甲状腺炎を含めた自己免疫性内分泌疾患、慢性甲状腺炎橋本甲状腺炎)、亜急性甲状腺炎、特発性甲状腺機能低下症、アジソン病、グレーブス病、自己免疫性多腺性症候群(または多腺性内分泌疾患症候群)、シーハン症候群、自己免疫性肝炎、リンパ性間質性肺炎HIV)、閉塞性細気管支炎(非移植)vs NSIP、ギラン・バレー症候群、大型血管炎(リウマチ性多発筋痛および巨細胞(高安)動脈炎を含む)、中型血管炎(川崎病および結節性多発性動脈炎を含む)、強直性脊椎炎、ベルジェ病(IgA腎症)、急速進行性糸球体腎炎、原発性胆汁性肝硬変、セリアックスプルー(グルテン腸症)、寒冷グロブリン血症、および筋萎縮性側索硬化症(ALS)が挙げられる。ある特定の実施形態では、本開示の方法は、これだけに限定されないが、喘息、多発性硬化症(例えば、再発寛解型多発性硬化症および二次性進行型多発性硬化症)、関節炎(例えば、関節リウマチ、変形性関節症、および乾癬性関節炎)、エリテマトーデス、および乾癬を含めた炎症性の状態に適用可能である。

0104

一部の実施形態では、本開示のシステムおよび方法を、細菌またはウイルスなどの病原体によって引き起こされる可能性がある全身性感染自体をモニタリングするために使用することができる。コピー数多型またはさらには突然変異を検出することを使用して、感染の過程中に病原体の集団がどのように変化するかを決定することができる。これは、感染の過程中ウイルスが生活環の状態を変化させ、かつ/またはより毒性の強い形態に突然変異する可能性があるHIV/AIDSまたは肝炎感染などの慢性感染の間、特に重要であり得る。

0105

一部の実施形態では、本開示のシステムおよび方法を、移植対象をモニタリングするために使用することができる。一般に、移植される組織は、移植時に体によってある特定の程度の拒絶反応を受ける。本開示の方法を、免疫細胞が移植された組織を破壊しようとするにしたがって、宿主である体の拒絶反応の活動性を決定またはプロファイリングするために使用することができる。これは、移植された組織の状態をモニタリングすることならびに拒絶反応の処置または予防の過程を変更することにおいて有用であり得る。

0106

さらに、一部の実施形態では、本開示の方法を、対象における異常な状態の不均一性を特徴付けるために使用することができ、方法は、対象における細胞外ポリヌクレオチドの遺伝子プロファイルを生成するステップであって、遺伝子プロファイルが、コピー数多型および突然変異分析によってもたらされた複数のデータを含むステップを含む。一部の場合では、これだけに限定されないが、がんを含め、疾患は不均一性であり得る。疾患細胞は同一でない場合がある。がんの例では、一部の腫瘍は、異なる型の腫瘍細胞、異なるステージのがんにおけるいくつかの細胞を含むことが公知である。一部の実施形態では、不均一性は、疾患の多数の病巣を含む。再度、がんの例では、多数の腫瘍病巣が存在し得、その場合、おそらく、1つまたは複数の病巣は主要な部位から拡散した転移の結果である。

0107

本開示の方法を、不均一性疾患における異なる細胞に由来する遺伝情報の合計であるプロファイル、指紋、またはデータのセットを生成するために使用することができる。このデータのセットは、コピー数多型および突然変異分析を単独でまたは組合せで含み得る。

0108

さらに、本開示のシステムおよび方法を、胎児起源のがんまたは他の疾患を診断する、予後判定する、モニタリングするまたは観察するために使用することができる。すなわち、これらの方法体系を妊娠中の対象において使用して、DNAおよび他のポリヌクレオチドが母体分子と共循環している可能性がある、まだ生まれていない対象のがんまたは他の疾患を診断する、予後判定する、モニタリングするまたは観察することができる。一部の実施形態では、システムおよび方法は、出生前疾患または妊娠に関連する疾患または状態を診断する、予後判定する、モニタリングするまたは観察するために有用である。本明細書で使用される場合、「出生前疾患または妊娠に関連する疾患または状態」という用語は、妊娠中の女性、または胎児に影響を及ぼす任意の疾患、障害、または状態を指す。出生前のまたは妊娠に関連する状態は、妊娠に付随するまたは妊娠の結果として直接または間接的に生じる任意の疾患、障害、または状態も指し得る。これらの疾患または状態は、任意のかつ全ての先天性欠損先天性の状態、または遺伝性の疾患または状態を含み得る。出生前疾患または妊娠に関連する疾患例としては、これだけに限定されないが、Rh血液型不適合新生児溶血性疾患ベータサラセミア性別決定、妊娠の決定、遺伝性メンデル遺伝障害、染色体異常胎児染色体異数性、胎児染色体トリソミー、胎児染色体モノソミー、8トリソミー、13トリソミー(パトー症候群)、16トリソミー、18トリソミー(エドワーズ症候群)、21トリソミー(ダウン症候群)、X染色体連鎖障害、Xトリソミー(XXX症候群)、Xモノソミー(ターナー症候群)、XXY症候群XYY症候群、XYY症候群、XXXY症候群、XXYY症候群、XYYY症候群、XXXXX症候群、XXXXY症候群、XXXYY症候群、XXYYY症候群、脆弱X症候群胎児発育遅延嚢胞性線維症異常ヘモグロビン症胎児死亡胎児アルコール症候群鎌状赤血球貧血血友病クラインフェルター症候群、dup(17)(p11.2p1.2)症候群、子宮内膜症ペリツェウスメルツバッヘル病、dup(22)(q11.2q11.2)症候群、ネコ眼症候群、ネコ鳴き症候群ウォルフヒルシュホーン症候群、ウィリアムズ・ビューレン症候群、シャルコー・マリー・トゥース病、圧迫性麻痺に罹患しやすいニューロパチー、スミス・マゲニス症候群神経線維腫症アラジール症候群、口蓋心臓顔面症候群、ディジョージ症候群ステロイドスルファターゼ欠損症プラダーウィリー症候群、カルマン症候群、線状皮膚欠損を伴う小眼球症、副腎低形成、グリセロールキナーゼ欠損症、ペリツェウス・メルツバッヘル病、Y染色体精巣決定因子無精子症(a因子)、無精子症(b因子)、無精子症(c因子)、1p36欠失、フェニルケトン尿症テイサックス病、副腎皮質過形成症、ファンコニー貧血、脊髄性筋萎縮症デュシェンヌ型筋ジストロフィーハンチントン病筋緊張性ジストロフィーロバートソン転座アンジェルマン症候群、結節性硬化症毛細血管拡張性運動失調症開放性二分脊椎神経管欠損腹壁欠損、胎内発育遅延、先天性のサイトメガロウイルス軟骨無形成症、マルファン症候群先天性甲状腺機能低下症、先天性トキソプラズマ症ビオチニダーゼ欠損症、ガラクトース血症メープルシロップ尿症ホモシスチン尿症中鎖アシルCo−Aデヒドロゲナーゼ欠損症、構造的先天性欠損症、心臓欠損四肢異常、内反足無脳症、無嗅脳症/全前脳症水頭症無眼球症/小眼球症、無耳症小耳症大血管転位症ファロー四徴症左心形成症候群大動脈縮窄症口唇裂を伴わない口蓋裂、口蓋裂を伴うまたは伴わない口唇裂、食道閉鎖症/瘻孔を伴うまたは伴わない狭窄症小腸閉鎖症/狭窄症、肛門直腸閉鎖症/狭窄症、尿道下裂半陰陽無発生、嚢胞腎、軸前多指症、肢欠損、横隔膜ヘルニア失明白内障、視覚の問題、聴力損失聴覚消失X連鎖副腎白質ジストロフィーレット症候群、リソソーム障害脳性麻痺自閉症、無舌症、白皮症眼白子症眼皮膚白皮症、妊娠糖尿病アーノルド・キア奇形チャージ症候群、先天性横隔膜ヘルニア、短指無虹彩症、裂足および裂手異色症、ドワーニア症(Dwarnian ear)、エーラース・ダンロス症候群、表皮水疱症ゴーラム病、橋本症候群、胎児水腫筋緊張低下、クリペルファイル症候群、筋ジストロフィー骨形成不全症早老症、スミス・レムリ・オピッツ症候群、色盲、X連鎖リンパ増殖性疾患臍帯ヘルニア、腹壁破裂子癇前症子癇早期分娩早産流産子宮内発育遅延子宮外妊娠妊娠悪阻早朝嘔吐、または上首尾の分娩誘発の可能性が挙げられる。

0109

さらに、一部の実施形態では、報告書提出され、インターネット経由で電子的にアクセスされる。ある特定の実施形態では、対象の所在地以外の場所で配列データの解析を行う。報告書を作成し、対象の所在地に伝達する。対象はインターネット接続可能なコンピュータを介して自身の腫瘍量を反映する報告書にアクセスする。

0110

アノテートされた情報は、健康管理提供者が他の薬物処置選択肢を選択するためおよび/または薬物処置選択肢に関する情報を保険会社に提供するために使用することができる。方法は、例えば、NCCN Clinical Practice Guidelines in Oncology or the American Society of Clinical Oncology(ASCO)診療ガイドライン中の状態に対して薬物処置選択肢をアノテートするステップを含み得る。

0111

追加的な薬物処置選択肢の一覧表を作成することにより、報告書中に層別化される薬物処置選択肢を報告書中にアノテートすることができる。追加的な薬物処置は、適応外使用に関してFDAに認可された薬物であってよい。1993 Omnibus Budget Reconciliation Act(OBRA)の条項では、標準の医学大要に含まれる抗がん薬の適応外使用を包含するメディケアが要求されている。一覧へのアノテートのために使用する薬物は、National Comprehensive Cancer Network(NCCN)Drugs and Biologics Compendiumm」、Thomson Micromedex DrugDex(登録商標)、Elsevier Gold Standard’s Clinical Pharmacology compendium、およびAmerican Hospital Formulary Service−Drug Information Compendium(登録商標)を含めた、CMSに認可された大要に見いだすことができる。

0112

特定の状態の1つまたは複数の分子マーカーを用いてがんを処置することにおいて有用であり得る実験薬の一覧表を作成することにより、薬物処置選択肢をアノテートすることができる。実験薬は、in vitroデータ、in vivoデータ、動物モデルデータ、前臨床試験データ、または臨床試験データ入手可能な薬物であってよい。データは、例えば、American Journal of Medicine、Annals of Internal Medicine、Annals of Oncology、Annals of Surgical Oncology、Biology of Blood and Marrow Transplantation、Blood、Bone Marrow Transplantation、British Journal of Cancer、British Journal of Hematology、British Medical Journal、Cancer、Clinical Cancer Research、Drugs、European Journal of Cancer (以前はthe European Journal of Cancer and Clinical Oncology)、Gynecologic Oncology、International Journal of Radiation, Oncology, Biology, and Physics、The Journal of the American Medical Association、Journal of Clinical Oncology、Journal of the National Cancer Institute、Journal of the National Comprehensive Cancer Network (NCCN)、Journal of Urology、Lancet、Lancet Oncology、Leukemia、The New England Journal of Medicine、およびRadiation Oncologyを含めた、CMS Medicare Benefit Policy Manualに列挙されている雑誌において見いだされる査読された医学文献において公開されているものであってよい。

0113

列挙された薬物を薬物に関する科学的情報と結び付ける電子に基づく報告書のリンクを提供することにより、薬物処置選択肢をアノテートすることができる。例えば、薬物に対する臨床試験に関する情報(clinicaltrials.gov)に対するリンクを提供することができる。報告書がコンピュータまたはコンピュータウェブサイトを介して提供される場合、リンクは、情報を伴うフットノート、ウェブサイトへのハイパーリンクポップアップボックス、またはフライオーバーボックスなどであってよい。報告書およびアノテートされた情報は、印刷された形態で提供することができ、アノテーションは、例えば、参照へのフットノートであってよい。

0114

報告書中の1つまたは複数の薬物処置選択肢をアノテートするための情報は、科学的情報を保管している商業的実体によりもたらされるものであってよい。健康管理提供者は、がん患者などの対象を、アノテートされた情報に列挙されている実験薬を用いて処置することができ、健康管理提供者は、アノテートされた薬物処置選択肢にアクセスし、科学的情報を検索し(例えば、医学学術論文を印刷し)、それ(例えば、印刷された学術論文)を薬物処置の提供に対する償還の要求と一緒に保険会社に提出することができる。医師は、償還を可能にするために種々の診断関連群(DRG)コードのいずれかを使用することができる。

0115

報告書中の薬物処置選択肢に、薬物が影響を及ぼす経路内の他の分子成分に関する情報(例えば、薬物標的である細胞表面受容体の下流のキナーゼを標的とする薬物に関する情報)をアノテートすることもできる。薬物処置選択肢に、1つまたは複数の他の分子経路成分を標的とする薬物に関する情報をアノテートすることができる。経路に関連する情報の識別および/またはアノテーションを別の会社に外注または下請けにだすことができる。

0116

アノテートされた情報は、例えば、薬物の名称(例えば、適応外使用についてFDAに認可された薬物;CMSに認可された大要に見いだされる薬物、および/または科学(医学)学術論文に記載されている薬物)、1つまたは複数の薬物処置選択肢に関する科学的情報、1つまたは複数の薬物に関する科学的情報への1つまたは複数のリンク、1つまたは複数の薬物に関する臨床試験情報(例えば、clinicaltrials.gov/からの情報)、薬物に関する科学的情報についての引用への1つまたは複数のリンクなどであってよい。

0117

アノテートされた情報は、報告書の任意の箇所に挿入することができる。アノテートされた情報は、報告書の多数の箇所に挿入することができる。アノテートされた情報は、報告書に、層別化された薬物処置選択肢に関する節の近くに挿入することができる。アノテートされた情報は、報告書に、層別化された薬物処置選択肢とは離れた頁に挿入することができる。層別化された薬物処置選択肢を含有しない報告書に情報をアノテートすることができる。

0118

システムは、対象(例えばがん患者)から単離された試料(例えば、腫瘍細胞)に対する薬物の影響に関する報告書も含み得る。種々の技法を使用し、がん患者由来の腫瘍を使用したin vitro培養物を確立することができる。システムは、前記in vitro培養物および/または異種移植モデルを使用し、FDAに認可された適応外薬物または実験薬のハイスループットなスクリーニングを行うことも含み得る。システムは、腫瘍抗原を再発検出に関してモニタリングすることも含み得る。

0119

システムは、がんを有する対象に関する報告書のインターネット接続可能なアクセスを提供することができる。システムには、手持ち型DNAシーケンサーを使用することもでき、デスクトップDNAシーケンサーを使用することもできる。DNAシーケンサーは、DNAシーケンシングプロセスを自動化するために使用される科学的機器である。DNAの試料を考えると、DNAシーケンサーを使用して、4種の塩基アデニン、グアニン、シトシン、およびチミンの順序を決定する。DNA塩基の順序は、リードと称される文字列として報告される。一部のDNAシーケンサーは、ヌクレオチドに付着した蛍光色素由来の光信号を分析するものであるので、光学機器とも考えることができる。

0120

DNAシーケンサーには、DNAの化学修飾、その後の特定の塩基における切断に基づくジルベールのシーケンシング法を適用することもでき、ジデオキシヌクレオチド連鎖終止反応に基づくサンガー技法を適用することもできる。サンガー法は、効率が上昇しており、放射活性が低いことに起因して人気になった。DNAシーケンサーには、シーケンシング前の試料調製のスピード上がり、エラーが減少する、DNA増幅(ポリメラーゼ連鎖反応−PCR)を必要としない技法を使用することができる。さらに、シーケンシングデータが、相補鎖へのヌクレオチドの付加によって引き起こされる反応からリアルタイムで収集される。例えば、DNAシーケンサーに、蛍光色素を含有する酵素によってヌクレオチドが相補鎖に付加されると放出される光(カメラによって捕捉される)によってシーケンシングデータがもたらされる、単一分子リアルタイム(SMRT)と称される方法を利用することができる。あるいは、DNAシーケンサーにナノポアセンシング技術に基づく電子システムを使用することができる。

0121

データは、処理のために、DNAシーケンサーにより直接接続によってまたはインターネットを通じてコンピュータに送信される。システムのデータ処理面は、デジタル電子回路網で、またはコンピュータハードウェアファームウェアソフトウェアで、またはそれらを組み合わせて実行することができる。本開示のデータ処理機器プログラム可能プロセッサによる実行のために機械可読記憶デバイスに明確に具体化されたコンピュータプログラム製品で実行することができ、本開示のデータ処理法ステップを指示のプログラムを実行するプログラム可能なプロセッサによって実施して、入力データを操作し、出力を生成することによって本開示の機能を実施することができる。本開示のデータ処理面は、データ記憶システムからデータおよび指示を受信するため、ならびにデータ記憶システムにデータおよび指示を送信するためにカップリングした少なくとも1つのプログラム可能なプロセッサ、少なくとも1つの入力デバイス、および少なくとも1つの出力デバイスを含むプログラム可能なシステムで実行可能な1つまたは複数のコンピュータプログラムで有利に実行することができる。各コンピュータプログラムは、所望であれば、高水準手続き型またはオブジェクト指向プログラミング言語で、またはアセンブリ言語もしくは機械言語で実行することができ、いずれの場合でも、言語は、コンパイルまたは解釈された言語であってよい。適切なプロセッサとしては、例として、汎用マイクロプロセッサおよび特殊用途マイクロプロセッサが挙げられる。一般に、プロセッサは、リードオンリーメモリおよび/またはランダムアクセスメモリから指示およびデータを受信する。コンピュータプログラム指示およびデータを明確に具体化するために適する記憶デバイスとしては、例としてEPROM、EEPROM、およびフラッシュメモリデバイスなどの半導体メモリデバイスを含めた全形態の不揮発性メモリ内臓ハードディスクおよびリムーバブルディスクなどの磁気ディスク光磁気ディスク;ならびにCD−ROMディスクが挙げられる。前述のいずれも、ASIC特定用途向け集積回路)によって補足することまたはそれに組み入れることができる。

0122

使用者との相互作用をもたらすために、本開示を、情報を使用者にディスプレイするためのモニターまたはLCD(液晶ディスプレイスクリーンなどのディスプレイデバイスおよびキーボードマウスもしくはトラックボールなどの2次元ポインティングデバイス、またはデータグローブもしくはジャイロスコープマウスなどの3次元ポインティングデバイスなどの、使用者がコンピュータシステムへの入力をもたらすことができる入力デバイスを有するコンピュータシステムを使用して実行することができる。それを通じてコンピュータプログラムが使用者と相互作用するグラフィカルユーザインタフェースがもたらされるようにコンピュータシステムをプログラミングすることができる。仮想現実、3次元ディスプレイインタフェースがもたらされるようにコンピュータシステムをプログラミングすることができる。
試験試料

0123

本明細書に開示される方法は、1つまたは複数のポリヌクレオチドを単離するステップを含み得る。

0124

ポリヌクレオチドは、DNAおよび/またはRNAなどの任意の型の核酸を含み得る。例えば、ポリヌクレオチドがDNAの場合、ゲノムDNA、相補DNAcDNA)、または任意の他のデオキシリボ核酸であってよい。ポリヌクレオチドは、無細胞DNA(cfDNA)などの無細胞核酸であってもよい。例えば、ポリヌクレオチドは、循環cfDNAであってよい。循環cfDNAは、アポトーシスまたは壊死によって体細胞から放出されたDNAを含み得る。アポトーシスまたは壊死によって放出されたcfDNAは、正常な体細胞が起源であり得る。例えば、がんに関してなど、異常な組織成長がある場合には腫瘍DNAが放出される可能性がある。循環cfDNAは、循環腫瘍DNA(ctDNA)を含み得る。本明細書に記載の通り、本開示の方法により、当業者が、遺伝子座(例えば、遺伝子座における変異体)の起源が生殖系列であるのかまたはcfDNA由来の体細胞性であるのかを、ゲノムDNAからの別々の配列情報を必要とせずに決定することが可能になる。

0125

ポリヌクレオチドは、二本鎖であっても一本鎖であってもよい。あるいは、ポリヌクレオチドは、二本鎖部分と一本鎖部分の組合せを含んでよい。

0126

試料は、対象から単離される任意の生体試料であってよい。例えば、試料は、これだけに限定することなく、体液全血血小板血清、血漿、便、赤血球白血球(white blood cell or leukocyte)、内皮細胞、組織生検材料滑液リンパ液腹水間質液もしくは細胞外液歯肉溝滲出液を含めた細胞間の空間中の流体骨髄脳脊髄液、唾液、粘液喀痰精液、汗、尿、鼻ブラッシングによる流体、papスメアによる流体、または任意の他の体液を含み得る。体液は、唾液、血液、または血清を含み得る。例えば、ポリヌクレオチドは、体液、例えば、血液または血清から単離された無細胞DNAであってよい。試料は、対象から、これだけに限定されないが、静脈穿刺排泄物射精マッサージ生検、針穿刺吸引洗浄擦過外科切開、または介入または他の手法を含めた種々の手法によって得ることができる腫瘍試料であってもよい。試料は、無細胞試料(例えば、いかなる細胞も含まない)であってよい。

0127

試料は、無細胞DNA分子を含有するある体積の血漿を含み得る。試料は、所与のリードの深さを実現するために十分な体積の血漿を含み得る。試料採取された血漿の体積は、少なくとも0.5ミリリットル(mL)、1mL、5mL、10mL、20mL、30mL、または40mLであり得る。試料採取された血漿の体積は、最大で0.5mL、1mL、5mL、10mL、20mL、30mL、または40mLであり得る。試料採取された血漿の体積は、5〜20mLであり得る。試料採取された血漿の体積は、10ml〜20mLであり得る。

0128

試料は、ゲノム当量を含有する種々の核酸の量を含み得る。例えば、DNA約30ngの試料は、約10,000(104)一倍体ヒトゲノム当量を含有し得、cfDNAの場合では、個々のポリヌクレオチド分子を約2000億(2×1011)個含有し得る。同様に、DNA約100ngの試料は、約30,000一倍体ヒトゲノム当量を含有し得、cfDNAの場合では、個々の分子を約6000億個含有し得る。

0129

試料は、異なる供給源からの核酸を含み得る。例えば、試料は、生殖系列DNAまたは体細胞DNAを含み得る。試料は、突然変異を有する核酸を含み得る。例えば、試料は、生殖系列突然変異および/または体細胞突然変異を有するDNAを含み得る。試料はまた、がん関連突然変異(例えば、がん関連体細胞突然変異)を有するDNAも含み得る。一部の実施形態では、試料は、一塩基置換、コピー数多型、インデル、遺伝子融合、塩基転換、転座、反転、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造変更、染色体融合、遺伝子短縮、遺伝子増幅、遺伝子重複、染色体病変、DNA病変、核酸化学修飾の異常な変化、エピジェネティックパターンの異常な変化、ゲノム領域にわたる核酸(例えば、cfDNA)断片の分布の異常な変化、核酸(例えば、cfDNA)断片の長さの分布の異常な変化、および核酸メチル化の異常な変化のうちの1つまたは複数を含む。

0130

本発明の方法は、ある特定の量の核酸分子、例えば、無細胞核酸分子を試料から得るステップを含み得る。例えば、方法は、約600ngに至るまで、約500ngに至るまで、約400ngに至るまで、約300ngに至るまで、約200ngに至るまで、約100ngに至るまで、約50ngに至るまで、または約20ngに至るまでの無細胞核酸分子を試料から得るステップを含み得る。方法は、少なくとも1フェムトグラム(fg)、少なくとも10fg、少なくとも100fg、少なくとも1ピコグラム(pg)、少なくとも10pg、少なくとも100pg、少なくとも1ng、少なくとも10ng、少なくとも100ng、少なくとも150ng、または少なくとも200ngの無細胞核酸分子を得るステップを含み得る。方法は、最大で1フェムトグラム(fg)、最大で10fg、最大で100fg、最大で1ピコグラム(pg)、最大で10pg、最大で100pg、最大で1ng、最大で10ng、最大で100ng、最大で150ng、または最大で200ngの無細胞核酸分子を得るステップを含み得る。方法は、1フェムトグラム(fg)〜200ng、1ピコグラム(pg)〜200ng、1ng〜100ng、10ng〜150ng、10ng〜200ng、10ng〜300ng、10ng〜400ng、10ng〜500ng、10ng〜600ng、10ng〜700ng、10ng〜800ng、10ng〜900ng、または10ng〜1000ngの無細胞核酸分子を得るステップを含み得る。無細胞核酸分子の量は、一倍体ゲノムコピーの数と同等であり得る。一倍体ゲノムコピーの質量は約3.3ピコグラム(pg)であるので、無細胞核酸分子の各ナノグラム(ng)は約300一倍体ゲノムコピーと同等であり得る。例えば、無細胞核酸分子5ngは、1,500ゲノムコピーと同等であり得る。

0131

無細胞核酸は、細胞に付着していない任意の細胞外核酸であり得る。無細胞核酸は、血液中を循環している核酸であり得る。あるいは、無細胞核酸は、本明細書に開示される他の体液、例えば、尿中の核酸であり得る。無細胞核酸は、デオキシリボ核酸(「DNA」)、例えば、ゲノムDNA、ミトコンドリアDNA、またはその断片であり得る。無細胞核酸は、リボ核酸(「RNA」)、例えば、mRNA、低分子干渉RNA(siRNA)、マイクロRNA(miRNA)、循環RNA(cRNA)、転移RNAtRNA)、リボソームRNArRNA)、低分子核小体RNA(snoRNA)、Piwi相互作用RNA(piRNA)、高分子非コードRNA(高分子ncRNA)、またはその断片であり得る。一部の場合では、無細胞核酸は、DNA/RNAハイブリッドである。無細胞核酸は、二本鎖、一本鎖、またはそれらのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞壊死およびアポトーシスによって体液中に放出され得る。

0132

無細胞核酸は、1つまたは複数のエピジェネティックな修飾を含み得る。例えば、無細胞核酸は、アセチル化されていてよく、メチル化されていてよく、ユビキチン化されていてよく、リン酸化されていてよく、SUMO化されていてよく、リボシル化されていてよく、かつ/またはシトルリン化されていてよい。例えば、無細胞核酸は、メチル化無細胞DNAであってよい。

0133

無細胞DNAは、一般には、約110〜約230ヌクレオチドのサイズ分布を有し、最頻値は約168ヌクレオチドである。第2に、無細胞核酸分子の長さを数量化するアッセイにおいて検出される小さいピークは、240〜440ヌクレオチドの範囲を有する。追加的な高次のヌクレオチドピークもより長い長さにおいて存在する。

0134

本開示の一部の実施形態では、無細胞核酸は、最大で1,000ヌクレオチド(nt)の長さ、最大で500ヌクレオチドの長さ、最大で400ヌクレオチドの長さ、最大で300ヌクレオチドの長さ、最大で250ヌクレオチドの長さ、最大で225ヌクレオチドの長さ、最大で200ヌクレオチドの長さ、最大で190ヌクレオチドの長さ、最大で180ヌクレオチドの長さ、最大で170ヌクレオチドの長さ、最大で160ヌクレオチドの長さ、最大で150ヌクレオチドの長さ、最大で140ヌクレオチドの長さ、最大で130ヌクレオチドの長さ、最大で120ヌクレオチドの長さ、最大で110ヌクレオチドの長さ、または最大で100ヌクレオチドの長さであり得る。

0135

本開示の一部の実施形態では、無細胞核酸は、少なくとも1,000ヌクレオチドの長さ、少なくとも500ヌクレオチドの長さ、少なくとも400ヌクレオチドの長さ、少なくとも300ヌクレオチドの長さ、少なくとも250ヌクレオチドの長さ、少なくとも225ヌクレオチドの長さ、少なくとも200ヌクレオチドの長さ、少なくとも190ヌクレオチドの長さ、少なくとも180ヌクレオチドの長さ、少なくとも170ヌクレオチドの長さ、少なくとも160ヌクレオチドの長さ、少なくとも150ヌクレオチドの長さ、少なくとも140ヌクレオチドの長さ、少なくとも130ヌクレオチドの長さ、少なくとも120ヌクレオチドの長さ、少なくとも110ヌクレオチドの長さ、または少なくとも100ヌクレオチドの長さであり得る。無細胞核酸は、140ヌクレオチドから180ヌクレオチドまでの長さであり得る。

0136

本開示の一部の実施形態では、対象における無細胞核酸は、腫瘍に由来するものであり得る。例えば、対象から単離された無細胞DNAは、循環腫瘍DNA、(ctDNA)を含み得る。次世代シーケンシングにより、稀な突然変異の検出および測定が可能になる。無細胞DNAの画分中の生殖系列配列と相対的な突然変異の検出により、ctDNAの存在が示され、したがって、腫瘍の存在が示され得る。無細胞DNAのシーケンシングを行うことにより、がんの存在を示すことが分かっている遺伝子変異体の検出が可能になり得る。例えば、無細胞DNAのシーケンシングを行うことにより、がん関連遺伝子の突然変異を検出することが可能になり得る。
単離および抽出

0137

無細胞ポリヌクレオチドは、胎児起源のもの(妊娠中の対象から取得した流体を介したもの)であり得る、または対象自体の組織に由来するものであり得る。無細胞ポリヌクレオチドは、健康な組織、腫瘍組織などの患部組織、または移植器官に由来するものであり得る。

0138

一部の実施形態では、無細胞ポリヌクレオチドは、血液試料またはその画分に由来するものである。例えば、血液試料(例えば、約10〜約30ml)を対象から取得し、遠心分離して細胞を除去し、得られた血漿をcfDNA抽出のために使用することができる。

0139

ポリヌクレオチドの単離および抽出は、様々な技法を使用した体液の採取によって実施することができる。一部の場合では、採取は、シリンジを使用して対象から体液を吸引することを含む。他の場合では、採取は、ピペット操作または採取容器への流体の直接採取を含み得る。

0140

体液採取後、当技術分野において利用される様々な技法を使用してポリヌクレオチドを単離し、抽出することができる。一部の場合では、Qiagen Qiamp(登録商標)Circulating Nucleic Acid Kit protocolなどの市販のキットを使用して無細胞DNAを単離し、抽出し、調製することができる。他の例では、Qiagen Qubit(商標)dsDNA HS Assay kit protocol、Agilent(商標)DNA 1000 kit、またはTruSeq(商標)Sequencing Library Preparation;Low−Throughput(LT) protocolを使用することができる。

0141

一般に、無細胞ポリヌクレオチドは、無細胞DNAが溶液中に見いだされると細胞および体液の他の不溶性成分から分離される分割ステップによって体液から抽出し、単離することができる。分割としては、これだけに限定されないが、遠心分離または濾過などの技法を挙げることができる。他の場合では、細胞をまず無細胞DNAから分割するのではなく、溶解させることができる。例えば、インタクトな細胞のゲノムDNAは、選択的沈殿によって分割することができる。試料分割は、識別子(例えば、バーコードを含む識別子など)でタグ付けされた核酸と組み合わせることもでき、識別子を使用しない方法で実施することもできる。試料を分割に分けることができ、したがって、各分割に独立にバーコードを付すことができ(例えば、分割当たり1つの固有のバーコードを用いて)、分割からのシーケンシングデータを後で再度組み合わせることができる。試料を分割に分け、分割内または分割間で核酸分子に互いに対して非固有にタグ付けすることができる。一部の実施形態では、試料を、識別子を使用せずに分割に分けることができる。一例では、cfDNA試料を4つまたはそれよりも多くの分割に分け、ここで、各分割は空間的にアドレス可能なロケーションである。試料の調製およびシーケンシングを空間的にアドレス可能な分割それぞれに対して実施し、アドレス可能なロケーションをバイオインフォマティクスで利用して、固有の分子をさらに識別することができる。一例では、核酸分子は、例えば、異なる型の核酸分子(例えば、DNAなどの二本鎖核酸ならびに/またはRNAおよび/もしくは一本鎖DNAなどの一本鎖核酸)を含有する分割に分けることができる。DNAを含めた無細胞ポリヌクレオチドは、可溶性のままであり得、不溶性ゲノムDNAから分離し、抽出することができる。一般に、異なるキットに特異的な緩衝剤の添加および他の洗浄ステップの後、イソプロパノール沈殿を使用してDNAを沈殿させることができる。シリカに基づくカラムまたはビーズ(例えば、磁気ビーズなど)などのさらなる浄化ステップを使用して、夾雑物または塩を除去することができる。一般的なステップを特定の適用のために最適化することができる。例えば、収率などの手順のある特定の側面を最適化するために、反応全体を通して非特異的なバルクキャリアポリヌクレオチドを添加することができる。

0142

一部の実施形態では、血漿試料を処理してプロテイナーゼKを分解し、イソプロパノールを用いてDNAを沈殿させ、その後、Qiagenカラムで捕捉する。次いで、DNAを溶出させることができる(例えば、水またはTris−EDTA(TE)溶出緩衝剤などの溶離液100マイクロリットル(μl)を使用して)。一部の実施形態では、DNAの一部分を、例えば、AgenCourt(登録商標)AMPure(登録商標)ビーズなどの固相可逆的固定化(SPRI)ビーズを使用し、サイズに基づいて選択することができる(例えば、500ヌクレオチドまたはそれ未満の長さのDNA)。一部の実施形態では、DNAをより小さな体積、例えば、水30μlなどに再懸濁させ、DNAのサイズ分布をチェックすることができる(例えば、166ヌクレオチドにおける主要なピークおよび330ヌクレオチドにおける小さいピークをチェックするため)。DNAおよそ5ngは約1500一倍体ゲノム当量(「HGE」)と同等であり得る。

0143

抽出後、試料から、1マイクログラム(μg)までのDNA、800ngまでのDNA、500ngまでのDNA、300ngまでのDNA、250ngまでのDNA、200ngまでのDNA、180ngまでのDNA、160ngまでのDNA、140ngまでのDNA、120ngまでのDNA、100ngまでのDNA、90ngまでのDNA、80ngまでのDNA、70ngまでのDNA、60ngまでのDNA、50ngまでのDNA、40ngまでのDNA、30ngまでのDNA、20ngまでのDNA、10ngまでのDNA、9ngまでのDNA、8ngまでのDNA、7ngまでのDNA、6ngまでのDNA、5ngまでのDNA、4ngまでのDNA、3ngまでのDNA、2ngまでのDNA、または1ngまでのDNAが生じ得る。

0144

抽出後、試料から、少なくとも1ngのDNA、少なくとも3ngのDNA、少なくとも5ngのDNA、少なくとも7ngのDNA、少なくとも10ngのDNA、少なくとも20ngのDNA、少なくとも30ngのDNA、少なくとも40ngのDNA、少なくとも50ngのDNA、少なくとも70ngのDNA、少なくとも100ngのDNA、少なくとも150ngのDNA、少なくとも200ngのDNA、少なくとも250ngのDNA、少なくとも300ngのDNA、少なくとも400ngのDNA、少なくとも500ngのDNA、または少なくとも700ngのDNAが生じ得る。

0145

無細胞核酸の1つまたは複数を試料中の細胞断片から単離することができる。一部の場合では、無細胞核酸の1つまたは複数を、膜、細胞小器官ヌクレオソームエキソソーム、または核、ミトコンドリア粗面小胞体リボソーム滑面小胞体葉緑体ゴルジ装置ゴルジ体糖タンパク質糖脂質、槽、リポソームペルオキシソームグリオキシソーム中心粒細胞骨格リソソーム絨毛鞭毛収縮胞小胞核膜液胞微小管、核小体、原形質膜エンドソームクロマチン、またはこれらの組合せから単離する。無細胞核酸の1つまたは複数を、1つまたは複数のエキソソームから単離することができる。一部の場合では、無細胞核酸の1つまたは複数を、1つまたは複数の細胞表面結合核酸から単離する。

0146

無細胞DNAの精製は、これだけに限定されないが、例えばSigma Aldrich、Life Technologies、Promega、Affymetrix、IBIなどの会社から提供される市販のキットおよびプロトコールの使用を含めた任意の方法体系を使用して実現することができる。キットおよびプロトコールは、市販されていないものであってもよい。

0147

単離後、一部の場合では、無細胞ポリヌクレオチドを、1つまたは複数の試薬(例えば、リガーゼプロテアーゼ、ポリメラーゼ)などの1つまたは複数の追加的な材料と予備混合した後、シーケンシングを行ってもよい。

0148

試料中の頻度が0.0005%ほどの低さの遺伝子変異体を検出するための十分なリードの深さで無細胞DNAのシーケンシングを行うことができる。試料中の頻度が0.001%ほどの低さの遺伝子変異体を検出するために十分なリードの深さで無細胞DNAのシーケンシングを行うことができる。試料中の頻度が1.0%、0.75%、0.5%、0.25%、0.1%、0.075%、0.05%、0.025%、0.01%、または0.005%ほどの低さの遺伝子変異体を検出するために十分なリードの深さで無細胞DNAのシーケンシングを行うことができる。したがって、無細胞DNAのシーケンシングを行うことにより、対象におけるがんの非常に高感度の検出が可能になる。

0149

本発明の方法を、対象におけるがんを検出するために使用することができる。がんを有することが分かっていない、またはがんを有する疑いがある対象において、がんが存在するかしないかを診断するために、無細胞DNAのシーケンシングを行うことができる。無細胞DNAのシーケンシングを行うことにより、がんの早期検出のため、または、既知のがんの「生検」のための非侵襲的方法がもたらされる。がんと診断された対象において、がんに関する情報をもたらすために、無細胞DNAのシーケンシングを行うことができる。処置の有効性を決定するために、対象においてがんの処置前および処置後に無細胞DNAのシーケンシングを行うことができる。

0150

対象は、がんを有する疑いがある場合もあり、がんを有する疑いがない場合もある。対象は、がんの診断と一致した症状を経験している場合がある。対象は、いかなる症状も経験していない場合がある、またはがんと一致しない症状を示している場合がある。対象は、生物学的イメージング法に基づいてがんを有すると診断されている場合がある。対象は、イメージング法によって検出可能ながんを有さない場合がある。イメージング法は、陽電子放出断層撮影磁気共鳴画像法X線コンピュータ化軸方向断層撮影、超音波、またはこれらの組合せであり得る。

0151

対象は、がんを示す場合がある。あるいは、対象は、がんを検出可能に示さない場合がある。一部の場合では、がんを検出可能に示さない対象は、がんを有し得るが、検出可能な症状を有さない。がんを有することが分かっていない、またはがんを有する疑いがある対象は、種々のがんスクリーニング方法を使用して検出可能でないがんを有し得る。種々のイメージング法を使用してがんが検出されない場合がある。イメージング法としては、例えば、陽電子放出断層撮影、磁気共鳴画像法、X線、コンピュータ化軸方向断層撮影、内視鏡検査、超音波、またはこれらの組合せを挙げることができる。がんを有することまたはがんを有する疑いがあることが分かっていない対象に関しては、組織生検、骨髄穿刺、pap試験、便潜血反応検査タンパク質バイオマーカー検出、例えば、前立腺特異的抗原検査アルファフェトプロテイン血液検査、またはCA−125検査、またはこれらの組合せなどの検査により、対象ががんを有さないことが示され得る、例えば、対象に関してがんが検出されない。他の場合では、がんを検出可能に示していない対象は、いかなるがんも有さない可能性がある。

0152

対象は、がんを有するリスクが一般集団よりも高い場合がある。対象は、がんの家族歴を有し得る。対象は、がんリスクの既知の遺伝源を有し得る。対象は、がんリスクを上昇させるまたは引き起こすことが公知の環境条件曝露されていた場合がある。対象は、がんの危険因子年齢および/または性別だけの患者であり得る。対象は、既知のがん危険因子を有さない場合がある。

0153

対象は、がんと診断されている場合がある。がんは、初期または後期であり得る。がんは、転移性の場合もあり、転移性でない場合もある。対象が診断を受けた可能性があるがんの型としては、これだけに限定されないが、癌腫、肉腫、リンパ腫、白血病、胚細胞性腫瘍および芽細胞腫が挙げられる。対象が診断を受けた可能性があるがんの型としては、これだけに限定されないが、急性リンパ芽球性白血病(ALL)、急性骨髄性白血病、副腎皮質癌、成人急性骨髄性白血病、成人原発部位不明癌、成人悪性中皮腫、AIDS関連がん、AIDS関連リンパ腫、肛門がん、虫垂がん、星状細胞腫小児期小脳または大脳基底細胞癌胆管がん、膀胱がん、骨腫瘍骨肉腫/悪性線維性組織球腫、脳がん、脳幹神経膠腫、乳がん、気管支腺腫カルチノイドバーキットリンパ腫カルチノイド腫瘍、原発不明癌、中枢神経系リンパ腫、小脳星状細胞腫、大脳星状細胞腫/悪性神経膠腫、子宮頸がん、小児期急性骨髄性白血病、小児期原発部位不明がん、小児期がん、小児期大脳星状細胞腫、小児期中皮腫軟骨肉腫慢性リンパ球性白血病慢性骨髄性白血病、慢性骨髄増殖性疾患、結腸がん、皮膚T細胞リンパ腫線維形成性小円細胞腫瘍、子宮体がん子宮内膜がん上衣腫類上皮血管内皮腫(EHE)、食道がん、ユーインファミリー腫瘍肉腫、ユーイングファミリー腫瘍中のユーイング肉腫頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝外胆管がん、眼がん、眼内黒色腫胆嚢がん、胃がん(Gastric(stomach)cancer)、胃カルチノイド、消化管カルチノイド腫瘍、消化管間質腫瘍GIST)、妊娠性絨毛性腫瘍、脳幹の神経膠腫、神経膠腫、ヘアリー細胞白血病頭頸部がん、心臓がん、肝細胞(肝)がん、ホジキンリンパ腫下咽頭がん視床下部および視経路神経膠腫、膵島細胞癌(内分泌部)、カポジ肉腫、腎がん(腎細胞がん)、喉頭がん、急性リンパ性白血病(Leukaemia、acute lymphoblastic)(急性リンパ性白血病(acute lymphocytic leukaemia)とも称される)、急性骨髄性白血病(Leukaemia、acute myeloid)(急性骨髄性白血病(acute myelogenous leukemia)とも称される)、慢性リンパ性白血病(Leukaemia、chronic lymphocytic)(慢性リンパ性白血病(chronic lymphocytic leukemia)とも称される)、白血病、慢性骨髄性白血病(Leukemia、chronic myelogenous)(慢性骨髄性白血病(chronic myeloid leukemia)とも称される)、白血病、ヘアリー細胞、口唇・口腔がん、脂肪肉腫、肝がん(原発性)、肺がん、非小細胞、肺がん、小細胞、リンパ腫(AIDS関連)、リンパ腫、マクログロブリン血症、ワルデンシュトレーム、男性乳がん、骨の悪性線維性組織球腫/骨肉腫、髄芽腫、黒色腫、メルケル細胞がん、原発不明転移性扁平上皮性頸部がん、口腔がん(mouth cancer)、多発性内分泌腫瘍症候群、小児期、多発性骨髄腫(骨髄のがん)、多発性骨髄腫/形質細胞新生物菌状息肉腫骨髄異形成症候群骨髄異形成の/骨髄増殖性疾患、慢性骨髄性白血病(myelogenous leukemia、chronic)、粘液腫、鼻腔・副鼻腔がん、上咽頭癌神経芽細胞腫非ホジキンリンパ腫、非小細胞肺がん、乏枝神経膠腫、口腔がん(oral cancer)、中咽頭がん、骨肉腫/骨の悪性線維性組織球腫、卵巣がん、卵巣上皮がん表層上皮性間質性腫瘍)、卵巣胚細胞性腫瘍、卵巣低悪性度腫瘍、膵がん、膵がん、膵島細胞、副鼻腔および鼻腔がん、副甲状腺がん、陰茎がん咽頭がん褐色細胞腫松果体星状細胞腫、松果体胚細胞腫松果体芽腫およびテント原始神経外胚葉性腫瘍下垂体腺腫形質細胞新形成/多発性骨髄腫、胸膜肺芽腫、原発性中枢神経系リンパ腫、前立腺がん、直腸がん、腎細胞癌(腎がん)、腎盤および尿管移行上皮がん網膜芽細胞腫横紋筋肉腫唾液腺がん、セザリー症候群、皮膚がん(黒色腫)、皮膚がん(非黒色腫性の)、皮膚癌、メルケル細胞、小細胞肺がん、小腸がん、軟部肉腫扁平上皮細胞癌、転移性原発不明扁平上皮性頸部がん、胃がん、テント上原始神経外胚葉性腫瘍、皮膚T細胞リンパ腫、精巣がん、咽喉がん、胸腺腫および胸腺癌、胸腺腫、甲状腺がん、腎盤および尿管の移行上皮がん、尿管および腎盤の移行上皮がん、尿道がん、子宮肉腫がん、視覚路および視床下部神経膠腫、視覚路および視床下部神経膠腫、小児期、外陰がん、ワルデンシュトレームマクログロブリン血症、およびウィルムス腫瘍(腎がん)が挙げられる。

0154

対象は、がんに対する処置を以前に受けていてよい。対象は、外科的処置放射線処置化学療法、標的化がん治療薬またはがん免疫療法を受けていてよい。対象は、がんワクチンを用いた処置を受けていてよい。対象は、実験的ながん処置を用いた処置を受けていてよい。対象は、がん処置を受けていなくてよい。対象は、がんからの寛解の状態にあってよい。対象は、がんに対する処置を以前に受けており、いかなる症状も検出可能に示していなくてよい。
遺伝子解析

0155

ある特定のDNAシーケンシング法では、配列捕捉を使用して、目的の配列を富化させる。配列捕捉は、一般には、目的の配列とハイブリダイズするオリゴヌクレオチドプローブの使用を伴う。プローブセット戦略は、目的の領域にわたってプローブタイリングすることを伴い得る。そのようなプローブは、例えば、約60〜120塩基長であってよい。セットの深さは、約2×、3×、4×、5×、6×、8×、9×、10×、15×、20×、50×またはそれよりも深くてよい。配列捕捉の効果は、プローブの配列と相補的(またはほぼ相補的)である標的分子内の配列の長さに一部依存する。富化された核酸分子は、5,000塩基よりも多くのヒトゲノム、10,000塩基よりも多くのヒトゲノム、15,000塩基よりも多くのヒトゲノム、20,000塩基よりも多くのヒトゲノム、25,000塩基よりも多くのヒトゲノム、30,000塩基よりも多くのヒトゲノム、35,000塩基よりも多くのヒトゲノム、40,000塩基よりも多くのヒトゲノム、45,000塩基よりも多くのヒトゲノム、50,000塩基よりも多くのヒトゲノム、55,000塩基よりも多くのヒトゲノム、60,000塩基よりも多くのヒトゲノム、65,000塩基よりも多くのヒトゲノム、70,000塩基よりも多くのヒトゲノム、75,000塩基よりも多くのヒトゲノム、80,000塩基よりも多くのヒトゲノム、85,000塩基よりも多くのヒトゲノム、90,000塩基よりも多くのヒトゲノム、95,000塩基よりも多くのヒトゲノム、または100,000塩基よりも多くのヒトゲノムを表し得る。富化された核酸分子は、5,000塩基以下のヒトゲノム、10,000塩基以下のヒトゲノム、15,000塩基以下のヒトゲノム、20,000塩基以下のヒトゲノム、25,000塩基以下のヒトゲノム、30,000塩基以下のヒトゲノム、35,000塩基以下のヒトゲノム、40,000塩基以下のヒトゲノム、45,000塩基以下のヒトゲノム、50,000塩基以下のヒトゲノム、55,000塩基以下のヒトゲノム、60,000塩基以下のヒトゲノム、65,000塩基以下のヒトゲノム、70,000塩基以下のヒトゲノム、75,000塩基以下のヒトゲノム、80,000塩基以下のヒトゲノム、85,000塩基以下のヒトゲノム、90,000塩基以下のヒトゲノム、95,000塩基以下のヒトゲノム、または100,000塩基以下のヒトゲノムを表し得る。富化された核酸分子は、5,000〜100,000塩基のヒトゲノム、5,000〜50,000塩基のヒトゲノム、5,000〜30,000塩基のヒトゲノム、10,000〜100,000塩基のヒトゲノム、10,000〜50,000塩基のヒトゲノム、または10,000〜30,000塩基のヒトゲノムを表し得る。富化された核酸分子は、ヌクレオチド変異体(SNV)、コピー数変異体(CNV)、挿入または欠失(例えば、インデル)、がんに関連するヌクレオソーム領域、遺伝子融合、および反転などの遺伝子変異体を含めた種々の核酸特徴を表し得る。

0156

一般に、本明細書で提供される方法およびシステムは、下流適用シーケンシング反応のための無細胞ポリヌクレオチド配列を調製するために有用である。シーケンシング法は、大規模並列処理シーケンシング、すなわち、少なくとも100個、1000個、10,000個、100,000個、100万個、1000万個、1億個、10億個、または100億個のいずれかのポリヌクレオチド分子を同時に(または立て続けに)シーケンシングするものであってよい。シーケンシング法としては、これだけに限定されないが、ハイスループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、単一分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、RNA−Seq(Illumina)、Digital Gene Expression(Helicos)、次世代シーケンシング、単一分子合成によるシーケンシング(SMSS)(Helicos)、大規模並列処理シーケンシング、Clonal Single Molecule Array(Solexa)、ショットガンシーケンシング、マクサムギルバートまたはサンガーシーケンシング、プライマーウォーキング、PacBio、SOLiD、Ion Torrent、またはNanoporeプラットフォームを使用したシーケンシングおよび当技術分野で公知の任意の他のシーケンシング法を挙げることができる。

0157

ゲノム核酸試料(例えば、ゲノムDNA試料)中の個々のポリヌクレオチド断片を、非固有識別子でタグ付けすること、例えば、個々のポリヌクレオチド断片を非固有にタグ付けすることによって固有に識別することができる。
シーケンシングパネル

0158

腫瘍を示す突然変異の検出の可能性を改善するために、シーケンシングされたDNAの領域は、遺伝子またはゲノム領域のパネルを含み得る。限定された領域(例えば、限定されたパネル)をシーケンシングのために選択することにより、必要な総シーケンシング(例えば、シーケンシングするヌクレオチドの総量)を減少させることができる。シーケンシングパネルにより、複数の異なる遺伝子または領域を標的として、単一のがん、がんのセット、または全てのがんを検出することができる。

0159

一部の態様では、複数の異なる遺伝子またはゲノム領域を標的とするパネルを選択し、したがって、決定されるがんを有する対象の割合により、パネル内の1つまたは複数の異なる遺伝子またはゲノム領域における遺伝子変異体または腫瘍マーカーが示される。パネルを、シーケンシングの領域が固定数塩基対に限定されるように選択することができる。パネルを、所望の量のDNAがシーケンシングされるように選択することができる。パネルを、所望の配列リードの深さが実現されるようにさらに選択することができる。パネルを、ある量のシーケンシングされる塩基対に対して所望の配列リードの深さまたは配列リードカバレッジが実現されるように選択することができる。パネルを、試料中の1種または複数種の遺伝子変異体を検出するための理論的感度、理論的特異度および/または理論的正確度が実現されるように選択することができる。

0160

領域のパネルを検出するためのプローブは、ホットスポット領域を検出するためのプローブならびにヌクレオソーム認識プローブ(例えば、KRASコドン12および13)を含んでよく、ヌクレオソーム結合パターンおよびGC配列組成の影響を受けるcfDNAカバレッジおよび断片サイズ変動の分析に基づく捕捉が最適化されるように設計することができる。本明細書で使用される領域は、ヌクレオソームの位置およびGCモデルに基づいて最適化された非ホットスポット領域も含んでよい。パネルは、例えば腫瘍抑制因子遺伝子(例えば、結腸直腸がんにおけるSEPT9/VIM))のプロモーターにおける、起源組織(例えば、組織にわたって最も多様な転写プロファイルを有する遺伝子を表す50〜100のベイト(必ずしもプロモーターではない)を定義するための、公開文献の使用)、全ゲノム足場(例えば、コピー数に基づいて並べるために少数のプローブを用いて染色体にわたって超保存的ゲノム含有量を識別し、低密度にタイリングするため)、転写開始点TSS)/CpGアイランド(例えば、示差的メチル化領域(例えば、示差的にメチル化された領域(DMR)を捕捉するため)を識別するためのサブパネルを含めた複数のサブパネルを含んでよい。一部の実施形態では、起源組織についてのマーカーは、組織特異的エピジェネティックマーカーである。

0161

目的のゲノム上の位置の例示的な一覧表は、表1および表2において見ることができる。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表1の遺伝子のうちの少なくとも5種、少なくとも10種、少なくとも15種、少なくとも20種、少なくとも25種、少なくとも30種、少なくとも35種、少なくとも40種、少なくとも45種、少なくとも50種、少なくとも55種、少なくとも60種、少なくとも65種、少なくとも70種、少なくとも75種、少なくとも80種、少なくとも85種、少なくとも90種、少なくとも95種、または97種の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表1のSNVのうちの少なくとも5種、少なくとも10種、少なくとも15種、少なくとも20種、少なくとも25種、少なくとも30種、少なくとも35種、少なくとも40種、少なくとも45種、少なくとも50種、少なくとも55種、少なくとも60種、少なくとも65種、または70種を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表1のCNVのうちの少なくとも1種、少なくとも2種、少なくとも3種、少なくとも4種、少なくとも5種、少なくとも6種、少なくとも7種、少なくとも8種、少なくとも9種、少なくとも10種、少なくとも11種、少なくとも12種、少なくとも13種、少なくとも14種、少なくとも15種、少なくとも16種、少なくとも17種、または18種を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表1の融合物のうちの少なくとも1種、少なくとも2種、少なくとも3種、少なくとも4種、少なくとも5種、または6種を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表1のインデルのうちの少なくとも1種、少なくとも2種、または3種の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は表2の遺伝子の、少なくとも5種、少なくとも10種、少なくとも15種、少なくとも20種、少なくとも25種、少なくとも30種、少なくとも35種、少なくとも40種、少なくとも45種、少なくとも50種、少なくとも55種、少なくとも60種、少なくとも65種、少なくとも70種、少なくとも75種、少なくとも80種、少なくとも85種、少なくとも90種、少なくとも95種、少なくとも100種、少なくとも105種、少なくとも110種、または115種の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表2のSNVの少なくとも5種、少なくとも10種、少なくとも15種、少なくとも20種、少なくとも25種、少なくとも30種、少なくとも35種、少なくとも40種、少なくとも45種、少なくとも50種、少なくとも55種、少なくとも60種、少なくとも65種、少なくとも70種、または73種を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表2のCNVの少なくとも1種、少なくとも2種、少なくとも3種、少なくとも4種、少なくとも5種、少なくとも6種、少なくとも7種、少なくとも8種、少なくとも9種、少なくとも10種、少なくとも11種、少なくとも12種、少なくとも13種、少なくとも14種、少なくとも15種、少なくとも16種、少なくとも17種、または18種を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表2の融合物のうちの少なくとも1種、少なくとも2種、少なくとも3種、少なくとも4種、少なくとも5種、または6種を含む。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表2のインデルのうちの少なくとも1種、少なくとも2種、少なくとも3種、少なくとも4種、少なくとも5種、少なくとも6種、少なくとも7種、少なくとも8種、少なくとも9種、少なくとも10種、少なくとも11種、少なくとも12種、少なくとも13種、少なくとも14種、少なくとも15種、少なくとも16種、少なくとも17種、または18種の少なくとも一部分を含む。これらの目的のゲノム上の位置のそれぞれを、所与のベイトセットパネルについての骨格領域またはホットスポット領域として識別することができる。目的のホットスポットのゲノム上の位置の例示的な一覧表は、表3において見ることができる。一部の実施形態では、本開示の方法において使用されるゲノム領域は、表3の遺伝子のうちの少なくとも1種、少なくとも2種、少なくとも3種、少なくとも4種、少なくとも5種、少なくとも6種、少なくとも7種、少なくとも8種、少なくとも9種、少なくとも10種、少なくとも11種、少なくとも12種、少なくとも13種、少なくとも14種、少なくとも15種、少なくとも16種、少なくとも17種、少なくとも18種、少なくとも19種、または少なくとも20種の少なくとも一部分を含む。各ホットスポットゲノム領域が、関連する遺伝子、それが存在する染色体、遺伝子座を表すゲノムの開始位置および終止位置、塩基対内の遺伝子座の長さ、遺伝子に包含されるエクソン、ならびに目的の所与のゲノム領域が捕捉しようとし得る重要な特徴(例えば、突然変異の型)を含めたいくつかの特性と共に列挙されている。

0162

一部の実施形態では、パネル内の1つまたは複数の領域は、外科手術後の残存がんを検出するための1種または複数種の遺伝子由来の1種または複数種の遺伝子座を含む。この検出は、がん検出の既存の方法で可能なものよりも早い可能性がある。一部の実施形態では、パネル内の1つまたは複数の領域は、高リスク患者集団においてがんを検出するための1種または複数種の遺伝子由来の1種または複数種の遺伝子座を含む。例えば、喫煙者は、肺がんの率が一般集団よりもはるかに高い。さらに、喫煙者では、肺内不規則小結節の発生などの、がん検出をより難しくする他の肺の状態が発症する可能性がある。一部の実施形態では、本明細書に記載の方法により、高リスク患者において、がん検出の既存の方法で可能なものよりも早くがんが検出される。

0163

領域を、その遺伝子または領域内に腫瘍マーカーを有するがんを有する対象の数に基づいて、シーケンシングパネルに含めるために選択することができる。領域を、がんを有する対象の有病率およびその遺伝子内に存在する腫瘍マーカーに基づいて、シーケンシングパネルに含めるために選択することができる。領域内に腫瘍マーカーが存在することにより、がんを有する対象が示され得る。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ