図面 (/)

この項目の情報は公開日時点(2019年5月16日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題・解決手段

対象からの試料、例えば、腫瘍試料または腫瘍由来の試料中の腫瘍変異負荷を評価する方法が開示される。

概要

背景

がん細胞は、がんの発症及び進行の間、変異を蓄積する。これらの変異は、DNA修復、複製、もしくは修飾の本質的な機能不全、または外部の変異原への曝露の結果であり得る。ある特定の変異は、がん細胞に対して成長の利点を付与しており、がんが発症する組織微小環境において正に選択される。有利な変異の選択は腫瘍発生に寄与するが、腫瘍ネオ抗原の生成及びその後の免疫認識の尤度もまた、変異が発生すると増加する(Gubin and Schreiber. Science 350:158−9,2015)。よって、全ての変異負荷は、全エクソーム解析(WES)によって測定される場合、患者治療決定を導くために使用されて、例えば、がん免疫療法に対する持続的応答予測し得る。しかし、全エクソーム解析は広く利用可能であるわけではなく、高価で多大な時間がかかり、かつ技術的な課題があるため、ゲノム研究を日常的な診療に結び付けるには問題が残されたままである。

よって、ゲノムまたはエクソームのサブセットを標的とするゲノムプロファイリングを含む、腫瘍試料中の変異荷重を正確に測定するための新規の手法がなおも必要とされている。

概要

対象からの試料、例えば、腫瘍試料または腫瘍由来の試料中の腫瘍変異負荷を評価する方法が開示される。A

目的

本発明は、試料からのサブゲノム区間のセットの配列を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

試料(例えば、腫瘍試料または腫瘍由来の試料)中の腫瘍変異負荷を評価する方法であって、a)前記試料からのサブゲノム区間(例えば、コードサブゲノム区間)のセットであって、所定の遺伝子セットからのものである、前記サブゲノム区間のセットの配列、例えば、ヌクレオチド配列を提供することと、b)前記腫瘍変異負荷に対する値を決定することと、を含み、前記値が、前記サブゲノム区間のセット内の体細胞変化(例えば、1つ以上の体細胞変化)の数の関数であり、前記変化の数が、(i)サブゲノム区間内の機能的変化、及び(ii)サブゲノム区間内の生殖細胞変化を除外し、それにより、前記試料中の前記腫瘍変異負荷を評価する、前記方法。

請求項2

試料(例えば、腫瘍試料または腫瘍由来の試料)中の腫瘍変異負荷を評価する方法であって、(i)前記試料から複数の腫瘍メンバーを含むライブラリを取得することと、(ii)前記ライブラリを、選択された腫瘍メンバーを提供するためのベイトセットであって、前記腫瘍メンバーとハイブリッド形成する、前記ベイトセットと接触させて、それにより、ライブラリキャッチを提供することと、(iii)例えば、次世代配列決定法によって、前記ライブラリキャッチからの腫瘍メンバーから変化(例えば、体細胞変化)を含むサブゲノム区間(例えば、コードサブゲノム区間)に対する読み取りデータを取得することと、(iv)整列法によって前記読み取りデータを整列させることと、(v)前記読み取りデータから事前選択されたヌクレオチド位置ヌクレオチド値を割り当てることと、(vi)前記割り当てられたヌクレオチド位置のセットから、所定の遺伝子セットからのものである、サブゲノム区間のセットを選択することと、(vii)前記腫瘍変異負荷に対する値を決定することと、を含み、前記値が、前記サブゲノム区間のセット内の体細胞変化(例えば、1つ以上の体細胞変化)の数の関数であり、前記変化の数が、(a)サブゲノム区間内の機能的変化、及び(b)サブゲノム区間内の生殖細胞変化を除外し、それにより、前記試料中の前記腫瘍変異負荷を評価する、前記方法。

請求項3

前記所定の遺伝子セットが、全ゲノムまたは全エクソームを含まない、請求項1または2に記載の方法。

請求項4

前記サブゲノム区間のセットが、全ゲノムまたは全エクソームを含まない、請求項1または2に記載の方法。

請求項5

前記値が、前記所定の遺伝子セット、例えば、前記所定の遺伝子セットの前記コード領域の関数として表される、請求項1または2に記載の方法。

請求項6

前記値が、配列決定された前記サブゲノム区間、例えば、配列決定された前記コードサブゲノム区間の関数として表される、請求項1または2に記載の方法。

請求項7

前記値が、事前選択された単位当たりの体細胞変化の数の関数として、例えば、1メガ塩基当たりの体細胞変化の数の関数として表される、請求項1または2に記載の方法。

請求項8

前記値が、前記所定の遺伝子セットの事前選択された位置の数における体細胞変化の数、例えば、前記所定の遺伝子セットの前記コード領域の関数として表される、請求項1または2に記載の方法。

請求項9

前記値が、配列決定された前記サブゲノム区間(例えば、コードサブゲノム区間)の事前選択された位置の数における体細胞変化の数の関数として表される、請求項1または2に記載の方法。

請求項10

前記値が、前記所定の遺伝子セット内の1メガ塩基当たりの体細胞変化の数、例えば、前記所定の遺伝子セットの前記コード領域の関数として表される、請求項1または2に記載の方法。

請求項11

前記値が、配列決定された前記サブゲノム区間(例えば、コードサブゲノム区間)内の1メガ塩基当たりの変化の数の関数として表される、請求項1または2に記載の方法。

請求項12

前記腫瘍変異負荷が、より多くの前記ゲノムに、例えば、全エクソームまたは全ゲノムに外挿される、請求項1または2に記載の方法。

請求項13

前記試料が、対象、例えば、がんを有する対象、または療法を受けているか、もしくは受けたことのある対象からのものである、請求項1または2に記載の方法。

請求項14

前記腫瘍変異負荷が、例えば、参照集団、例えば、前記対象と同じ型のがんを有する患者、または前記対象と同じ種類の療法を受けているか、もしくは受けたことのある患者の参照集団からの試料中の前記腫瘍変異負荷におけるパーセンタイルとして表される、請求項1または2に記載の方法。

請求項15

前記機能的変化は、参照配列、例えば、野生型配列または未変異配列と比較すると、細胞分裂成長、または生存に対して影響を有し、例えば、細胞分裂、成長、または生存を促進する変化である、請求項1または2に記載の方法。

請求項16

前記機能的変化が、機能的変化のデータベース、例えば、COSMICデータベース(cancer.sanger.ac.uk/cosmic;Forbesetal.Nucl.AcidsRes.2015;43(D1):D805−D811)に含むことにより識別される、請求項1または2に記載の方法。

請求項17

前記機能的変化が、例えば、COSMICデータベースにおいて既知の体細胞変化として起こる既知の機能状態を伴う変化である、請求項1または2に記載の方法。

請求項18

前記機能的変化が、機能的である可能性が高い状態、例えば、腫瘍抑制遺伝子における切断を伴う変化である、請求項1または2に記載の方法。

請求項19

前記機能的変化が、ドライバー変異、例えば、細胞生存または繁殖を増加することによって、クローンにその微小環境において、選択的利点供与する変化である、請求項1または2に記載の方法。

請求項20

前記機能的変化が、クローン展開を引き起こすことができる変化である、請求項1または2に記載の方法。

請求項21

前記機能的変化が、次の:(a)成長シグナルにおける自給自足、(b)抗成長シグナルの減少、例えば、それに対する非感受性、(c)アポトーシスの減少、(d)複製能の増加、(e)血管新生持続、または(f)組織浸潤もしくは転移のうちの1つ以上を引き起こすことができる変化である、請求項1または2に記載の方法。

請求項22

前記機能的変化が、パッセンジャー変異ではなく、例えば、クローンの適応度に対して検出可能な影響を有する変化である、請求項1または2に記載の方法。

請求項23

前記機能的変化が、意義不明の変異形VUS)ではなく、例えば、その病原性を確認も排除もできない変化ではない、請求項1または2に記載の方法。

請求項24

前記所定の遺伝子セット内の事前選択された遺伝子(例えば、腫瘍遺伝子)における複数(例えば、10%、20%、30%、40%、50%、または75%以上)の機能的変化が除外される、請求項1または2に記載の方法。

請求項25

前記所定の遺伝子セット内の事前選択された遺伝子(例えば、腫瘍遺伝子)における全ての機能的変化が除外される、請求項1または2に記載の方法。

請求項26

前記所定の遺伝子セット内の複数の事前選択された遺伝子(例えば、腫瘍遺伝子)における複数の機能的変化が除外される、請求項1または2に記載の方法。

請求項27

前記所定の遺伝子セット内の全ての遺伝子(例えば、腫瘍遺伝子)における全ての機能的変化が除外される、請求項1または2に記載の方法。

請求項28

前記生殖細胞変化が、適合正常配列との比較を使用しない方法の使用によって除外される、請求項1または2に記載の方法。

請求項29

前記生殖細胞変化が、SGZアルゴリズムの使用を含む方法によって除外される、請求項1または2に記載の方法。

請求項30

前記生殖細胞変化が、生殖細胞変化のデータベース、例えば、dbSNPデータベース(www.ncbi.nlm.nih.gov/SNP/index.html;Sherryetal.NucleicAcidsRes.2001;29(1):308−311)に含むことにより識別される、請求項1または2に記載の方法。

請求項31

前記生殖細胞変化が、ExACデータベースの複数のカウント(exac.broadinstitute.org;ExomeAggregationConsortiumetal.「Analysisofprotein−codinggeneticin60,706humans,」bioRxivpreprint.October30,2015)に含むことにより識別される、請求項1または2に記載の方法。

請求項32

前記生殖細胞変化が、一塩基多型(SNP)、塩基、置換インデル、またはサイレント変異(例えば、同義変異)である、請求項1または2に記載の方法。

請求項33

前記生殖細胞変化が、1000人ゲノムプロジェクトデータベース(www.1000genomes.org;McVeanetal.Nature.2012;491,56−65)に含むことにより識別される、請求項1または2に記載の方法。

請求項34

前記生殖細胞変化が、ESPデータベース(ExomeVariantServer,NHLBIGOExomeSequencingProject(ESP),Seattle,WA(evs.gs.washington.edu/EVS/)に含むことにより識別される、請求項1または2に記載の方法。

請求項35

前記体細胞変化が、サイレント変異、例えば、同義変化である、請求項1または2に記載の方法。

請求項36

前記体細胞変化が、パッセンジャー変異、例えば、クローンの適応度に対して検出可能な影響を有さない変化である、請求項1または2に記載の方法。

請求項37

前記体細胞変化が、意義不明の変異形(VUS)、例えば、その病原性を確認も排除もできない変化である、請求項1または2に記載の方法。

請求項38

前記体細胞変化が、点変異である、請求項1または2に記載の方法。

請求項39

前記体細胞変化が、短い変異形(例えば、短いコード変異形)、例えば、塩基置換、インデル、挿入、または欠失である、請求項1または2に記載の方法。

請求項40

前記体細胞変化が、非同義一塩基変異形(SNV)である、請求項1または2に記載の方法。

請求項41

前記体細胞変化が、スプライス変異形である、請求項1または2に記載の方法。

請求項42

前記体細胞変化が、がん表現型に関連していると識別されていない、請求項1または2に記載の方法。

請求項43

前記体細胞変化が、再編成以外、例えば、転座以外である、請求項1または2に記載の方法。

請求項44

前記所定の遺伝子セットが、変異体形態で、細胞分裂、成長、もしくは生存に対する影響に関連するか、またはがんに関連する複数の遺伝子を含む、請求項1または2に記載の方法。

請求項45

前記所定の遺伝子セットが、少なくとも約50個以上、約100個以上、約150個以上、約200個以上、約250個以上、約300個以上、約350個以上、約400個以上、約450個以上、または約500個以上の遺伝子を含む、請求項1または2に記載の方法。

請求項46

前記所定の遺伝子セットが、表1〜4または図3A〜4Dから選ばれる遺伝子または遺伝子産物のうちの少なくとも約50個以上、約100個以上、約150個以上、約200個以上、約250個以上、約300個以上、または全てを含む、請求項1または2に記載の方法。

請求項47

前記腫瘍試料から複数の腫瘍メンバーを含むライブラリを取得することをさらに含む、請求項1または2に記載の方法。

請求項48

前記ライブラリをベイトセットと接触させて、選択された腫瘍メンバーを提供することをさらに含み、前記ベイトセットが前記腫瘍メンバーとハイブリッド形成して、それにより、ライブラリキャッチを提供する、請求項1または2に記載の方法。

請求項49

前記ライブラリまたはライブラリキャッチからの腫瘍メンバーから体細胞変化を含むサブゲノム区間に対する読み取りデータを取得し、それにより、例えば、次世代配列決定法によって前記サブゲノム区間に対する読み取りデータを取得することをさらに含む、請求項1または2に記載の方法。

請求項50

整列法によって前記読み取りデータを整列させることをさらに含む、請求項1または2に記載の方法。

請求項51

前記読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てることをさらに含む、請求項1または2に記載の方法。

請求項52

前記サブゲノム区間に対する読み取りデータを取得することが、表1〜4または図3A〜4Dから選ばれる遺伝子または遺伝子産物のうちの少なくとも約50個以上、約100個以上、約150個以上、約200個以上、約250個以上、約300個以上、または全てからのサブゲノム区間を配列決定することを含む、請求項1または2に記載の方法。

請求項53

前記サブゲノム区間に対する読み取りデータを取得することが、平均固有カバレッジの約250X超、約500X超、または約1,000X超で配列決定することを含む、請求項1または2に記載の方法。

請求項54

前記サブゲノム区間に対する読み取りデータを取得することが、配列決定された遺伝子(例えば、エクソン)の95%超、約97%超、または約99%超において、平均固有カバレッジの約250X超、約500X超、または約1,000X超で配列決定することを含む、請求項1または2に記載の方法。

請求項55

前記配列が、請求項1〜54のいずれかに記載の方法によって提供される、請求項1または2に記載の方法。

請求項56

前記腫瘍試料中の変異形、例えば、変化を、a)i)複数の選択されたサブゲノム区間の各々に対して、前記選択されたサブゲノム区間における正規化された配列カバレッジに対する値を含む配列カバレッジ入力(SCI)であって、サブゲノム区間に対する読み取りデータの数と処理適合対照に対する読み取りデータの数との関数である、前記SCI、ii)複数の選択された生殖細胞SNPの各々に対して、前記腫瘍試料中の対立遺伝子頻度に対する値を含むSNP対立遺伝子頻度入力(SAFI)であって、前記腫瘍試料中の低頻度または代替対立遺伝子の頻度に少なくとも部分的に基づく、前記SAFI、及びiii)前記腫瘍試料中の前記変異形に対する前記対立遺伝子頻度を含む、変異形対立遺伝子頻度入力(VAFI)を取得することと、b)SCI及びSAFIの関数として、i)複数のゲノム分節の各々に対するゲノム分節総コピー数(C)、ii)複数のゲノム分節の各々に対するゲノム分節低頻度対立遺伝子コピー数(M)、及びiii)試料純度(p)に対する値を取得することであって、前記C、M、及びpの値が、ゲノム全体でのコピー数モデルをSCI及びSAFIに適合させることによって得られる、前記取得することと、c)前記変異形が、体細胞、サブクローナル体細胞変異形、生殖細胞、または区別不可能であることを示し、VAFI、p、C、及びMの関数である、変異型に対する値、gを取得することと、によって特徴付けることをさらに含む、請求項1または2に記載の方法。

請求項57

複数の選択されたサブゲノム区間の各々、複数の選択された生殖細胞SNPの各々、及び変異形(例えば、変化)を配列決定することをさらに含み、正規化の前の前記平均配列カバレッジが、少なくとも約250x、例えば、少なくとも約500xである、請求項56に記載の方法。

請求項58

前記ゲノム全体でのコピー数モデルをSCIに適合させることが、以下の等式を使用することを含み、、式中、ψが腫瘍倍数性である、請求項56に記載の方法。

請求項59

前記ゲノム全体でのコピー数モデルをSAFIに適合させることが、以下の等式を使用することを含み、、式中、AFが対立遺伝子頻度である、請求項56に記載の方法。

請求項60

gが、体細胞/生殖細胞状態のモデルに対するVAFI、p、C、及びMの値の適合を決定することによって決定される、請求項56に記載の方法。

請求項61

前記gの値が、以下によって取得され、、式中、AFが対立遺伝子頻度である、請求項56に記載の方法。

請求項62

0であるか、または0に近いgの値が、前記変異形が体細胞変異形であることを示し、1であるか、または1に近いgの値が、前記変異形が生殖細胞変異形であることを示し、0超であるが1未満であるgの値が、区別不能な結果を示し、0を著しく下回るgの値が、前記変異形がサブクローナル体細胞変異形であることを示す、請求項56に記載の方法。

請求項63

前記試料(例えば、腫瘍試料または腫瘍由来の試料)が、1つ以上の前悪性もしくは悪性細胞固形腫瘍軟組織腫瘍、もしくは転移性病巣からの細胞;外科的縁からの組織もしくは細胞;組織学的に正常な組織;1つ以上の循環腫瘍細胞(CTC);正常な近接組織(NAT);前記腫瘍を有するか、もしくはそれを有するリスクがある同じ対象からの血液試料;またはFFPE試料を含む、請求項1または2に記載の方法。

請求項64

前記試料が、FFPE試料である、請求項1または2に記載の方法。

請求項65

前記FFPE試料が、次の特性:(a)25mm2以上の表面積を有するか、(b)1mm3以上の試料体積を有するか、または(c)80%以上もしくは30,000個以上の細胞の有核細胞充実性を有するのうちの1つ、2つ、または全てを有する、請求項64に記載の方法。

請求項66

前記試料が、循環腫瘍DNA(ctDNA)を含む試料である、請求項1または2に記載の方法。

請求項67

前記試料が、固形腫瘍、血液癌、またはそれらの転移形態から取得される、請求項1または2に記載の方法。

請求項68

前記腫瘍変異負荷の評価に応じて前記腫瘍試料、または前記腫瘍試料が由来する前記対象を分類することをさらに含む、請求項1または2に記載の方法。

請求項69

前記患者または別の者または実体介護者内科医、腫瘍医、病院診療所、第3者の支払人保険会社、もしくは官に対する、報告書、例えば、電子報告書、ウェブベース報告書、または書面報告書を作成することをさらに含む、請求項1または2に記載の方法。

請求項70

前記報告書が、前記腫瘍変異負荷を含む前記方法による結果を含む、請求項69に記載の方法

請求項71

試料(腫瘍試料または腫瘍由来の試料)中の腫瘍変異負荷を評価するためのシステムであって、メモリに動作可能に接続された少なくとも1つのプロセッサを備え、前記少なくとも1つのプロセッサが、実行すると、a)前記腫瘍試料からのサブゲノム区間(例えば、コードサブゲノム区間)のセットの配列、例えば、ヌクレオチド配列を取得することであって、前記コードサブゲノム区間のセットが所定の遺伝子セットからのものである、配列を取得することと、b)前記腫瘍変異負荷に対する前記値を決定することと、を行うように構成され、前記値が、前記サブゲノム区間のセット内の体細胞変化(例えば、1つ以上の体細胞変化)の数の関数であり、前記変化の数が、(i)サブゲノム区間(例えば、コードサブゲノム区間)内の機能的変化、及び(ii)サブゲノム区間(例えば、コードサブゲノム区間)内の生殖細胞変化を除外する、前記システム。

技術分野

0001

関連出願の相互参照
本出願は、2016年2月29日出願の米国仮出願第62/301,534号の利益を主張する。前述の出願内容は、参照によってそれらの全体が本明細書に組み込まれる。

0002

本発明は、腫瘍変異負荷などの遺伝子変化を評価する方法に関する。

背景技術

0003

がん細胞は、がんの発症及び進行の間、変異を蓄積する。これらの変異は、DNA修復、複製、もしくは修飾の本質的な機能不全、または外部の変異原への曝露の結果であり得る。ある特定の変異は、がん細胞に対して成長の利点を付与しており、がんが発症する組織微小環境において正に選択される。有利な変異の選択は腫瘍発生に寄与するが、腫瘍ネオ抗原の生成及びその後の免疫認識の尤度もまた、変異が発生すると増加する(Gubin and Schreiber. Science 350:158−9,2015)。よって、全ての変異負荷は、全エクソーム解析(WES)によって測定される場合、患者治療決定を導くために使用されて、例えば、がん免疫療法に対する持続的応答予測し得る。しかし、全エクソーム解析は広く利用可能であるわけではなく、高価で多大な時間がかかり、かつ技術的な課題があるため、ゲノム研究を日常的な診療に結び付けるには問題が残されたままである。

0004

よって、ゲノムまたはエクソームのサブセットを標的とするゲノムプロファイリングを含む、腫瘍試料中の変異荷重を正確に測定するための新規の手法がなおも必要とされている。

0005

本発明は、例えば、ハイブリッド捕捉に基づく次世代配列決定(NGS)プラットフォームを使用して、患者試料からのゲノムまたはエクソームの小画分をプロファイリングすることが、全ての変異荷重の分析に対して有効な代替法役割を果たすという発見に少なくとも部分的に基づく。変異負荷を検出するための標的NGS手法を含む方法を使用することは、例えば、全ゲノムまたは全エクソーム解析と比較してより早い、例えば、より臨床的に管理可能な結果所要時間(約2週間)、標準化情報パイプライン、及びより管理可能なコストを含むが、これらに限定されない、いくつかの利点を有する。本明細書に開示される方法は、本方法が主観尺度(例えば、病理学スコア付け)よりむしろ、客観的尺度(例えば、変異荷重)を生み出すために、組織化学的に検出されるタンパク質発現などの従来のマーカーを上回る他の利点を有する。本明細書に開示される方法は、標的療法のための実施可能な変化、ならびに免疫療法のための変異負荷の同時検出も可能にする。これらの方法は、がんを有する患者における療法に対する応答の臨床的に実施可能な予測因子を提供し得る。

0006

したがって、本発明は、試料からのサブゲノム区間のセットの配列を提供すること、及び変異荷重に対する値を決定することによって、試料中の変異荷重を評価する方法を少なくとも部分的に提供し、ここで、値は、サブゲノム区間のセット内の変化の数の関数である。ある特定の実施形態において、サブゲノム区間のセットは、所定の遺伝子セット、例えば、全ゲノムまたはエクソームを含まない所定の遺伝子セットからのものである。ある特定の実施形態において、サブゲノム区間のセットは、コードサブゲノム区間のセットである。他の実施形態において、サブゲノム区間のセットは、コードサブゲノム区間及び非コードサブゲノム区間の両方を含有する。ある特定の実施形態において、変異荷重に対する値は、サブゲノム区間のセット内の変化(例えば、体細胞変化)の数の関数である。ある特定の実施形態において、変化の数は、機能的変化生殖細胞変化、またはそれらの両方を除外する。いくつかの実施形態において、試料は、腫瘍試料または腫瘍由来の試料である。本明細書に記載される方法はまた、例えば、試料から複数の腫瘍メンバーを含むライブラリを取得することと、ライブラリをベイトセットと接触させて、ハイブリダイゼーションによって選択された腫瘍メンバーを提供し、それにより、ライブラリキャッチを提供することと、ライブラリキャッチからの腫瘍メンバーから変化を含むサブゲノム区間に対する読み取りデータを取得することと、整列法によって読み取りデータを整列させることと、読み取りデータから事前選択されたヌクレオチド位置ヌクレオチド値を割り当てることと、割り当てられたヌクレオチド位置のセットから、所定の遺伝子セットからのものであるサブゲノム区間のセットを選択することと、のうちの1つ以上を含み得る。

0007

一態様において、本発明は、試料、例えば、腫瘍試料(例えば、腫瘍から取得される試料)中の変異荷重を評価する方法を特徴とする。本方法は、
a)試料からのサブゲノム区間(例えば、コードサブゲノム区間)のセットであって、所定の遺伝子セットからのものである、サブゲノム区間のセットの配列、例えば、ヌクレオチド配列を提供することと、
b)変異荷重に対する値を決定することと、を含み、値は、サブゲノム区間のセット内の変化(例えば、1つ以上の変化)、例えば、体細胞変化(例えば、1つ以上の体細胞変化)の数の関数である。

0008

ある特定の実施形態において、変化の数は、サブゲノム区間内の機能的変化を除外する。他の実施形態において、変化の数は、サブゲノム区間内の生殖細胞変化を除外する。ある特定の実施形態において、変化の数は、サブゲノム区間内の機能的変化及びサブゲノム区間内の生殖細胞変化を除外する。

0009

ある特定の実施形態において、サブゲノム区間のセットは、コードサブゲノム区間を含む。他の実施形態において、サブゲノム区間のセットは、非コードサブゲノム区間を含む。ある特定の実施形態において、サブゲノム区間のセットは、コードサブゲノム区間を含む。他の実施形態において、サブゲノム区間のセットは、1つ以上のコードサブゲノム区間及び1つ以上の非コードサブゲノム区間を含む。ある特定の実施形態において、サブゲノム区間のセット内のサブゲノム区間の約5%以上、約10%以上、約20%以上、約30%以上、約40%以上、約50%以上、約60%以上、約70%以上、約80%以上、約90%以上、または約95%以上がコードサブゲノム区間である。他の実施形態において、サブゲノム区間のセット内のサブゲノム区間の約90%以下、約80%以下、約70%以下、約60%以下、約50%以下、約40%以下、約30%以下、約20%以下、約10%以下、または約5%以下が非コードサブゲノム区間である。

0010

他の実施形態において、サブゲノム区間のセットは、全ゲノムまたは全エクソームを含まない。他の実施形態において、コードサブゲノム区間のセットは、全エクソームを含まない。

0011

ある特定の実施形態において、所定の遺伝子セットは、全ゲノムまたは全エクソームを含まない。他の実施形態において、所定の遺伝子セットは、表1〜4または図3A〜4Dに記載される1つ以上の遺伝子を含むか、またはそれらからなる。

0012

ある特定の実施形態において、値は、所定の遺伝子セットの関数として表される。ある特定の実施形態において、値は、所定の遺伝子セットのコード領域の関数として表される。他の実施形態において、値は、所定の遺伝子セットの非コード領域の関数として表される。ある特定の実施形態において、値は、所定の遺伝子セットのエクソンの関数として表される。他の実施形態において、値は、所定の遺伝子セットのイントロンの関数として表される。

0013

ある特定の実施形態において、値は、配列決定された所定の遺伝子セットの関数として表される。ある特定の実施形態において、値は、配列決定された所定の遺伝子セットのコード領域の関数として表される。他の実施形態において、値は、配列決定された所定の遺伝子セットの非コード領域の関数として表される。ある特定の実施形態において、値は、配列決定された所定の遺伝子セットのエクソンの関数として表される。他の実施形態において、値は、配列決定された所定の遺伝子セットのイントロンの関数として表される。

0014

ある特定の実施形態において、値は、所定の遺伝子セットの事前選択された位置の数における変化(例えば、体細胞変化)の数の関数として表される。ある特定の実施形態において、値は、所定の遺伝子セットのコード領域の事前選択された位置の数における変化(例えば、体細胞変化)の数の関数として表される。他の実施形態において、値は、所定の遺伝子セットの非コード領域の事前選択された位置の数における変化(例えば、体細胞変化)の数の関数として表される。ある特定の実施形態において、値は、所定の遺伝子セットのエクソンの事前選択された位置の数における変化(例えば、体細胞変化)の数の関数として表される。他の実施形態において、値は、所定の遺伝子セットのイントロンの事前選択された位置の数における変化(例えば、体細胞変化)の数の関数として表される。

0015

ある特定の実施形態において、値は、配列決定された所定の遺伝子セットの事前選択された位置の数における変化(例えば、体細胞変化)の数の関数として表される。ある特定の実施形態において、値は、配列決定された所定の遺伝子セットのコード領域の事前選択された位置の数における変化(例えば、体細胞変化)の数の関数として表される。他の実施形態において、値は、配列決定された所定の遺伝子セットの非コード領域の事前選択された位置の数における変化(例えば、体細胞変化)の数の関数として表される。ある特定の実施形態において、値は、配列決定された所定の遺伝子セットのエクソンの事前選択された位置の数における変化(例えば、体細胞変化)の数の関数として表される。他の実施形態において、値は、配列決定された所定の遺伝子セットのイントロンの事前選択された位置の数における変化(例えば、体細胞変化)の数の関数として表される。

0016

ある特定の実施形態において、値は、事前選択された単位当たりの変化(例えば、体細胞変化)の数の関数として、例えば、1メガ塩基当たりの体細胞変化の数の関数として表される。

0017

ある特定の実施形態において、値は、所定の遺伝子セット内の1メガ塩基当たりの変化(例えば、体細胞変化)の数の関数として表される。ある特定の実施形態において、値は、所定の遺伝子セットのコード領域内の1メガ塩基当たりの変化(例えば、体細胞変化)の数の関数として表される。他の実施形態において、値は、所定の遺伝子セットの非コード領域内の1メガ塩基当たりの変化(例えば、体細胞変化)の数の関数として表される。ある特定の実施形態において、値は、所定の遺伝子セットのエクソン内の1メガ塩基当たりの変化(例えば、体細胞変化)の数の関数として表される。他の実施形態において、値は、所定の遺伝子セットのイントロン内の1メガ塩基当たりの変化(例えば、体細胞変化)の数の関数として表される。

0018

ある特定の実施形態において、値は、配列決定された所定の遺伝子セット内の1メガ塩基当たりの変化(例えば、体細胞変化)の数の関数として表される。ある特定の実施形態において、値は、配列決定された所定の遺伝子セットのコード領域内の1メガ塩基当たりの変化(例えば、体細胞変化)の数の関数として表される。他の実施形態において、値は、配列決定された所定の遺伝子セットの非コード領域内の1メガ塩基当たりの変化(例えば、体細胞変化)の数の関数として表される。ある特定の実施形態において、値は、配列決定された所定の遺伝子セットのエクソン内の1メガ塩基当たりの変化(例えば、体細胞変化)の数の関数として表される。他の実施形態において、値は、配列決定された所定の遺伝子セットのイントロン内の1メガ塩基当たりの変化(例えば、体細胞変化)の数の関数として表される。

0019

ある特定の実施形態において、変異荷重は、より多くのゲノムに、例えば、エクソームまたは全ゲノムに外挿されて、例えば、全ての変異荷重を得る。他の実施形態において、変異荷重は、より多くのエクソームに、例えば、全エクソームに外挿される。

0020

ある特定の実施形態において、試料は、対象からのものである。ある特定の実施形態において、対象は、障害、例えば、がんを有する。他の実施形態において、対象は、療法、例えば、免疫療法を受けているか、または受けたことがある。

0021

ある特定の実施形態において、変異荷重は、例えば、参照集団からの試料中の変異荷重におけるパーセンタイルとして表される。ある特定の実施形態において、参照集団は、対象と同じ型のがんを有する患者を含む。他の実施形態において、参照集団は、対象と同じ種類の療法を受けているか、または受けたことのある患者を含む。

0022

別の態様において、本発明は、試料、例えば、腫瘍試料または腫瘍由来の試料中の変異荷重を評価する方法を特徴とする。本方法は、
(i)試料から複数の腫瘍メンバーを含むライブラリを取得することと、
(ii)ライブラリを、選択された腫瘍メンバーを提供するためのベイトセットであって、腫瘍メンバーとハイブリッド形成する、該ベイトセットと接触させて、それにより、ライブラリキャッチを提供することと、
(iii)例えば、次世代配列決定法によって、該ライブラリキャッチからの腫瘍メンバーから変化(例えば、体細胞変化)を含むサブゲノム区間に対する読み取りデータを取得することと、
(iv)整列法によって該読み取りデータを整列させることと、
(v)該読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てることと、
(vi)割り当てられたヌクレオチド位置のセットから、所定の遺伝子セットからのものである、サブゲノム区間(例えば、コードサブゲノム区間)のセットを選択することと、
(vii)変異荷重に対する値を決定することと、を含み、値は、サブゲノム区間のセット内の変化(例えば、1つ以上の変化)、例えば、体細胞変化(例えば、1つ以上の体細胞変化)の数の関数である。

0023

ある特定の実施形態において、変化の数(例えば、体細胞変化)は、サブゲノム区間内の機能的変化を除外する。他の実施形態において、変化の数は、サブゲノム区間内の生殖細胞変化を除外する。ある特定の実施形態において、変化の数(例えば、体細胞変化)は、サブゲノム区間内の機能的変化及びサブゲノム区間内の生殖細胞変化を除外する。

0024

変化の種類
本明細書に記載されるような方法またはシステムにおいて、様々な種類の変化(例えば、体細胞変化)が評価され得、変異荷重の分析のために使用され得る。

0025

体細胞変化
ある特定の実施形態において、本明細書に記載される方法に従って評価される変化は、変化(例えば、体細胞変化)である。

0026

ある特定の実施形態において、変化(例えば、体細胞変化)は、短いコード変異形、例えば、塩基置換またはインデル(挿入または欠失)である。ある特定の実施形態において、変化(例えば、体細胞変化)は、点変異である。他の実施形態において、変化(例えば、体細胞変化)は、再編成以外、例えば、転座以外である。ある特定の実施形態において、変化(例えば、体細胞変化)は、スプライス変異形である。

0027

ある特定の実施形態において、変化(例えば、体細胞変化)は、サイレント変異、例えば、同義変化である。他の実施形態において、変化(例えば、体細胞変化)は、非同義一塩基変異形(SNV)である。他の実施形態において、変化(例えば、体細胞変化)は、パッセンジャー変異、例えば、細胞のクローン適応度に対して検出可能な影響を有さない変化である。ある特定の実施形態において、変化(例えば、体細胞変化)は、意義不明の変異形(VUS)、例えば、病原性を確認も排除もできない変化である。ある特定の実施形態において、変化(例えば、体細胞変化)は、がん表現型に関連していると識別されていない。

0028

ある特定の実施形態において、変化(例えば、体細胞変化)は、細胞分裂、成長、もしくは生存に対する影響に関連していないか、またはそれに関連すると知られていない。他の実施形態において、変化(例えば、体細胞変化)は、細胞分裂、成長、または生存に対する影響に関連する。

0029

ある特定の実施形態において、体細胞変化のレベル増加は、1つ以上の分類または種類の体細胞変化(例えば、再編成、点変異、インデル、またはそれらの任意の組み合わせ)のレベル増加である。ある特定の実施形態において、体細胞変化のレベル増加は、1つの分類または1つの種類の体細胞変化(例えば、再編成のみ、点変異のみ、またはインデルのみ)のレベル増加である。ある特定の実施形態において、体細胞変化のレベル増加は、事前選択された位置(例えば、本明細書に記載される変化)における体細胞変化のレベル増加である。ある特定の実施形態において、体細胞変化のレベル増加は、事前選択された体細胞変化(例えば、本明細書に記載される変化)のレベル増加である。

0030

機能的変化
ある特定の実施形態において、変化の数(例えば、体細胞変化)は、サブゲノム区間内の機能的変化を除外する。

0031

いくつかの実施形態において、機能的変化は、参照配列、例えば、野生型配列または未変異配列と比較すると、細胞分裂、成長、または生存に対して影響を有し、例えば、細胞分裂、成長、または生存を促進する変化である。ある特定の実施形態において、機能的変化は、機能的変化のデータベース、例えば、COSMICデータベース(cancer.sanger.ac.uk/cosmic;Forbes et al.Nucl. AcidsRes. 2015;43(D1):D805−D811)に含むことにより識別される。他の実施形態において、機能的変化は、例えば、COSMICデータベースにおいて既知の体細胞変化として起こる既知の機能状態を伴う変化である。ある特定の実施形態において、機能的変化は、機能的である可能性が高い状態、例えば、腫瘍抑制遺伝子における切断を伴う変化である。ある特定の実施形態において、機能的変化は、ドライバー変異、例えば、細胞生存または繁殖を増加することによって、クローンにその微小環境において、選択優位性供与する変化である。他の実施形態において、機能的変化は、クローン展開を引き起こすことができる変化である。ある特定の実施形態において、機能的変化は、次の(a)成長シグナルにおける自給自足、(b)抗成長シグナルの減少、例えば、それに対する非感受性、(c)アポトーシスの減少、(d)複製能の増加、(e)血管新生の持続、または(f)組織浸潤もしくは転移のうちの1つ、2つ、3つ、4つ、5つ、または全てを引き起こすことができる変化である。

0032

ある特定の実施形態において、機能的変化は、パッセンジャー変異ではなく、例えば、細胞のクローンの適応度に対して検出可能な影響を有さない変化ではない。ある特定の実施形態において、機能的変化は、意義不明の変異形(VUS)ではなく、例えば、その病原性を確認も排除もできない変化ではない。

0033

ある特定の実施形態において、所定の遺伝子セット内の事前選択された腫瘍遺伝子における複数(例えば、約10%、20%、30%、40%、50%、60%、70%、80%、90%以上)の機能的変化が除外される。ある特定の実施形態において、所定の遺伝子セット内の事前選択された遺伝子(例えば、腫瘍遺伝子)における全ての機能的変化が除外される。ある特定の実施形態において、所定の遺伝子セット内の複数の事前選択された遺伝子(例えば、腫瘍遺伝子)における複数の機能的変化が除外される。ある特定の実施形態において、所定の遺伝子セット内の全ての遺伝子(例えば、腫瘍遺伝子)における全ての機能的変化が除外される。

0034

生殖細胞変異
ある特定の実施形態において、変化の数は、サブゲノム区間内の生殖細胞変異を除外する。ある特定の実施形態において、体細胞変化は、生殖細胞変異と同一または同様ではなく、例えば、それと区別可能である。

0035

ある特定の実施形態において、生殖細胞変化は、一塩基多型(SNP)、塩基置換、インデル(例えば、挿入または欠失)、またはサイレント変異(例えば、同義変異)である。

0036

ある特定の実施形態において、生殖細胞変化は、適合正常配列との比較を使用しない方法の使用によって除外される。他の実施形態において、生殖細胞変化は、SGZアルゴリズムの使用を含む方法によって除外される。ある特定の実施形態において、生殖細胞変化は、生殖細胞変化のデータベース、例えば、dbSNPデータベース(www.ncbi.nlm.nih.gov/SNP/index.html;Sherry et al.Nucleic AcidsRes. 2001;29(1):308−311)に含むことにより識別される。他の実施形態において、生殖細胞変化は、ExACデータベースの複数のカウント(exac.broadinstitute.org;Exome Aggregation Consortium et al.“Analysis of protein−coding genetic in 60,706 humans,”bioRxiv preprint. October 30,2015)に含むことにより識別される。いくつかの実施形態において、生殖細胞変化は、1000人ゲノムプロジェクトデータベース(www.1000genomes.org;McVean et al.Nature. 2012;491,56−65)に含むことにより識別される。いくつかの実施形態において、生殖細胞変化は、ESPデータベース(Exome Variant Server,NHLBI GO Exome Sequencing Project(ESP),Seattle,WA(evs.gs.washington.edu/EVS/)に含むことにより識別される。

0037

多重遺伝子分析
本明細書に記載される方法及びシステムは、例えば、所定の遺伝子セットからの、例えば、サブゲノム区間のセットを評価する。

0038

ある特定の実施形態において、所定の遺伝子セットは、変異体形態で、細胞分裂、成長、もしくは生存に対する影響に関連するか、またはがん、例えば、本明細書に記載されるがんに関連する複数の遺伝子を含む。

0039

ある特定の実施形態において、所定の遺伝子セットは、少なくとも約50個以上、約100個以上、約150個以上、約200個以上、約250個以上、約300個以上、約350個以上、約400個以上、約450個以上、約500個以上、約550個以上、約600個以上、約650個以上、約700個以上、約750個以上、または約800個以上の、例えば、本明細書に記載されるような遺伝子を含む。いくつかの実施形態において、所定の遺伝子セットは、表1〜4または図3A〜4Dから選ばれる遺伝子または遺伝子産物のうちの少なくとも約50個以上、約100個以上、約150個以上、約200個以上、約250個以上、約300個以上、または全てを含む。

0040

ある特定の実施形態において、本方法は、試料から複数の腫瘍メンバーを含むライブラリを取得することをさらに含む。ある特定の実施形態において、本方法は、ライブラリをベイトセットと接触させて、選択された腫瘍メンバーを提供することをさらに含み、ここで、該ベイトセットは、ライブラリからの腫瘍メンバーとハイブリッド形成して、それにより、ライブラリキャッチを提供する。ある特定の実施形態において、本方法は、ライブラリまたはライブラリキャッチからの腫瘍メンバーから変化(例えば、体細胞変化)を含むサブゲノム区間に対する読み取りデータを取得し、それにより、例えば、次世代配列決定法によってサブゲノム区間に対する読み取りデータを取得することをさらに含む。ある特定の実施形態において、本方法は、整列法、例えば、本明細書に記載される整列法によってサブゲノム区間に対する読み取りデータを整列させることをさらに含む。ある特定の実施形態において、本方法は、例えば、本明細書に記載される変異呼び出し法によってサブゲノム区間に対する読み取りデータから事前選択されたヌクレオチド位置にヌクレオチド値を割り当てることをさらに含む。

0041

ある特定の実施形態において、本方法は、
(a)試料から複数の腫瘍メンバーを含むライブラリを取得すること、
(b)ライブラリを、選択された腫瘍メンバーを提供するためのベイトセットであって、腫瘍メンバーとハイブリッド形成する、該ベイトセットと接触させて、それにより、ライブラリキャッチを提供すること、
(c)該ライブラリキャッチからの腫瘍メンバーから変化(例えば、体細胞変化)を含むサブゲノム区間に対する読み取りデータを取得し、それにより、例えば、次世代配列決定法によってサブゲノム区間に対する読み取りデータを取得すること、
(d)整列法、例えば、本明細書に記載される整列法によって該読み取りデータを整列させること、または
(e)例えば、本明細書に記載される変異呼び出し法によって、該読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること、のうちの1つ、2つ、3つ、4つ、または全てをさらに含む。

0042

ある特定の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、少なくとも約50個以上、約100個以上、約150個以上、約200個以上、約250個以上、約300個以上、約350個以上、約400個以上、約450個以上、約500個以上、約550個以上、約600個以上、約650個以上、約700個以上、約750個以上、または約800個以上の遺伝子からのサブゲノム区間を配列決定することを含む。ある特定の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、表1〜4または図3A〜4Dから選ばれる遺伝子または遺伝子産物のうちの少なくとも約50個以上、約100個以上、約150個以上、約200個以上、約250個以上、約300個以上、または全てからのサブゲノム区間を配列決定することを含む。

0043

ある特定の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、平均固有カバレッジの約250X超で配列決定することを含む。他の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、平均固有カバレッジの約500X超で配列決定することを含む。他の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、平均固有カバレッジの約1,000X超で配列決定することを含む。

0044

ある特定の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、配列決定された遺伝子(例えば、エクソン)の約99%超において、平均固有カバレッジの約250X超で配列決定することを含む。他の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、配列決定された遺伝子(例えば、エクソン)の約95%超において、平均固有カバレッジの約500X超で配列決定することを含む。ある特定の実施形態において、サブゲノム区間に対する読み取りデータを取得することは、配列決定された遺伝子(例えば、エクソン)の約99%超において、平均固有カバレッジの約250X超、約500X超、または約1,000X超で配列決定することを含む。

0045

ある特定の実施形態において、本明細書に記載される、サブゲノム区間(例えば、コードサブゲノム区間)のセットの配列、例えば、ヌクレオチド配列は、本明細書に記載される方法によって提供される。ある特定の実施形態において、配列は、適合正常対照(例えば、野生型対照)、適合腫瘍対照(例えば、原発転移性)、またはそれらの両方を含む方法を使用することなく提供される。

0046

SGZ分析
ある特定の実施形態において、生殖細胞変化は、SGZアルゴリズムの使用を含む方法またはシステムによって除外される。

0047

ある特定の実施形態において、本方法は、腫瘍試料中の変異形、例えば、変化を、
a)i)複数の選択されたサブゲノム区間の各々に対して、選択されたサブゲノム区間における正規化された配列カバレッジに対する値を含む配列カバレッジ入力(SCI)であって、サブゲノム区間に対する読み取りデータの数と処理適合対照に対する読み取りデータの数との関数である、SCI、
ii)複数の選択された生殖細胞SNPの各々に対して、腫瘍試料中の対立遺伝子頻度に対する値を含むSNP対立遺伝子頻度入力(SAFI)であって、腫瘍試料中の低頻度または代替対立遺伝子の頻度に少なくとも部分的に基づく、SAFI、及び
iii)腫瘍試料中の該変異形に対する対立遺伝子頻度を含む、変異形対立遺伝子頻度入力(VAFI)を取得することと、
b)SCI及びSAFIの関数として、
i)複数のゲノム分節の各々に対するゲノム分節総コピー数(C)、
ii)複数のゲノム分節の各々に対するゲノム分節低頻度対立遺伝子コピー数(M)、及び
iii)試料純度(p)に対する値を取得することであって、
C、M、及びpの値が、ゲノム全体でのコピー数モデルをSCI及びSAFIに適合させることによって得られる、取得することと、
c)変異形が、体細胞、サブクローナル体細胞変異形、生殖細胞、または区別不可能であることを示し、VAFI、p、C、及びMの関数である、変異型に対する値、gを取得することと、によって特徴付けることをさらに含む。

0048

ある特定の実施形態において、本方法は、複数の選択されたサブゲノム区間の各々、複数の選択された生殖細胞SNPの各々、及び変異形(例えば、変化)を配列決定することをさらに含み、ここで、正規化の前の平均配列カバレッジは、少なくとも約250x、例えば、少なくとも約500xである。

0049

ある特定の実施形態において、ゲノム全体でのコピー数モデルをSCIに適合させることは、以下の等式を使用することを含み、

、式中、ψが腫瘍倍数性である。

0050

ある特定の実施形態において、ゲノム全体でのコピー数モデルをSAFIに適合させることは、以下の等式を使用することを含み、

、式中、AFは、対立遺伝子頻度である。

0051

ある特定の実施形態において、gは、体細胞/生殖細胞状態のモデルに対するVAFI、p、C、及びMの値の適合を決定することによって決定される。ある特定の実施形態において、gの値は、以下によって取得され、

、式中、AFは、対立遺伝子頻度である。

0052

ある特定の実施形態において、0であるか、または0に近いgの値は、変異形が体細胞変異形であることを示し、1であるか、または1に近いgの値は、変異形が生殖細胞変異形であることを示し、0超であるが1未満であるgの値は、区別不能な結果を示すか、または0を著しく下回るgの値は、変異形がサブクローナル体細胞変異形であることを示す。

0053

SGZアルゴリズムは、国際出願公開第WO2014/183078号及び米国出願公開第2014/0336996号に記載されており、それらの内容は、参照によってそれらの全体が組み込まれる。SGZアルゴリズムは、Sun et al.Cancer Research 2014;74(19S):1893−1893にも記載されている。

0054

試料、例えば、腫瘍試料
本明細書に記載される方法及びシステムは、いくつかの異なる供給源からの様々な種類の試料中の変異荷重を評価するために使用され得る。

0055

いくつかの実施形態において、試料は、腫瘍試料または腫瘍由来の試料である。ある特定の実施形態において、試料は、固形腫瘍血液癌、またはそれらの転移形態から取得される。ある特定の実施形態において、試料は、本明細書に記載されるように、がんを有する対象、または療法を受けているか、もしくは療法を受けたことがある対象から得られる。

0056

いくつかの実施形態において、試料(例えば、腫瘍試料)は、前悪性もしくは悪性細胞;固形腫瘍、軟組織腫瘍、もしくは転移性病巣からの細胞;外科的縁からの組織もしくは細胞;組織学的に正常な組織;1つ以上の循環腫瘍細胞(CTC);正常な近接組織(NAT);腫瘍を有するか、もしくはそれを有するリスクがある同じ対象からの血液試料;またはFFPE試料のうちの1つ以上を含む。ある特定の実施形態において、試料は、循環腫瘍DNA(ctDNA)を含む。

0057

ある特定の実施形態において、試料は、FFPE試料である。ある特定の実施形態において、FFPE試料は、次の特性のうちの1つ、2つ、または全てを有する:(a)約10mm2以上、約25mm2以上、または約50mm2以上の表面積を有するか、(b)約1mm3以上、約2mm3以上、約3mm3以上、約4mm3以上、または約5mm3以上の試料体積を有するか、あるいは(c)約50%以上、約60%以上、約70%以上、約80%以上、もしくは約90%以上、または約10,000個以上の細胞、約20,000個以上の細胞、約30,000個以上の細胞、約40,000個以上の細胞、もしくは約50,000個以上の細胞の有核細胞充実性を有する。

0058

システム
別の態様において、本発明は、試料(例えば、腫瘍試料または腫瘍由来の試料)中の変異荷重を評価するためのシステムを特徴とする。システムは、メモリに動作可能に接続された少なくとも1つのプロセッサを備え、少なくとも1つのプロセッサは、実行すると、
a)試料からのサブゲノム区間(例えば、コードサブゲノム区間)のセットの配列、例えば、ヌクレオチド配列を取得することであって、コードサブゲノム区間のセットが所定の遺伝子セットからのものである、配列を取得することと、
b)変異荷重に対する値を決定することと、を行うように構成され、ここで、値は、サブゲノム区間のセット内の変化(例えば、体細胞変化)の数の関数である。

0059

ある特定の実施形態において、該変化の数は、(i)サブゲノム区間内(例えば、コードサブゲノム区間)の機能的変化、(ii)サブゲノム区間内(例えば、コードサブゲノム区間)の生殖細胞変化、または(iii)それらの両方を除外する。

0060

用途
いくつかの実施形態において、本方法は、変異荷重、例えば、変異荷重のレベル増加の評価に応じて治療を選択することをさらに含む。いくつかの実施形態において、本方法は、変異荷重、例えば、変異荷重のレベル増加の評価に応じて治療を施すことをさらに含む。いくつかの実施形態において、本方法は、変異荷重の評価に応じて試料、またはその試料が由来する対象を分類することをさらに含む。いくつかの実施形態において、本方法は、報告書、例えば、電子報告書、ウェブベース報告書、または書面報告書を作成し、患者、または別の者もしくは実体介護者内科医、腫瘍医、病院診療所、第3者の支払人保険会社、もしくは官提出することをさらに含む。いくつかの実施形態において、報告書は、変異荷重を含む本方法による結果を含む。

0061

本発明の追加の態様または実施形態は、次のうちの1つ以上を含む。

0062

整列
本明細書に開示される方法は、多数の個別に調節される整列法またはアルゴリズムの使用を統合して、配列決定法において、特に、例えば、本明細書に記載されるがん由来の多くの多様な遺伝子における多くの多様な遺伝的事象の超並列配列決定法に依存する方法、例えば、腫瘍試料を分析する方法において能力を最適化し得る。実施形態において、異なる遺伝子のいくつかの変異形の各々に対して個別にカスタマイズまたは調節される多数の整列法は、読み取りデータを分析するために使用される。実施形態において、調節することは、配列決定されている遺伝子(または、他のサブゲノム区間)、試料中の腫瘍型、配列決定されている変異形の(うちの1つ以上の)機能、または試料もしくは対象の特質であり得る。配列決定されるいくつかの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に対して個別に調節される整列条件の選択または使用によって、速度、感度、及び特異性の最適化が可能になる。本方法は、比較的多くの多様な対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に対する読み取りデータの整列が最適化される場合、特に有効である。

0063

したがって、一態様において、本発明は、試料、例えば、血液悪性腫瘍(または、前悪性腫瘍)、例えば、本明細書に記載される血液悪性腫瘍(または、前悪性腫瘍)からの腫瘍試料を分析する方法を特徴とする。本方法は、
(a)試料から複数のメンバー、例えば、腫瘍試料から複数の腫瘍メンバーを含む1つまたは複数のライブラリを取得することと、
(b)任意に、例えば、1つまたは複数のライブラリを、ベイトセット(または、複数のベイトセット)と接触させることによって、事前選択された配列に対する1つまたは複数のライブラリを富化して、選択されたメンバー(本明細書において、ライブラリキャッチと称される場合もある)を提供することと、
(c)例えば、配列決定することを含む方法によって、例えば、次世代配列決定法を用いて、メンバー、例えば、ライブラリまたはライブラリキャッチからの腫瘍メンバーから、対象区間、例えば、サブゲノム区間または発現サブゲノム区間に対する読み取りデータを取得することと、
(d)整列法、例えば、本明細書に記載される整列法によって該読み取りデータを整列させることと、
(e)該読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること(例えば、ベイジアン法を用いて、例えば、変異を呼び出すこと)と、を含み、
それにより、該腫瘍試料を分析し、
ここで、任意に、
X個の固有の対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)の各々からの読み取りデータは、固有の整列法で整列され、固有の対象区間(例えば、サブゲノム区間または発現サブゲノム区間)は、他のX−1個の対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)とは異なることを意味し、固有の整列法は、他のX−1個の整列法とは異なることを意味し、Xは、少なくとも2である。

0064

実施形態において、本方法は、サブゲノム区間に対応するメンバー及び発現サブゲノム区間に対応するメンバーが各々得られるライブラリを取得することを含む。

0065

実施形態において、本方法は、サブゲノム区間に対応するメンバーが得られる第1のライブラリを取得することと、発現サブゲノム区間に対応するメンバーが得られる第2のライブラリを取得することと、を含む。

0066

実施形態において、ベイトセットは、サブゲノム区間及び発現区間の両方を含むメンバーまたはライブラリキャッチを提供するために使用される。

0067

実施形態において、第1のベイトセットは、サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用され、第2のベイトセットは、発現サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用される。

0068

実施形態において、ステップ(b)は、存在する。実施形態において、ステップ(b)は、存在しない。

0069

実施形態において、Xは、少なくとも3、4、5、10、15、20、30、50、100、200、300、400、500、600、700、800、900、または1,000である。

0070

実施形態において、少なくともX個の遺伝子、例えば、表1〜4または図3A〜4Dからの少なくともX個の遺伝子からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)は、固有の整列法で整列され、Xは、2、3、4、5、10、15、20、30、40、50、60、70、80、90、100、200、300、400、500、またはそれ以上と等しい。

0071

実施形態において、方法(例えば、上述される方法の要素(d))は、読み取りデータを分析する、例えば、整列させるための整列法を選択または使用することを含み、
ここで、該整列法は、
(i)腫瘍型、例えば、該試料中の腫瘍型、
(ii)配列決定されている該対象区間(例えば、サブゲノム区間または発現サブゲノム区間)が位置する遺伝子または遺伝子の型、例えば、事前選択されているまたは変異形もしくは変異形の種類、例えば、変異を特徴とするか、あるいは事前選択された頻度の変異を特徴とする遺伝子または遺伝子の型、
(iii)分析されている部位(例えば、ヌクレオチド位置)、
(iv)評価されている対象区間(例えば、サブゲノム区間または発現サブゲノム区間)内の変異形の種類、例えば、置換
(v)試料の種類、例えば、FFPE試料、血液試料、または骨髄穿刺液試料、及び
(vi)評価されている該サブゲノム区間内またはその付近の配列、例えば、該対象区間(例えば、サブゲノム区間または発現サブゲノム区間)の誤整列に対して予想される傾向、例えば、該対象区間(例えば、サブゲノム区間または発現サブゲノム区間)内またはその付近の反復配列の存在、のうちの1つ以上または全ての関数であるか、それらに応じて選択されるか、またはそれらに対して最適化される。

0072

本方法は、本明細書の他の箇所で言及されるように、比較的多くの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に対する読み取りデータの整列が最適化される場合、特に有効である。故に、実施形態において、少なくともX個の固有の整列法が少なくともX個の固有のサブゲノム区間に対する読み取りデータを分析するために使用され、ここで、固有のとは、他のX−1個とは異なることを意味し、Xは、2、3、4、5、10、15、20、30、50、100、200、300、400、500、600、700、800、900、1,000、またはそれ以上と等しい。

0073

実施形態において、表1〜4または図3A〜4Dからの少なくともX個の遺伝子からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)は、分析され、Xは、2、3、4、5、10、15、20、30、40、50、60、70、80、90、100、200、300、400、500、またはそれ以上と等しい。

0074

実施形態において、固有の整列法は、少なくとも3、5、10、20、40、50、60、70、80、90、100、200、300、400、または500個の異なる遺伝子の各々における対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に適用される。

0075

実施形態において、少なくとも20、40、60、80、100、120、140、160もしくは180、200、300、400、または500個の遺伝子、例えば、表1〜4または図3A〜4Dからの遺伝子内のヌクレオチド位置には、ヌクレオチド値が割り当てられる。実施形態において、固有の整列法は、分析される該遺伝子の少なくとも10、20、30、40、または50%の各々における対象区間(例えば、サブゲノム区間または発現サブゲノム区間)に適用される。

0076

本明細書に開示される方法は、煩雑な読み取りデータ、例えば、再編成を有する読み取りデータの急速及び効率的な整列を可能にする。故に、対象区間(例えば、サブゲノム区間または発現サブゲノム区間)に対する読み取りデータが再編成、例えば、転座されたヌクレオチド位置を含む実施形態において、本方法は、適切に調節され、かつ
読み取りデータとの整列のための、事前選択されて、事前選択された再編成と整列される該再編成参照配列を選択すること(実施形態において、参照配列は、ゲノム再編成と同一ではない)、
読み取りデータを該事前選択された再編成参照配列と比較すること、例えば、整列させることを含む整列法を使用することを含み得る。

0077

実施形態において、煩雑な読み取りデータを整列させるために他の方法が使用される。これらの方法は、比較的多くの多様なサブゲノム区間に対する読み取りデータの整列が最適化される場合、特に有効である。例として、腫瘍試料を分析する方法は、
第1のパラメータのセット(例えば、第1のマッピングアルゴリズム、または第1の参照配列を用いて)の下で読み取りデータの比較、例えば、整列比較を行い、該読み取りデータが第1の所定の整列基準を満たすか(例えば、読み取りデータが該第1の参照配列と、例えば、事前選択された不一致の数未満で整列され得るか)否かを判定することと、
該読み取りデータが第1の所定の整列基準を満たさない場合、第2のパラメータのセット(例えば、第2のマッピングアルゴリズム、または第2の参照配列を用いて)の下で第2の整列比較を行うことと、
任意に、該読み取りデータが該第2の所定の基準を満たす(例えば、読み取りデータが該第2の参照配列と、事前選択された不一致の数未満で整列され得るか)否かを判定することと、を含み得、
ここで、該第2のパラメータのセットは、パラメータのセット、例えば、該第2の参照配列を使用することを含み、これは、該第1のパラメータのセットと比較して、事前選択された変異形、例えば、再編成、例えば、挿入、欠失、または転座に対する読み取りデータとの整列をもたらす可能性がより高くなる。

0078

これら及び他の整列法は、本明細書の他の箇所、例えば、「発明を実施するための形態」内の「整列」という題名の項でより詳細に論じられる。そのモジュールの要素は、腫瘍を分析する方法に含められ得る。実施形態において、「整列」(「発明の概要」及び/または「発明を実施するための形態」内)という題名の項からの整列法は、「変異呼び出し」(「発明の概要」及び/または「発明を実施するための形態」内)という題名の項からの変異呼び出し法、及び/または「ベイト」(「発明の概要」内)という題名の項及び/または「ベイトの設計及び構築」及び「ベイト合成」「発明を実施するための形態」内)という題名の項からのベイトセットと組み合わせられる。本方法は、「遺伝子選択」(「発明の概要」及び/または「発明を実施するための形態」内)という題名の項からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)のセットに適用され得る。

0079

変異呼び出し
本明細書に開示される方法は、カスタマイズまたは調節される変異呼び出しパラメータの使用を統合して、配列決定法において、特に、例えば、腫瘍試料からの、例えば、本明細書に記載されるがん由来の、多くの多様な遺伝子における多くの多様な遺伝的事象の超並行配列決定法に依存する方法において能力を最適化し得る。本方法の実施形態において、いくつかの事前選択された対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)の各々に対する変異呼び出しは、個別にカスタマイズされるか、または微調節される。カスタマイズ化または調節することは、本明細書に記載される因子のうちの1つ以上、例えば、試料中のがんの型、配列決定される対象区間(例えば、サブゲノム区間または発現サブゲノム区間)が位置する遺伝子、または配列決定される変異形に基づき得る。配列決定されるいくつかの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に対して微調節される整列条件のこの選択または使用によって、速度、感度、及び特異性の最適化が可能になる。本方法は、比較的多くの多様な対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に対する読み取りデータの整列が最適化される場合、特に有効である。

0080

したがって、一態様において、本発明は、試料、例えば、血液悪性腫瘍(または、前悪性腫瘍)、例えば、本明細書に記載される血液悪性腫瘍(または、前悪性腫瘍)からの腫瘍試料を分析する方法を特徴とする。本方法は、
(a)試料から複数のメンバー、例えば、試料、例えば、腫瘍試料から複数の腫瘍メンバーを含む1つまたは複数のライブラリを取得することと、
(b)任意に、例えば、ライブラリを、ベイトセット(または、複数のベイトセット)と接触させることによって、事前選択された配列に対する1つまたは複数のライブラリを富化して、選択されたメンバー、例えば、ライブラリキャッチを提供することと、
(c)例えば、配列決定することを含む方法によって、例えば、次世代配列決定法を用いて、該ライブラリまたはライブラリキャッチからのメンバー、例えば、腫瘍メンバーから、対象区間(例えば、サブゲノム区間または発現サブゲノム区間)に対する読み取りデータを取得することと、
(d)整列法、例えば、本明細書に記載される整列法によって該読み取りデータを整列させることと、
(e)該読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること(例えば、本明細書に記載されるベイジアン法または呼び出し法を用いて、例えば、変異を呼び出すこと)と、を含み、
それにより、該腫瘍試料を分析する。
ここで、任意に、ヌクレオチド値は、固有の呼び出し法によってX個の固有の対象区間(サブゲノム区間、発現サブゲノム区間、またはそれらの両方)の各々においてヌクレオチド位置に割り当てられ、固有の対象区間(例えば、サブゲノム区間または発現サブゲノム区間)は、他のX−1個の対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)とは異なることを意味し、固有の呼び出し法は、他のX−1個の呼び出し法とは異なることを意味し、Xは、少なくとも2である。呼び出し法は異なり得、それにより、例えば、異なるベイジアン先行値に依存することによって、固有であり得る。

0081

実施形態において、本方法は、サブゲノム区間に対応するメンバー及び発現サブゲノム区間に対応するメンバーが各々得られるライブラリを取得することを含む。

0082

実施形態において、本方法は、サブゲノム区間に対応するメンバーが得られる第1のライブラリを取得することと、発現サブゲノム区間に対応するメンバーが得られる第2のライブラリを取得することと、を含む。

0083

実施形態において、ベイトセットは、サブゲノム区間及び発現区間の両方を含むメンバーまたはライブラリキャッチを提供するために使用される。

0084

実施形態において、第1のベイトセットは、サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用され、第2のベイトセットは、発現サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用される。

0085

実施形態において、ステップ(b)は、存在する。実施形態において、ステップ(b)は、存在しない。

0086

実施形態において、該ヌクレオチド値を割り当てることは、腫瘍型において該事前選択されたヌクレオチド位置で、事前選択された変異形、例えば、変異を示す読み取りデータを観察する先行(例えば、文献)期待値であるかまたはそれを表す値の関数である。

0087

実施形態において、本方法は、少なくとも10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000個の事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること(例えば、変異を呼び出すこと)を含み、ここで、各割り当ては、腫瘍型において該事前選択されたヌクレオチド位置で、事前選択された変異形、例えば、変異を示す読み取りデータを観察する先行(例えば、文献)期待値であるかまたはそれを表す固有(他の割り当てに対する値とは対照的)の値の関数である。

0088

実施形態において、該ヌクレオチド値を割り当てることは、変異形がある頻度(例えば、1%、5%、または10%など)で試料中に存在する場合、及び/または変異形が存在しない(例えば、塩基呼び出しエラーのみに起因して読み取りデータで観察される)場合、該事前選択されたヌクレオチド位置で該事前選択された変異形を示す読み取りデータを観察する確率を表す値のセットの関数である。

0089

実施形態において、方法(例えば、上述される方法のステップ(e))は、変異呼び出し法を含む。本明細書に記載される変異呼び出し法は、次の:
該X個の対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)の各々における事前選択されたヌクレオチド位置に対して、
(i)腫瘍型Xにおいて該事前選択されたヌクレオチド位置で、事前選択された変異形、例えば、変異を示す読み取りデータを観察する先行(例えば、文献)期待値であるか、またはそれを表す第1の値、及び
(ii)変異形がある頻度(例えば、1%、5%、10%など)で試料中に存在する場合、及び/または変異形が存在しない(例えば、塩基呼び出しエラーのみに起因して読み取りデータで観察される)場合、該事前選択されたヌクレオチド位置で該事前選択された変異形を示す読み取りデータを観察する確率を表す第2の値のセットを取得すること、
該値に応じて、第1の値を使用して第2のセット中の値の間で比較を、例えば、本明細書に記載されるベイジアン法によって重み付けする(例えば、変異の存在の事後確率を計算する)ことにより、該読み取りデータから該事前選択されたヌクレオチド位置の各々にヌクレオチド値を割り当て(例えば、変異を呼び出し)、それにより、該試料を分析すること、を含み得る。

0090

実施形態において、本方法は、次のうちの1つ以上または全てを含む:
(i)少なくとも10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1000個の事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること(例えば、変異を呼び出すこと)であって、各割り当ては、(他の割り当てとは対照的に)固有の第1及び/または第2の値に基づく、割り当てること;
(ii)割り当ての少なくとも10、20、30、40、50、60、70、80、90、100、200、300、400、または500は、例えば、事前選択された腫瘍型における細胞の、5、10、または20%未満で事前選択された変異形が存在する確率の関数である第1の値を用いて行われる、(i)の方法の割り当て;
(iii)少なくともX個の事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること(例えば、変異を呼び出すこと)であって、この各々は、事前選択された腫瘍型、例えば、該試料の腫瘍型中に存在する(他のX−1個の割り当てとは対照的に)固有の確率を有する事前選択された変異形に関連し、ここで、任意に、X個の割り当ての各々は、(他のX−1個の割り当てとは対照的に)固有の第1及び/または第2の値に基づく(ここで、X=2、3、5、10、20、40、50、60、70、80、90、100、200、300、400、または500)、割り当てること;
(iv)第1及び第2のヌクレオチド位置にヌクレオチド値を割り当てること(例えば、変異を呼び出すこと)であって、ここで、該第1のヌクレオチド位置で第1の事前選択された変異形が事前選択された腫瘍型(例えば、該試料の腫瘍型)中に存在する尤度は、該第2のヌクレオチド位置で第2の事前選択された変異形が存在する尤度よりも少なくとも2、5、10、20、30、または40倍大きく、各割り当ては、任意に(他の割り当てとは対照的に)固有の第1及び/または第2の値に基づく、割り当てること;
(v) 複数の事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること(例えば、変異を呼び出すこと)であって、該複数のものは、次の確率範囲のうちの1つ以上、例えば、少なくとも3、4、5、6、7、または全てに入る変異形に対する割り当てを含み:
0.01以下、
0.01超〜0.02以下、
0.02超〜0.03以下、
0.03超〜0.04以下、
0.04超〜0.05以下、
0.05超〜0.1以下、
0.1超〜0.2以下、
0.2超〜0.5以下、
0.5超〜1.0以下、
1.0超〜2.0以下、
2.0超〜5.0以下、
5.0超〜10.0以下、
10.0超〜20.0以下、
20.0超〜50.0以下、及び
50超〜100.0%以下、
ここで、確率範囲は、事前選択されたヌクレオチド位置での事前選択された変異形が事前選択された腫瘍型(例えば、該試料の腫瘍型)中に存在する確率、または事前選択されたヌクレオチド位置での事前選択された変異形が腫瘍試料中の細胞、腫瘍試料からのライブラリ、もしくは事前選択された型(例えば、該試料の腫瘍型)に対するそのライブラリからのライブラリキャッチの記載される%で腫瘍中に存在する確率の範囲であり;
任意に、各割り当ては、固有の第1及び/または第2の値に基づく(例えば、記載される確率範囲での他の割り当てとは対照的に固有であるか、または他の列挙される確率範囲のうちの1つ以上もしくは全てに対する第1の及び/または第2の値とは対照的に固有である)、割り当てること。
(vi)該試料中のDNAの50、40、25、20、15、10、5、4、3、2、1、0.5、0.4、0.3、0.2、または0.1%未満で存在する事前選択された変異形を各々独立して有する、少なくとも1、2、3、5、10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000個の事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること(例えば、変異を呼び出すこと)であって、ここで、任意に、各割り当ては、(他の割り当てとは対照的に)固有の第1及び/または第2の値に基づく、割り当てること;
(vii)第1及び第2のヌクレオチド位置にヌクレオチド値を割り当てること(例えば、変異を呼び出すこと)であって、ここで、該試料のDNA中の第1の位置での事前選択された変異形の尤度は、該試料のDNA中の該第2のヌクレオチド位置での事前選択された変異形の尤度よりも少なくとも2、5、10、20、30、または40倍大きく、ここで、任意に、各割り当ては、(他の割り当てとは対照的に)固有の第1及び/または第2の値に基づく、割り当てること;
(viii)次のうちの1つ以上または全てにおいてヌクレオチド値を割り当てることであって、(例えば、変異を呼び出すこと):
(1) 該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の1%未満で存在する事前選択された変異形を有する、少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置;
(2)該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の1〜2%で存在する事前選択された変異形を有する、少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置;
(3)該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の2%超〜3%以下で存在する事前選択された変異形を有する、少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置;
(4)該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の3%超〜4%以下で存在する事前選択された変異形を有する、少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置;
(5)該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の4%超〜5%以下で存在する事前選択された変異形を有する、少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置;
(6)該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の5%超〜10%以下で存在する事前選択された変異形を有する、少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置;
(7)該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の10%超〜20%以下で存在する事前選択された変異形を有する、少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置;
(8)該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の20%超〜40%以下で存在する事前選択された変異形を有する、少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置;
(9)該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の40%超〜50%以下で存在する事前選択された変異形を有する、少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置;または
(10)該試料中の細胞、該試料からのライブラリ中の核酸、もしくはそのライブラリからのライブラリキャッチ中の核酸の50%超〜100%以下で存在する事前選択された変異形を有する、少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置;
ここで、任意に、各割り当ては、固有の第1及び/または第2の値に基づく(例えば、記載される範囲での他の割り当てとは対照的に固有であるか(例えば、1%未満の(1)における範囲)、または他の列挙される範囲のうちの1つ以上もしくは全てにおける決定に対する第1及び/または第2の値とは対照的に固有である)、割り当てること;あるいは
(ix)X個のヌクレオチド位置の各々にヌクレオチド値を割り当てること(例えば、変異を呼び出すこと)であって、各ヌクレオチド位置は、独立して、他のX−1個のヌクレオチド位置での事前選択された変異形に関する尤度と比較すると固有である(該試料のDNA中に存在している事前選択された変異形の)尤度を有し、ここで、X個は、1、2、3、5、10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000以上であり、各割り当ては、(他の割り当てとは対照的に)固有の第1及び/または第2の値に基づく、割り当てること。

0091

本方法の実施形態において、「閾値」は、読み取りデータを評価するために、及び読み取りデータから、例えば、遺伝子における特定の位置で変異を呼び出して、ヌクレオチド位置に対する値を選択するために使用される。本方法の実施形態において、いくつかの事前選択された対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)の各々に対する閾値は、カスタマイズまたは微調節される。カスタマイズ化または調節することは、本明細書に記載される因子のうちの1つ以上、例えば、試料中のがんの型、配列決定される対象区間(サブゲノム区間または発現サブゲノム区間)が位置する遺伝子、または配列決定される変異形に基づき得る。これは、配列決定されるいくつかの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)の各々に対して微調節された呼び出しを提供する。本方法は、比較的多くの多様なサブゲノム区間が分析される場合、特に有効である。

0092

故に、別の実施形態において、腫瘍を分析する方法は、次の変異呼び出し法を含む:
該X個の対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)の各々に関して閾値を取得し、該取得されたX個の閾値の各々は、他のX−1個の閾値と比較して固有であり、それにより、X個の固有の閾値を提供し、
該X個の対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)の各々に対して、事前選択されたヌクレオチド位置に事前選択されたヌクレオチド値を有する読み取りデータの数の関数である実測値をその固有の閾値と比較し、それにより、該X個の対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)の各々にその固有の閾値を適用し、
任意に、該比較の結果に応じて、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てて、
ここで、Xは、2以上である。

0093

実施形態において、本方法は、0.5、0.4、0.25、0.15、0.10、0.05、0.04、0.03、0.02、または0.01未満である確率の関数である第1の値を各々独立して有する、少なくとも2、3、5、10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000個の事前選択されたヌクレオチド位置にヌクレオチド値を割り当てることを含む。

0094

実施形態において、本方法は、他のX−1個の第1の値と比較すると固有である第1の値を各々独立して有する、少なくともX個のヌクレオチド位置の各々にヌクレオチド値を割り当てることを含み、ここで、該X個の第1の値の各々は、0.5、0.4、0.25、0.15、0.10、0.05、0.04、0.03、0.02、または0.01未満である確率の関数であり、Xは、1、2、3、5、10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000以上である。

0095

実施形態において、少なくとも20、40、60、80、100、120、140、160もしくは180、200、300、400、または500個の遺伝子、例えば、表1〜4または図3A〜4Dからの遺伝子内のヌクレオチド位置には、ヌクレオチド値が割り当てられる。実施形態において、固有の第1及び/または第2の値は、分析される該遺伝子の少なくとも10、20、30、40、または50%の各々における対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に適用される。

0096

本方法の実施形態は、例えば、次の実施形態から分かるように、比較的多くの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に対する閾値が最適化される場合、適用され得る。

0097

実施形態において、固有の閾値は、少なくとも3、5、10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000個の異なる遺伝子の各々において対象区間、例えば、サブゲノム区間または発現サブゲノム区間に適用される。

0098

実施形態において、少なくとも20、40、60、80、100、120、140、160もしくは180、200、300、400、または500個の遺伝子、例えば、表1〜4または図3A〜4Dからの遺伝子内のヌクレオチド位置には、ヌクレオチド値が割り当てられる。実施形態において、固有の閾値は、分析される該遺伝子の少なくとも10、20、30、40、または50%の各々におけるサブゲノム区間に適用される。

0099

実施形態において、表1〜4または図3A〜4Dからの少なくとも5、10、20、30、または40個の遺伝子内のヌクレオチド位置には、ヌクレオチド値が割り当てられる。実施形態において、固有の閾値は、分析される該遺伝子の少なくとも10、20、30、40、または50%の各々における対象区間(例えば、サブゲノム区間または発現サブゲノム区間)に適用される。

0100

これら及び他の変異呼び出し法は、本明細書の他の箇所、例えば、「変異」という題名の項でより詳細に論じられる。そのモジュールの要素は、腫瘍を分析する方法に含められ得る。実施形態において、「変異呼び出し」という題名の項からの整列法は、「整列」という題名の項からの整列法及び/または「ベイト」という題名の項からのベイトセットと組み合わせられる。本方法は、「遺伝子選択」という題名の項からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)のセットに適用され得る。

0101

ベイト
本明細書に記載される方法は、配列決定される標的核酸の選択のためのベイト、例えば、溶液ハイブリダイゼーションにおける使用のためのベイトの適切な選択によって、1名以上の対象からの、試料、例えば、本明細書に記載されるがん由来の腫瘍試料からの多くの遺伝子及び遺伝子産物の最適化配列決定を提供する。事前選択された選択効率を有するベイトセットに従って、様々な対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)、またはそれらの分類に対して選択効率を適合させる。この項で使用される場合、「選択効率」は、標的対象区間(複数可)(例えば、サブゲノム区間(複数可)、発現サブゲノム区間(複数可)、またはそれらの両方)に従って調整されるような配列カバレッジのレベルまたは深さを指す。

0102

故に、方法(例えば、上述される方法のステップ(b))は、ライブラリを、複数のベイトと接触させて、選択されたメンバー(例えば、ライブラリキャッチ)を提供することを含む。

0103

したがって、一態様において、本発明は、試料、例えば、がん、例えば、本明細書に記載されるがん由来の腫瘍試料を分析する方法を特徴とする。本方法は、
(a)試料から複数のメンバー(例えば、標的メンバー)、例えば、腫瘍試料から複数の腫瘍メンバーを含む1つまたは複数のライブラリを取得することと、
(b)1つまたは複数のライブラリをベイトセット(または、複数のベイトセット)と接触させて、選択されたメンバー(例えば、ライブラリキャッチ)を提供することと、
(c)例えば、配列決定を含む方法によって、例えば、次世代配列決定法を用いて、該ライブラリまたはライブラリキャッチからのメンバー、例えば、腫瘍メンバーから、対象区間、例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方に対する読み取りデータを取得することと、
(d)整列法、例えば、本明細書に記載される整列法によって該読み取りデータを整列させることと、
(e)該読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること(例えば、ベイジアン法または本明細書に記載される方法を用いて、例えば、変異を呼び出すこと)と、を含み、
それにより、該腫瘍試料を分析し、
ここで、任意に、本方法は、ライブラリを、複数の、例えば、少なくとも2、3、4、または5つのベイトまたはベイトセットと接触させることを含み、該複数の各ベイトまたはベイトセットは、(複数の他のベイトとは対照的に)固有の、事前選択された選択効率を有する。例えば、各固有のベイトまたはベイトセットは、配列決定の固有の深さを提供する。「ベイトセット」という用語は、本明細書で使用されるとき、1つのベイトまたは複数のベイト分子をまとめて指す。

0104

実施形態において、本方法は、サブゲノム区間に対応するメンバー及び発現ゲノム区間に対応するメンバーが各々得られるライブラリを取得することを含む。

0105

実施形態において、本方法は、サブゲノム区間に対応するメンバーが得られる第1のライブラリを取得することと、発現サブゲノム区間に対応するメンバーが得られる第2のライブラリを取得することと、を含む。

0106

実施形態において、ベイトセットは、サブゲノム区間及び発現区間の両方を含むメンバーまたはライブラリキャッチを提供するために使用される。

0107

実施形態において、第1のベイトセットは、サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用され、第2のベイトセットは、発現サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用される。

0108

実施形態において、複数である第1のベイトセットの選択効率は、複数である第2のベイトセットの効率と少なくとも2倍異なる。実施形態において、第1及び第2のベイトセットは、少なくとも2倍異なる配列決定の深さを提供する。

0109

実施形態において、本方法は、次のベイトセットのうちの1つまたは複数をライブラリと接触させることを含む:
a)約500X以上の配列決定深さを提供するために、例えば、試料からの細胞のうちの5%以下で存在する変異を配列決定するために、サブゲノム区間を含む十分なメンバーを選択するベイトセット;
b)約200X以上、例えば、約200X〜約500Xの配列決定深さを提供するために、例えば、試料からの細胞のうちの10%以下で存在する変異を配列決定するために、サブゲノム区間を含む十分なメンバーを選択するベイトセット;
c)約10〜100Xの配列決定深さを提供するために、例えば、i)異なる薬物を患者が代謝する能力を説明し得る薬理ゲノム(PGx)一塩基多型(SNP)、もしくはii)患者を固有に識別(例えば、フィンガープリント)するために使用され得るゲノムSNPから選ばれる1つ以上のサブゲノム区間(例えば、エクソン)を配列決定するために、サブゲノム区間を含む十分なメンバーを選択するベイトセット;
d)約5〜50Xの配列決定深さを提供するために、例えば、構造限界点、例えば、ゲノム転座もしくはインデルを検出するために、対象区間(例えば、サブゲノム区間または発現サブゲノム区間)を含む十分なメンバーを選択するベイトセット。例えば、イントロン限界点の検出は、高い検出信頼性を確保するために5〜50Xの配列対スパニング深さを必要とする。このようなベイトセットは、例えば、転座/インデルが起こり易いがん遺伝子を検出するために使用され得るか;または
e)約0.1〜300Xの配列決定深さを提供するために、例えば、コピー数の変化を検出するために、対象区間(例えば、サブゲノム区間または発現サブゲノム区間)を含む十分なメンバーを選択するベイトセット。一実施形態において、配列決定深さは、コピー数の変化を検出するために約0.1〜10Xの配列決定深さの範囲である。他の実施形態において、配列決定深さは、ゲノムDNAのコピー数の増加/減少またはヘテロ接合性喪失(LOH)を評価するために使用されるゲノムSNP/遺伝子座を検出するために、約100〜300Xの範囲である。このようなベイトセットは、例えば、増幅/欠失が起こり易いがん遺伝子を検出するために使用され得る。

0110

配列決定深さのレベル(例えば、配列決定深さのX倍レベル)は、本明細書で使用されるとき、重複読み取りデータ、例えば、PCR重複読み取りデータの検出及び除去後の読み取りデータ(例えば、固有の読み取りデータ)のカバレッジのレベルを指す。

0111

一実施形態において、ベイトセットは、1つ以上の再編成、例えば、ゲノム再編成を含有するイントロンを含有する対象区間(例えば、サブゲノム区間または発現サブゲノム区間)を選択する。このような実施形態において、ベイトセットは、選択効率を増加させるために反復配列が遮蔽されるように設計される。再編成が既知の連結配列を有する実施形態において、選択効率を増加させるために、連結配列に対して相補的なベイトセットが設計され得る。

0112

実施形態において、本方法は、2つ以上の異なる標的カテゴリを捕捉するように設計されたベイトの使用を含み、各々のカテゴリは、異なるベイト設計方策を有する。実施形態において、本明細書に開示されるハイブリッド捕捉方法及び組成物は、標的配列の定められたサブセット(例えば、標的メンバー)を捕捉し、そのサブセットの外側のカバレッジを最小限にしながら、標的配列の均質なカバレッジを提供する。一実施形態において、標的配列は、ゲノムDNAからの全エクソン、またはその選択されたサブセットを含む。別の実施形態において、標的配列は、大きな染色体領域、例えば、染色体アーム全体を含む。本明細書に開示される方法及び組成物は、複雑な標的核酸配列(例えば、核酸ライブラリ)に対してカバレッジの異なる深さ及びパターンを達成するための異なるベイトセットを提供する。

0113

実施形態において、本方法は、1つまたは複数の核酸ライブラリの選択されたメンバー(例えば、ライブラリキャッチ)を提供することを含む。本方法は、
複数のメンバー、例えば、標的核酸メンバー(例えば、複数の腫瘍メンバー、参照メンバー、及び/またはPGxメンバーを含む)を含む1つまたは複数のライブラリ(例えば、1つまたは複数の核酸ライブラリ)を提供すること、
1つまたは複数のライブラリを、例えば、溶液系の反応において、複数のベイト(例えば、オリゴヌクレオチドベイト)と接触させて、複数のベイト/メンバーハイブリッドを含むハイブリダイゼーション混合物を形成すること、
例えば、該ハイブリダイゼーション混合物を、該複数のベイト/メンバーハイブリッドの分離を可能にする結合実体と接触させることによって、該ハイブリダイゼーション混合物から複数のベイト/メンバーハイブリッドを分離し、
それにより、ライブラリキャッチ(例えば、1つまたは複数のライブラリからの核酸分子の、選択されたまたは富化された下位群)を提供することを含み、
ここで、任意に、複数のベイトは、次のうちの2つ以上を含む:
a)低頻度、例えば、約5%以下で出現する(すなわち、試料からの細胞のうちの5%がそれらのゲノムにおいて変化を保有する)変化(例えば、1つ以上の変異)に対する高レベルの感度を可能にするために、最大深さのカバレッジが必要とされる、高レベルの標的(例えば、対象区間(例えば、サブゲノム区間または発現サブゲノム区間)を含む1つ以上の腫瘍メンバー、例えば、遺伝子、エクソン、または塩基)を選択する第1のベイトセット。一実施形態において、第1のベイトセットは、約500X以上の配列決定深さを必要とする変化(例えば、点変異)を含む腫瘍メンバーを選択する(例えば、それに相補的である)。
b)a)における高レベルの標的よりも高い頻度、例えば、約10%の頻度で出現する(すなわち、試料からの細胞のうちの10%がそれらのゲノムにおいて変化を保有する)変化(例えば、1つ以上の変異)に対する高レベルの感度を可能にするために高いカバレッジが必要とされる、中レベルの標的(例えば、対象区間(例えば、サブゲノム区間または発現サブゲノム区間)を含む1つ以上の腫瘍メンバー、例えば、遺伝子、エクソン、または塩基)を選択する第2のベイトセット。一実施形態において、第2のベイトセットは、約200X以上の配列決定深さを必要とする変化(例えば、点変異)を含む腫瘍メンバーを選択する(例えば、それに相補的である)。
c)高レベルの感度を可能にするために、例えば、ヘテロ接合性の対立遺伝子を検出するために、低−中程度のカバレッジが必要とされる、低レベルの標的(例えば、対象区間(例えば、サブゲノム区間または発現サブゲノム区間)を含む1つ以上のPGxメンバー、例えば、遺伝子、エクソン、または塩基)を選択する第3のベイトセット。例えば、ヘテロ接合性の対立遺伝子の検出は、高い検出信頼性を確保するために10〜100Xの配列決定深さを必要とする。一実施形態において、第3のベイトセットは、a)患者が異なる薬物を代謝する能力を説明し得る薬理ゲノム(PGx)一塩基多型(SNP)、またはb)患者を固有に識別(例えば、フィンガープリント)するために使用され得るゲノムSNPから選ばれる1つ以上の対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方、例えば、エクソン)を選択し;
d)例えば、ゲノム転座もしくはインデルなどの構造限界点を検出するために、低−中程度のカバレッジが必要とされる第1のイントロン標的(例えば、イントロン配列を含むメンバー)を選択する第4のベイトセット。例えば、イントロン限界点の検出は、高い検出信頼性を確保するために5〜50Xの配列対スパニング深さを必要とする。該第4のベイトセットは、例えば、転座/インデルが起こり易いがん遺伝子を検出するために使用され得るか、または
e)コピー数の変化を検出する能力を改善するために低密度のカバレッジが必要とされる第2のイントロン標的(例えば、イントロンメンバー)を選択する第5のベイトセット。例えば、いくつかの末端エクソンの1コピー欠失の検出は、高い検出信頼性を確保するために0.1〜300Xのカバレッジを必要とする。一実施形態において、カバレッジの深さは、コピー数の変化を検出するために約0.1〜10Xの範囲である。他の実施形態において、カバレッジの深さは、ゲノムDNAのコピー数の増加/減少またはヘテロ接合性喪失(LOH)を評価するためのゲノムSNP/遺伝子座を検出するために、約100〜300Xの範囲である。該第5のベイトセットは、例えば、増幅/欠失が起こり易いがん遺伝子を検出するために使用され得る。

0114

前述のベイトセットのうちの2、3、4、またはそれ以上の任意の組み合わせ、例えば、第1及び第2のベイトセット、第1及び第3のベイトセット、第1及び第4のベイトセット、第1及び第5のベイトセット、第2及び第3のベイトセット、第2及び第4のベイトセット、第2及び第5のベイトセット、第3及び第4のベイトセット、第3及び第5のベイトセット、第4及び第5のベイトセット、第1、第2、及び第3のベイトセット、第1、第2、及び第4のベイトセット、第1、第2、及び第5のベイトセット、第1、第2、第3、第4のベイトセット、第1、第2、第3、第4、及び第5のベイトセットなどの組み合わせが使用され得る。

0115

一実施形態において、第1、第2、第3、第4、または第5のベイトセットの各々は、事前選択された選択(例えば、捕捉)効率を有する。一実施形態において、選択効率に対する値は、a)〜e)による全5つのベイトのうちの少なくとも2、3、4個に関して同じである。他の実施形態において、選択効率に対する値は、a)〜e)による全5つのベイトのうちの少なくとも2、3、4個に関して異なる。

0116

いくつかの実施形態において、少なくとも2、3、4、または5個全てのベイトセットは、異なる事前選択された効率値を有する。例えば、次のうちのより多くのうちの1つから選ばれた選択効率に対する値は:
(i)第1の事前選択された効率は、少なくとも約500X以上の配列決定深さである第1の選択効率に対する値を有するか(例えば、第2、第3、第4、または第5の事前選択された選択効率よりも大きい選択効率に対する値を有する(例えば、第2の選択効率に対する値よりも約2〜3倍大きく、第3の選択効率に対する値よりも約5〜6倍大きく、第4の選択効率に対する値よりも約10倍大きく、第5の選択効率に対する値よりも約50〜5000倍大きい)、
(ii)第2の事前選択された効率は、少なくとも約200X以上の配列決定深さである第2の選択効率に対する値を有し、例えば、第3、第4、もしくは第5の事前選択された選択効率よりも大きい選択効率に対する値を有するか(例えば、第3の選択効率に対する値よりも約2倍大きく、第4の選択効率に対する値よりも約4倍大きく、第5の選択効率に対する値よりも約20〜2000倍大きい)、
(iii)第3の事前選択された効率は、少なくとも約100X以上の配列決定深さである第3の選択効率に対する値を有し、例えば、第4もしくは第5の事前選択された選択効率よりも大きい選択効率に対する値を有するか(例えば、第4の選択効率に対する値よりも約2倍大きく、第5の選択効率に対する値よりも約10〜1000倍大きい)、
(iv)第4の事前選択された効率は、少なくとも約50X以上の配列決定深さである第4の選択効率に対する値を有し、例えば、第5の事前選択された選択効率よりも大きい選択効率に対する値を有するか(例えば、第5の選択効率に対する値よりも約50〜500倍大きい)、または
(v)第5の事前選択された効率は、少なくとも約10X〜0.1Xの配列決定深さである第5の選択効率に対する値を有する。

0117

ある特定の実施形態において、選択効率に対する値は、異なるベイトセットの差次的な表示、ベイトサブセットの差次的な重複、差次的なベイトパラメータ、異なるベイトセットの混合、及び/または異なる種類のベイトセットの使用のうちの1つ以上によって改変される。例えば、選択効率の変動(例えば、各ベイトセット/標的カテゴリの相対的配列カバレッジ)は、次のうちの1つ以上を変化させることによって調整され得る:
(i)異なるベイトセットの差次的な表示−所与の標的(例えば、標的メンバー)を捕捉するためのベイトセット設計は、より多くの/より少ないコピー数に含まれて、相対的な標的カバレッジの深さを増強/低減させ得る;
(ii)ベイトサブセットの差次的な重複−所与の標的(例えば、標的メンバー)を捕捉するためのベイトセット設計は、近隣ベイト間のより長いかまたはより短い重複を含み、相対的な標的カバレッジの深さを増強/低減させ得る;
(iii)差次的なベイトパラメータ−所与の標的(例えば、標的メンバー)を捕捉するためのベイトセット設計は、配列修飾/より短い長さを含み、捕捉効率を低減させ、相対的な標的カバレッジの深さを低下させ得る;
(iv)異なるベイトセットの混合−異なる標的セットを捕捉するように設計されるベイトセットは、異なるモル比で混合されて、相対的な標的カバレッジの深さを増強/低減させ得る;
(v)異なる種類のオリゴヌクレオチドベイトセットの使用−ある特定の実施形態において、ベイトセットは次のものを含み得る:
(a)1つ以上の化学的に(例えば、非酵素的に)合成された(例えば、個別に合成された)ベイト、
(b)アレイにおいて合成された1つ以上のベイト、
(c)1つ以上の酵素的に調製された、例えば、インビトロ転写されたベイト、
(d)(a)、(b)、及び/もしくは(c)の任意の組み合わせ、
(e)1つ以上のDNAオリゴヌクレオチド(例えば、天然または非天然のDNAオリゴヌクレオチド)、
(f)1つ以上のRNAオリゴヌクレオチド(例えば、天然または非天然のRNAオリゴヌクレオチド)、
(g)(e)及び(f)の組み合わせ、または
(h)上記のいずれかの組み合わせ。

0118

異なるオリゴヌクレオチドの組み合わせは、異なる比、例えば、1:1、1:2、1:3、1:4、1:5、1:10、1:20、1:50、1:100、1:1000などから選ばれる比で混合され得る。一実施形態において、化学合成されたベイト対アレイ生成ベイトの比は、1:5、1:10、または1:20から選ばれる。DNAまたはRNAオリゴヌクレオチドは、天然または非天然であり得る。ある特定の実施形態において、ベイトは、例えば、融解温度を上昇させるために1つ以上の非天然ヌクレオチドを含む。例示的な非天然オリゴヌクレオチドには、修飾DNAまたはRNAヌクレオチドが含まれる。例示的な修飾ヌクレオチド(例えば、修飾RNAまたはDNAヌクレオチド)には、ロックド核酸(LNA)(LNAヌクレオチドリボース部分が2’酸素及び4’炭素を連結する余分な架橋で修飾される);ペプチド核酸(PNA)、例えば、ペプチド結合によって連結された繰り返しN−(2−アミノエチル)−グリシン単位から構成されるPNA;低GC領域を捕捉するように修飾されたDNAまたはRNAオリゴヌクレオチド;二環式核酸(BNA);架橋オリゴヌクレオチド;修飾5−メチルデオキシシチジン;及び2,6−ジアミノプリンが含まれるがこれらに限定されない。他の修飾DNA及びRNAヌクレオチドが当技術分野で知られている。

0119

ある特定の実施形態において、標的配列(例えば、標的メンバー)の実質的に均一または均質なカバレッジが得られる。例えば、各ベイトセット/標的カテゴリ内で、カバレッジの均一性は、ベイトパラメータを修飾することによって、例えば次のうちの1つ以上によって最適化され得る:
(i)同じカテゴリ中の他の標的に対して過小/過剰にカバーされる標的(例えば、標的メンバー)のカバレッジを増強/低減させるために、ベイト表示もしくは重複を増加/減少させることが使用され得るか、
(ii)標的配列(例えば、高GC含量配列)を捕捉することが困難である低カバレッジに関して、例えば、近接配列(例えば、GCリッチ度がより低い近接配列)をカバーするようにベイトセットで標的化されている領域を拡大するか、
(iii)ベイトの二次構造を低減させ、その選択効率を増強させるために、ベイト配列を修飾することが使用され得るか、
(iv)同じカテゴリ内の異なるベイトの融解ハイブリダイゼーション速度を等しくするために、ベイトの長さを変更することが使用され得る。(長さが様々なベイトを産生することによって)直接、もしくは(一貫した長さのベイトを産生し、ベイト末端をランダムな配列で置き換えることによって)間接的にベイトの長さを変更し得るか、
(v)同じ標的領域(すなわち、フォワード及びリバース鎖)に対して異なる配向のベイトを修飾することによって、結合効率が異なり得る。各標的に対して最適のカバレッジを提供するいずれかの配向を有するベイトセットが選択され得るか、
(vi)各ベイト上に存在する結合実体、例えば、捕捉タグ(例えば、ビオチン)の量を変更することによって、その結合効率が影響を受け得る。相対的な標的カバレッジを増強/低減させるために、特定の標的を標的とするベイトのタグレベルを増加/減少させることが使用され得るか、
(vii)標的への結合親和性に影響を及ぼし、相対的な標的カバレッジを増強/低減させるために、異なるベイトに対して使用されるヌクレオチドの種類の変更が使用され得るか、または
(viii)高GC含量に対して低いもしくは正常なGC含量の領域間での融解ハイブリダイゼーション速度を等しくするために、修飾オリゴヌクレオチドベイトを使用すること、例えば、より安定した塩基対形成を有することが使用され得る。

0120

例えば、異なる種類のオリゴヌクレオチドベイトセットが使用され得る。

0121

一実施形態において、選択効率に対する値は、事前選択された標的領域を包含するために異なる種類のベイトオリゴヌクレオチドを使用することによって変更される。例えば、第1のベイトセット(例えば、10,000〜50,000のRNAまたはDNAベイトを含むアレイに基づくベイトセット)は、大きな標的範囲(例えば、1〜2MBの全標的範囲)をカバーするために使用され得る。第1のベイトセットは、第2のベイトセット(例えば、5,000個未満のベイトを含む個別に合成されたRNAまたはDNAベイトセット)に添加されて、事前選択された標的領域(例えば、標的範囲の対象とするスパニング、例えば、250kb以下の選択されたサブゲノム区間)、及び/またはより高い二次構造、例えば、より高いGC含量の領域をカバーし得る。対象とする選択された対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)は、本明細書に記載される遺伝子もしくは遺伝子産物、またはそれらの断片のうちの1つ以上に対応し得る。第2のベイトセットは、所望のベイト重複に応じて、約1〜5,000、2〜5,000、3〜5,000、10〜5,000、100〜5,000、500〜5,000、100〜5,000、1,000〜5,000、2,000〜5,000個のベイトを含み得る。他の実施形態において、第2のベイトセットは、第1のベイトセットに添加される選択されたオリゴベイト(例えば、400、200、100、50、40、30、20、10、5、4、3、2、または1個未満のベイト)を含み得る。第2のベイトセットは、個別のオリゴベイトの任意の比で混合され得る。例えば、第2のベイトセットは、1:1の等モル比として存在する個別のベイトを含み得る。あるいは、第2のベイトセットは、例えば、ある特定の標的(例えば、ある特定の標的は、他の標的と比較して5〜10Xの第2のベイトセットを有し得る)の捕捉を最適化するために、異なる比(例えば、1:5、1:10、1:20)で存在する個別のベイトを含み得る。

0122

他の実施形態において、ベイトの当モル混合物を使用した場合に観察される差次的な配列捕捉効率に関連してベイトの相対的存在量または結合実体の密度(例えば、ハプテンまたは親和性タグ密度)を調整し、次いで、第2の群のベイトに対して、全体的なベイト混合物に差次的過剰量の第1群のベイトを導入することによって、群内の個別のベイト(例えば、第1、第2、または第3の複数のベイト)の効率を等しくすることによって、選択効率が調整される。

0123

実施形態において、本方法は、腫瘍メンバー、例えば、腫瘍細胞からの対象区間(例えば、サブゲノム区間または発現サブゲノム区間)を含む核酸分子を選択するベイトセット(本明細書で「腫瘍ベイトセット」とも称される)を含む複数のベイトセットの使用を含む。腫瘍メンバーは、腫瘍細胞中に存在する任意のヌクレオチド配列、例えば、腫瘍またはがん細胞中に存在する本明細書に記載されるような変異型、野生型、PGx、参照、またはイントロンヌクレオチド配列であり得る。一実施形態において、腫瘍メンバーは、低頻度で出現する変化(例えば、1つ以上の変異)を含み、例えば、腫瘍試料からの細胞の約5%以下は、それらのゲノムにおいて変化を保有する。他の実施形態において、腫瘍メンバーは、腫瘍試料からの細胞の約10%の頻度で出現する変化(例えば、1つ以上の変異)を含む。他の実施形態において、腫瘍メンバーは、PGx遺伝子または遺伝子産物からのサブゲノム区間、イントロン配列、例えば、本明細書に記載されるようなイントロン配列、腫瘍細胞中に存在する参照配列を含む。

0124

別の態様において、本発明は、本明細書に記載されるベイトセット、本明細書に記載される個別のベイトセットの組み合わせ、例えば、本明細書に記載される組み合わせを特徴とする。ベイトセット(複数可)は、説明書標準物質緩衝液もしくは酵素、または他の試薬を任意に含み得るキットの一部であり得る。

0125

遺伝子選択
分析のための事前選択された対象区間、例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方、例えば、遺伝子及び他の領域のセットまたは群に対するサブゲノム区間の群またはセットが本明細書に記載される。

0126

故に、実施形態において、方法は、取得された核酸試料からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個以上の遺伝子または遺伝子産物からの対象区間(例えば、サブゲノム区間または発現サブゲノム区間)を、例えば、次世代配列決定法によって配列決定し、それにより、例えば、本明細書に記載されるがん由来の腫瘍試料を分析することを含み、ここで、遺伝子または遺伝子産物は、表1〜4または図3A〜4Dから選ばれる。

0127

したがって、一態様において、本発明は、試料、例えば、血液悪性腫瘍(または、前悪性腫瘍)、例えば、本明細書に記載される血液悪性腫瘍(または、前悪性腫瘍)からの腫瘍試料を分析する方法を特徴とする。本方法は、
(a)試料から複数メンバー、例えば、血液悪性腫瘍(または、前悪性腫瘍)、例えば、本明細書に記載される血液悪性腫瘍(または、前悪性腫瘍)からの腫瘍試料から複数の腫瘍メンバーを含む1つまたは複数のライブラリを取得することと、
(b)任意に、例えば、1つまたは複数のライブラリを、ベイトセット(または、複数のベイトセット)と接触させることによって、事前選択された配列に対する1つまたは複数のライブラリを富化して、選択されたメンバー(例えば、ライブラリキャッチ)を提供することと、
(c)例えば、配列決定することを含む方法によって、例えば、次世代配列決定法を用いて、該ライブラリまたはライブラリキャッチからのメンバー、例えば、腫瘍メンバーから、対象区間(例えば、サブゲノム区間または発現サブゲノム区間)に対する読み取りデータを取得することと、
(d)整列法、例えば、本明細書に記載される整列法によって該読み取りデータを整列させることと、
(e)該読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てること(例えば、ベイジアン法または本明細書に記載される方法を用いて、例えば、変異を呼び出すこと)と、を含み、
それにより、該腫瘍試料を分析し、
ここで、任意に、本方法は、試料からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個以上の遺伝子または遺伝子産物からの対象区間(例えば、サブゲノム区間または発現サブゲノム区間)を、例えば、次世代配列決定法によって配列決定することを含み、ここで、遺伝子または遺伝子産物は、表1〜4または図3A〜4Dから選ばれる。

0128

実施形態において、ステップ(b)は、存在する。実施形態において、ステップ(b)は、存在しない。

0129

別の実施形態において、次のセットまたは群のうちの1つの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)を分析する。例えば、腫瘍またはがん遺伝子または遺伝子産物、参照(例えば、野生型)遺伝子または遺伝子産物、及びPGx遺伝子または遺伝子産物に関連する対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)は、腫瘍試料からサブゲノム区間の群またはセットを提供し得る。

0130

実施形態において、本方法は、腫瘍試料から、読み取りデータ、例えば、配列、対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)のセットを取得し、ここで、対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)は、次のうちの少なくとも1、2、3、4、5、6、7、または全てから選ばれる:
A)表1〜4または図3A〜4Dによる変異型または野生型遺伝子または遺伝子産物からの、少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個以上の対象区間、例えば、サブゲノム区間、または発現サブゲノム区間、またはそれらの両方;
B)腫瘍またはがんに関連する遺伝子または遺伝子産物(例えば、陽性もしくは陰性治療応答予測因子であるか、陽性もしくは陰性予後因子であるか、または腫瘍もしくはがんの差次的な診断を可能とするもの、例えば、表1〜4または図3A〜4Dによる遺伝子または遺伝子産物)からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個以上の対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方);
C)表1〜4または図3A〜4Dから選ばれる、薬物代謝薬物応答性、または毒性のうちの1つ以上に関連する遺伝子または遺伝子産物(本明細書において「PGx」遺伝子とも称される)中に存在するサブゲノム区間の変異型または野生型遺伝子または遺伝子産物(例えば、一塩基多型(SNP)からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個以上の対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方);
D)表1〜4または図3A〜4Dから選ばれる、(i)薬物で治療されたがん患者のより良好な生存率(例えば、パクリタキセルで治療された乳癌患者のより良好な生存率)、(ii)パクリタキセル代謝、(iii)薬物に対する毒性、または(iv)薬物に対する副作用のうちの1つ以上に関連する遺伝子または遺伝子産物中に存在する対象区間(例えば、サブゲノム区間または発現サブゲノム区間)の変異型または野生型PGx遺伝子または遺伝子産物(例えば、一塩基多型(SNP)からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個以上の対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方);
E)表1〜4または図3A〜4Dによる少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個以上の遺伝子または遺伝子産物を伴う複数の転座変化;
F)例えば、事前選択された位置での対立遺伝子の多様性が事前選択された腫瘍型に関連し、該対立遺伝子の多様性が、該腫瘍型における細胞の5%未満で存在する、表1〜4または図3A〜4Dから選択される少なくとも5個の遺伝子または遺伝子産物;
G)GCリッチ領域に埋め込まれている、表1〜4または図3A〜4Dから選択される少なくとも5個の遺伝子または遺伝子産物;あるいは
H)がん発症のための遺伝(例えば、生殖細胞リスク)要因を示す少なくとも5個の遺伝子または遺伝子産物(例えば、遺伝子または遺伝子産物は表1〜4または図3A〜4Dから選ばれる)。

0131

さらに別の実施形態において、本方法は、腫瘍試料から、読み取りデータ、例えば、配列、対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)のセットを取得し、ここで、対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)は、表1に記載される遺伝子または遺伝子産物のうちの、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、または全てから選ばれる。

0132

さらに別の実施形態において、本方法は、腫瘍試料から、読み取りデータ、例えば、配列、対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)のセットを取得し、ここで、対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)は、表2に記載される遺伝子または遺伝子産物のうちの、5、6、7、8、9、10、15、20、25、30、または全てから選ばれる。

0133

さらに別の実施形態において、本方法は、腫瘍試料から、読み取りデータ、例えば、配列、対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)のセットを取得し、ここで、対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)は、表3に記載される遺伝子または遺伝子産物のうちの、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、または全てから選ばれる。

0134

さらに別の実施形態において、本方法は、腫瘍試料から、読み取りデータ、例えば、配列、対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)のセットを取得し、ここで、対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)は、表4に記載される遺伝子または遺伝子産物のうちの、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、または全てから選ばれる。

0135

これら及び他のサブゲノム区間のセット及び群は、本明細書の他の箇所、例えば、「遺伝子選択」という題名の項でより詳細に論じられる。

0136

本明細書に記載される方法のいずれも、次の実施形態のうちの1つ以上と組み合わせられ得る。

0137

他の実施形態において、試料は腫瘍試料であり、例えば、1つ以上の前悪性または悪性細胞を含む。ある特定の実施形態において、試料、例えば、腫瘍試料は、悪性血液腫瘍(または前悪性腫瘍)、例えば、本明細書に記載される悪性血液腫瘍(または、前悪性腫瘍)から取得される。ある特定の実施形態において、試料、例えば、腫瘍試料は、固形腫瘍、軟組織腫瘍、または転移性病巣から取得される。他の実施形態において、試料、例えば、腫瘍試料は、外科的縁からの組織または細胞を含む。ある特定の実施形態において、試料、例えば、腫瘍試料は、腫瘍浸潤リンパ球を含む。試料は、組織学的に正常な組織であり得る。別の実施形態において、試料、例えば、腫瘍試料は、1つ以上の循環腫瘍細胞(CTC)(例えば、血液試料から取得されるCTC)を含む。実施形態において、試料、例えば、腫瘍試料は、1つ以上の非悪性細胞を含む。実施形態において、試料、例えば、腫瘍試料は、1つ以上の腫瘍浸潤リンパ球を含む。

0138

一実施形態において、本方法は、試料、例えば、本明細書に記載されるような腫瘍試料を取得することをさらに含む。試料は、直接的または間接的に取得され得る。実施形態において、試料は、悪性細胞及び非悪性細胞(例えば、腫瘍浸潤リンパ球)の両方を含有する試料から、例えば、単離または精製によって取得される。

0139

他の実施形態において、本方法は、本明細書に記載される方法を使用して、試料、例えば、組織学的に正常な試料、例えば、外科的縁からの試料を評価することを含む。出願人は、組織学的に正常な組織から得られた試料(例えば、他の点では組織学的に正常な組織縁)が、本明細書に記載されるような変化を依然として有し得ることを発見した。故に、本方法は、検出された変化の存在に基づいて組織試料再分類することをさらに含み得る。

0140

別の実施形態において、取得されるかまたは分析される読み取りデータの少なくとも10、20、30、40、50、60、70、80、または90%は、本明細書に記載される遺伝子、例えば、表1〜4または図3A〜4Dからの遺伝子からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に対するものである。

0141

実施形態において、本方法で作製される変異呼び出しの少なくとも10、20、30、40、50、60、70、80、または90%は、本明細書に記載される遺伝子または遺伝子産物、例えば、表1〜4または図3A〜4Dからの遺伝子または遺伝子産物からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に対するものである。

0142

実施形態において、本方法において使用される固有の閾値の少なくとも10、20、30、40、50、60、70、80、または90%は、本明細書に記載される遺伝子または遺伝子産物、例えば、表1〜4または図3A〜4Dからの遺伝子または遺伝子産物からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に対するものである。

0143

実施形態において、アノテーションされるかまたは第3者に対して報告される変異呼び出しの少なくとも10、20、30、40、50、60、70、80、または90%は、本明細書に記載される遺伝子または遺伝子産物、例えば、表1〜4または図3A〜4Dからの遺伝子または遺伝子産物からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に対するものである。

0144

実施形態において、本方法は、腫瘍及び/または対照核酸試料(例えば、FFPE由来核酸試料)から得られたヌクレオチド配列読み取りデータを取得することを含む。

0145

実施形態において、読み取りデータは、NGS配列決定法によって提供される。

0146

実施形態において、本方法は、核酸メンバーの1つまたは複数のライブラリを提供することと、該1つまたは複数のライブラリの複数のメンバーから、事前選択されたサブゲノム区間を配列決定することと、を含む。実施形態において、本方法は、配列決定のための該1つまたは複数のライブラリのサブセットを選択するステップ、例えば、溶液ベースの選択または固体支持体(例えば、アレイ)ベースの選択を含み得る。

0147

実施形態において、本方法は、1つまたは複数のライブラリを複数のベイトと接触させて、核酸の選択下位群、例えば、ライブラリキャッチを提供するステップを含む。一実施形態において、接触ステップは、溶液ハイブリダイゼーションにおいて実施される。別の実施形態において、接触ステップは、固体支持体、例えば、アレイにおいて実施される。ある特定の実施形態において、本方法は、1回以上の追加のハイブリダイゼーションによってハイブリダイゼーションステップを反復することを含む。いくつかの実施形態において、本方法は、同じかまたは異なるベイト集合体を用いた1回以上の追加のハイブリダイゼーションにライブラリキャッチを供することをさらに含む。

0148

さらに他の実施形態において、本方法は、ライブラリキャッチを分析することをさらに含む。一実施形態において、ライブラリキャッチは、配列決定法、例えば、本明細書に記載されるような次世代配列決定法によって分析される。本方法は、例えば、溶液ハイブリダイゼーションによってライブラリキャッチを単離し、核酸配列決定によってそのライブラリキャッチを供することを含む。ある特定の実施形態において、ライブラリキャッチは、再配列決定され得る。次世代配列決定法は、当技術分野で知られており、例えば、Metzker,M.(2010)Nature Biotechnology Reviews 11:31−46に記載されている。

0149

実施形態において、ヌクレオチド位置に対する割り当て値は、任意に、説明的なアノテーション付きで第3者に伝達される。

0150

実施形態において、ヌクレオチド位置に対する割り当て値は、第3者に伝達されない。

0151

実施形態において、複数のヌクレオチド位置に対する割り当て値は、任意に、説明的なアノテーション付きで、第3者に伝達され、第2の複数のヌクレオチド位置に対する割り当て値は第3者に伝達されない。

0152

実施形態において、少なくとも0.01、0.02、0.03、0.04、0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、2.0、5.0、10、15、または30メガ塩基、例えば、ゲノム塩基が配列決定される。

0153

実施形態において、本方法は、少なくとも1つのSNPを含む複数の読み取りデータを評価することを含む。

0154

実施形態において、本方法は、試料及び/または対照読み取りデータ中のSNP対立遺伝子比を決定することを含む。

0155

実施形態において、本方法は、例えば、バーコード解析によって、1つ以上の読み取りデータを対象に割り当てることを含む。

0156

実施形態において、本方法は、例えば、バーコード解析によって、腫瘍読み取りデータまたは対照読み取りデータとして1つ以上の読み取りデータを割り当てることを含む。

0157

実施形態において、本方法は、例えば、参照配列との整列によって、該1つ以上の読み取りデータの各々をマッピングすることを含む。

0158

実施形態において、本方法は、呼び出された変異を提出することを含む。

0159

実施形態において、本方法は、呼び出された変異をアノテーションすること、例えば、変異構造の指標を有する呼び出された変異、例えば、ミスセンス変異、または機能、例えば、疾患表現型をアノテーションすることを含む。

0160

実施形態において、本方法は、腫瘍及び対照核酸に対するヌクレオチド配列読み取りデータを取得することを含む。

0161

実施形態において、本方法は、例えば、ベイジアン呼び出し法または非ベイジアン呼び出し法を用いて、対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)の各々に対する、ヌクレオチド値、例えば、変異形、例えば、変異を呼び出すことを含む。

0162

実施形態において、例えば、異なる対象からの複数の試料が同時に処理される。

0163

本明細書に開示される方法は、対象のゲノムまたはトランスクリプトームに存在する変化を検出するために使用され得、DNA及びRNA配列決定、例えば、標的化RNA及び/またはDNA配列決定に適用され得る。故に、本発明において取り上げられる別の態様は、本明細書に記載される変化を検出するための、標的化RNA配列決定、例えば、試料、例えば、FFPE試料、血液試料、または骨髄穿刺液試料から取得されたRNA由来cDNAの配列決定のための方法を含む。この変化は、再編成、例えば、遺伝子融合をコードする再編成であり得る。他の実施形態において、本方法は、遺伝子または遺伝子産物のレベルの変化(例えば、増加または減少)、例えば、本明細書に記載される遺伝子または遺伝子産物の発現の変化の検出を含む。任意に、本方法は、標的RNAに対して試料を富化するステップを含み得る。他の実施形態において、本方法は、ある特定の高存在量のRNA、例えば、リボソームまたはグロビンRNAの試料を枯渇させるステップを含む。RNA配列決定法は、単独で、または本明細書に記載されるDNA配列決定法と組み合わせて使用され得る。一実施形態において、本方法は、DNA配列決定ステップ及びRNA配列決定ステップを行うことを含む。本方法は、任意の順序で行われ得る。例えば、本方法は、本明細書に記載される変化の発現をRNA配列決定することによって確認すること、例えば、本発明のDNA配列決定法によって検出される変異または融合の発現を確認することを含み得る。他の実施形態において、本方法は、RNA配列決定ステップを行い、続いてDNA配列決定ステップを行うことを含む。

0164

別の態様において、本発明は、標的化サブゲノム領域に対する配列決定/整列アーチファクトのデータベースを構築することを含む方法を特徴とする。実施形態において、データベースは、の変異呼び出しを除去し、特異性を改善するために使用され得る。実施形態において、データベースは、無関係の非腫瘍(例えば、FFPE、血液、または骨髄穿刺液)試料または細胞株の配列決定を行い、これらの正常試料のうちの1つ以上においてランダムな配列決定エラーのみに起因する、予想されるものよりも頻度が高いと思われる非参照対立遺伝子事象を記録することによって構築される。この手法は、生殖細胞変動をアーチファクトとして分類し得るが、それは、体細胞変異に関する方法では許容可能である。アーチファクトとしての生殖細胞変動のこの誤分類は、必要に応じて、既知の生殖細胞変動(共通変異形の除去)に対して、及び1個体のみに出現するアーチファクトに対して(希少変動の除去)、このデータベースをフィルタリングすることによって改善され得る。

0165

本明細書に開示される方法は、例えば、ゲノムのがん関連分節に適用されるような、最適化されたベイトに基づく選択、最適化された整列、及び最適化された変異呼び出しを含むいくつかの最適化された要素の統合を可能にする。本明細書に記載される方法は、がんごと、遺伝子ごと、及び部位ごとに最適化され得る腫瘍のNGSに基づく分析を提供する。これは、例えば、本明細書に記載される遺伝子/部位及び腫瘍型に適用され得る。本方法は、所与の配列決定技術を用いて変異検出に対する感度及び特異性のレベルを最適化する。がんごと、遺伝子ごと、及び部位ごとの最適化は、臨床製品にとって必須である非常に高いレベルの感度/特異性(例えば、両方に関して>99%)を提供する。

0166

本明細書に記載される方法は、最適な治療及び疾患管理の決断を知らせるために、日常的な実在の試料からの、次世代配列決定技術を使用した、臨床及び規制グレード包括的な分析、ならびに妥当に実施可能な遺伝子の包括的セット(これは、典型的には、50〜500個の遺伝子の範囲であり得る)に対するゲノム異常の解釈を提供する。

0167

本明細書に記載される方法は、最適治療及び疾患管理の判断を知らせるために、腫瘍試料を送付して、その腫瘍に対するゲノム及び他の分子の変化の包括的な分析及び説明を受領する腫瘍医/病理学者のためのワンストップショッピングを提供する。

0168

本明細書に記載される方法は、標準的な入手可能な腫瘍試料を採取する堅牢現実的な臨床腫瘍診断ツールを提供し、1つの試験で、どの異常が腫瘍の原因になり得、腫瘍医に治療判断を知らせるのに有用であり得るかの包括的な説明を腫瘍医に提供するために、包括的なゲノム及び他の分子異常分析を提供する。

0169

本明細書に記載される方法は、臨床グレード品質の、患者のがんゲノムの包括的な分析を提供する。方法は、最も関連性の高い遺伝子及び潜在的な変化を含み、変異(例えば、インデルまたは塩基置換)、コピー数、再編成、例えば、転座、発現、及びエピジェネティックマーカーの分析のうちの1つ以上を含む。遺伝子分析の結果は、実施可能な結果の記述的報告とともに状況を説明し得る。方法は、この使用を、関連する科学的及び医学的知識の最新のセットと結び付ける。

0170

本明細書に記載される方法は、患者のケアの質及び効率の両方の向上を提供する。これは、標準治療がないかまたは確立された一連の療法が患者にとって無効であるような、腫瘍が稀であるかまたはあまり研究されていない型のものであり、追加の療法の選択のための、または臨床試験参加のための合理的基準が有用であり得る適用を含む。例えば、本方法は、療法の任意の時点で、腫瘍医が意思決定を知らせるために利用可能な完全な「分子イメージ」及び/または「分子サブ診断」を有することによって利益を得る選択を可能にする。

0171

本明細書に記載される方法は、患者または別の者または実体、例えば、介護者、例えば、内科医、例えば、腫瘍医、病院、診療所、第3者の支払人、保険会社、もしくは官庁に対する、報告書、例えば、電子報告書、ウェブベース報告書、または書面報告書を提供することを含み得る。この報告書は、本方法からの結果、例えば、ヌクレオチド値の同定、試料の種類の腫瘍に関連する、例えば、対象区間(例えば、サブゲノム区間、発現サブゲノム区間、またはそれらの両方)に対する、変化、変異、または野生型配列の有無の指標を含み得る。報告書は、配列の役割における情報、例えば、疾患における変化、変異、または野生型配列も含み得る。このような情報は、予後、耐性、または潜在的もしくは示唆された療法選択肢に対する情報を含み得る。報告書は、療法選択肢の推定効性、療法選択肢の許容性、または、本報告書で識別される患者、例えば、試験において、及び実施形態において識別される配列、変化を有する患者に対する療法選択肢の適用の適否に対する情報を含み得る。例えば、報告書は、薬物の投与、例えば、事前選択された用量での、または事前選択された治療レジメンでの、例えば、他の薬物と組み合わせられた、患者への投与に対する情報または推奨を含み得る。実施形態において、本方法で識別される変異の全てが報告書で識別されるわけではない。例えば、報告書は、例えば、事前選択された療法選択肢による治療に対するがんの発生、予後、ステージ、または易罹患性との事前選択された相関レベルを有する遺伝子における変異に限定され得る。本明細書において取り上げられる方法は、本方法を実施する実体による試料の受領から7日、14日、または21日以内に、例えば、本明細書に記載される実体に報告書を送付することを可能にする。

0172

故に、本発明において取り上げられる方法は、例えば、試料の受領から7、14、または21日以内という、迅速な結果所用時間を可能にする。

0173

本明細書に記載される方法は、組織学的に正常な試料、例えば、外科的縁からの試料を評価するためにも使用され得る。本明細書に記載されるような1つ以上の変化が検出される場合、組織は、例えば、悪性または前悪性として再分類され得、及び/または治療経過が変更され得る。

0174

ある特定の態様において、本明細書に記載される配列決定法は、非がん用途、例えば、法医学用途(例えば、歯科記録の使用の代替としてまたはそれに加えた同定)、親子検査、ならびに例えば、中でも感染性疾患自己免疫障害嚢胞性線維症ハンチントン病アルツハイマー病に関する疾患の診断及び予後において有用である。例えば、本明細書に記載される方法による遺伝子変化の同定は、特定の障害を発症することに関しての個体の存在またはリスクを示し得る。

0175

別途定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の技術者によって一般的に理解されるものと同じ意味を有する。本明細書に記載されるものと同様または同等の方法及び材料が本発明の実施または試験で使用され得るが、好適な方法及び材料が以下に記載される。本明細書で言及される全ての刊行物、特許出願、特許、及び他の参考文献は、参照によってその全体が組み込まれる。加えて、材料、方法、及び実施例は例示にすぎず、限定であることは意図されない。

0176

本発明の他の特徴及び利点は、発明を実施するための形態、図面から、及び特許請求の範囲から明らかになるであろう。

図面の簡単な説明

0177

腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を示す。
腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を示す。
腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を示す。
腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を示す。
腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を示す。
腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を示す。
変異検出に対する先行期待値及び読み取りデータ深さの影響を示す。
本明細書に記載される方法に従って、(例えば、固形腫瘍中の)評価され得る追加の例示的な遺伝子を示す。
本明細書に記載される方法に従って、(例えば、固形腫瘍中の)評価され得る追加の例示的な遺伝子を示す。
本明細書に記載される方法に従って、(例えば、血液悪性腫瘍または肉腫中の)評価され得る追加の例示的な遺伝子を示す。
本明細書に記載される方法に従って、(例えば、血液悪性腫瘍または肉腫中の)評価され得る追加の例示的な遺伝子を示す。
本明細書に記載される方法に従って、(例えば、血液悪性腫瘍または肉腫中の)評価され得る追加の例示的な遺伝子を示す。
本明細書に記載される方法に従って、(例えば、血液悪性腫瘍または肉腫中の)評価され得る追加の例示的な遺伝子を示す。
標的遺伝子から測定される全エクソーム変異負荷と変異負荷との間の相関を示す散布図を示す。
標的遺伝子から測定される全エクソーム変異負荷と変異負荷との間の相関を示す散布図を示す。
肺癌における腫瘍変異負荷分布を示す。10,676ケース肺腺癌腫(図7A)、1,960ケースの扁平上皮細胞癌腫(図7B)、220ケースの肺大細胞癌腫(図7C)、及び784ケースの肺小細胞癌腫(図7D)の臨床検体、それぞれにおいて、TMBを包括的ゲノムプロファイリングによって決定した。
肺癌における腫瘍変異負荷分布を示す。10,676ケースの肺腺癌腫(図7A)、1,960ケースの肺扁平上皮細胞癌腫(図7B)、220ケースの肺大細胞癌腫(図7C)、及び784ケースの肺小細胞癌腫(図7D)の臨床検体、それぞれにおいて、TMBを包括的ゲノムプロファイリングによって決定した。
肺癌における腫瘍変異負荷分布を示す。10,676ケースの肺腺癌腫(図7A)、1,960ケースの肺扁平上皮細胞癌腫(図7B)、220ケースの肺大細胞癌腫(図7C)、及び784ケースの肺小細胞癌腫(図7D)の臨床検体、それぞれにおいて、TMBを包括的ゲノムプロファイリングによって決定した。
肺癌における腫瘍変異負荷分布を示す。10,676ケースの肺腺癌腫(図7A)、1,960ケースの肺扁平上皮細胞癌腫(図7B)、220ケースの肺大細胞癌腫(図7C)、及び784ケースの肺小細胞癌腫(図7D)の臨床検体、それぞれにおいて、TMBを包括的ゲノムプロファイリングによって決定した。
肺癌における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、肺腺癌腫(図8A)、肺扁平上皮細胞癌腫(図8B)、肺大細胞癌腫(図8C)、及び肺小細胞癌腫(図8D)、それぞれにおいて、頻繁に入れ替わった25個の遺伝子を識別した。肺癌の4つ全てのサブタイプ図8E)の集合遺伝子保有率が示される。SV:短い変異形、CNA:コピー数変化、RE:再編成、複合:同じ遺伝子における多数の種類の変化。
肺癌における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、肺腺癌腫(図8A)、肺扁平上皮細胞癌腫(図8B)、肺大細胞癌腫(図8C)、及び肺小細胞癌腫(図8D)、それぞれにおいて、頻繁に入れ替わった25個の遺伝子を識別した。肺癌の4つ全てのサブタイプ(図8E)の集合遺伝子保有率が示される。SV:短い変異形、CNA:コピー数変化、RE:再編成、複合:同じ遺伝子における多数の種類の変化。
肺癌における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、肺腺癌腫(図8A)、肺扁平上皮細胞癌腫(図8B)、肺大細胞癌腫(図8C)、及び肺小細胞癌腫(図8D)、それぞれにおいて、頻繁に入れ替わった25個の遺伝子を識別した。肺癌の4つ全てのサブタイプ(図8E)の集合遺伝子保有率が示される。SV:短い変異形、CNA:コピー数変化、RE:再編成、複合:同じ遺伝子における多数の種類の変化。
肺癌における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、肺腺癌腫(図8A)、肺扁平上皮細胞癌腫(図8B)、肺大細胞癌腫(図8C)、及び肺小細胞癌腫(図8D)、それぞれにおいて、頻繁に入れ替わった25個の遺伝子を識別した。肺癌の4つ全てのサブタイプ(図8E)の集合遺伝子保有率が示される。SV:短い変異形、CNA:コピー数変化、RE:再編成、複合:同じ遺伝子における多数の種類の変化。
肺癌における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、肺腺癌腫(図8A)、肺扁平上皮細胞癌腫(図8B)、肺大細胞癌腫(図8C)、及び肺小細胞癌腫(図8D)、それぞれにおいて、頻繁に入れ替わった25個の遺伝子を識別した。肺癌の4つ全てのサブタイプ(図8E)の集合遺伝子保有率が示される。SV:短い変異形、CNA:コピー数変化、RE:再編成、複合:同じ遺伝子における多数の種類の変化。
結腸直腸腺癌腫における腫瘍変異負荷分布を示す。6,742ケースの結腸腺癌腫(図9A)及び1,176ケースの直腸腺癌腫図9B)の臨床検体、それぞれにおいて、TMBを包括的ゲノムプロファイリングによって決定した。
結腸直腸腺癌腫における腫瘍変異負荷分布を示す。6,742ケースの結腸腺癌腫(図9A)及び1,176ケースの直腸腺癌腫(図9B)の臨床検体、それぞれにおいて、TMBを包括的ゲノムプロファイリングによって決定した。
結腸直腸腺癌腫における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、結腸腺癌腫(図10A)及び直腸腺癌腫(図10B)、それぞれにおいて、頻繁に入れ替わった25個の遺伝子を識別した。結腸直腸腺癌腫(図10C)の集合遺伝子保有率が示される。SV:短い変異形、CNA:コピー数変化、RE:再編成、複合:同じ遺伝子における多数の種類の変化。
結腸直腸腺癌腫における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、結腸腺癌腫(図10A)及び直腸腺癌腫(図10B)、それぞれにおいて、頻繁に入れ替わった25個の遺伝子を識別した。結腸直腸腺癌腫(図10C)の集合遺伝子保有率が示される。SV:短い変異形、CNA:コピー数変化、RE:再編成、複合:同じ遺伝子における多数の種類の変化。
結腸直腸腺癌腫における遺伝子変化保有率を示す。包括的ゲノムプロファイリングによって、結腸腺癌腫(図10A)及び直腸腺癌腫(図10B)、それぞれにおいて、頻繁に入れ替わった25個の遺伝子を識別した。結腸直腸腺癌腫(図10C)の集合遺伝子保有率が示される。SV:短い変異形、CNA:コピー数変化、RE:再編成、複合:同じ遺伝子における多数の種類の変化。
は、24種類の新生物における腫瘍変異負荷分布を示す。例えば、膀胱、脳、乳房子宮頸部、頭頸部肝臓卵巣膵臓前立腺、皮膚、、及び子宮の腫瘍を含む合計15508ケースの臨床検体において、TMBを包括的ゲノムプロファイリングによって決定した。

0178

本発明は、例えば、ハイブリッド捕捉に基づく次世代配列決定(NGS)プラットフォームを使用して、患者試料からのゲノムまたはエクソームの小画分をプロファイリングすることが、全ての変異荷重の分析に対して有効な代替法の役割を果たすという発見に少なくとも部分的に基づく。

0179

理論に束縛されるものではないが、免疫原性腫瘍ネオ抗原を生成する尤度は、確率的な様式で、変異が発生すると増加し、免疫認識の尤度を増加すると考えられている(Gubin and Schreiber. Science 350:158−9,2015)。しかし、全ての変異荷重を評価することは、全エクソーム解析(WES)を必要とする。この手法は、特化された組織処理、適合正常検体を要し、現在、研究ツールとして広く行われている。臨床的セッティングにおいてWESを行う上での技術的及び情報学的課題を考慮すると、変異負荷を検出する代理方法が必要とされる。本明細書に記載される有効化されたハイブリッド捕捉に基づくNGSプラットフォームを含む本方法は、例えば、より臨床的に実現可能な結果所要時間(約2週間)、標準化情報学パイプライン、及びより管理可能なコストを含むいくつかの実用本位の利点を有する。この手法は、それが主観的尺度(病理学的スコア付け)よりむしろ、客観的尺度(例えば、変異荷重)を生み出すために、組織化学によって検出されるタンパク質発現などの従来のマーカーを上回る他の利点を有する(Hansen and Siu. JAMA Oncol 2(1):15−6,2016)。さらに、このプラットフォームは、標的療法に関連する実施可能な変化の同時検出を容易にする。

0180

したがって、本発明は、試料からのサブゲノム区間のセットの配列を提供すること、及び変異荷重に対する値を決定することによって、試料中の変異荷重を評価する方法を少なくとも部分的に提供し、ここで、値は、サブゲノム区間のセット内の変化の数の関数である。ある特定の実施形態において、サブゲノム区間のセットは、所定の遺伝子セット、例えば、全ゲノムまたはエクソームを含まない所定の遺伝子セットからのものである。ある特定の実施形態において、サブゲノム区間のセットは、コードサブゲノム区間のセットである。他の実施形態において、サブゲノム区間のセットは、コードサブゲノム区間及び非コードサブゲノム区間の両方を含有する。ある特定の実施形態において、変異荷重に対する値は、サブゲノム区間のセット内の変化(例えば、体細胞変化)の数の関数である。ある特定の実施形態において、変化の数は、機能的変化、生殖細胞変化、またはそれらの両方を除外する。いくつかの実施形態において、試料は、腫瘍試料または腫瘍由来の試料である。本明細書に記載される方法はまた、例えば、試料から複数の腫瘍メンバーを含むライブラリを取得することと、ライブラリをベイトセットと接触させて、ハイブリダイゼーションによって選択された腫瘍メンバーを提供し、それにより、ライブラリキャッチを提供することと、ライブラリキャッチからの腫瘍メンバーから変化を含むサブゲノム区間に対する読み取りデータを取得することと、整列法によって読み取りデータを整列させることと、読み取りデータから、事前選択されたヌクレオチド位置にヌクレオチド値を割り当てることと、割り当てられたヌクレオチド位置のセットから、所定の遺伝子セットからのものであるサブゲノム区間のセットを選択することと、のうちの1つ以上を含み得る。試料中の変異荷重を評価するためのシステムも開示されている。

0181

ある特定の用語が最初に定義される。追加の用語は、本明細書全体を通して定義される。

0182

本明細書で使用されるとき、詞「a」及び「an」は、冠詞の文法上の目的語のうちの1つまたは1つを超えるもの(例えば、少なくとも1つ)を指す。

0183

「約」及び「およそ」は、概して、測定の性質または精度を考慮して、測定された量に対する許容可能なエラーの程度を意味する。例示的なエラーの程度は、所与の値また値の範囲の20パーセント(%)以内、典型的には10%以内、及びより典型的には5%以内である。

0184

「取得する」または「取得すること」という用語は、本明細書で使用されるとき、物理的実体、もしくは値、例えば、「直接的に取得する」ことによって数値、または「間接的に取得する」ことによって物理的実体もしくは値を得ることを指す。「直接的に取得すること」は、プロセスを行って(例えば、合成方法または分析方法を行って)、物理的実体または値を得ることを意味する。「間接的に取得すること」は、別の団体または供給源(例えば、物理的実体または値を直接的に取得した第3者の研究室)から物理的実体または値を受領することを指す。物理的実体を直接的に取得することは、物理的物質、例えば、開始材料中で物理的変化を含むプロセスを行うことを含む。例示的な変化には、2つ以上の開始材料から物理的実体を作製すること、物質せん断または断片化すること、物質を分離または精製すること、2つ以上の別個の実体を組み合わせて混合物にすること、共有結合または非共有結合を切断または形成することを含む化学反応を行うことが含まれる。値を直接的に取得することは、試料または別の物質中で物理的変化を含むプロセスを行うこと、例えば、物質、例えば、試料、分析物、または試薬中で物理的変化を含む分析プロセス(本明細書において、「物理的な分析」と称される場合もある)を行うこと、分析方法、例えば、次の:物質、例えば、分析物、もしくは断片、もしくはそれらの他の誘導体を、別の物質から分離もしくは精製すること、分析物、もしくは断片、もしくはそれらの他の誘導体を、別の物質、例えば、緩衝剤溶媒、もしくは反応物質と組み合わせること、または、例えば、分析物の第1及び第2の原子間の共有結合もしくは非共有結合を切断もしくは形成することによって、分析物、もしくは断片、もしくはそれらの他の誘導体の構造を変化させること、または、例えば、試薬の第1及び第2の原子間の共有結合もしくは非共有結合を切断もしくは形成することによって、試薬、もしくは断片、もしくはそれらの他の誘導体の構造を変化させることのうちの1つ以上を含む方法を行うことを含む。

0185

「配列を取得すること」または「読み取りデータを取得すること」という用語は、本明細書で使用されるとき、「直接的に取得すること」によってヌクレオチド配列もしくはアミノ酸配列、または「間接的に取得すること」によって配列もしくは読み取りデータを得ることを指す。配列または読み取りデータを「直接的に取得すること」は、プロセスを行って(例えば、合成方法または分析方法を行って)、例えば、配列決定法(例えば、次世代配列決定(NGS)法)を行って、配列を得ることを意味する。配列または読み取りデータを「間接的に取得すること」は、別の団体または供給源(例えば、配列を直接的に取得した第3者の研究室)から、配列の情報もしくは知識を受領すること、または配列を受領することを指す。取得された配列または読み取りデータは、完全配列である必要はなく、例えば、配列を取得する対象構成に存在していると本明細書に開示される変化のうちの1つ以上を識別する少なくとも1個のヌクレオチドの配列決定、または情報もしくは知識を得ることである。

0186

配列または読み取りデータを直接的に取得することは、物理的物質、例えば、開始材料、例えば、組織または細胞試料、例えば、生体組織または単離核酸(例えば、DNAまたはRNA)試料における物理的変化を含むプロセスを行うことを含む。例示的な変化には、2つ以上の開始材料から物理的実体を作製すること、物質、例えば、ゲノムDNA断片をせん断または断片化すること、物質を分離または精製すること(例えば、組織から核酸試料を単離すること)、2つ以上の別個の実体を組み合わせて混合物にすること、共有結合または非共有結合を切断または形成することを含む化学反応を行うことが含まれる。値を直接的に取得することは、上述されるような試料または別の物質における物理的変化を含むプロセスを行うことを含む。

0187

「試料を取得すること」という用語は、本明細書で使用されるとき、試料を「直接的に取得すること」または「間接的に取得すること」によって、試料、例えば、組織試料または核酸試料を得ることを指す。「試料を直接的に取得すること」は、試料を得るためのプロセスを行うこと(例えば、外科的手術または抽出などの物理的方法を行うこと)を意味する。「試料を間接的に取得すること」は、別の団体または供給源(例えば、試料を直接的に取得した第3者の研究室)から試料を受領することを指す。試料を直接的に取得することは、物理的物質、例えば、開始材料、例えば、組織、例えば、ヒト患者における組織、または患者から以前に単離された組織における物理的変化を含むプロセスを行うことを含む。例示的な変化には、開始材料から物理的実体を作製すること、組織を解剖または擦り取ること、物質(例えば、試料組織または核酸試料)を分離または精製すること、2つ以上の別個の実体を組み合わせて混合物にすること、共有結合または非共有結合を切断または形成することを含む化学反応を行うことが含まれる。試料を直接的に取得することは、例えば、上述されるような試料または別の物質における物理的変化を含むプロセスを行うことを含む。

0188

「整列セレクタ」は、本明細書で使用されるとき、事前選択されたサブゲノム区間の配列決定を最適化し得る整列法、例えば、整列アルゴリズムまたはパラメータの選択を可能にするかまたは指示するパラメータを指す。整列セレクタは、例えば、次のうちの1つ以上の関数に特異的であり得るか、またはそれらの関数として選択され得る。
1.配列状況、例えば、サブゲノム区間(例えば、評価される事前選択されたヌクレオチド位置)に対する読み取りデータの誤整列に対する傾向に関連する該サブゲノム区間の配列状況。例えば、ゲノムの他の場所で反復される評価されるサブゲノム区間中またはその付近の配列要素の存在は、誤整列を引き起こし得、それにより、能力が低減し得る。誤整列を最小限にするアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。この場合、整列セレクタに対する値は、配列状況、例えば、ゲノム(または、分析されているゲノムの一部分)中の少なくとも事前選択された回数反復される事前選択された長さの配列の有無の関数であり得る。
2. 分析されている腫瘍型。例えば、特定の腫瘍型は、欠失率の増加を特徴とし得る。故に、インデルに対してより感度が高いアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。この場合、整列セレクタに対する値は、腫瘍型の関数、例えば、腫瘍型に対する識別子であり得る。実施形態において、値は、腫瘍型、例えば、血液悪性腫瘍(または前悪性腫瘍)の同一性である。
3. 分析されている遺伝子または遺伝子の型、例えば、遺伝子または遺伝子の型が分析され得る。例として、発がん遺伝子は、置換またはインフレームインデルを特徴とすることが多い。故に、これらの変異形に対して特に感度が高く、他のものに対して特異的であるアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。腫瘍抑制因子は、フレームシフトインデルを特徴とすることが多い。故に、これらの変異形に対して特に感度があるアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。故に、サブゲノム区間と適合するアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。この場合、整列セレクタに対する値は、遺伝子または遺伝子の型の関数、例えば、遺伝子または遺伝子の型に対する識別子であり得る。実施形態において、値は、遺伝子の同一性である。
4. 分析されている部位(例えば、ヌクレオチド位置)。この場合、整列セレクタに対する値は、部位または部位の種類の関数、例えば、部位または部位の種類に対する識別子であり得る。実施形態において、値は、部位の同一性である。(例えば、その部位を含有する遺伝子が別の遺伝子と相同性が高い場合、正常型高速の短い読み取りデータ整列アルゴリズム(例えば、BWA)は、2個の遺伝子間を区別することが困難であり得、より強力な整列法(Smith−Waterman)または均等アセンブリ(ARACHNE)を要する可能性がある。同様に、遺伝子配列複雑性の低い領域(例えば、AAAAAA)を含有する場合、より強力な整列法が必要であり得る。
5. 評価されているサブゲノム区間に関連する、変異形または変異形の種類。例えば、置換、挿入、欠失、転座、または他の再編成。故に、特異的な変異形の種類に対してより感度が高いアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。この場合、整列セレクタに対する値は、変異形の種類の関数、例えば、変異形の種類に対する識別子であり得る。実施形態において、値は、変異形の種類、例えば、置換の同一性である。
6.試料の種類、FFPEまたは他の固定試料。試料の種類/品質は、エラー(非参照配列の偽の観察)率に影響を及ぼし得る。故に、試料中の真偽率を正確に具現化するアルゴリズムまたはアルゴリズムパラメータを選択することによって、能力が増強され得る。この場合、整列セレクタに対する値は、試料の種類の関数、例えば、試料の種類に対する識別子であり得る。実施形態において、値は、試料の種類、例えば、固定試料の同一性である。

0189

遺伝子または遺伝子産物(例えば、マーカー遺伝子または遺伝子産物)の「変化」または「変化した構造」は、本明細書で使用されるとき、正常または野生型遺伝子と比較して、遺伝子または遺伝子産物内の変異(複数可)、例えば、遺伝子または遺伝子産物の完全性、配列、構造、量、または活性に影響を及ぼす変異の存在を指す。この変化は、正常または健康な組織または細胞(例えば、対照)におけるその量、構造、及び/または活性と比較した場合の、がん組織またはがん細胞における量、構造、及び/または活性におけるものであり得、がんなどの疾患状態に関連する。例えば、がんに関連するか、または抗がん療法に対する応答性を予測する変化は、がん組織またはがん細胞において、正常で健康な組織または細胞と比較して、変化したヌクレオチド配列(例えば、変異)、アミノ酸配列、染色体転座、染色体内逆位、コピー数、発現レベルタンパク質レベルタンパク質活性エピジェネティック修飾(例えば、メチル化状態もしくはアセチル化状態、または翻訳後修飾を有し得る。例示的な変異には、点変異(例えば、サイレントミスセンス、またはナンセンス)、欠失、挿入、逆位、重複、増幅、転座、染色体間再編成、及び染色体内再編成が含まれるが、これらに限定されない変異は、遺伝子のコードまたは非コード領域に存在し得る。ある特定の実施形態において、変化(複数可)は、再編成、例えば、1つ以上のイントロンまたはその断片(例えば、5’−及び/または3’−UTRにおける1つ以上の再編成)を含むゲノム再編成として検出される。ある特定の実施形態において、変化は、表現型、例えば、がん性表現型(例えば、がんリスク、がん進行、がん治療、またはがん治療に対する耐性のうちの1つ以上)に関連する(か、または関連しない)。一実施形態において、変化は、がんに対する遺伝的リスク因子、陽性治療応答予測因子、陰性治療応答予測因子、陽性予後因子、陰性予後因子、または診断因子のうちの1つ以上に関連する。

0190

本明細書で使用されるとき、「インデル」という用語は、細胞の核酸中の1つ以上のヌクレオチドの挿入、欠失、またはそれらの両方を指す。ある特定の実施形態において、インデルは、1つ以上のヌクレオチドの挿入及び欠失の両方を含み、ここで、挿入及び欠失の両方は、核酸上の付近にある。ある特定の実施形態において、インデルは、ヌクレオチドの合計数において正味の変化をもたらす。ある特定の実施形態において、インデルは、約1〜約50個のヌクレオチドの正味の変化をもたらす。

0191

「クローンプロファイル」という用語は、本明細書で使用されるとき、出現、同一性、可変性分布、発現(サブゲノムシグネチャーの転写コピーの出現またはレベル)、または対象区間の(または、それを含む細胞の)1つ以上の配列、例えば、対立遺伝子もしくはシグネチャーの存在量、例えば、相対的存在量を指す。実施形態において、クローンプロファイルは、対象区間に対する複数の配列、対立遺伝子、またはシグネチャーが試料中に存在する場合、対象区間(または、それを含む細胞)に対する1つの配列、対立遺伝子、またはシグネチャーに関する相対的存在量に対する値である。例えば、実施形態において、クローンプロファイルは、対象区間に対する複数のVDJまたはVJの組み合わせのうちの1つ以上の相対的存在量に対する値を含む。実施形態において、クローンプロファイルは、対象区間に対する選択されたV分節の、相対的存在量に対する値を含む。実施形態において、クローンプロファイルは、対象区間の配列内での、例えば、体細胞高頻度変異から生じるような多様性に対する値を含む。実施形態において、クローンプロファイルは、例えば、配列、対立遺伝子、またはシグネチャーを含む発現サブゲノム区間の出現またはレベルによって証明されるような、配列、対立遺伝子、またはシグネチャーの発現の出現またはレベルに対する値を含む。

0192

「発現サブゲノム区間」という用語は、本明細書で使用されるとき、サブゲノム区間の転写された配列を指す。実施形態において、発現サブゲノム区間の配列は、それが転写されるサブゲノム区間とは異なり、例えば、いくつかの配列は、転写され得ない。

0193

「シグネチャー」という用語は、本明細書で使用されるとき、対象区間の配列を指す。シグネチャーは、対象区間で複数の可能性のうちの1つの出現を示し得、例えば、シグネチャーは、再編成された重鎖または軽鎖可変領域遺伝子における選択されたV分節の出現;選択されたVJ接合部の出現、例えば、再編成された重鎖可変領域遺伝子における選択されたV分節及び選択されたJ分節の出現を示し得る。実施形態において、シグネチャーは、複数の特異的な核酸配列を含む。故に、シグネチャーは、特異的な核酸配列に限定されず、むしろ、対象区間での配列または可能性の第1の群と、対象区間での可能性の第2の群とを区別し得、例えば、第1のV分節と第2のV分節とを区別し得るのに十分固有であり、これにより、例えば、様々なV分節の使用の評価が可能となる。シグネチャーという用語は、特異的な核酸配列である、特異的シグネチャーという用語を含む。実施形態において、シグネチャーは、特異的な事象、例えば、再編成事象を示すものであるか、またはその結果である。

0194

「サブゲノム区間」という用語は、本明細書で使用されるとき、ゲノム配列の一部分を指す。実施形態において、サブゲノム区間は、単一のヌクレオチド位置、例えば、腫瘍表現型と(陽性または陰性に)関連するヌクレオチド位置変異形であり得る。実施形態において、サブゲノム区間は、1個を超えるヌクレオチド位置を含む。このような実施形態は、少なくとも2、5、10、50、100、150、または250個のヌクレオチド位置の長さの配列を含む。サブゲノム区間は、遺伝子全体またはその事前選択された部分、例えば、コード領域(または、その一部)、事前選択されたイントロン(または、その一部)、またはエクソン(または、その一部)を含み得る。サブゲノム区間は、天然の、例えば、ゲノムDNA、核酸の断片の全てまたは一部を含み得る。例えば、サブゲノム区間は、配列決定反応に供されるゲノムDNAの断片に対応し得る。実施形態において、サブゲノム区間は、ゲノムの供給源からの連続的な配列である。実施形態において、サブゲノム区間は、ゲノム中で連続していない配列を含み、例えば、それは、cDNA中のエクソン−エクソン接合部で形成されることが見られる接合部を含み得る。

0195

実施形態において、サブゲノム区間は、再編成された配列、例えば、V分節とD分節、D分節とJ分節、V分節とJ分節、またはJ分節と分類分節との連結の結果として生じるBまたはT細胞における配列に対応する。

0196

実施形態において、サブゲノム区間において多様性はない。

0197

実施形態において、サブゲノム区間において多様性があり、例えば、サブゲノム区間が1つを超える配列によって表され、例えば、VD配列をカバーするサブゲノム区間が1つを超えるシグネチャーによって表され得る。

0198

実施形態において、サブゲノム区間は、単一のヌクレオチド位置;遺伝子内領域または遺伝子間領域;エクソンもしくはイントロン、またはそれらの断片、典型的にはエクソン配列またはその断片;コード領域または非コード領域、例えば、プロモーターエンハンサー、5’非翻訳領域(5’UTR)もしくは3’非翻訳領域(3’UTR)、またはそれらの断片;cDNAまたはその断片;SNP;体細胞変異、生殖細胞変異、またはそれらの両方;変化、例えば、点または単一変異;欠失変異(例えば、インフレーム欠失、遺伝子内欠失、完全遺伝子欠失);挿入変異(例えば、遺伝子内挿入);逆位変異(例えば、染色体内逆位);連結変異;連結された挿入変異;逆位重複変異;タンデム重複(例えば、染色体内タンデム重複);転座(例えば、染色体転座、非相反転座);再編成(例えば、ゲノム再編成(例えば、1つ以上のイントロンまたはその断片の再編成;再編成されたイントロンは、5’−及び/または3’UTRを含み得る));遺伝子コピー数の変化;遺伝子発現の変化;RNAレベルの変化;あるいはそれらの組み合わせを含むかまたはそれらからなる。「遺伝子のコピー数」は、特定の遺伝子産物をコードする細胞中のDNA配列の数を指す。概して、所与の遺伝子に関して、哺乳動物は各遺伝子の2つのコピーを有する。コピー数は、例えば、遺伝子増幅もしくは重複によって増加され得るか、または欠失によって低減され得る。

0199

「対象区間」という用語は、本明細書で使用されるとき、サブゲノム区間または発現サブゲノム区間を指す。実施形態において、サブゲノム区間及び発現サブゲノム区間は対応し、これは、つまり、発現サブゲノム区間が、対応するサブゲノム区間から発現される配列を含むことを意味する。実施形態において、サブゲノム区間及び発現サブゲノム区間は対応せず、これは、つまり、発現サブゲノム区間が、対応しないサブゲノム区間から発現される配列を含まないが、むしろ異なるサブゲノム区間に対応することを意味する。実施形態において、サブゲノム区間及び発現サブゲノム区間は部分的に対応し、これは、つまり、発現サブゲノム区間が、対応するサブゲノム区間から発現される配列及び異なる対応するサブゲノム区間から発現される配列を含むことを意味する。

0200

本明細書で使用されるとき、「ライブラリ」という用語は、メンバーの集合体を指す。一実施形態において、ライブラリは、核酸メンバーの集合体、例えば、全ゲノム、サブゲノム断片、cDNA、cDNA断片、RNA、例えば、mRNA、RNA断片、またはそれらの組み合わせの集合体を含む。一実施形態において、ライブラリメンバーの一部または全てがアダプター配列を含む。アダプター配列は、一方または両方の末端に位置し得る。アダプター配列は、例えば、配列決定法(例えば、NGS法)に対して、増幅に対して、逆転写に対して、またはベクターへのクローニングに対して有用であり得る。

0201

ライブラリは、メンバー、例えば、標的メンバー(例えば、腫瘍メンバー、参照メンバー、PGxメンバー、またはそれらの組み合わせ)の集合体を含み得る。ライブラリのメンバーは、単一の個体のものであり得る。実施形態において、ライブラリは、1人を超える対象(例えば、2、3、4、5、6、7、8、9、10、20、30人以上の対象)からのメンバーを含み得、例えば、異なる対象からの2つ以上のライブラリが組み合わされ、1人を超える対象からのメンバーを含むライブラリを形成し得る。一実施形態において、対象は、がんまたは腫瘍を有するか、またはそれらを有するリスクがあるヒトである。

0202

「ライブラリキャッチ」は、ライブラリのサブセット、例えば、事前選択されたサブゲノム区間、例えば、事前選択されたベイトとのハイブリダイゼーションによって捕捉された産物に関して富化されたサブセットを指す。

0203

「メンバー」、または「ライブラリメンバー」、または他の同様の用語は、本明細書で使用されるとき、ライブラリのメンバーである核酸分子、例えば、DNA、RNA、またはそれらの組み合わせを指す。典型的には、メンバーは、DNA分子、例えば、ゲノムDNAまたはcDNAである。メンバーは、断片化された、例えば、せん断または酵素的に調製されたゲノムDNAであり得る。メンバーは、対象からの配列を含み、対象に由来しない配列、例えば、アダプター配列、プライマー配列、または同定を可能にする他の配列、例えば、「バーコード」配列も含み得る。

0204

「ベイト」は、本明細書で使用されるとき、ハイブリッド捕捉試薬の種類である。ベイトは、標的核酸にハイブリッド形成し得(例えば、それに相補的であり得る)、それにより、それの捕捉を可能にする核酸分子、例えば、DNAまたはRNA分子であり得る。一実施形態において、ベイトは、RNA分子(例えば、天然または修飾RNA分子)、DNA分子(例えば、天然または修飾DNA分子)、またはそれらの組み合わせである。他の実施形態において、ベイトは、例えば、結合実体への結合による、ベイト、及びベイトに対してハイブリッド形成される核酸によって形成されるハイブリッドの捕捉及び分離を可能にする、結合実体、例えば、親和性タグを含む。一実施形態において、ベイトは、溶液相ハイブリダイゼーションに好適である。一実施形態において、ベイトは、二環式核酸(BNA)分子である。

0205

「ベイトセット」は、本明細書で使用されるとき、1つまたは複数のベイト分子を指す。

0206

「結合実体」は分析物に特異的に結合することができる、分子タグが直接的または間接的に連結され得る任意の分子を意味する。結合実体は、各ベイト配列上の親和性タグであり得る。ある特定の実施形態において、結合実体は、アビジン分子などのパートナー、またはハプテンもしくはその抗原結合断片に結合する抗体に結合することによって、ハイブリダイゼーション混合物からベイト/メンバーハイブリッドを分離することを可能にする。例示的な結合実体には、ビオチン分子、ハプテン、抗体、抗体結合断片ペプチド、及びタンパク質が含まれるが、これらに限定されない。

0207

「相補的」は、2つの核酸鎖の領域間、または同じ核酸鎖の2つの領域間の配列相補性を指す。第1の核酸領域アデニン残基は、残基がチミンまたはウラシルである場合、第1の領域に対して逆平行である第2の核酸領域の残基と特異的な水素結合を形成(「塩基対形成」)できることが知られている。同様に、第1の核酸鎖のシトシン残基は、残基がグアニンである場合、第1の鎖に対して逆平行である第2の核酸鎖の残基と塩基対形成できることが知られている。核酸の第1の領域は、2つの領域が逆平行な様式で配置されるときに第1の領域の少なくとも1個のヌクレオチド残基が、第2の領域の残基と塩基対形成できる場合、同じかまたは異なる核酸の第2の領域と相補的である。ある特定の実施形態において、第1の領域は第1の部分を含み、第2の領域は第2の部分を含み、それにより、第1及び第2の部分が逆平行の様式で配置される場合、第1の部分のヌクレオチド残基の少なくとも約50%、少なくとも約75%、少なくとも約90%、または少なくとも約95%が、第2の部分のヌクレオチド残基と塩基対形成できる。他の実施形態において、第1の部分の全てのヌクレオチド残基は、第2の部分のヌクレオチド残基と塩基対形成できる。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ