図面 (/)

この項目の情報は公開日時点(2020年6月25日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

本発明は、アレルの相決定と、個別及び同時確率並びに最適合モデルの決定とに基づいて、染色体文節又は全長染色体の倍数性を検出するための、方法、システム、及びコンピュータ可読媒体を提供する。

解決手段

本発明は、妊娠中胎児における癌又は染色体異常を検出するための、方法、システム、及びコンピュータ可読媒体を提供する。また、本発明は、倍数性決定により見いだされる多型座位アレル不均衡率に基づいて、循環腫瘍核酸を検出するための方法を提供する。また、本発明は、増幅効率及びエラー率推定値に基づいて一塩基多様体を検出するための方法と、複数の個体由来対照試料多様性アレル頻度中央値に基づいて一塩基多様体を検出するための方法を提供する。

概要

背景

コピー数多様性(CNV)は、典型的には1,000塩基対(1kb)から20メガ塩基対(mb)の長さの配列の重複および欠失を含むゲノムの構造多様性の主因として認識されている。染色体分節または染色体全体の欠失および重複は、病気に対する感受性または耐性等、様々な条件と関連づけられる。

CNVは、影響を受ける配列の長さに基づいて主に2つの型の内の1つに分類されることが多い。1つ目の型はコピー数多型(CNP)を含む。CNPは、一般的な集団に共通して見られ、1%超の全頻度で発生する。CNPは、通常は小さく(ほとんどは10キロ塩基対未満の長さ)、薬物解毒および免疫に重要なタンパク質をコードする遺伝子に多い。これらCNPの下位集合ではコピー数が大きく異なる。その結果、遺伝子の特定の集合について染色体のコピー数が、個人間で大きく異なる(例えば、2、3、4、5等)可能性がある。免疫応答遺伝子に関連したCNPは、近年、遺伝性難病乾癬クローン病、および糸球体腎炎を含む)に対する感受性と関連づけられている。

もう一方のCNVは、長さが約10万塩基対から100万超の塩基対まで、CNPよりもかなり長い比較的希な多様体を含む。いくつかの場合では、これらCNVは、特定の個体を発生させた精子または卵子ができる過程で生じた可能性、あるいはある家族の数世代間でのみ受け継がれた可能性がある。このような希な大型構造多様体は、精神遅滞発達遅滞統合失調症、および自閉症を有する対象者において偏って観察されている。このような対象者の様子から、神経認知疾患においては遺伝した変異の他の形態(一塩基置換を含む)に比べてこのような希な大型CNVがより重要であるかもしれないと推測されている。

遺伝子のコピー数は癌細胞では変化している可能性がある。例えば、Chr1pの重複は乳癌で共通して見られる。また、EGFRのコピー数は、正常な細胞に比べて非小細胞肺癌では多くなり得る。癌は、主要死亡原因の1つであり、癌の早期診断および治療が重要である。というのは、早期診断および治療は(例えば、沈静の確率やその持続を向上させることによって)患者転帰を向上させることができるからである。早期診断はまた、患者が受ける治療法の量または数を低減させることができる。癌性細胞破壊する現在の治療法の多くは正常細胞にも影響を及ぼし、その結果、様々な副作用吐き気嘔吐血球数の低下、感染リスクの増加、抜け毛、および粘膜潰瘍等)を起こす可能性がある。よって、癌の早期検出は、治療法(化学療法薬または放射線等)の数および/または量を低減させることができるため望ましい。

コピー数変異はまた、数種の精神障害身体障害、および特発性学習障害と関連づけられている。無細胞DNAを用いた非侵襲性出生前検査(NIPT)により異常(例えば、胎児の13番染色体、18番染色体、および21番染色体の三染色体性三倍体性、および性染色体異数性等)を検出することができる。亜染色体の微小欠失もまた、数種の精神障害および身体障害を引き起こし得るが、より小さいものであるためにその検出はより困難である。微小欠失症候群のうち、8つは凝集発生率が1000分の1を超えており、胎児の常染色体の三染色体性と同程度見られる。

また、CCL3L1の高コピー数がHIV感染への低感受性と関連づけられている。FCGR3B(CD16細胞表面免疫グロブリン受容体)のコピー数が少ないと、全身性エリテマトーデスおよび類似の炎症性自己免疫疾患に対する感受性を増加させ得る。

このように、染色体分節または染色体全体の欠失および重複を検出する改良された方法が求められている。これら方法を用いて、癌等の病気の診断や病気の発症リスクの増加、あるいは胎児のCNVを正確に診断することができるが好ましい。

概要

本発明は、アレルの相決定と、個別及び同時確率並びに最適合モデルの決定とに基づいて、染色体文節又は全長染色体の倍数性を検出するための、方法、システム、及びコンピュータ可読媒体を提供する。本発明は、妊娠中の胎児における癌又は染色体異常を検出するための、方法、システム、及びコンピュータ可読媒体を提供する。また、本発明は、倍数性決定により見いだされる多型座位アレル不均衡率に基づいて、循環腫瘍核酸を検出するための方法を提供する。また、本発明は、増幅効率及びエラー率推定値に基づいて一塩基多様体を検出するための方法と、複数の個体由来対照試料の多様性アレル頻度中央値に基づいて一塩基多様体を検出するための方法を提供する。A−20B

目的

本発明は循環腫瘍核酸が個体の試料中に存在するかを決定するための方法を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

個体の試料に含まれる染色体分節倍数性を決定する方法であって、該方法は、a.該試料中の該染色体分節にある多型座位集合のうちの各座位に存在する各アレルの量を含む、該試料から得られたアレル頻度データを受け、b.該アレル頻度データの相を推定することによって該多型座位の集合に関する相決定済み(phased)アレル情報を作成し、c.該アレル頻度データを用いて、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、ここで前記個別確率は、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて作成され、d.該個別確率と該相決定済みアレル情報を用いて該多型座位の集合に関する同時確率を作成し、ここで前記同時確率は、前記染色体分節にある多型座位間の連鎖を考慮することによって作成され、e.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、該染色体分節の倍数性を決定することとを含み、ここで該試料は、癌を有すると考えられる個体から得た血液試料血清試料、又は血漿試料であり、ここで該方法は、前記選択に基づき該個体の腫瘍細胞コピー数多様性が存在するかを決定することをさらに含む、方法。

請求項2

前記アレル頻度データが核酸配列データから作成される、請求項1に記載の方法。

請求項3

前記アレル頻度データの誤差修正することと、修正済みアレル頻度データを前記個別確率の作成工程に使用することとをさらに含み、修正される前記誤差がアレル増幅効率偏りである、請求項1に記載の方法。

請求項4

個体の試料の染色体倍数性を検出するための方法であって、該方法は、a.該個体の染色体分節にある多型座位の集合に存在するアレルに関する核酸配列データを受け、b.該核酸配列データを用いて該多型座位の集合におけるアレル頻度を検出し、c.検出された該アレル頻度のアレル増幅効率の偏りを修正することによって、該多型座位の集合に関する修正済みアレル頻度を作成し、d.該核酸配列データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、e.該修正済みアレル頻度を該多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、f.該個別確率を該染色体分節にある多型座位間の連鎖を考慮しながら組み合わせることにより、該多型座位の集合に関する同時確率を作成し、g.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択することとを含み、ここで該試料は、癌を有すると考えられる個体から得た血液試料、血清試料、又は血漿試料であり、ここで該方法は、前記選択に基づき該個体の腫瘍細胞にコピー数多様性が存在するかを決定することをさらに含む、方法。

請求項5

前記染色体分節の第一の相同体と該染色体分節の第二の相同体の倍数性状態をモデリングすることによって個別確率を作成する、請求項1〜4のいずれか一項に記載の方法であって、該倍数性状態が、(1)いずれの細胞も該染色体分節の該第一の相同体または該第二の相同体の欠失または増幅を有していない状態、(2)少なくとも一部の細胞が該染色体分節の該第一の相同体の欠失、または該第二の相同体の増幅を有する状態、および(3)少なくとも一部の細胞が該染色体分節の該第二の相同体の欠失、または該第一の相同体の増幅を有する状態である、方法。

請求項6

修正されるエラーが環境不純物および遺伝型解析による不純物を含み、前記試料中のホモ接合アレルに関して測定される、請求項5に記載の方法。

請求項7

前記選択が、前記モデルに関して作成された前記相決定済みアレル情報と推定アレル頻度との差異の大きさを分析することによって実行され、差異の大きさが最も小さいモデルが選択される、請求項5に記載の方法。

請求項8

アレル頻度の前記個別確率が、前記多型座位の集合におけるアレル頻度の期待値観測値ベータ二項モデルに基づいて作成される、請求項1〜7のいずれか一項に記載の方法。

請求項9

前記個別確率がベイズ分類器を用いて作成される、請求項1〜7のいずれか一項に記載の方法。

請求項10

前記核酸配列データが、多重増幅反応によって生成された一連増幅産物の複数のコピーの高処理DNA配列決定を実行することによって作成され、ここで、該一連の増幅産物のうちの各増幅産物は、前記多型座位の集合のうちの少なくとも1つの多型座位にわたり、該多型座位の集合のうちの各多型座位が増幅される、請求項2又は4に記載の方法。

請求項11

前記多重増幅反応が制限的なプライマー条件で実行される、請求項10に記載の方法。

請求項12

前記試料に含まれる染色体分節の集合について染色体倍数性が決定される、請求項10に記載の方法。

請求項13

前記多重増幅反応が1,000〜100,000プレクス多重反応を含む、請求項10に記載の方法。

請求項14

0.45%以上の平均アレル不均衡率が、該個体の腫瘍細胞にコピー数多様性が存在することを示す、請求項1〜7のいずれか一項に記載の方法。

請求項15

前記試料が、固形腫瘍を有していたことが知られている個体から得た血漿試料である、請求項1〜7のいずれか一項に記載の方法。

請求項16

標的となる複数の一塩基多様体のセットのうち何れかの一塩基多様体が前記試料に存在するか否かを決定することをさらに含み、ここで、該コピー数多様性および/または該一塩基多様体の検出は前記試料中に循環腫瘍核酸が存在することを示す、請求項1〜7のいずれか一項に記載の方法。

請求項17

前記個体の腫瘍に関する前記染色体分節のハプロタイプ情報を受けることと、該ハプロタイプ情報を用いて、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の前記モデルのセットを作成することをさらに含む、請求項15に記載の方法。

請求項18

前記方法が、既知の平均アレル不均衡比を有する対照試料に対して該方法を実行することをさらに含む、請求項1〜7のいずれか一項に記載の方法。

請求項19

前記修正済みアレル頻度を前記モデルのセットと比較する前に該修正済みアレル頻度のデータから異常値を除外することをさらに含む、請求項1〜7のいずれか一項に記載の方法。

請求項20

個体の試料の染色体倍数性を検出するためのシステムであって、該システムは、a.該試料中の該染色体分節にある多型座位の集合のうちの各座位に存在する各アレルの量を含む、該試料から得られたアレル頻度データを受けるよう構成された入力プロセッサと、b.モデラーであって、i.該アレル頻度データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、ii.該アレル頻度データを用いて、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、ここで前記個別確率は、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて作成され、iii.該個別確率と該相決定済みアレル情報を用いて該多型座位の集合に関する同時確率を作成し、ここで前記同時確率は、前記染色体分節にある多型座位間の連鎖を考慮することによって作成されるよう構成されたモデラーと、c.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、該染色体分節の倍数性を決定するよう構成された、仮説管理部(hypothesis manager)とを含み、ここで該試料は、癌を有すると考えられる個体から得た血液試料、血清試料、又は血漿試料であり、ここで該仮説管理部はさらに、前記選択に基づき該個体の腫瘍細胞にコピー数多様性が存在するかを決定するよう構成される、システム。

請求項21

前記アレル頻度データが核酸配列決定システムによって作成される、請求項20に記載のシステム。

請求項22

前記アレル頻度データの誤差を修正するよう構成された誤差修正部をさらに含み、ここで、修正済みアレル頻度データが前記個別確率の作成工程に用いられ、前記誤差修正部がアレル増幅効率の偏りを修正する、請求項21に記載のシステム。

請求項23

個体の試料の染色体倍数性を検出するためのシステムであって、該システムは、a.該個体の染色体分節にある多型座位の集合に存在するアレルに関する、該試料から得られた核酸配列データを受け、該核酸配列データを用いて該多型座位の集合におけるアレル頻度を検出するよう構成された入力プロセッサと、b.検出された該アレル頻度の誤差を修正し、該多型座位の集合に関する修正済みアレル頻度を作成するよう構成された誤差修正部と、c.モデラーであって、i.該核酸配列データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、ii.該相決定済みアレル情報を該多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、iii.該個別確率を該染色体分節にある多型座位間の相対的距離を考慮しながら組み合わせることにより、該多型座位の集合に関する同時確率を作成するよう構成されたモデラーと、d.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択するよう構成された仮説管理部とを含み、ここで該試料は、癌を有すると考えられる個体から得た血液試料、血清試料、又は血漿試料であり、ここで該仮説管理部はさらに、前記選択に基づき該個体の腫瘍細胞にコピー数多様性が存在するかを決定するよう構成される、システム。

請求項24

前記仮説管理部が、前記モデルに関して作成された前記相決定済みアレル情報と推定アレル頻度との差異の大きさを分析することによって選択を行い、差異の大きさが最も小さいモデルを選択する、請求項23に記載のシステム。

請求項25

前記モデラーが、前記多型座位の集合におけるアレル頻度の期待値と観測値のベータ二項モデルに基づいてアレル頻度の前記個別確率を作成する、請求項24に記載のシステム。

請求項26

個体の試料の染色体倍数性を検出するための非一過性コンピュータ可読媒体であって、該媒体はコンピュータ可読コードを含み、該コードを処理装置で実行することにより、該処理装置が、a.該試料中の該染色体分節にある多型座位の集合のうちの各座位に存在する各アレルの量を含む、該試料から得られたアレル頻度データを受け、b.該アレル頻度データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、c.該アレル頻度データを用いて、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、ここで前記個別確率は、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて作成され、d.該個別確率と該相決定済みアレル情報を用いて該多型座位の集合に関する同時確率を作成し、ここで前記同時確率は、前記染色体分節にある多型座位間の連鎖を考慮することによって作成され、e.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、該染色体分節の倍数性を決定する、ように構成され、ここで該試料は、癌を有すると考えられる個体から得た血液試料、血清試料、又は血漿試料であり、ここで該コードを該処理装置で実行することにより、該処理装置がさらに、前記選択に基づき該個体の腫瘍細胞にコピー数多様性が存在するかを決定するよう構成される、コンピュータ可読媒体。

請求項27

前記アレル頻度データが核酸配列データから作成される、請求項26に記載のコンピュータ可読媒体。

請求項28

前記アレル頻度データの誤差を修正することと、修正済みアレル頻度データを前記個別確率の作成工程に使用することをさらに含み、修正される前記誤差がアレル増幅効率の偏りである、請求項26に記載のコンピュータ可読媒体。

請求項29

個体の試料の染色体倍数性を検出するための非一過性のコンピュータ可読媒体であって、該媒体はコンピュータ可読コードを含み、該コードを処理装置で実行することにより、該処理装置が、a.該個体の染色体分節にある多型座位の集合に存在するアレルに関する、該試料から得られた核酸配列データを受け、b.該核酸配列データを用いて該多型座位の集合におけるアレル頻度を検出し、c.検出された該アレル頻度のアレル増幅効率の偏りを修正することによって、該多型座位の集合に関する修正済みアレル頻度を作成し、d.該核酸配列データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、e.該修正済みアレル頻度を該多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、f.該個別確率を該染色体分節にある多型座位間の連鎖を考慮しながら組み合わせることにより、該多型座位の集合に関する同時確率を作成し、g.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択する、ように構成され、ここで該試料は、癌を有すると考えられる個体から得た血液試料、血清試料、又は血漿試料であり、ここで該コードを該処理装置で実行することにより、該処理装置がさらに、前記選択に基づき該個体の腫瘍細胞にコピー数多様性が存在するかを決定するよう構成される、コンピュータ可読媒体。

請求項30

前記選択が、前記モデルに関して作成された前記相決定済みアレル情報と推定アレル頻度との差異の大きさを分析することによって実行され、差異の大きさが最も小さいモデルが選択される、請求項29に記載のコンピュータ可読媒体。

請求項31

アレル頻度の前記個別確率が、前記多型座位の集合におけるアレル頻度の期待値と観測値のベータ二項モデルに基づいて作成される、請求項26〜29のいずれか一項に記載のコンピュータ可読媒体。

請求項32

前記方法が、標的となる複数の一塩基多様体のセットのうち何れかの一塩基多様体が前記試料に存在するか否かを決定することをさらに含み、前記コピー数多様性および/または前記一塩基多様体の検出は、前記試料中に循環腫瘍核酸が存在することを示し、前記核酸配列データが、多重増幅反応によって生成された一連の増幅産物の複数のコピーの高処理DNA配列決定を実行することによって作成され、該一連の増幅産物のうちの各増幅産物は、前記多型座位の集合のうちの少なくとも1つの多型座位にわたり、該多型座位の集合のうちの各多型座位が増幅され、前記血液試料、血清試料、又は血漿試料と同一の試料を用いて、該個体の腫瘍の細胞にコピー数多様性または一塩基多様体又はその両方が存在するか否かが決定される、請求項2〜7の何れか一項に記載の方法。

技術分野

0001

関連する出願の参照
本願は、2014年4月21日に提出された米国仮特許出願第61/982,245号、2014年5月1日に提出された米国仮特許出願第61/987,407号、2014年10月21日に提出された米国仮特許出願第62/066,514号、2015年4月10日に提出された米国仮特許出願第62/146,188号、2015年4月14日に提出された米国仮特許出願第62/147,377号、および2015年4月15日に提出された米国仮特許出願第62/148,173号の優先権を主張するものであり、これら出願の教示についてその全内容を参照により本明細書に組み込む。

0002

本発明は、主に染色体分節倍数性を検出する方法およびシステム、および一塩基多様体を検出する方法およびシステムに関する。

背景技術

0003

コピー数多様性(CNV)は、典型的には1,000塩基対(1kb)から20メガ塩基対(mb)の長さの配列の重複および欠失を含むゲノムの構造多様性の主因として認識されている。染色体分節または染色体全体の欠失および重複は、病気に対する感受性または耐性等、様々な条件と関連づけられる。

0004

CNVは、影響を受ける配列の長さに基づいて主に2つの型の内の1つに分類されることが多い。1つ目の型はコピー数多型(CNP)を含む。CNPは、一般的な集団に共通して見られ、1%超の全頻度で発生する。CNPは、通常は小さく(ほとんどは10キロ塩基対未満の長さ)、薬物解毒および免疫に重要なタンパク質をコードする遺伝子に多い。これらCNPの下位集合ではコピー数が大きく異なる。その結果、遺伝子の特定の集合について染色体のコピー数が、個人間で大きく異なる(例えば、2、3、4、5等)可能性がある。免疫応答遺伝子に関連したCNPは、近年、遺伝性難病乾癬クローン病、および糸球体腎炎を含む)に対する感受性と関連づけられている。

0005

もう一方のCNVは、長さが約10万塩基対から100万超の塩基対まで、CNPよりもかなり長い比較的希な多様体を含む。いくつかの場合では、これらCNVは、特定の個体を発生させた精子または卵子ができる過程で生じた可能性、あるいはある家族の数世代間でのみ受け継がれた可能性がある。このような希な大型構造多様体は、精神遅滞発達遅滞統合失調症、および自閉症を有する対象者において偏って観察されている。このような対象者の様子から、神経認知疾患においては遺伝した変異の他の形態(一塩基置換を含む)に比べてこのような希な大型CNVがより重要であるかもしれないと推測されている。

0006

遺伝子のコピー数は癌細胞では変化している可能性がある。例えば、Chr1pの重複は乳癌で共通して見られる。また、EGFRのコピー数は、正常な細胞に比べて非小細胞肺癌では多くなり得る。癌は、主要死亡原因の1つであり、癌の早期診断および治療が重要である。というのは、早期診断および治療は(例えば、沈静の確率やその持続を向上させることによって)患者転帰を向上させることができるからである。早期診断はまた、患者が受ける治療法の量または数を低減させることができる。癌性細胞破壊する現在の治療法の多くは正常細胞にも影響を及ぼし、その結果、様々な副作用吐き気嘔吐血球数の低下、感染リスクの増加、抜け毛、および粘膜潰瘍等)を起こす可能性がある。よって、癌の早期検出は、治療法(化学療法薬または放射線等)の数および/または量を低減させることができるため望ましい。

0007

コピー数変異はまた、数種の精神障害身体障害、および特発性学習障害と関連づけられている。無細胞DNAを用いた非侵襲性出生前検査(NIPT)により異常(例えば、胎児の13番染色体、18番染色体、および21番染色体の三染色体性三倍体性、および性染色体異数性等)を検出することができる。亜染色体の微小欠失もまた、数種の精神障害および身体障害を引き起こし得るが、より小さいものであるためにその検出はより困難である。微小欠失症候群のうち、8つは凝集発生率が1000分の1を超えており、胎児の常染色体の三染色体性と同程度見られる。

0008

また、CCL3L1の高コピー数がHIV感染への低感受性と関連づけられている。FCGR3B(CD16細胞表面免疫グロブリン受容体)のコピー数が少ないと、全身性エリテマトーデスおよび類似の炎症性自己免疫疾患に対する感受性を増加させ得る。

0009

このように、染色体分節または染色体全体の欠失および重複を検出する改良された方法が求められている。これら方法を用いて、癌等の病気の診断や病気の発症リスクの増加、あるいは胎児のCNVを正確に診断することができるが好ましい。

0010

本明細書の例示的態様では、個体の試料に含まれる染色体分節の倍数性を決定するための方法が提供される。該方法は以下の工程を含む。
a.該試料中の該染色体分節にある多型座位の集合のうちの各座位に存在する各アレルの量を含むアレル頻度データを受け、
b.該アレル頻度データの相を推定することによって該多型座位の集合に関する相決定済み(phased)アレル情報を作成し、
c.該アレル頻度データを用いて、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、
d.該個別確率と該相決定済みアレル情報を用いて該多型座位の集合に関する同時確率を作成し、
e.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、該染色体分節の倍数性を決定すること。

0011

前記倍数性を決定するための方法の例示的な一態様では、前記データが核酸配列データ、特に高処理核酸配列データを用いて作成される。前記倍数性を決定するための方法のある例では、前記アレル頻度データが個別確率の作成に用いられる前に、エラー修正される。特定の例示的な態様では、修正されるエラーがアレル増幅効率偏りを含む。他の態様では、修正されるエラーが、環境不純物および遺伝型解析による不純物を含む。いくつかの態様では、修正されるエラーが、アレル増幅の偏り、環境不純物、および遺伝型解析による不純物を含む。

0012

前記倍数性を決定するための方法の特定の態様では、前記個別確率が、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて作成される。これらの態様および他の態様では、前記同時確率が、前記染色体分節にある多型座位間の連鎖を考慮することによって作成される。

0013

したがって、本明細書では、これら態様のいくつかを組み合わせた例示的一態様において、個体の試料の染色体倍数性を検出するための方法が提供される。該方法は以下の工程を含む。
a.該個体の染色体分節にある多型座位の集合に存在するアレルに関する核酸配列データを受け、
b.該核酸配列データを用いて該多型座位の集合におけるアレル頻度を検出し、
c.検出された該アレル頻度のアレル増幅効率の偏りを修正することによって、該多型座位の集合に関する修正済みアレル頻度を作成し、
d.該核酸配列データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、
e.該修正済みアレル頻度を該多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、
f.該個別確率を該染色体分節にある多型座位間の連鎖を考慮しながら組み合わせることにより、該多型座位の集合に関する同時確率を作成し、
g.該同時確率に基づき、染色体異数性を示す最適合モデルを選択すること。

0014

本明細書において他の側面では、個体の試料の染色体倍数性を検出するためのシステムであって、該システムは、
a.該試料中の該染色体分節にある多型座位の集合のうちの各座位に存在する各アレルの量を含むアレル頻度データを受けるよう構成された入力プロセッサと、
b.モデラーであって、
i.該アレル頻度データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、
ii.該アレル頻度データを用いて、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、
iii.該個別確率と該相決定済みアレル情報を用いて該多型座位の集合に関する同時確率を作成するよう構成されたモデラーと、
c.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、該染色体分節の倍数性を決定するよう構成された、仮説管理部(hypothesis manager)とを含む。

0015

このシステムの態様の特定の態様では、前記アレル頻度データが核酸配列決定システムによって作成されるデータである。特定の態様では、前記システムはさらに、前記アレル頻度データのエラーを修正するよう構成されたエラー修正部を含み、修正済みアレル頻度データが前記モデラーによって用いられて個別確率を作成する。特定の態様では、前記エラー修正部がアレル増幅効率の偏りを修正する。特定の態様では、前記モデラーが、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて前記個別確率を作成する。特定の例示的な態様では、前記モデラーが前記染色体分節にある多型座位間の連鎖を考慮することによって前記同時確率を作成する。

0016

本明細書において、例示的一態様では、個体の試料の染色体倍数性を検出するためのシステムが提供される。該システムは、
a.該個体の染色体分節にある多型座位の集合に存在するアレルに関する核酸配列データを受け、該核酸配列データを用いて該多型座位の集合におけるアレル頻度を検出するよう構成された入力プロセッサと、
b.検出された該アレル頻度のエラーを修正し、該多型座位の集合に関する修正済みアレル頻度を作成するよう構成されたエラー修正部と、
c.モデラーであって、
i.該核酸配列データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、
ii.該相決定済みアレル情報を該多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、
iii.該個別確率を該染色体分節にある多型座位間の相対的距離を考慮しながら組み合わせることにより、該多型座位の集合に関する同時確率を作成するよう構成されたモデラーと、
d.該同時確率に基づき、染色体異数性を示す最適合モデルを選択するよう構成された仮説管理部とを含む。

0017

ある側面では、本発明は循環腫瘍核酸が個体の試料中に存在するかを決定するための方法を提供する。該方法は、
a.該試料を分析して該個体の染色体分節にある多型座位の集合の倍数性を決定し、
b.該多型座位に存在するアレル不均衡のレベルを該倍数性決定に基づいて決定することを含み、ここで、0.4%、0.45%、または0.5%以上のアレル不均衡率は該試料に循環腫瘍核酸が存在することを示す。

0018

特定の態様では、前記循環腫瘍核酸が存在するかを決定するための方法が、一塩基多様性位置の集合に含まれる一塩基多様性位置の一塩基多様体を検出することをさらに含み、ここで、45%以上のアレル不均衡率の検出および/または一塩基多様体の検出は前記試料に循環腫瘍核酸が存在することを示す。

0019

特定の態様では、前記循環腫瘍核酸が存在するかを決定するための方法の分析工程は、癌で異数性を示すことが知られている染色体分節の集合を分析することを含む。特定の態様では、前記循環腫瘍核酸が存在するかを決定するための方法の分析工程は、倍数性について1,000個から50,000個、または100個から1000個の多型座位を分析することを含む。

0020

本明細書において、ある側面では、試料の一塩基多様体を検出する方法が提供される。したがって、本明細書において個体の試料に含まれるゲノム位置の集合に一塩基多様体が存在するかを決定するための方法が提供される。該方法は、
a.各ゲノム位置に関して、訓練データセットを用いてそのゲノム位置にわたる増幅産物に関する効率およびサイクル当たりエラー率推定値を作成し、
b.該試料に含まれる各ゲノム位置に関する観測ヌクレオチド同一性情報を受け、
c.各ゲノム位置に関する増幅効率およびサイクル当たりのエラー率の該推定値を個別に用いて、各ゲノム位置に関する該観測ヌクレオチド同一性情報を異なる多様体率のモデルと比較することにより、各ゲノム位置における1つ以上の実際の変異によって生じる一塩基多様体率の確率のセットを決定し、
d.各ゲノム位置に関する該確率のセットから、最も可能性の高い実多様体率と信頼度を決定することとを含む。

0021

前記一塩基多様体が存在するかを決定するための方法の例示的態様では、効率およびサイクル当たりのエラー率の前記推定値が、前記ゲノム位置にわたる一連の増幅産物に関して作成される。例えば、前記ゲノム位置にわたる2、3、4、5、10、15、20、25、50、100個以上の増幅産物が含まれる可能性がある。特定の態様では、前記1つ以上のSNVを検出する方法における検出限界は0.015%、0.017%、または0.02%である。

0022

前記一塩基多様体が存在するかを決定するための方法の例示的態様では、前記観測ヌクレオチド同一性情報が、各ゲノム位置に関する全リード数観測値と各ゲノム位置に関する多様性アレルのリード数の観測値を含む。

0023

前記一塩基多様体が存在するかを決定するための方法の例示的態様では、前記試料が血漿試料であり前記一塩基多様体が該試料の循環腫瘍DNAに存在する。

0024

本明細書において、他の態様では、個体の試験試料中に存在する1つ以上の一塩基多様体を検出するための方法が提供される。この態様による方法は、以下の工程を含む。
a.配列決定の実行時に作成された結果に基づき、複数の正常な個体の各々から得た複数の対照試料の多様性アレル頻度の中央値を、一塩基多様性位置の集合に含まれる各一塩基多様性位置について決定することにより、閾値未満である正常試料の多様性アレル頻度の中央値を有する、選定された一塩基多様性位置を確認し、該一塩基多様性位置の各々について異常値試料を除外した後、該一塩基多様性位置の各々に関する背景エラーを決定し、
b.該試験試料に関する配列決定の実行時に作成されたデータに基づき、該試験試料について、選定された該一塩基多様性位置に関して観測リード深度による加重平均と分散を決定し、
c.コンピュータを用いて、リード深度による加重平均が背景エラーに比べて統計的に有意である1つ以上の一塩基多様性位置を確認することによって、該1つ以上の一塩基多様体を検出すること。

0025

特定の態様では、前記1つ以上のSNVを検出する方法において、前記試料が血漿試料であり、前記対照試料が血漿試料であり、検出された前記1つ以上の一塩基多様体が該試料の循環腫瘍DNAに存在する。特定の態様では、前記1つ以上のSNVを検出する方法において、前記複数の対照試料が少なくとも25個の試料を含む。特定の態様では、前記1つ以上のSNVを検出する方法において、高処理配列決定の実行時に作成されたデータから異常値を除外することによって前記観測リード深度による加重平均と観測分散が算出される。特定の態様では、前記1つ以上のSNVを検出する方法において、前記試験試料の各一塩基多様性位置に関する前記リード深度が少なくとも100リードである。

0026

特定の態様では、前記1つ以上のSNVを検出する方法において、前記配列決定の実行が、制限的なプライマー反応条件で実行される多重増幅反応を含む。特定の態様では、前記1つ以上のSNVを検出する方法において、前記検出限界が0.015%、0.017%、または0.02%である。

0027

一側面において、本発明は、ある個体に由来する1個以上の細胞のゲノム中の第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定する方法を特徴とする。いくつかの態様では、前記方法は、前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第一の相同染色体分節にあるその座位に存在するアレルの同一性を含む第一の相同染色体分節の相決定済み遺伝子データを得ることと、前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にあるその座位に存在するアレルの同一性を含む第二の相同染色体分節の相決定済み遺伝子データを得ることと、前記多型座位の集合のうちの各座位に存在する各アレルについて、前記個体に由来する1個以上の細胞に由来するDNAまたはRNAの試料に存在する各アレルの量を含む、測定されたアレルの遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記個体に由来する1個以上の細胞のゲノムにおける前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙し、得られた前記試料の遺伝子データおよび相決定済み遺伝子データに基づいて前記1つ以上の仮説の尤度を(コンピュータ等で)算出し、最も可能性が高い仮説を選択して、前記個体に由来する1個以上の細胞のゲノムにおける第一の相同染色体分節のコピー数の過剰出現度を決定することを含む。いくつかの態様では、前記相決定済みデータは、集団に基づくハプロタイプ頻度および/または測定された相決定済みデータ(例えば、前記個体または前記個体の血縁者に由来するDNAまたはRNAを含む試料を測定することによって得られた相決定済みデータ)を用いて推論された相決定済みデータを含む。

0028

一側面において、本発明は、ある個体に由来する1個以上の細胞のゲノム中の第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定する方法を提供する。いくつかの態様では、前記方法は、前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに第一の相同染色体分節についてその座位に存在するアレルの同一性を含む第一の相同染色体分節の相決定済み遺伝子データを得ることと、前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にあるにその座位に存在するアレルの同一性を含む第二の相同染色体分節の相決定済み遺伝子データを得ることと、前記多型座位の集合のうちの各座位に存在する各アレルについて、前記個体に由来する1個以上の細胞に由来するDNAまたはRNAの試料に存在する各アレルの量を含む、測定されたアレルの遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙し、前記仮説のそれぞれについて得られた相決定済み遺伝子データから前記試料の複数の座位について期待遺伝子データを算出し、前記試料について得られた該試料の遺伝子データと期待遺伝子データとのデータ適合を(コンピュータ等で)算出し、前記データ適合に応じて前記仮説の1つ以上をランク付けし、最高ランクの仮説を選択して、前記個体に由来する1個以上の細胞のゲノム中の前記第一の相同染色体分節のコピー数の過剰出現度を決定することを含む。

0029

一側面において、本発明は、ある個体の1個以上の細胞のゲノム中の第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定する方法を特徴とする。いくつかの態様では、前記方法は、前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに第一の相同染色体分節についてその座位に存在するアレルの同一性を含む第一の相同染色体分節の相決定済み遺伝子データを得ることと、前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にあるその座位に存在するアレルの同一性を含む第二の相同染色体分節の相決定済み遺伝子データを得ることと、前記多型座位の集合のうちの各座位に存在する各アレルについて前記個体に由来する1個以上の目的細胞および1個以上の目的でない細胞に由来するDNAまたはRNAの試料に存在する各アレルの量を含む、測定されたアレルの遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙し、前記仮説のそれぞれについて、得られた相決定済み遺伝子データから、前記1個以上の目的細胞に由来するDNAまたはRNAの前記試料中の総DNAまたはRNAに対する1つ以上の可能な比率について前記試料中の前記複数の座位に関する期待遺伝子データを(コンピュータ等で)算出し、DNAまたはRNAの可能な比率および仮説ごとに、前記試料の得られた遺伝子データと前記試料の期待遺伝子データとのデータ適合を(コンピュータ等で)算出し、前記データ適合に応じて前記仮説の1つ以上をランク付けし、最高ランクの仮説を選択して、前記個体に由来する1個以上の細胞のゲノムの第一の相同染色体分節のコピー数の過剰出現度を決定することを含む。

0030

一側面において、本発明は、ある個体に由来する1個以上の細胞のゲノム中の第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定する方法を特徴とする。いくつかの態様では、前記方法は、前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに第一の相同染色体分節についてその座位に存在するアレルの同一性を含む第一の相同染色体分節の相決定済み遺伝子データを得ることと、前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にあるその座位に存在するアレルの同一性を含む第二の相同染色体分節の相決定済み遺伝子データを得ることと、前記多型座位の集合のうちの各座位に存在する各アレルについて、前記個体に由来する1個以上の目的細胞および1個以上の目的でない細胞に由来するDNAまたはRNAの試料に存在する各アレルの量を含む、測定されたアレルの遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙し、前記仮説のそれぞれについて、得られた相決定済み遺伝子データから、前記1個以上の目的細胞に由来するDNAまたはRNAの前記試料中の総DNAまたはRNAに対する1つ以上の可能な比率について前記試料中の前記複数の座位に関する期待遺伝子データを(コンピュータ等で)算出し、前記複数の座位の各座位、DNAまたはRNAの可能な比率および仮説ごとに、その仮説が正しい尤度を、その座位について得られた前記試料の遺伝子データと、そのDNAまたはRNAの可能な比率およびその仮説でのその座位の期待遺伝子データとの比較を(コンピュータ等で)算出し、各座位および可能な比率ごとに仮説の各座位の確率を組み合わせることによって各仮説の複合確率を決定し、最も高い複合確率を有する仮説を選択して、前記第一の相同染色体分節のコピー数の過剰出現度を決定することを含む。いくつかの態様では、すべての多型座位が同時に考慮されて特定の仮説の確率が算出され、最も高い確率を有する仮説が選択される。

0031

一側面において、本発明は、胎児のゲノム中の目的の染色体分節のコピー数を決定するための方法を特徴とする。いくつかの態様では、前記方法は、前記胎児の少なくとも一方の生物学上の親の相決定済み遺伝子データを得ることを含み、ここで、前記相決定済み遺伝子データは、前記目的の染色体分節を含む相同染色体分節対中に、第一の相同染色体分節および第二の相同染色体分節にある多型座位の集合のうちの各座位に存在するアレルの同一性を含む。いくつかの態様では、前記方法は、胎児のDNAまたはRNAおよびその胎児の母親に由来する母親のDNAまたはRNAを含むDNAまたはRNA混合試料中の、各座位に存在する各アレルの量を測定することにより目的の染色体分節にある多型座位の集合の遺伝子データを得ることを含む。いくつかの態様では、前記方法は、胎児のゲノムに存在する目的の染色体分節のコピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、一方または両方の親について、胎児のゲノム中のその親に由来する第一の相同染色体分節またはその部分のコピー数と、胎児のゲノム中のその親に由来する第二の相同染色体分節またはその部分のコピー数と、その胎児のゲノムに存在する目的の染色体分節の総コピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、前記仮説のそれぞれについて、得られた前記(両)親由来の相決定済み遺伝子データから前記混合試料中の複数の座位の期待遺伝子データを(コンピュータ等で)算出し、得られた混合試料の遺伝子データとその混合試料の期待遺伝子データとのデータ適合を(コンピュータで等で)算出し、前記データ適合により前記仮説の1つ以上をランク付けし、最高ランクの仮説を選択して、胎児のゲノムにおける目的の染色体分節のコピー数を決定することとを含む。

0032

一側面において、本発明は、胎児のゲノム中の目的の染色体または染色体分節のコピー数を決定するための方法を特徴とする。いくつかの態様では、前記方法は、前記胎児の生物学上の少なくとも一方の親について相決定済み遺伝子データを得ることを含み、ここで前記相決定済み遺伝子データは、前記親の第一の相同染色体分節および第二の相同染色体分節にある多型座位の集合のうちの各座位に存在するアレルの同一性を含む。いくつかの態様では、前記方法は、胎児のDNAまたはRNAおよび前記胎児の母親由来の母親DNAまたはRNAを含むDNAまたはRNA混合試料において、各座位に存在する各アレルの量を測定することにより染色体または染色体分節にある多型座位の集合の遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記胎児のゲノムに存在する目的の染色体または染色体分節のコピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、前記仮説のそれぞれについて、(i)得られた前記(両)親由来の相決定済み遺伝子データと任意で(ii)前記胎児に目的の染色体または染色体分節のコピーをもたらした配偶子形成時に発生した可能性がある1つ以上の交差の確率から混合試料中の前記複数の座位の各座位に存在する各アレルの期待量の確率分布を(例えば、コンピュータ上で作成する等)作成し、前記仮説のそれぞれについて、(1)前記得られた混合試料の遺伝子データと(2)その仮説に対する混合試料中の複数の座位の各座位における各アレルの期待量の確率分布との適合を(コンピュータ等で)算出し、前記データ適合によって前記仮説の1つ以上をランク付けし、最高ランクの仮説を選択して、前記胎児のゲノムにおける目的の染色体分節のコピー数を決定することとを含む。

0033

いくつかの態様では、前記方法は、前記胎児の母親の相決定済み遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記胎児のゲノム中の母親由来の第一の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中の母親由来の第二の相同染色体分節またはその部分のコピー数と、前記胎児のゲノムに存在する目的の染色体分節の総コピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、前記仮説のそれぞれについて、得られた母親由来の相決定済み遺伝子データから前記混合試料中の複数の座位について期待遺伝子データを算出することを含む。

0034

いくつかの態様では、前記仮説のそれぞれについての期待遺伝子データは、前記混合試料中の母親のDNAまたはRNAおよび胎児のDNAまたはRNAの複数の座位の各座位に存在する1つ以上のアレルの同一性および量を含む。いくつかの態様では、前記方法は、前記混合試料中の胎児のDNAまたはRNA分画および母親のDNAまたはRNA分画を決定することによって期待遺伝子データを(コンピュータ等で)算出することを含む。いくつかの態様では、前記方法は、複数の座位の各座位について、得られた母親の相決定済み遺伝子データ中のその座位に存在するアレルの同一性および前記混合試料中の母親のDNAまたはRNA分画を用いて、前記混合試料中の母親のDNAまたはRNAのその座位に対する1つ以上のアレルの期待量を算出することを含む。いくつかの態様では、前記方法は、仮説ごとに前記複数の座位の各座位について、前記胎児によって受け継がれたと前記仮説によって規定された母親由来の第一または第二の相同染色体分節のその座位に存在するアレルの同一性と、前記胎児によって受け継がれたと前記仮説により規定された母親由来の第一または第二の相同染色体分節のコピー数と、前記混合試料中の胎児のDNAまたはRNAの分画を用いて、前記混合試料中の母親から譲り受けた胎児のDNAまたはRNAにおけるその座位に対する1つ以上のアレルの期待量を(コンピュータ等で)算出することを含む。

0035

いくつかの態様では、前記仮説のそれぞれについての期待遺伝子データは、前記混合試料中の母親のDNAまたはRNAおよび胎児のDNAまたはRNAの複数の座位の各座位に存在する1つ以上のアレルの同一性および量を含む。いくつかの態様では、前記方法は、前記混合試料の胎児のDNAまたはRNAの分画および母親のDNAまたはRNAの分画を決定することによって期待遺伝子データを算出することを含む。いくつかの態様では、前記方法は、前記複数の座位の各座位について、得られた母親の相決定済み遺伝子データ中のその座位に存在するアレルの同一性および前記混合試料中の母親のDNAまたはRNA分画を用いて、前記混合試料中の母親のDNAまたはRNAのその座位に対する1つ以上のアレルの期待量を(コンピュータ等で)算出することを含む。いくつかの態様では、前記方法は、仮説ごとに前記複数の座位のうちの各座位について、前記胎児によって受け継がれたと仮説によって規定された母親由来の第一または第二の相同染色体分節に存在するアレルの同一性と、前記胎児によって受け継がれたと仮説によって規定された母親由来の第一または第二の相同染色体分節のコピー数と、前記胎児によって受け継がれたと仮説によって規定された親由来の第一または第二の相同染色体分節におけるその座位に存在し得る1つ以上のアレルの同一性と、前記胎児によって受け継がれたと仮説によって規定された父親由来の第一または第二の相同染色体分節のコピー数と、前記混合試料中の胎児のDNAまたはRNAの分画を用いて、前記混合試料中の母親から譲り受けた胎児のDNAまたはRNAにおけるその座位に対する1つ以上のアレルの期待量(コンピュータ等で)算出することを含む。いくつかの態様では、集団頻度を用いて父親由来の第一または第二の相同染色体分節のアレルの同一性を予測する。いくつかの態様では、前記父親由来の第一または第二の相同染色体分節の各座位に存在し得るアレルのそれぞれについてその確率が同じであると見なす。

0036

いくつかの態様では、前記方法は、前記胎児の母親および父親の両方の相決定済み遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記胎児のゲノム中の母親由来の第一の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中の母親由来の第二の相同染色体分節のコピー数と、前記胎児のゲノム中の父親由来の第一の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中の父親由来の第二の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中に存在する目的の染色体分節の総コピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、前記仮説のそれぞれについて、得られた母親由来の相決定済み遺伝子データおよび父親由来の相決定済み遺伝子データから前記混合試料中の複数の座位の期待遺伝子データを(コンピュータ等で)算出することを含む。

0037

いくつかの態様では、前記仮説のそれぞれについて、前記期待遺伝子データは、前記混合試料中の前記母親のDNAまたはRNAおよび胎児のDNAまたはRNAの複数の座位において各座位に存在する1つ以上のアレルの同一性と量を含む。いくつかの態様では、前記方法は、前記混合試料のDNAまたはRNAの分画と胎児の母親のDNAまたはRNAの分画を決定することによって期待遺伝子データを算出することを含む。いくつかの態様では、前記方法は、前記複数の座位の各座位について、得られた母親の相決定済み遺伝子データ中のその座位に存在するアレルの同一性および前記混合試料中の母親のDNAまたはRNA分画を用いて、前記混合試料中の母親のDNAまたはRNAのその座位に対する1つ以上のアレルの期待量を(コンピュータ等で)算出することを含む。いくつかの態様では、前記方法は、仮説ごとに前記複数の座位の各座位について、前記胎児によって受け継がれたと仮説によって規定された母親由来の第一または第二の相同染色体分節のアレルの同一性と、前記胎児によって受け継がれたと仮説によって規定された母親由来の第一または第二の相同染色体分節のコピー数と、前記胎児によって受け継がれたと仮説によって規定された父親由来の第一または第二の相同染色体分節のその座位に存在するアレルの同一性と、前記胎児によって受け継がれたと仮説によって規定された父親由来の第一または第二の相同染色体分節のコピー数と、前記混合試料中の胎児のDNAまたはRNAの分画を用いて前記混合試料中の胎児のDNAまたはRNAの座位について1つ以上のアレルの期待量を(コンピュータ等で)算出することを含む。

0038

いくつかの態様では、前記方法は、前記仮説のそれぞれについて、得られた前記(両)親由来の相決定済み遺伝子データから前記混合試料中の前記複数の座位の期待遺伝子データの確率分布を(コンピュータ等で)算出することを含む。いくつかの態様では、前記方法は、前記混合試料の第一の座位に存在する特定のアレルが前記親の第一の相同分節に存在し、かつ前記親の第一の相同分節の近隣した座位に存在するアレルが前記混合試料の得られた遺伝子データに観察される場合にその特定のアレルの確率分布における確率を増加させること、あるいは前記混合試料の第一の座位に存在する特定のアレルが前記親の第一の相同分節に存在し、かつ前記親の第一の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データにおいて観察されない場合にその特定のアレルの確率分布の確率を低減させることを含む。いくつかの態様では、前記方法は、前記混合試料の第二の座位に存在する特定のアレルが前記親の第二の相同分節に存在し、かつ前記親の第二の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データに観察される場合にその特定のアレルの確率分布の確率を増加させること、あるいは前記混合試料の第二の座位に存在する特定のアレルが前記親の第二の相同分節に存在し、かつ前記親の第二の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データに観察されない場合にその特定のアレルの確率分布の確率を低減させることを含む。

0039

いくつかの態様では、前記方法は、前記胎児の母親および父親両方の相決定済み遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記胎児のゲノム中の前記母親由来の第一の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中の前記母親由来の第二の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中の前記父親由来の第一の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中の前記父親由来の第二の相同染色体分節またはその部分のコピー数と、前記胎児のゲノムに存在する目的の染色体分節の総コピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、前記仮説のそれぞれについて、前記母親および父親から得られた相決定済み遺伝子データから前記混合試料の複数の座位の期待遺伝子データの確率分布を(コンピュータ等で)算出することを含む。いくつかの態様では、前記方法は、前記混合試料の第一の座位に存在する特定のアレルが前記母親または父親の第一の相同分節に存在し、かつその親の第一の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データに観察される場合にその特定のアレルの確率分布の確率を増加させること、あるいは前記混合試料の第一の座位に存在する特定のアレルが前記母親または父親の第一の相同分節に存在し、かつその親の第一の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データに観察されない場合にはその特定のアレルの確率分布の確率を低減させることを含む。いくつかの態様では、前記方法は、前記混合試料の第二の座位に存在する特定のアレルが前記母親または父親の第二の相同分節に存在し、かつその親の第二の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データに観察される場合にその特定のアレルの確率分布の確率を増加させること、あるいは前記混合試料の第二の座位に存在する特定のアレルが前記母親または父親の第二の相同分節に存在し、かつその親の第二の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データに観察されない場合にその特定のアレルの確率分布の確率を低減させることを含む。

0040

いくつかの態様では、前記第一の座位と第一の座位に近接した座位が共分離している。いくつかの態様では、前記第二の座位と第二の座位に近接した座位が共分離している。いくつかの態様では、前記第一の座位と第一の座位に近接した座位との間では、交差は起こらないと予測される。いくつかの態様では、前記第二の座位と第二の座位に近接した座位との間では、交差は起こらないと予測される。いくつかの態様では、前記第一の座位と第一の座位に近接した座位との距離は、5mb未満、1mb未満、100kb未満、10kb未満、1kb未満、0.1kb未満、または0.01kb未満である。いくつかの態様では、前記第二の座位と第二の座位に近接した座位との距離は、5mb未満、1mb未満、100kb未満、10kb未満、1kb未満、0.1kb未満、または0.01kb未満である。

0041

いくつかの態様では、目的の染色体分節のコピーを前記胎児にもたらす配偶子の形成時に1つ以上の交差が起こり、その交差によって前記親由来の第一の相同分節の部分および第二の相同分節の部分を含む前記胎児のゲノム中の目的の染色体分節が生じる。いくつかの態様では、前記仮説の集合は、前記親に由来する第一の相同分節の部分および第二の相同分節の部分を含む前記胎児のゲノム中の目的の染色体分節のコピー数を規定する1つ以上の仮説を含む。

0042

いくつかの態様では、前記混合試料の期待遺伝子データは、前記仮説のそれぞれについて、前記混合試料の複数の座位の各座位に存在する1つ以上のアレルの期待量を含む。

0043

一側面において、本発明は、ある個体のゲノム(例えば、1個以上の細胞、無細胞DNA、無細胞RNA、癌が疑われる個体、胎児、またはのゲノム)において第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを、相決定済み遺伝子データを用いて決定する方法を特徴とする。いくつかの態様では、前記方法は、同時にまたは任意の順序で順に(i)前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに第一の相同染色体分節についてその座位に存在するアレルの同一性を含む第一の相同染色体分節の相決定済み遺伝子データを得ることと、(ii)前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にあるその座位に存在するアレルの同一性を含む第二の相同染色体分節の相決定済み遺伝子データを得ることと、(iii)前記個体に由来する1個以上の細胞に由来するDNAまたはRNAの試料または前記個体の遺伝的に異なる2個以上の細胞に由来する無細胞DNAまたはRNAの混合試料中の、前記多型座位の集合のうちの各座位に存在する各アレルの量を含む測定されたアレルの遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記試料が由来する少なくとも1個の細胞においてヘテロ接合である前記多型座位の集合の1箇所以上の座位についてアレル比率を算出することを含む。いくつかの態様では、特定の座位の算出済みアレル比率は、前記アレルの1つの測定量をその座位のすべてのアレルの総測定量で除したものである。いくつかの態様では、前記方法は、ある座位の1つ以上の算出済みアレル比率を期待アレル比率(例えば、第一および第二の相同染色体分節が等しい割合で存在する場合にその座位に期待される比率)と比較することで第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定することを含む。いくつかの態様では、期待比率は2アレル座位について0.5である。

0044

出生前検査に関するいくつかの態様では、前記方法は、同時にまたは任意の順序で順に(i)胎児(例えば、妊娠している母親の胎内の胎児)のゲノムの第一の相同染色体分節について、前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第一の相同染色体分節にある各座位に存在するアレルの同一性を含む相決定済み遺伝子データを得ることと、(ii)前記胎児のゲノムの第二の相同染色体分節について、前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にある各座位に存在するアレルの同一性を含む相決定済み遺伝子データを得ることと、(iii)胎児のDNAまたはRNAおよび母親のDNAまたはRNAを含む前記胎児の母親由来のDNAまたはRNAの混合試料(例えば、母親由来の血液試料に由来する、胎児の無細胞DNAまたはRNAと母親の無細胞DNAまたはRNAを含む無細胞DNAまたはRNAの混合試料)において、前記多型座位の集合の各座位に存在する各アレルの量を含む測定されたアレルの遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記胎児においてヘテロ接合であり、かつ/または前記母親においてヘテロ接合である多型座位の集合の1箇所以上の座位についてアレル比率を算出することを含む。いくつかの態様では、特定の座位の算出済みアレル比率は、前記アレルの1つの測定量を前記座位のすべてのアレルの総測定量で除したものである。いくつかの態様では、前記方法は、ある座位の1つ以上の算出済みアレル比率を期待アレル比率(例えば、第一および第二の相同染色体分節が等しい割合で存在する場合にその座位に期待される比率)と比較することで前記第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定することを含む。

0045

いくつかの態様では、(i)ある座位のすべてのアレルの総測定量で除した、前記第一の相同染色体にあるその座位に存在するアレルの測定量のアレル比率が、その座位の期待アレル比率より大きい場合、または(ii)ある座位のすべてのアレルの総測定量で除した、前記第二の相同染色体にあるその座位に存在するアレルの測定量のアレル比率がその座位の期待アレル比率より小さい場合のいずれかであれば、算出済みアレル比率は前記第一の相同染色体分節のコピー数過剰出現を示す。いくつかの態様では、(i)ある座位のすべてのアレルの総測定量で除した、前記第一の相同染色体にあるその座位に存在するアレルの測定量のアレル比率がその座位の期待アレル比率以下である場合、または(ii)ある座位のすべてのアレルの総測定量で除した、前記第二の相同染色体にあるその座位に存在するアレルの測定量のアレル比率がその座位の期待アレル比率以上である場合のいずれかであれば、算出済みアレル比率は前記第一の相同染色体分節のコピー数過剰出現でないことを示す。

0046

いくつかの態様では、前記第一の相同染色体分節のコピー数の過剰出現があるかどうかの決定が、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)の予測アレル比率は、仮説ごとにその仮説によって過剰出現度が規定されたと仮定して推定される。いくつかの態様では、前記算出済みアレル比率と予測アレル比率を比較することで、仮説が正しい尤度が算出され、最も可能性が高い仮説が選択される。いくつかの態様では、仮説ごとに予測アレル比率を用いて検定統計量期待分布が算出される。いくつかの態様では、前記算出済みアレル比率を用いて算出された検定統計量を、前記予測アレル比率を用いて算出された検定統計量の期待分布と比較することで、仮説が正しい尤度が算出され、最も可能性が高い仮説が選択される。いくつかの態様では、少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)の予測アレル比率に、前記第一の相同染色体分節の相決定済み遺伝子データ、前記第二の相同染色体分節の相決定済み遺伝子データ、および過剰出現度がその仮説によって規定されたと仮定して推定される。いくつかの態様では、前記算出済みアレル比率を前記予測アレル比率と比較することで、仮説が正しい尤度が算出され、最も可能性が高い仮説が選択される。

0047

いくつかの態様では、1個以上の目的細胞に由来するDNA(またはRNA)の前記試料中の総DNA(またはRNA)に対する比率が算出される。典型的な比率は、胎児のDNA(またはRNA)の前記試料中の総DNA(またはRNA)に対する比率である。いくつかの態様では、胎児のDNAの前記試料中の総DNAに対する比率は、前記胎児がアレルを有するがその母親はアレルを有していない1箇所以上の座位でアレルの量を測定することにより求められる。いくつかの態様では、胎児のDNAの前記試料中の総DNAに対する比率は、1つ以上の母親のアレルと胎児のアレルのメチル化の違いを測定することで求められる。いくつかの態様では、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合が列挙される。いくつかの態様では、少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)の予測アレル比率は、DNAまたはRNAの算出済み比率を仮定して推定され、その仮説によって規定された過剰出現度が仮説ごとに推定される。いくつかの態様では、前記算出済みアレル比率を前記予測アレル比率と比較することで、仮説が正しい尤度が算出され、最も可能性が高い仮説が選択される。いくつかの態様では、前記予測アレル比率およびDNAまたはRNAの算出済み比率を用いて算出された検定統計量の期待分布は、仮説ごとに推定される。いくつかの態様では、前記算出済みアレル比率とDNAまたはRNAの算出済み比率を用いて算出された検定統計量を、前記予測アレル比率とDNAまたはRNAの算出済み比率を用いて算出された検定統計量の期待分布と比較することで、仮説が正しい尤度が求められ、最も可能性が高い仮説が選択される。

0048

いくつかの態様では、前記方法は、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、仮説ごとに、(i)過剰出現度がその仮説によって規定されたと仮定して少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)の予測アレル比率、または(ii)DNAまたはRNAの1つ以上の起こりうる比率(例えば、胎児のDNAまたはRNAの前記試料中の総DNAまたはRNAに対する比率)について、前記予測アレル比率および前記試料中の総DNAまたはRNAに対する1個以上の目的細胞(例えば、胎児の細胞)に由来するDNAまたはRNAの起こりうる比率を用いて算出された検定統計量の期待分布のいずれかを推定することを含む。いくつかの態様では、(i)前記予測アレル比率に対する算出済みアレル比率または(ii)前記算出済みアレル比率および前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量のいずれかと、前記予測アレル比率および前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量の期待分布とを比較することでデータ適合が算出される。いくつかの態様では、前記データ適合によって1つ以上の仮説がランク付けされ、最高ランクの仮説が選択される。いくつかの態様では、前記データ適合を算出する工程、前記仮説をランク付けする工程、最高ランクの仮説を選択する工程の1つ以上において技術またはアルゴリズム(例えば、検索アルゴリズム等)が用いられる。いくつかの態様では、前記データ適合は、ベータ二項分布に対する適合または二項分布への適合である。いくつかの態様では、前記技術またはアルゴリズムは、最尤推定最大事後確率推定ベイズ推定、動的推定(例えば、動的ベイズ推定等)、および期待値最大化推定からなる群から選択される。いくつかの態様では、前記方法は、前記技術またはアルゴリズムを前記得られた遺伝子データおよび前記期待遺伝子データに適用することを含む。

0049

いくつかの態様では、前記方法は、1個以上の目的細胞に由来するDNAまたはRNAの前記試料中の総DNAまたはRNAに対する比率について下限から上限までの範囲の起こりうる比率(例えば、胎児のDNAまたはRNAの前記試料中の総DNAまたはRNAに対する比率)の区分を作成することを含む。いくつかの態様では、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合が列挙される。いくつかの態様では、前記方法は、前記区分におけるDNAまたはRNAの起こりうる比率の各比率と各仮説について、(i)前記DNAまたはRNAの起こりうる比率およびその仮説によって規定された過剰出現度が与えられた場合は少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)の予測アレル比率、または(ii)前記予測アレル比率と前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量の期待分布のいずれかを推定することを含む。いくつかの態様では、前記方法は、(i)前記予測アレル比率に対する算出済みアレル比率または(ii)前記算出済みアレル比率および前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量のいずれかと、前記予測アレル比率および前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量の期待分布とを比較することで前記区分における前記DNAまたはRNAの起こりうる比率の各比率と各仮説について、前記仮説が正しい尤度を算出することを含む。いくつかの態様では、前記区分において前記起こりうる比率の比率ごとにその仮説の確率を組み合わせることによって各仮説の複合確率が決定され、最も高い複合確率を有する仮説が選択される。いくつかの態様では、各仮説の複合確率は、前記起こりうる比率が正しい比率であるという尤度に基づいて特定の起こりうる比率について仮説の確率を加重平均することで各仮説が決定される。

0050

一側面において、本発明は、相決定済み遺伝子データまたは相未決定(unphased)遺伝子データを用いてある個体由来の1個以上の細胞のゲノムの染色体または染色体分節のコピー数を決定するための方法を特徴とする。いくつかの態様では、前記方法は、各座位に存在する各アレルの量を測定することで試料中の前記染色体または染色体分節にある多型座位の集合の遺伝子データを得ることを含む。いくつかの態様では、前記試料は、前記個体に由来する1個以上の細胞に由来するDNAまたはRNAの試料、または2個以上の遺伝的に異なる細胞に由来する無細胞DNAを含む、前記個体由来の無細胞DNAの混合試料である。いくつかの態様では、前記試料が由来している少なくとも1個の細胞中のヘテロ接合である座位についてアレル比率が算出される。いくつかの態様では、特定の座位の算出済みアレル比率は、そのアレルの1つの測定量を、前記座位のすべてのアレルの総測定量で除したものである。いくつかの態様では、特定の座位の算出済みアレル比率は、アレル(例えば、第一の相同染色体分節のアレル)の1つの測定量を、その座位の1つ以上の他のアレル(例えば、第二の相同染色体分節のアレル)の測定量で除したものである。いくつかの態様では、前記細胞の1つ以上のゲノムの染色体または染色体分節のコピー数を規定する1つ以上の仮説の集合が列挙される。いくつかの態様では、前記検定統計量に基づいて最も可能性が高い仮説が選択され、これにより前記細胞の1つ以上のゲノムの染色体または染色体分節のコピー数が決定される。

0051

一側面において、本発明は、相決定済みまたは相未決定遺伝子データを用いて胎児(例えば、妊娠している母親の胎内の胎児)のゲノムの染色体または染色体分節のコピー数を決定する方法を特徴とする。いくつかの態様では、前記方法は、各座位に存在する各アレルの量を測定することで試料中の前記染色体または染色体分節にある多型座位の集合の遺伝子データを得ることに関する。いくつかの態様では、前記試料は、胎児のDNAまたはRNAおよびその胎児の母親に由来する母親のDNAまたはRNA(例えば、母親由来の血液試料に由来する、胎児の無細胞DNAまたはRNAおよび母親の無細胞DNAまたはRNAを含む無細胞DNAまたはRNAの混合試料)を含むDNAの混合試料である。いくつかの態様では、前記胎児のヘテロ接合である座位および/または前記母親のヘテロ接合である座位についてアレル比率が算出される。いくつかの態様では、特定の座位の算出済みアレル比率は、前記アレルの1つの測定量を、その座位のすべてのアレルの総測定量で除したものである。いくつかの態様では、特定の座位の算出済みアレル比率が前記アレル(例えば、前記第一の相同染色体分節にあるアレル等)の1つの測定量を、その座位の1つ以上の他のアレル(例えば、第二の相同染色体分節にあるアレル等)の測定量で除したものである。いくつかの態様では、胎児のゲノムの染色体または染色体分節のコピー数を規定する1つ以上の仮説の集合が列挙される。いくつかの態様では、前記検定統計量に基づいて最も可能性が高い仮説が選択され、これによって前記胎児のゲノムの染色体または染色体分節のコピー数が決定される。

0052

いくつかの態様では、前記検定統計量がある仮説の検定統計量分布に属する確率が上限閾値を超える場合にその仮説が選択され、前記検定統計量が1つ以上の仮説の検定統計量分布に属する確率が下限閾値未満である場合にそれら1つ以上の仮説が棄却される。あるいは、前記検定統計量ある仮説の検定統計量分布に属する確率が下限閾値と上限閾値の間である場合、またはその確率が十分に高い信頼度を持って決定されない場合には、その仮説は選択も棄却もされない。いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現は、前記第一の相同染色体分節の重複または前記第二の相同染色体分節の欠失によるものである。いくつかの態様では、1箇所以上の座位についてすべてのアレルの総測定量が、基準量と比較されて、前記第一の相同染色体分節のコピー数過剰出現が前記第一の相同染色体分節の重複または前記第二の相同染色体分節の欠失によるものであるかどうかが決定される。いくつかの態様では、1箇所以上の座位について前記算出済みアレル比率と前記期待アレル比率との差異の大きさを用いて前記第一の相同染色体分節のコピー数過剰出現が前記第一の相同染色体分節の重複または前記第二の相同染色体分節の欠失によるものかどうかが決定される。いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現がなく、かつ(例えば、細胞、無細胞DNA、無細胞RNA、個体、胎児、または胚のゲノム中の)第二の相同染色体分節の過剰出現がない場合に前記第一および第二の相同染色体分節が等しい割合で存在すると決定される。

0053

いくつかの態様では、対象細胞の遺伝型が非対象細胞の遺伝型と異なっており、かつ対象細胞および非対象細胞が二染色体であると予測される1箇所以上の座位に存在する1つ以上のアレルの総量または相対量に基づき、1個以上の目的細胞に由来するDNAの前記試料中の総DNAに対する比率が決定される。いくつかの態様では、この比率を用いて、前記第一の相同染色体分節のコピー数過剰出現が前記第一の相同染色体分節の重複または前記第二の相同染色体分節の欠失によるものかどうかが決定される。いくつかの態様では、この比率を用いて、重複している染色体分節または染色体の余剰コピー数が決定される。いくつかの態様では、前記相決定済み遺伝子データは確率データを含む。いくつかの態様では、前記胎児のゲノム中の第一の相同染色体分節および/または第二の相同染色体分節の相決定済み遺伝子データを得ることは、前記胎児の生物学上の親の一方または両方のゲノム中の第一の相同染色体分節および/または第二の相同染色体分節の相決定済み遺伝子データを得ることと、前記胎児がどの相同染色体分節をその生物学上の親のどちらから受け継いでいるかを推論することを含む。いくつかの態様では、胎児個体に前記第一の相同染色体分節または第二の相同染色体分節のコピーをもたらした配偶子の形成時に発生した可能性がある1つ以上の交差(例えば1つ、2つ、3つ、または4つの交差)の確率を用いて、前記胎児がどの相同染色体分節を生物学上の親のどちらから受け継いでいるかが推論される。いくつかの態様では、デジタルPCR、集団に基づくハプロタイプ頻度を用いたハプロタイプの推論、半数体細胞(例えば、精子または卵子)を用いたハプロタイプ決定、1つ以上の第一度親近に由来する遺伝子データを用いたハプロタイプ決定、およびこれらの組み合わせからなる群から選択される技術を用いて胎児の母親および/または父親の相決定済み遺伝子データが得られる。いくつかの態様では、前記個体に由来する試料中の欠失または重複に対応する領域の一部またはすべてについて相決定することで前記個体の相決定済み遺伝子データが得られる。いくつかの態様では、胎児または胎児の母親に由来する試料中の欠失または重複に対応する領域の一部またはすべてについて相決定することで胎児の相決定済み遺伝子データが得られる。いくつかの態様では、前記第一および第二の相同染色体分節の相決定済み遺伝子データを得ることは、これら染色体分節の一方に存在するアレルの同一性と、他方の染色体分節に存在するアレルの同一性を推論によって求めることを含む。いくつかの態様では、相未決定遺伝子データに由来する、第一の相同染色体分節に存在しないアレルは、第二の相同染色体分節に割り当てられる。例えば、ある個体の遺伝型が(AB,AB)であり、その個体の相決定済みデータが第一のハプロタイプが(A,A)であることを示している場合、もう一方のハプロタイプは(B,B)であると推論することができる。いくつかの態様では、ある座位でアレルが1つのみ測定されると、そのアレルは第一および第二の相同染色体分節の両方の一部であると決定される(例えば、ある座位で遺伝型がAAである場合、両方のハプロタイプはアレルAを有する)。いくつかの態様では、前記個体の相決定済み遺伝子データは、例えば、組換えの起こりやすい箇所の配列と、任意で組換えの起こりやすい箇所に隣接する領域の配列を決定することで1つ以上の起こり得る染色体交差が起こったどうかの決定を含む。いくつかの態様では、本発明のプライマーライブラリーのいずれかを用いて組換え事象を検出して、ある個体のゲノムにどのハプロタイプブロックが存在するかが決定される。

0054

いくつかの態様では、前記方法は、同時分布モデル(例えば、座位間の連鎖を考慮した同時分布モデル等)を用いること、連鎖分析を行うこと、二項分布モデルを用いること、ベータ二項分布モデルを用いること、および/または胎児になった胚を形成した配偶子を発生させた減数分裂時に起こった交差の尤度を用いること(例えば、染色体の異なる位置で染色体が交差する確率を用いて目的の染色体または染色体分節にある多型アレル間の依存度モデル化すること等)を含む。

0055

いくつかの態様では、無細胞DNAまたは無細胞RNAに関する1つ以上の算出済みアレル比率は、その無細胞DNAまたは無細胞RNAが由来している細胞における対応するDNAまたはRNAのアレル比率を示している。いくつかの態様では、無細胞DNAまたは無細胞RNAに関する1つ以上の算出済みアレル比率は、前記個体のゲノムにおける対応するアレル比率を示している。いくつかの態様では、測定された遺伝子データが2つ以上の異なるアレルが前記試料中(例えば、無細胞DNAまたは無細胞RNA試料中)のその座位に存在することを示している場合には、アレル比率が算出されるのみ、あるいは期待アレル比率と比較されるのみである。いくつかの態様では、前記座位が、前記試料が由来している細胞の少なくとも1個においてヘテロ接合である(例えば、胎児においてヘテロ接合である座位および/またはその母親においてヘテロ接合である座位等)場合には、アレル比率が算出されるのみ、あるいは期待アレル比率と比較されるのみである。いくつかの態様では、前記座位が胎児においてヘテロ接合である場合には、アレル比率が算出されるのみ、あるいは期待アレル比率と比較されるのみである。いくつかの態様では、アレル比率が算出されて、ホモ接合座位の期待アレル比率と比較される。例えば、検査される特定の個体(または胎児および妊娠している母親の両方)についてホモ接合が予測される座位のアレル比率を分析して、システムのノイズまたはエラーの量を決定してもよい。

0056

いくつかの態様では、目的の染色体または染色体分節について少なくとも10個、50個、100個、200個、300個、500個、750個、1,000個、2,000個、3,000個、4,000個以上の(例えばSNP)座位が分析される。いくつかの態様では、目的の染色体または染色体分節のメガ塩基対(mb)当たりの(例えばSNP)座位の平均数は、メガ塩基対あたり少なくとも1個、10個、25個、50個、100個、150個、200個、300個、500個、750個、1,000個以上である。いくつかの態様では、目的の染色体または染色体分節のメガ塩基対当たりの座位(例えばSNP)の平均数は、メガ塩基対当たり1個と500個の間(例えば、メガ塩基対当たり1個と50個の間、50個と100個の間、100個と200個の間、200個と400個の間、200個と300個の間、または300個と400個、各両端の数値を含む)である。いくつかの態様では、起こり得る欠失または重複の複数の部分の座位が分析されて、1座位のみの分析や隣接するいくつかの座位のみの分析に比べてCNV決定の感度および/または特異性が高められる。いくつかの態様では、各座位に存在する最も共通する2つのアレルのみが測定される、あるいはこれらアレルのみが用いられて算出済みアレル比率が決定される。いくつかの態様では、5’→3’エキソヌクレアーゼ活性および/または低鎖置換活性を有するポリメラーゼ(例えば、DNAポリメラーゼRNAポリメラーゼ、または逆転写酵素等)を用いて座位の増幅が行われる。いくつかの態様では、(i)前記試料中のDNAまたはRNAの配列決定を行うこと、(ii)前記試料中のDNAまたはRNAを増幅して、増幅されたDNAを配列決定すること、または(iii)前記試料中のDNAまたはRNAを増幅して、PCR生成物ライゲートして、ライゲートした生成物を配列決定することで前記測定されたアレルの遺伝子データが得られる。いくつかの態様では、前記試料に由来するDNAまたはRNAを複数の分画に分割して、(例えば、特定の分画のすべてのDNAまたはRNAは同じバーコードを有する等)各分画のDNAまたはRNAに異なるバーコードを付加して、任意でバーコード付きDNAまたはRNAを増幅して、分画を結合させ、結合させた分画のバーコード付きDNAまたはRNAを配列決定することで測定されたアレルの遺伝子データが得られる。いくつかの態様では、配列決定(例えば、ナノポア配列決定、Halcyon Molecular配列決定等)、SNPアレイリアルタイムPCR、TaqMan、Nanostring nCounter(登録商標分析装置差別的DNAポリメラーゼおよびリガーゼを用いたIllumina GoldenGate GenotypingAssay、ライゲーション媒介PCR、連結逆方向プローブ(LIP、環状化済みプローブ、予備環状化型プローブ、環状化型プローブ、パドロックプローブ、または分子反転プローブMIP)と呼ばれることもある)のうちの1つ以上の方法を用いて、多型座位(例えばSNP)のアレルが同定される。いくつかの態様では、2つ以上(例えば、3または4)の対象増幅産物がライゲーションで結合されて、ライゲート生成物の配列決定が行われる。いくつかの態様では、同じ座位について異なるアレルの測定は、これらアレル間の代謝、アポトーシスヒストン、不活性、および/または増幅の違い(例えば、同じ座位の異なるアレル間の増幅効率の違い等)についての調整が行われる。いくつかの態様では、この調整は、得られた遺伝子データのアレル比率を算出する前、あるいは測定遺伝子データを期待遺伝子データと比較する前に行われる。

0057

いくつかの態様では、前記方法はまた、病気または障害の1種以上の危険因子の有無を決定することを含む。いくつかの態様では、前記方法はまた、病気または障害あるいはその病気または障害の危険性の増加に関連づけられた1種以上の多型または変異の有無を決定することを含む。いくつかの態様では、前記方法はまた、無細胞DNA、無細胞ミトコンドリアDNA、無細胞核内DNA、無細胞RNA、miRNA、またはこれらの任意の組み合わせの総量を決定することを含む。いくつかの態様では、前記方法は、1つ以上の目的の無細胞DNA、無細胞ミトコンドリアDNA、無細胞核内DNA、無細胞RNA、および/またはmiRNA分子(例えば、病気または障害あるいはその病気または障害の危険性の増加に関連づけられた多型または変異を有する分子等)の量を決定することを含む。いくつかの態様では、総DNA中の腫瘍DNA分画(例えば、総無細胞DNA中の腫瘍無細胞DNA分画、総無細胞DNA中の特定の変異を有する腫瘍無細胞DNA分画等)が決定される。いくつかの態様では、この腫瘍分画を用いて癌の段階が決定される(腫瘍分画が高い程、癌のより進行した段階と関連づけることができるため)。いくつかの態様では、前記方法はまた、DNAまたはRNAの総量を決定することを含む。いくつかの態様では、前記方法は、メチル化された1種以上の目的のDNAまたはRNA分子(例えば、病気または障害あるいはその病気または障害の危険性の増加に関連づけられた多型または変異を有する分子等)の量を決定することを含む。いくつかの態様では、前記方法は、DNAの完全性における変化の有無を決定することを含む。いくつかの態様では、前記方法はまた、mRNAスプライシングの総量を決定することを含む。いくつかの態様では、前記方法は、mRNAスプライシングの量を決定すること、または目的の1つ以上のRNA分子(例えば、病気または障害あるいはその病気または障害の危険性の増加に関連づけられた多型または変異を有する分子)に対応するもう1つのmRNAスプライシングを検出することを含む。

0058

いくつかの態様では、本発明は、個体において癌の表現型を検出するための方法であって、前記癌の表現型が変異の集合のうちの少なくとも1つの変異の存在によって定義されることを特徴とする。いくつかの態様では、前記方法は、前記細胞の1つ以上が癌の表現型を有すると疑われる場合に前記個体に由来する1個以上の細胞に由来するDNAまたはRNAの試料についてDNAまたはRNA測定を得ることと、前記DNAまたはRNA測定を分析して前記変異の集合のうちの変異ごとに前記細胞の少なくとも1つがその変異を有する尤度を決定することを含む。いくつかの態様では、前記方法は、(i)前記変異の少なくとも1つについて、前記細胞の少なくとも1つがその変異を含む尤度が閾値よりも大きい場合、または(ii)前記変異の少なくとも1つの変異について、前記細胞の少なくとも1つがその変異を有する尤度が前記閾値未満である場合のいずれかであり、かつ複数の変異について、前記細胞の少なくとも1つが前記変異の少なくとも1つを有する尤度の組み合わせが前記閾値より大きい場合に前記個体が前記癌の表現型を有していると決定することを含む。いくつかの態様では、1個以上の細胞は、前記変異の集合内に下位集合または変異のすべてを有する。いくつかの態様では、前記変異の下位集合は、癌または癌の危険性の増加と関連づけられる。いくつかの態様では、前記試料は、無細胞DNAまたはRNAを含む。いくつかの態様では、前記DNAまたはRNA測定は、1つ以上の染色体または染色体分節にある多型座位の集合における測定(例えば、各座位に存在する各アレルの量等)を含む。

0059

一側面において、本発明は、哺乳類の病気または障害の治療、安定化、または予防のための治療法を選択する方法を特徴とする。いくつかの態様では、前記方法は、本明細書で開示した方法のいずれかを用いて、第二の相同染色体分節に比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定することを含む。いくつかの態様では、前記哺乳類に対して治療法(例えば、第一の相同染色体分節の過剰出現と関連づけられた病気または障害の治療法等)が選択される。

0060

一側面において、本発明は、哺乳類の病気または障害を防止、遅延、安定化、または治療するための方法を特徴とする。いくつかの態様では、前記方法は、本明細書で開示した方法のいずれかを用いて、第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定することを含む。いくつかの態様では、治療法(例えば、第一の相同染色体分節の過剰出現と関連づけられた病気または障害の治療法)が選択されて、前記哺乳類に施される。

0061

いくつかの態様では、病気または障害を治療、安定化、または防止することは、病気または障害の初期の発生またはそれに続いて起こる事象を防止または遅延すること、状態の消失からその再発までの無病生存時間を増加させること、状態に関連づけられた有害な症状を安定化または低下させること、あるいは状態の進行を阻害または安定化させることを含む。いくつかの態様では、治療された対象者の少なくとも20、40、60、80、90、または95%が、前記状態のすべての兆候が消え完全に沈静している。いくつかの態様では、ある状態と診断されて治療された後の対象者の生存時間は、(i)未治療の対象者の平均生存時間または(ii)他の治療法で治療された対象者の平均生存時間の少なくとも20、40、60、80、100、200、または500%延長されている。

0062

いくつかの態様では、癌を治療、安定化、または防止することは、腫瘍(例えば、良性腫瘍または悪性腫瘍)の大きさを縮小する、あるいは安定化させること、腫瘍の増大を遅延または防止させること、腫瘍細胞数を低減または安定化させること、腫瘍の消失からその再発までの無病生存時間を増加させること、腫瘍の初期の発生またはそれに続く発生を防止すること、あるいは腫瘍と関連づけられた有害状態を低減または安定化させることを含む。一態様では、任意の標準的なアッセイを用いた測定において、治療後に残った癌性細胞数は、癌性細胞の初期数に比べて少なくとも10、20、40、60、80、または100%低減している。いくつかの態様では、本発明の治療法を施すことによって誘発された癌性細胞数は、非癌細胞数に比べて少なくとも2、5、10、20、または50倍超、低減している。いくつかの態様では、治療法を施した後に存在する癌性細胞数は、対照(例えば、生理食塩水または緩衝剤投与等)の投与後に存在する癌性細胞数に比べて少なくとも2、5、10、20、または50倍低減している。いくつかの態様では、本発明の方法によって、標準的な方法を用いて決定した腫瘍の大きさが10、20、40、60、80、または100%縮小した。いくつかの態様では、治療された対象者の少なくとも10、20、40、60、80、90、または95%が癌性細胞の検出されない完全な沈静を示した。いくつかの態様では、癌が全く再発しない、あるいは少なくとも2、5、10、15、または20年間は再発しない。いくつかの態様では、癌と診断されて、本発明の治療法で治療された対象者の生存時間は、(i)未治療の対象者の平均生存時間または(ii)他の治療法で治療された対象者の平均生存時間の少なくとも10、20、40、60、80、100、200、または500%延長されている。

0063

一側面において、本発明は、哺乳類の病気または障害を治療、安定化、または予防するための臨床試験に含まれる対象者を層別化するための方法を特徴とする。いくつかの態様では、前記方法は、本明細書で開示した方法のいずれかを用いて、前記臨床試験の前、最中、または後に第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定することを含む。いくつかの態様では、前記対象者のゲノムにおける第一の相同染色体分節の過剰出現の有無によって前記対象者が臨床試験のための下位群振り分けられる。

0064

いくつかの態様では、前記病気または障害は、癌、精神障害、学習障害(例えば、特発性学習障害)、精神遅滞、発達遅滞、自閉症、神経変性病または障害、統合失調症、身体障害、自己免疫疾患または障害、全身性エリテマトーデス、乾癬、クローン病、糸球体腎炎、HIV感染、AIDS、およびこれらの組み合わせからなる群から選択される。いくつかの態様では、前記病気または障害は、ディジョージ(DiGeorge)症候群、ディ・ジョージ2症候群、ディ・ジョージ/口蓋帆心臓・顔(VCFS)症候群、プラダーウィリー(Prader-Willi)症候群、アンジェルマン(Angelman)症候群、ベックウィズ-ヴィーデマン(Beckwith-Wiedemann)症候群、1p36欠失症候群、2q37欠失症候群、3q29欠失症候群、9q34欠失症候群、17q21.31欠失症候群、鳴き(Cri-du-chat)症候群、ヤコブセン(Jacobsen)症候群、ミラー・ディッカー(Miller Dieker)症候群、フェラン-マクダーミド(Phelan-McDermid)症候群、スミス・マゲニス(Smith-Magenis)症候群、腫瘍-無虹彩症-泌尿生殖器奇形-精神遅滞(WAGR)症候群、ウォルフヒルシュホーン(Wolf-Hirschhorn)症候群、ウィリアムズ(Williams)症候群、ウィリアムズ・ボイレン(Williams-Beuren)症候群、ミラー・ディッカー(Miller-Dieker)症候群、フェラン-マクダーミド(Phelan-McDermid)症候群、スミス・マゲニス(Smith-Magenis)症候群、ダウン症候群、エドワーズ(Edward)症候群、パトウ(Patau)症候群、クラインフェルター(Klinefelter)症候群、ターナー(Turner)症候群、47,XXX症候群、47,XYY症候群、ソトス(Sotos)症候群、およびこれらの組み合わせからなる群から選択される。いくつかの態様では、前記方法は、以下の染色体異常の1種以上の有無を決定する:零染色体性一染色体性片親二染色体性、三染色体性、一致型三染色体性、部分一致型三染色体性、母親性三染色体性、親性三染色体性、三体性モザイク四染色体性、一致型四染色体性、部分一致型四染色体性、他の異数性、非均衡型転座、均衡型転座、挿入、欠失、組換え、およびこれらの組み合わせ。いくつかの態様では、前記染色体異常は、特定の染色体または染色体分節の最も一般的なコピー数との任意のズレであり、例えばヒト体細胞では、2コピーからずれているものはいずれも染色体異常と見なすことができる。いくつかの態様では、前記方法は、正倍数性の有無を決定する。いくつかの態様では、前記コピー数仮説は、単胎妊娠に関する1つ以上のコピー数仮説を含む。いくつかの態様では、前記コピー数仮説は、多胎妊娠、例えば双胎妊娠(例えば、同一性双生児、兄弟性双生児、消失性双生児)に関する1つ以上のコピー数仮説を含む。いくつかの態様では、前記コピー数仮説は、多胎妊娠の正倍数体であるすべての胎児、多胎妊娠の異数体(例えば、本明細書において開示される任意の異数性)であるすべての胎児、および/または多胎妊娠の正倍数体である1体以上の胎児、および多胎妊娠の異数性である1体以上の胎児を含む。いくつかの態様では、前記コピー数仮説は、同一性双生児(一卵性双生児ともいう)または兄弟性双生児(二卵性双生児ともいう)を含む。いくつかの態様では、前記コピー数仮説は、奇胎妊娠(例えば、完全奇胎妊娠、部分奇胎妊娠等)を含む。いくつかの態様では、前記目的の染色体分節は1本の染色体全体である。いくつかの態様では、前記染色体または染色体分節は、13番染色体、18番染色体、21番染色体、X染色体Y染色体、これらの分節、およびこれらの組み合わせからなる群から選択される。いくつかの態様では、前記第一の相同染色体分節および前記第二の相同染色体分節は、前記目的の染色体分節を含む相同染色体分節の対である。いくつかの態様では、前記第一の相同染色体分節および前記第二の相同染色体分節は目的の相同染色体の対である。いくつかの態様では、信頼度は、CNVの決定または病気または障害の診断について算出される。

0065

いくつかの態様では、前記欠失は、少なくとも0.01kb、0.1kb、1kb、10kb、100kb、1mb、2mb、3mb、5mb、10mb、15mb、20mb、30mb、または40mbの欠失である。いくつかの態様では、前記欠失は、1kb〜40mb、例えば1kb〜100kb、100kb〜1mb、1〜5mb、5〜10mb、10〜15mb、15〜20mb、20〜25mb、25〜30mb、または30〜40mb(数値を含む)の欠失である。いくつかの態様では、前記染色体分節の1コピーが欠失しており、1コピーは存在する。いくつかの態様では、前記染色体分節の2コピーが欠失している。いくつかの態様では、1本の染色体全体が欠失している。

0066

いくつかの態様では、前記重複は、少なくとも0.01kb、0.1kb、1kb、10kb、100kb、1mb、2mb、3mb、5mb、10mb、15mb、20mb、30mb、または40mbの重複である。いくつかの態様では、前記重複は、1kb〜40mb、例えば1kb〜100kb、100kb〜1mb、1〜5mb、5〜10mb、10〜15mb、15〜20mb、20〜25mb、25〜30mb、30〜40mb(数値を含む)の重複である。いくつかの態様では、前記染色体分節の重複は1回である。いくつかの態様では、前記染色体分節の重複は2回以上(例えば、2、3、4、5回)である。いくつかの態様では、1本の染色体全体が重複している。いくつかの態様では、第一の相同分節のある領域が欠失しており、第二の相同分節の同じ領域または他の領域が重複している。いくつかの態様では、検査したSNVの少なくとも50、60、70、80、90、95、96、98、99、100%は転換型変異であり、転移型変異ではない。

0067

いくつかの態様では、前記試料は、(i)1個以上の目的細胞または(ii)1個以上の目的でない細胞に由来するDNAおよび/またはRNAを含む。いくつかの態様では、前記試料は、1個以上の目的細胞および1個以上の目的でない細胞に由来するDNAおよび/またはRNAを含む混合試料である。いくつかの態様では、前記対象細胞はCNV(例えば、目的の欠失または重複)を有する細胞であり、前記非対象細胞は目的のコピー数多様性を有しない細胞である。前記1個以上の目的細胞が癌細胞であり、前記1個以上の目的でない細胞が非癌細胞であるいくつかの態様では、前記方法は、前記癌細胞のうちの1個以上の癌細胞のゲノム中の前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することを含む。前記1個以上の目的細胞が遺伝的に同一の癌細胞であり、前記1個以上の目的でない細胞が非癌細胞であるいくつかの態様では、前記方法は、前記癌細胞のゲノム中の前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することを含む。前記1個以上の目的細胞が遺伝的に非同一の癌細胞であり、前記1個以上の目的でない細胞が非癌細胞であるいくつかの態様では、前記方法は、前記遺伝的に非同一の癌細胞のうちの1個以上の癌細胞のゲノム中の前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することを含む。前記試料が1個以上の癌細胞および1つ以上の非癌細胞の混合物に由来する無細胞DNAを含むいくつかの態様では、前記方法は、前記癌細胞のうちの1個以上の癌細胞のゲノム中の前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することを含む。前記1個以上の目的細胞が遺伝的に同一の胎児の細胞であり、前記1個以上の目的でない細胞が母親の細胞であるいくつかの態様では、前記方法は、前記胎児の細胞のゲノム中の前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することを含む。前記1個以上の目的細胞が遺伝的に非同一の胎児の細胞であり、前記1個以上の目的でない細胞が母親の細胞であるいくつかの態様において、前記方法は、前記遺伝的に非同一の胎児の細胞のうちの1個以上の細胞のゲノム中の前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することを含む。大部分の個体の細胞は細胞核DNAのほぼ同一の集合を含むので、いくつかの態様では用語「対象細胞」は、用語「個体」とは区別なく用いてもよい。癌性細胞は、宿主である個体とは異なる遺伝型を有する。この場合、その癌自体を個体と見なしてもよい。また、多くの癌は異種性であるが、これはある腫瘍の各細胞が同じ腫瘍の他の細胞と遺伝的に異なっていることを意味する。この場合、遺伝的に同一の領域をそれぞれ異なる個体と見なすことができる。あるいは、その癌を、異なるゲノムを有する細胞の混合物を含む単一の個体を見なしてもよい。非対象細胞は、通常、正倍数体であるが、必ずしもそうでない場合がある。

0068

いくつかの態様では、前記試料は、母親の全血液試料またはその分画、母親の血液試料から単離した細胞、羊水穿刺試料、受胎試料の生成物、胎盤組織試料、絨毛膜絨毛試料、胎盤膜試料、頸管粘液試料、または胎児由来の試料から得られる。いくつかの態様では、前記試料は、前記母親由来の血液試料またはその分画から得られた無細胞DNAを含む。いくつかの態様では、前記試料は、胎児の細胞および母親の細胞の混合物から得られた細胞核DNAを含む。いくつかの態様では、前記試料は、胎児の細胞が富化された、有核細胞を含む母親の血液の分画から得られる。いくつかの態様では、前記試料は、複数個の分画(例えば、2、3、4、5個以上の分画)に分割されて、本発明の方法を用いてそれぞれ分析される。各分画が同じ結果(例えば、目的の1つ以上のCNVの有無)を示す場合は、その結果の信頼度が増す。各分画が異なる結果を示す場合は、その試料が再分析される、あるいは同じ対象者から他の試料が採取されて分析されることがある。

0069

対象者の例としては、哺乳類(例えば、ヒトおよび獣医学の目的の哺乳類)等が挙げられる。いくつかの態様では、前記哺乳類は霊長類(例えば、ヒト、サルゴリラ類人猿キツネザル等)、ウシウマブタイヌ、またはネコである。

0070

いくつかの態様では、前記方法のいずれかは、本発明の前記方法の結果(例えば、欠失または重複の有無)を開示する報告書(例えば、文書による報告書、または電子報告書)を作成することを含む。

0071

いくつかの態様では、前記方法のいずれかは、本発明の前記方法の結果(例えば、欠失または重複の有無)に基づいて臨床行為を行うことを含む。本発明の前記方法の結果に基づき、胚または胎児が1つ以上の目的の多型または変異(例えば、CNV)を有するいくつかの態様では、前記臨床行為は、追加試験(例えば、多型または変異の存在を確認するための試験等)を行うことを含むが、体外受精のための前記胚を移植すること、体外受精のための別の胚を移植すること、妊娠状態を終了させること、特別支援が必要な子供に備えること、あるいは遺伝性疾患の表現型提示重症度を低減するように設計された介入を行うことは含まない。いくつかの態様では、前記臨床行為は、超音波診断、胎児の羊水穿刺、母親および/または父親に由来する遺伝子材料を受け継いだ胎児の羊水穿刺、胎児の絨毛膜絨毛生検、母親および/または父親に由来する遺伝子材料を受け継いた胎児の絨毛膜絨毛生検、体外受精、母親および/または父親に由来する遺伝子材料を受け継いだ1個以上の胚の着床遺伝子診断、母親の染色体分析、父親の染色体分析、胎児の心エコー図検査(例えば、三染色体性21、18、または13、一染色体性X、または微少欠失を有する胎児の心エコー図検査等)、およびこれらの組み合わせからなる群から選択される。いくつかの態様では、前記臨床行為は、一染色体性Xを有する生まれた子供への成長ホルモンの投与(例えば、約9ヶ月での投与開始)、22q欠失(例えば、ディ・ジョージ症候群)を持って生まれた子供へのカルシウム投与、47,XXYを有する生まれた子供へのテストステロン等のアンドロゲンの投与(例えば、3ヶ月間、乳児または幼児への1ヶ月あたり25mgのエナント酸テストステロンの注射)、(例えば、三倍体胎児等の)完全奇胎妊娠または部分奇胎妊娠の女性に対する癌検査の実施、(例えば、三倍体胎児等の)完全奇胎妊娠または部分奇胎妊娠の女性に対する(化学療法薬等による)癌治療の実施、男子と判定された胎児(例えば、本発明の方法を用いて男子と判定された胎児)に対する1種以上のX関連遺伝性疾患(例えば、デュシェンヌ型筋ジストロフィーDMD)、副腎白質ジストロフィー血友病等)についてのスクリーニング検査、X関連疾患の危険性がある男子の胎児の羊水穿刺の実施、先天性副腎過形成の危険性がある子の胎児(例えば、本発明の方法を用いて女子と判定された胎児)を妊娠している女性へのデキサメタゾンの投与、先天性副腎過形成の危険性がある男子の胎児について羊水穿刺の実施、(生ワクチンの代わりに)死菌ワクチンの投与または22q11.2欠失による免疫不全(または、免疫不全の疑いがある)生まれた子供へのある種のワクチン投与の回避、作業療法および/または物理治療の実施、教育への早期介入、新生児集中治療室および/または出産時に対応可能な小児専門医を有する三次医療センターへの赤ん坊の搬送、生まれた子供(例えば、XXX、XXY、またはXYYを有する子供)への行動介入、およびこれらの組み合わせからなる群から選択される。

0072

いくつかの態様では、多胎妊娠(例えば、双生児)であると判定された女性に対して超音波または他のスクリーニング検査が行われて、胎児の2体以上が単一絨毛膜性であるかどうかが決定される。一卵性双生児は、単一の卵母細胞排卵および受精と、それに続く受精卵細胞分裂から発生する。胎盤形成は二絨毛膜性または単一絨毛膜性である可能性がある。二卵性双生児は、2つの卵母細胞の排卵および受精から発生するが、通常、二絨毛膜性胎盤が形成される。単一絨毛膜性双生児は双胎児間輸血症候群の危険性を有する。これら症候群によって胎児間の血液分布が不均衡になる可能性があり、その結果、双生児の成長や発達に差が生じ、場合によっては死産となる。よって、本発明の方法を用いて一卵性双生児と判定された双生児は、(例えば、超音波等によって)検査されて、単一絨毛膜性双生児であるかどうかが判定され、単一絨毛膜性双生児である場合は双胎児間輸血症候群の兆候についてこれらの双生児を(例えば、16週目から隔週で超音波等により)監視することができることが望ましい。

0073

本発明の前記方法の結果に基づいて胚または胎児が1つ以上の目的の多型または変異(例えば、CNV)を有していないいくつかの態様では、前記臨床行為は、体外受精のための前記胚を移植すること、または妊娠状態を継続することを含む。いくつかの態様では、前記臨床行為は、超音波、羊水穿刺、絨毛膜絨毛生検、およびこれらの組み合わせからなる群から選択される行為を行って前記多型または変異がないことを確認するための追加検査である。

0074

本発明の前記方法の結果に基づいてある個体が1つ以上の多型または変異(例えば、(癌等の)病気または障害または(癌等の)病気または障害の危険性の増加に関連づけられた多型または変異)を有するいくつかの態様では、前記臨床行為は、追加検査を行うこと、または病気または障害に対する1つ以上の治療法(例えば、癌の治療法、前記個体が診断された特定の種類の癌または特定の種類の変異に対する治療法、または本明細書で開示された治療法のいずれか)を施すことを含む。いくつかの態様では、前記臨床行為は、生検、手術医療画像診断(例えば、マンモグラム、超音波等)、およびこれらの組み合わせからなる群から選択される、多型または変異の有無を確認するための追加検査である。

0075

いくつかの態様では、前記追加検査は、多型または変異(例えば、CNV)の有無を確認するための同じまたは異なる方法(例えば、本明細書で開示した方法のいずれか)を行うこと(例えば、検査された同じ試料の第二の分画、または同じ個体(例えば、癌の危険性が増加している同じ妊娠している母親、胎児、胚、または個体)に由来する異なる試料を検査する等)を含む。いくつかの態様では、多型または変異(例えば、CNV)の確率が閾値を超えている個体に対して前記追加検査(例えば、可能性の高い多型または変異の存在を確認するための追加検査等)が行われる。いくつかの態様では、多型または変異(例えば、CNV)の決定の信頼度またはZ値が閾値を超えている個体に対して前記追加検査(例えば、可能性の高い多型または変異の存在を確認するための追加検査等)が行われる。いくつかの態様では、多型または変異(例えば、CNV)の決定のための信頼度またはZ値が最少閾値と最大閾値の間である個体について、前記追加検査(例えば、初期の結果が正しいことの信頼度を高めるための追加検査等)が行われる。いくつかの態様では、多型または変異(例えば、CNV)の有無の決定のための信頼度が閾値未満(例えば、CNVの有無を十分な信頼度でもって決定できなかった結果である「呼び出しなし」等)である個体について、前記追加検査が行われる。Z値は例えばChiu et al. BMJ 2011;342:c7401(参照によりその全体が本明細書に組み込まれる)で算出される。ここでは、一例として21番染色体が用いられているが、検査試料中のいずれか他の染色体または染色体分節と置換されてもよい。
検査ケースの21番染色体の百分率に対するZ値=((検査ケースの21番染色体の百分率)−(基準対照の21番染色体の百分率の平均値))/(基準対照の21番染色体の百分率の標準偏差
いくつかの態様では、最初の試料が品質管理ガイドラインを満たしてなかった、あるいは閾値未満の胎児の分画または腫瘍分画を含んでいた個体について、前記追加検査が行われる。いくつかの態様では、前記方法は、本発明の前記方法の結果、その結果の確率、その結果の信頼度、またはZ値に基づいて追加検査を行う個体を選択し、前記個体(例えば、同じまたは別の試料)に前記追加検査を行うことを含む。いくつかの態様では、(例えば、癌等の)病気または障害と診断された対象者は、本発明の方法または前記病気または障害を検査するための周知の検査方法を用いて複数の時点で反復検査を受けて、前記病気または障害の進行、沈静、または再発が監視される。

0076

一側面において、本発明は、本発明の方法の結果(例えば、欠失または重複の有無)を開示する報告書(例えば、文書による報告書、または電子報告書)を特徴とする。

0077

様々な態様では、前記プライマー伸長反応すなわち前記ポリメラーゼ連鎖反応は、ポリメラーゼで1個以上のヌクレオチドを付加させることを含む。いくつかの態様では、前記プライマーは溶液中にある。いくつかの態様では、前記プライマーは溶液中にあり、固体支持体固定化されていない。いくつかの態様では、前記プライマーはマイクロアレイの一部ではない。様々な態様では、前記プライマー伸長反応すなわち前記ポリメラーゼ連鎖反応は、ライゲーション媒介PCRを含まない。様々な態様では、前記プライマー伸長反応すなわち前記ポリメラーゼ連鎖反応は、リガーゼで2本のプライマーを結合させることを含まない。様々な態様では、前記プライマーは、連結逆方向プローブ(LIP、環状化済みプローブ、予備環状化型プローブ、環状化型プローブ、パドロックプローブ、または分子反転プローブ(MIP)と呼ばれることもある)を含まない。

0078

本明細書で記載された本発明の側面および態様は、本発明の側面または態様のうち、いずれか2つ以上の組み合わせを含む。
定義

0079

一塩基多型(SNP)」は、同じ種の2個体間のゲノムで異なる場合がある1つのヌクレオチドを指す。この用語の使用は、各変異体が発生する頻度に関するいかなる限定も意味する意図はない。

0080

「配列」は、DNA配列または遺伝子配列を指す。この用語は、個体のDNA分子またはDNA鎖の一次的物理構造を指す場合がある。この用語は、DNA分子に見られるヌクレオチド配列、またはこのDNA分子の相補鎖を指す場合がある。この用語は、コンピュータでの表示として、このDNA分子に含まれる情報を指す場合がある。

0081

「座位」は、個体のDNAに関する目的の特定の領域を指し、SNP、挿入または欠失の可能性がある部位、あるいはその他のなんらかの関連する遺伝的多様性の部位を指す場合がある。疾病関連SNPはまた、疾病関連座位という場合がある。

0082

「多型アレル」および「多型座位」はそれぞれ、ある種の個体間で遺伝型が異なるアレル、座位を指す。多型アレルのいくつかの例として、一塩基多型、短縦列型反復、欠失、重複、および逆位等が挙げられる。

0083

多型部位」は、多型領域に見られる、個体間で異なる特定のヌクレオチドを指す。

0084

「変異」は、天然の核酸配列または基準核酸配列の変化を指し、挿入、欠失、重複、転座、置換、読み枠シフト変異、サイレント変異ナンセンス変異ミスセンス変異点変異塩基転位変異、塩基転換変異、復帰変異マイクロサテライト変更等が挙げられる。いくつかの態様では、核酸配列によってコードされるアミノ酸配列は、天然の配列から少なくとも1つのアミノ酸変更を有する。

0085

「アレル」は、特定の座位を占める遺伝子群を指す。

0086

「遺伝子データ」、「遺伝型データ」はいずれも、1つ以上の個体のゲノムの側面を記述したものを指す。この用語は、座位または座位の集合、配列の部分または配列全体、染色体の部分または染色体全体、あるいはゲノム全体を指す場合がある。この用語は、1個または複数のヌクレオチドの同一性を指す場合がある。また、ヌクレオチド配列、ゲノム中の異なる位置にあるヌクレオチド、またはこれらの組み合わせを指す場合がある。しかしながら、遺伝型データは典型的にはコンピュータ内のものであり、ある配列の物理的ヌクレオチドを、化学的にコードされた遺伝子データとして考慮することも可能である。遺伝型データは、個体「上」、「の」、「で」、「から」、または「に関する」遺伝型データという場合がある。遺伝型データは、遺伝子材料を測定する遺伝型決定プラットフォームから得られる測定出力を指す場合がある。

0087

「遺伝子材料」および「遺伝子試料」は、DNAまたはRNAを含む1つ以上の個体由来の物質組織または血液等)を指す。

0088

「信頼度」は、呼び出されたSNP、アレル、アレルの集合、染色体または染色体分節の決定されたコピー数、あるいは病気の有無の診断が、その個体の実際の遺伝子状態を正しく表していることについての統計尤度を指す。

0089

「倍数性呼び出し」、および「染色体コピー数呼び出し」あるいは「コピー数呼び出し」(CNC)は、ある細胞に存在する1つ以上の染色体または染色体分節の量および/または染色体同一性を決定する動作を指す場合がある。

0090

「異数性」は、ある細胞に染色体数誤り(例えば、完全な染色体の数の誤り、染色体分節の数の誤り(染色体分節の欠失または重複の存在等)が存在する状態を指す。ヒト体細胞の場合、この用語は、ある細胞が22対の常染色体と1対の性染色体を含まない場合を指すことがある。ヒト配偶子の場合、この用語は、ある細胞が23本の染色体のいずれか1つを含まない場合を指すことがある。単一染色体型の場合、この用語は、3つ以上または1つ以下の相同ではあるが同一ではない染色体コピーが存在する場合、あるいは同じ親由来の染色体コピーが2つ存在する場合を指すことがある。いくつかの態様では、染色体分節の欠失は微少欠失である。

0091

「倍数性状態」は、ある細胞の1つ以上の染色体または染色体分節の量および/または染色体同一性を指す。

0092

「染色体」は、単一染色体コピーを指す場合がある。この用語は、正常な体細胞には46個存在するDNAの単一分子(例えば「母親由来の18番染色体」等)を意味する。染色体はまた、正常なヒト体細胞には23個存在する染色体型(例えば「18番染色体」等)を指すことがある。

0093

「染色体同一性」は、染色体参照番号、すなわち染色体型を指す場合がある。正常なヒトは、番号付けされた常染色体の22種の染色体型と、2種類の性染色体を有する。この用語は、染色体の親の起源を指すこともある。この用語は、親から受け継いだ特定の染色体を指すこともある。この用語は、染色体のその他の同定に用いられる特徴を指すこともある。

0094

「アレルデータ」は、1つ以上のアレルの集合に関する遺伝型データの集合を指す。この用語は、相決定済みハプロタイプデータを指す場合がある。この用語は、SNP同一性を指す場合がある。また、挿入、欠失、反復、および変異を含むDNAの配列データを指す場合がある。この用語は、各アレルの親起源を含むことがある。

0095

「アレル状態」は、1つ以上のアレルの集合における遺伝子の実際の状態を指す。この用語は、アレルデータによって記載された遺伝子の実際の状態を指す場合がある。

0096

「アレル数」は、特定の座位にマッピングされる配列の数を指し、その座位が多型である場合は各アレルにマッピングされる配列の数を指す。各アレルが二進数計測される場合、アレルの数は整数になる。アレルが確率で計測される場合、アレルの数は分数であってもよい。

0097

「アレル数確率」は、特定の座位または多型座位にあるアレルの集合にマッピングされると思われる配列の数を、マッピングの確率と合わせたものを指す。各計測された配列のマッピング確率二値(0または1)である場合は、アレル数は、アレル数確率に相当する。いくつかの態様では、アレル数確率は二値である場合がある。いくつかの態様では、アレル数確率はDNA測定と等しくなるように設定されていることがある。

0098

「アレル分布」または「アレル数分布」は、座位の集合における各座位に存在する各アレルの相対量を指す。アレル分布は、個体、試料、または試料に対して行った測定の集合を指し得る。配列決定等のデジタルアレル測定の文脈では、このアレル分布は、多型座位の集合における各アレルについて特定のアレルにマッピングされるリードの数または確数を指す。SNPアレイ等、アナログアレル測定の文脈では、このアレル分布は、アレル強度および/またはアレル比率を指す。アレル測定は、確率として、すなわち、あるアレルがある配列リードに存在する尤度が0と1の間の分数として処理されてもよく、または二進法、すなわち、ある任意のリードがある特定のアレルのコピーとして0または1のいずれかと見なされるような方法で処理されてもよい。

0099

「アレル分布パターン」は、文脈(親の文脈等)ごとに異なるアレル分布の集合を指す。あるアレル分布パターンは、ある倍数性状態を指す場合がある。

0100

「アレルの偏り」は、ヘテロ接合座位に存在するアレルの測定比率がDNAまたはRNAの元の試料の比率と異なっている程度を指す。特定の座位に存在するアレルの偏りの程度は、測定されたその座位に存在する観察されたアレルの比率を元のDNAまたはRNA試料のその座位に存在するアレルの比率で除したものに等しい。アレルの偏りは、増幅による偏り、精製による偏り、または異なるアレルに様々な影響を及ぼすいくつかのその他の現象による場合がある。

0101

「アレル不均衡率」は、SNVの場合、異常なDNAの割合を指す。この割合は、典型的には多様性アレル頻度(ある座位に存在する多様性アレル数/その座位に存在する総アレル数)を用いて計測される。腫瘍における2つの相同体の量の差は類似しているので、CNVについて異常なDNAの割合を平均アレル不均衡率(AAI)を用いて測定する。平均アレル不均衡率は|(H1−H2)|/(H1+H2)として定義され、ここでHiは試料中の相同体iの平均コピー数であり、Hi/(H1+H2)は相同体iの分数の量、すなわち相同体比率である。最大相同体比率は、もっとも量が多い相同体の相同体比率である。

0102

「試験脱落率」は、すべてのSNPを用いて推定した、リードのないSNPの百分率である。

0103

「単一アレル脱落(ADO)率」は、ヘテロ接合SNPのみを用いて推定した、アレルが1つのみ存在するSNPの百分率である。

0104

「プライマー」および「PCRプローブ」は、単一核酸分子(DNA分子、DNAオリゴマー等)、あるいは同一またはほぼ同一の核酸分子(DNA分子、DNAオリゴマー等)の集合体を指す。プライマーは、対象とする座位(例えば、対象とする多型座位または非多型座位)または汎用プライミング配列にハイブリダイズされるように設計された領域を含む。プライマーは、PCR増幅を可能にするように設計されたプライミング配列を含んでいてもよい。プライマーはまた、分子バーコードを含んでいてもよい。プライマーは、個体分子ごとに異なるランダム領域を含んでいてもよい。

0105

「プライマーのライブラリー」は、2個以上のプライマーの集団を指す。様々な態様において、このライブラリーは、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なるプライマーを含む。様々な態様において、このライブラリーは、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なるプライマー対を含み、各プライマー対は、フォワード試験プライマーおよびリバース試験プライマーを含み、各試験プライマー対は対象座位にハイブリダイズされる。いくつかの態様では、プライマーのライブラリーは、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なる個別のプライマーを含む。個別のプライマーはそれぞれ異なる対象座位にハイブリダイズされ、これら個別のプライマーはプライマー対の一部ではない。いくつかの態様では、ライブラリーは、(i)プライマー対および(ii)プライマー対の一部ではない個別のプライマー(汎用プライマー等)の両方を含む。

0106

「異なるプライマー」とは、同一ではないプライマーを指す。

0107

「異なるプール」とは、同一ではないプールを指す。

0108

「異なる対象座位」とは、同一ではない対象座位を指す。

0109

「異なる増幅産物」とは、同一ではない増幅産物を指す。

0110

ハイブリッドキャプチャー用プローブ」は、試料中の特定の目的DNA配列の一本鎖と相補であることを意図してPCR、直接合成等の様々な方法で作成された、修飾可能な任意の核酸配列を指す。用意した試料に外来性のハイブリッドキャプチャー用プローブを添加して、変性再アニール法でハイブリダイズさせて、外来性−内在性断片の二本鎖を形成してもよい。これら二本鎖を様々な手段で試料から物理的に分離してもよい。

0111

「配列リード」は、例えば、クローン配列決定法を用いて測定したヌクレオチドの塩基配列を表すデータを指す。クローン配列決定法により、元の1つのDNA分子、そのクローン、またはそのクラスターを表す配列データが作成されてもよい。配列リードはまた、ヌクレオチドが正しく呼び出された確率を示す、関連づけられた質スコアを配列の各塩基位置に有していてもよい。

0112

「配列リードのマッピング」とは、特定の器官ゲノム配列における配列リードの元の位置を決定する方法である。配列リードの元の位置は、そのリードのヌクレオチド配列およびゲノム配列の類似性に基づいている。

0113

「一致型コピー誤り」および「一致型染色体異数性(MCA)」は、1個の細胞が2つの同一、またはほぼ同一の染色体を含む異数性状態を指す。この種の異数性は、減数分裂時に配偶子が形成されるときに生じる場合があり、減数分裂不分離誤りとも言う場合がある。この種の誤りは有糸分裂時に生じる場合がある。一致型三染色体性は、ある染色体のコピーが3つ、1個体に存在し、そのうちの2つが同一である場合を指すことがある。

0114

「部分一致型コピー誤り」および「非同一染色体異数性(UCA)」は、1個の細胞が、相同ではあるが同一ではない可能性がある、同じ親由来の2つの染色体を含む異数性状態を指す。この種の異数性は、減数分裂時に生じることがあり、減数分裂誤りと言う場合がある。部分一致型三染色体性は、ある染色体のコピーが3つ、1個体に存在し、そのうちの2つが同じ親由来であり、相同であるが同一ではない場合を指すことがある。部分一致型三染色体性は、一方の親由来の2つの相同染色体が存在し、その染色体分節のある部分は同一であるが他の分節は単に相同である場合を指すことがある。

0115

「相同染色体」は、減数分裂に正常に対をなす遺伝子の同じ集合を含む染色体コピーを指す。

0116

「同一染色体」は、同じ遺伝子の集合を含み、各遺伝子が同一、またはほぼ同一のアレルの同じ集合を有する染色体コピーを指す。

0117

「アレル脱落(ADO)」は、あるアレルの相同染色体の塩基対の集合のうち、少なくとも塩基対の一方が検出されない状況を指す。

0118

「座位脱落(LDO)」は、あるアレルの相同染色体の塩基対の集合のうち、塩基対の両方が検出されない状況を指す。

0119

「ホモ接合」は、対応する染色体座位として類似のアレルを有することを指す。

0120

「ヘテロ接合」は、対応する染色体座位として類似しないアレルを有することを指す。

0121

ヘテロ接合性率」は、集団におけるある座位にヘテロ接合アレルを有する個体の率を指す。ヘテロ接合性率はまた、個体あるいはDNAまたはRNA試料におけるある座位に存在するアレルの期待比率または測定比率を指すことがある。

0122

染色体領域」は染色体の分節、または完全な染色体を指す。

0123

「染色体の分節」は、染色体の部分を指し、1塩基対から完全な染色体までの大きさである可能性がある。

0124

「染色体」は、完全な染色体、または染色体の分節すなわち部分を指す。

0125

「コピー」は、染色体分節のコピー数を指す。この用語は、染色体分節の同一コピー、同一ではないが相同であるコピーを指す場合がある。同一ではないが相同であるコピーでは、染色体分節の各コピーが実質的に類似した座位集合を含み、1つ以上のアレルが異なっている。M2コピー誤り等、異数性のいくつかの場合では、ある染色体分節のコピーのうち、一部が同一コピーであり、一部が同一ではないコピーである可能性がある。

0126

「ハプロタイプ」は、典型的には同じ染色体に受け継がれる複数の座位に存在するアレルの組み合わせを指す。ハプロタイプは、座位の所定の集合間で起こった組換え事象の数に応じて少なくとも2つの座位から完全な染色体までを指すことがある。ハプロタイプはまた、統計的に関連づけられる単一の染色分体上にあるSNPの集合を指し得る。

0127

「ハプロタイプデータ」、および「相決定済みデータ」、「順序付け遺伝子データ」は、二倍体または倍数体における単一の染色体または染色体分節に由来するデータを指し、例えば、二倍体ゲノムにおける分離した母親または父親の染色体コピー等である。

0128

「相決定」は、ある順序づけされていない二倍体(または倍数性)遺伝子データにおいて個体のハプロタイプ遺伝子データを決定する動作を指す。この用語は、1つの染色体に見られるアレルの集合に関して、あるアレルの2つの遺伝子のうちのどちらと、個体の2つの相同染色体のいずれと関連づけられるかを決定する動作を指す場合がある。

0129

「相決定済みデータ」は、1つ以上のハプロタイプが決定された遺伝子データを指す。

0130

「仮説」は、起こりうる状態を指す(例えば、第一の相同染色体または染色体分節が第二の相同染色体または染色体分節と比較してコピー数過剰出現が起こりうる度合い、起こりうる欠失、起こりうる重複、1つ以上の染色体または染色体分節の集合で起こりうる倍数性状態、1箇所以上の座位の集合で起こりうるアレルの状態、起こりうる父系性関係、1つ以上の染色体または染色体分節の集合で起こりうるDNA、RNA、胎児の分画、座位の集合に由来する遺伝子材料の量の集合等)。遺伝子状態が、仮説の各要素が仮説の他の要素との関係で真であるという相対的尤度、あるいは仮説が全体として真であるという相対的尤度を示す確率と結びつけられてもよい。この可能性の集合は1つ以上の要素を含んでいてもよい。

0131

「コピー数仮説」および「倍数性状態仮説」は、個体の染色体または染色体分節のコピー数に関する仮説を指す。この用語はまた、各染色体の同一性(各染色体の元の親、およびその親の2つの染色体のうち、どちらがその個体に存在しているかを含む)に関する仮説を指す場合がある。この用語はまた、関係がある個体が存在する場合、その個体由来の染色体または染色体分節が、ある個体のある染色体と遺伝的に対応するということについての仮説を指す場合がある。

0132

「関係がある個体」は、対象の個体と遺伝的に関係があり、かつ対象の個体とハプロタイプブロックを共有する任意の個体を指す。ある文脈では、関係がある個体は、対象の個体の遺伝学上の親、または親に由来した任意の遺伝子材料(精子、極体、胚、胎児、または子供)であってもよい。この用語はまた、同胞、親、または祖父母を指す場合がある。

0133

「同胞」は、遺伝学上の親が対象の個体と同じである任意の個体を指す。いくつかの態様では、この用語は、生まれた子供、胚、胎児、あるいは生まれた子供、胚、または胎児に由来する1個以上の細胞を指す場合がある。同胞はまた、どちらかの親に由来する半数体個体(例えば、精子、極体、またはハプロタイプ遺伝物質のその他の集合)を指す場合がある。ある個体が、それ自身の同胞と見なされる場合がある。

0134

「子供」は、胚、卵割球、または胎児を指す場合がある。本明細書で開示された態様では、記述した概念は、生まれた子供、胎児、胚、またはそれらに由来する細胞の集合である個体にも等しく適用される。用語「子供」を用いた場合、単に、子供として言及された個体はその親からの遺伝的子孫であることを含意することを意味することがある。

0135

「胎児の」は、「その胎児の」または「その胎児に遺伝的に類似した胎盤領域」を指す。妊婦の胎盤のある部分は、胎児に遺伝的に類似しており、母親の血液中に見られる自由浮遊胎児DNAは、その胎児と一致する遺伝型を有する胎盤の一部に由来する場合がある。胎児の染色体の半分の遺伝子情報は、胎児の母親から受け継がれる。いくつかの態様では、胎児の細胞から得た、母親から受け継がれた染色体に由来するDNAは、「母親由来」ではなく「胎児由来」と見なされる。

0136

「胎児由来のDNA」は、本来、その遺伝型が胎児のものと本質的に同じであった細胞の一部であったDNAを指す。

0137

「母親由来のDNA」は、本来、その遺伝型が母親のものと本質的に同じであった細胞の一部であったDNAを指す。

0138

「親」は、個体の遺伝学上の母親または父親を指す。個体は、典型的には二親、母親と父親を有するが、遺伝子キメラ現象または染色体キメラ現象の場合は必ずしも当てはまらないことがある。親は個体と見なされる場合がある。

0139

「親の文脈」は、対象の二親のうち、一方または両方の関連する2つの染色体のそれぞれについて、あるSNPの遺伝子状態を指す。

0140

「母親の血漿」は、妊婦由来の血液の血漿部分を指す。

0141

臨床判断」は、個体の健康または生存に影響を及ぼす結果を有する行動を取るか否かという任意の判断を指す。臨床判断はまた、さらなる試験を行う、中絶すること、妊娠状態を維持する、望ましくない表現型を緩和するための行動を取る、またはある表現型に備えるための行動を取ることを指す場合がある。

0142

「診断ボックス」は、本明細書で開示される方法の一側面あるいは複数の側面を行うように設計された1つの機械、またはそのような機械の組み合わせを指す。一態様では、診断ボックスは患者治療の点で設けられている場合がある。一態様では、診断ボックスは、目的の増幅と、その後の配列決定を行う場合がある。一態様では、診断ボックスは独立して、あるいは技術者の助けにより機能する場合がある。

0143

インフォマティックスに基づく方法」は、大量のデータを解明するために統計学に大きく依存する方法を指す。出生前診断の文脈では、この用語は、(例えば、分子アレイや配列決定からの)大量の遺伝子データがある場合に、直接物理的にその状態を測定するのはなく、統計的に最も可能性のある状態を推測することにより、1つ以上の染色体または染色体分節の倍数性状態、1つ以上のアレルのアレル状態、または父系性を決定するように設計された方法を指す。本開示の一態様では、インフォマティックスに基づく技術は、本特許出願で開示されるものであることがある。本開示の一態様では、インフォマティックスに基づく技術は、PARENTAL SUPPORT(商標:Gen Security Network, Inc.で開発された染色体異数性のスクリーニング技術)である場合がある。

0144

「一次遺伝子データ」は、遺伝型決定プラットフォームによって出力されたアナログ強度信号を指す。SNPアレイの文脈では、一次遺伝子データは、任意の遺伝型呼び出しが行われる前の強度信号を指す。配列決定の文脈では、一次遺伝子データは、任意の塩基対の同一性が決定される前、および配列がゲノムにマッピングされる前に配列決定装置から出力される、クロマトグラムに類似したアナログ測定を指す。

0145

「二次遺伝子データ」は、遺伝型決定プラットフォームによって出力された処理済み遺伝子データを指す。SNPアレイの文脈では、二次遺伝子データは、SNPアレイ読取り器に関連づけられたソフトウェアによってなされるアレル呼び出しを指し、このソフトウェアは、あるアレルが試料中に存在するか否かを呼び出す。配列決定の文脈では、二次遺伝子データは、決定された配列の塩基対の同一性を指す。また、配列がゲノムにマッピングされた場合の塩基対の同一性を指し得る。

0146

「ある座位に対応するDNAの優先富化またはある座位に存在するDNAの優先富化」は、富化後のDNA混合物中のその座位に対応するDNA分子の百分率を、富化前のDNA混合物中のその座位に対応するDNA分子の百分率よりも高くする任意の方法を指す。この方法は、ある座位に対応するDNA分子の選択的増幅を含む場合がある。この方法は、その座位に対応しないDNA分子を除去することを含む場合がある。この方法は、複数の方法の組み合わせを含む場合がある。富化度は、富化後の混合物中のその座位に対応するDNA分子の百分率を、富化前の混合物中のその座位に対応するDNA分子の百分率で除したものとして定義される。優先富化が複数の座位について行われる場合がある。本開示のいくつかの態様では、富化度は、20、200、または2,000より大きい。優先富化が複数の座位について行われる場合、富化度は、座位の集合におけるすべての座位の平均富化度を指すことがある。

0147

「増幅」は、DNA分子またはRNA分子のコピー数を増加させる方法を指す。

0148

「選択的増幅」は、特定のDNA(またはRNA)分子のコピー数、またはDNA(またはRNA)の特定の領域に対応するDNA(またはRNA)分子のコピー数を増加させる方法を指す場合がある。この用語はまた、非対象DNA(またはRNA)分子または領域の増加以上に特定の対象DNA(またはRNA)分子または対象DNA(またはRNA)領域のコピー数を増加させる方法を指す場合がある。選択的増幅は優先富化の方法であってもよい。

0149

「汎用プライミング配列」は、例えば、ライゲーション、PCR、またはライゲーション媒介PCRによって対象DNA(またはRNA)分子の集団に付加されてもよいDNA(またはRNA)配列を指す。一旦、汎用プライミング配列が対象分子の集団に付加されると、この汎用プライミング配列に特異的なプライマーを用いて、この対象集団を1対の増幅プライマーにより増幅させることができる。汎用プライミング配列は、通常、対象配列と関係がない。

0150

「汎用接着体」、「ライゲーション接着体」、または「ライブラリー標識」は、対象の二本鎖核酸分子の集団の5’末端および3’末端に共有結合することができる汎用プライミング配列を含む核酸分子である。接着体の付加により、PCR増幅を開始させることができる対象集団の5’末端および3’末端に汎用プライミング配列が供給され、1対の増幅プライマーを用いてこの対象集団からすべての分子を増幅させる。

0151

「対象化」は、DNA(またはRNA)混合物中の座位の集合に対応するDNA(またはRNA)分子を選択的に増幅または優先的に富化するために用いられる方法を指す。

0152

「同時分布モデル」は、変数の確率が結合される同じ確率空間で定義された複数のランダム変数を仮定していくつかのランダム変数で定義される事象の確率を定義するモデルを指す。いくつかの態様では、変数の確率が結合されない縮退した場合が用いられることがある。

0153

癌関連遺伝子」は、癌の危険性の変化または予後の変化に関連した遺伝子を指す。癌を促進する癌関連遺伝子の例としては、癌遺伝子細胞増殖浸潤、または転移を高める遺伝子、アポトーシスを阻害する遺伝子、および血管形成促進遺伝子等が挙げられる。癌を阻害する癌関連遺伝子の例としては、腫瘍抑制遺伝子、細胞増殖、浸潤、または転移を阻害する遺伝子、アポトーシスを促進する遺伝子、および血管形成阻害遺伝子等が挙げられるが、これらに限定されない。

0154

エストロゲン関連癌」は、エストロゲンによって調節される癌を指す。エストロゲン関連癌の例としては、乳癌および卵巣癌が挙げられるが、これらに限定されない。Her2は多くのエストロゲン関連癌で過剰発現する(米国特許第6,165,464号、参照によりその全体が本明細書に組み込まれる)。

0155

「アンドロゲン関連癌」は、アンドロゲンによって調節される癌を指す。アンドロゲン関連癌の例としては、前立腺癌がある。

0156

「正常な発現量より高い」とは、対照としての対象者(例えば、癌等の病気や疾患がない対象者)のmRNAまたはタンパク質の平均発現量よりも高いことを指す。様々な態様では、この正常な発現量より高い発現量は、対照としての対象者における発現量に対して少なくとも20、40、50、75、90、100、200、500,あるいは1000%、多くなっている。

0157

「正常な発現量より低い」とは、対照としての対象者(例えば、癌等の病気や疾患がない対象者)のmRNAまたはタンパク質の平均発現量よりも低いことを指す。様々な態様では、この正常な発現量より高い発現量は、対照としての対象者における発現量に対して少なくとも20、40、50、75、90、95、または100%、低くなっている。いくつかの態様では、mRNAまたはタンパク質の発現が検出不能である。

0158

「発現または活性を調節する」とは、例えば、対照条件に対してタンパク質または核酸配列の発現または活性を増加あるいは低減させることを指す。いくつかの態様では、発現または活性における調節は、少なくとも10、20、40、50、75、90、100、200、500、または1000%の増加あるいは低減である。様々な態様では、転写翻訳、mRNAまたはタンパク質の安定性、あるいは生体内の他の分子へのmRNAまたはタンパク質の結合が治療によって調節される。いくつかの態様では、mRNAの量が標準的なノーザンブロット解析によって求められ、タンパク質の量が標準的なウエスタンブロット解析(例えば、本明細書において記載する解析や、例えばAusubel et al. (Current Protocols in Molecular Biology(分子生物学における最新プロトコル), John Wiley & Sons, New York, July 11, 2013, 参照によりその全体が本明細書に組み込まれる)で記述された解析)によって求められる。一態様では、タンパク質の量は、標準的な方法を用いて酵素活性の量を測定することにより求められる。他の好ましい態様では、mRNA、タンパク質、または酵素活性の量は、タンパク質の機能型を発現していない対照細胞(例えば、ノンセンス変異の場合ホモ接合である細胞等)のそれらの量より多いが、20倍、10倍、5倍、または2倍以下である。さらに他の態様において、mRNA、タンパク質、または酵素活性の量は、対照細胞(例えば、非癌細胞、異常細胞増殖を誘発する条件、またはアポトーシスを阻害する条件にさらされなかった細胞、目的の病気または疾患を有しない対象者由来の細胞等)の基礎量より多いが、20倍、10倍、5倍、または2倍以下である。

0159

「mRNAまたはタンパク質の発現または活性を調節するのに十分な投与量」は、対象者に投与するとmRNAまたはタンパク質の発現または活性が増加あるいは低減する治療法の量を指す。いくつかの態様では、発現または活性を低減させる化合物の場合、調節は、治療を受けた対象者において、阻害薬を投与される前の同じ対象者と比べて、あるいは治療を受けていない対照としての対象者と比べて少なくとも10%、30%、40%、50%、75%、または90%、発現または活性を低減させることである。また、いくつかの態様では、発現または活性を増加させる化合物の場合、治療を受けた対象者のmRNAまたはタンパク質の発現量または活性量は、調節薬を投与する前の同じ対象者あるいは治療を受けていない対照としての対象者の発現量または活性量に比べて1.5倍、2倍、3倍、5倍、10倍、または20倍多くなっている。

0160

いくつかの態様では、化合物はRNAまたはタンパク質の発現または活性を直接または間接に調節することがある。例えば、ある化合物は、目的mRNAまたはタンパク質の発現または活性に直接または間接に影響を及ぼす分子(例えば、核酸、タンパク質、シグナル伝達分子成長因子サイトカイン、またはケモカイン)の発現または活性を調節することで目的のmRNAまたはタンパク質の発現または活性を間接的に調節することがある。いくつかの態様では、前記化合物は、細胞分裂を阻害する、あるいはアポトーシスを誘発する。前記治療法におけるこれらの化合物の例としては、非精製タンパク質または精製タンパク質、抗体、合成有機分子、天然有機分子、核酸分子、およびこれらの成分等が挙げられる。併用療法においてこれらの化合物は同時または順次に投与されてもよい。これらの化合物としては、例えば、シグナル伝達抑制分子が挙げられる。

0161

「精製」は、天然に伴っている他の成分から分離することを指す。通常、ある因子の少なくとも50重量%が天然の状態で関連づけられたタンパク質、抗体、および天然有機分子を含まなければ、その因子は実質的に純粋である。いくつかの態様では、前記因子は少なくとも75重量%、90重量%、または99重量%純粋である。実質的に純粋な因子は、化学合成、天然源からのその因子の分離、または天然にはその因子を生成しない組み換え宿主細胞におけるその因子の生成によって得られることがある。タンパク質および小分子は、例えば、Ausubel et al.(Current Protocols in Molecular Biology, John Wiley & Sons, New York, July 11, 2013, 参照によりその全体が本明細書に組み込まれる)に記載された標準的な技術を用いて当業者によって精製されることがある。いくつかの態様では、ポリアクリルアミドゲル電気泳動法カラムクロマトグラフィー光学濃度HPLC分析、またはウエスタン分析(Ausubel et al., supra)を用いた測定において前記因子は開始材料の少なくとも2倍、5倍、または10倍純粋である。精製の方法としては、例えば、免疫沈殿、カラムクロマトグラフィー(例えば、免疫親和性クロマトグラフィー)、磁性ビーズ免疫親和性精製、およびプレート結合抗体によるパニング等が挙げられる。

0162

本発明の他の特徴および利点は、以下の詳細な説明および請求項から明らかである。

0163

本特許すなわち出願書類は、少なくとも1つのカラー図面を含む。カラー図面付きの本特許あるいは特許出願公報の複製は、請求と必要手数料支払いががあれば特許より提供される。

0164

本明細書において開示される態様は、添付の図面を参照してさらに説明される。いくつかの図面で、同様の構造には同様の参照符号が付けられている。ここに示めす図面は必ずしも縮尺通りではなく、むしろ本明細書において開示される態様の原則の説明に強調が置かれている。

図面の簡単な説明

0165

SNP数の増加に対し、リード深度(DOR)が500、腫瘍分画が1%の検定統計量SをT(SNP数)で除した(「S/T」)異なるコピー数仮説に関する分布を示すグラフである。

0166

SNP数の増加に対し、DORが500、腫瘍分画が2%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。

0167

SNP数の増加に対し、DORが500、腫瘍分画が3%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。

0168

SNP数の増加に対し、DORが500、腫瘍分画が4%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。

0169

SNP数の増加に対し、DORが500、腫瘍分画が5%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。

0170

SNP数の増加に対し、DORが500、腫瘍分画が6%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。

0171

SNP数の増加に対し、DORが1000、腫瘍分画が0.5%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。

0172

SNP数の増加に対し、DORが1000、腫瘍分画が1%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。

0173

SNP数の増加に対し、DORが1000、腫瘍分画が2%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。

0174

SNP数の増加に対し、DORが1000、腫瘍分画が3%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。

0175

SNP数の増加に対し、DORが1000、腫瘍分画が4%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。

0176

SNP数の増加に対し、DORが3000、腫瘍分画が0.5%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。

0177

SNP数の増加に対し、DORが3000、腫瘍分画が1%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。

0178

6種の微少欠失症候群を検出するための感度および特異性を示す表である。

0179

正倍数性をグラフ表示したものである。x軸は染色体に沿った個体の多型座位の直線位置を表し、y軸はアレルの総リード数(A+B)の分画としてアレルAのリード数を表す。母親の遺伝型および胎児の遺伝型は、プロットの右側に示されている。各プロットは母親の遺伝型に応じて色づけされている。例えば、赤色は母親の遺伝型AA、青色は母親の遺伝型BB、緑色は母親の遺伝型ABを表す。図15Aは、2本の染色体が存在し、胎児の無細胞DNA分画が0%であるときのプロットである。このプロットは、妊娠していない女性由来のものであり、よってその遺伝型はすべて母親のものであるパターンを表す。したがって、アレル群は1(AAのアレル)、0.5(ABのアレル)、および0(BBのアレル)に集中している。図15Bは、2本の染色体が存在し胎児の分画が12%であるときのプロットである。アレルAのリードの分画に含まれる胎児のアレルによって、アレルの点の位置がy軸に沿って上または下にシフトしている。図15Cは2本の染色体が存在し胎児の分画が26%である時のプロットである。このパターンには、2本の赤い周辺バンドと2本の青い周辺バンドを含み、3本の緑色の中のバンドが容易に見える。

0180

22q11.2欠失症候群をグラフ表示したものである。図16Aは、母親の22q11.2欠失の保有者についての図である(緑色のABのSNPがないことによって示されている)。図16Bは、親から受け継がれた胎児の22q11欠失についての図である(1本の赤い周辺バンドと1本の青い周辺バンドで示されている)。x軸はSNPの直線位置を表し、y軸は総リード数におけるアレルAのリードの分画を表す。各点は、単一のSNP座位を表す。

0181

母親から受け継がれた猫鳴き欠失症候群のグラフ表示である(3本の緑色のバンドの代わりに2本の中央の緑色のバンドの存在によって示されている)。x軸はSNPの直線位置を表し、y軸は総リード数におけるアレルAのリードの分画を表す。各点は、単一のSNP座位を表す。

0182

ウォルフ・ヒルシュホーン欠失症候群のグラフ表示である(1本の赤い周辺バンドと1本の青い周辺バンドによって示されている)。x軸はSNPの直線位置を表し、y軸は総リード数におけるアレルAのリードの分画を表す。各点は、単一のSNP座位を表す。

0183

染色体または染色体分節の余剰コピーを表す、X染色体スパイクイン(spike-in)実験のグラフ表示である。これらのプロットは、異なる量の父親由来のDNAを由来のDNAと混合したものを示しており、それぞれ、父親由来のDNAが16%(図19A)、10%(図19B)、1%(図19C)、および0.1%(図19D)である。x軸はX染色体にあるSNPの直線位置を表し、y軸は総リード数(M+R)におけるアレルMのリードの分画を表す。各点は、アレルMまたはRを有する単一のSNP座位を示す。
同上。
同上。
同上。

0184

ハプロタイプデータを用いた偽陰性率のグラフ(図20A)、およびハプロタイプデータを用いない偽陰性率のグラフ(図20B)である。

0185

ハプロタイプデータを用いたp=1%での偽陽性率のグラフ(図21A)、およびハプロタイプデータを用いないp=1%での偽陽性率のグラフ(図21B)である。

0186

ハプロタイプデータを用いたp=1.5%での偽陽性率のグラフ(図22A)、およびハプロタイプデータを用いないp=1.5%での偽陽性率のグラフ(図22B)である。

0187

ハプロタイプデータを用いたp=2%での偽陽性率のグラフ(図23A)、およびハプロタイプデータを用いないp=2%での偽陽性率のグラフ(図23B)である。

0188

ハプロタイプデータを用いたp=2.5%での偽陽性率のグラフ(図24A)、およびハプロタイプデータを用いないp=2.5%での偽陽性率のグラフ(図24B)である。

0189

ハプロタイプデータを用いたp=3%での偽陽性率のグラフ(図25A)、およびハプロタイプデータを用いないp=3%での偽陽性率のグラフ(図25B)である。

0190

第一のシミュレーション用の偽陽性率表である。

0191

第一のシミュレーション用の偽陰性率表である。

0192

図28Aは、正常な(非癌性細胞株について、その座位の総数で除した基準数(1つのアレル(例えば、アレル「A」)の数)のグラフである。図28Bは、欠失を有する癌細胞株について、総数で除した基準数のグラフである。図28Cは、上記正常細胞株と癌細胞株に由来するDNAの混合物について、基準計数総計数で除したグラフである。

0193

腫瘍分画が4.33%と推定された(DNAの4.33%が腫瘍細胞である)段階IIaの乳癌の患者に由来する血漿試料について、基準計数を総計数で除したグラフである。このグラフの緑色の部分は、CNVが存在しない領域を表す。このグラフの青色部分および赤色部分は、CNVが存在し、かつ期待アレル比率0.5から測定アレル比率が明らかに分離している領域を表す。青色はあるハプロタイプを示し、赤色は他のハプロタイプを示す。CNVの領域では、約636個のヘテロ接合SNPが分析された。

0194

腫瘍分画が0.58%と推定された段階IIbの乳癌の患者に由来する血漿試料について、基準計数を総計数で除したグラフである。このグラフの緑色の部分は、CNVが存在しない領域を表す。このグラフの青色部分および赤色部分は、CNVが存在するが、測定アレル比率が期待アレル比率0.5からはっきりとは分離していない領域を示す。この分析では、CNVの領域で86個のヘテロ接合SNPが分析された。

0195

腫瘍分画の最尤推定を示すグラフである。最尤推定値はグラフのピークで示され、図31Aでは4.33%、図31Bでは0.58%である。

0196

図32Aは、高腫瘍分画試料(4.33%)および低腫瘍分画試料(0.58%)について、様々な起こりうる腫瘍分画の対数オッズ比を比較したグラフである。対数オッズ比が0未満の場合、正倍数体仮説が最も可能性が高い。対数オッズ比が0超の場合、CNVの存在が最も可能性が高い。図32Bは、低腫瘍分画試料(0.58%)について、様々な起こりうる腫瘍分画で欠失の確率を欠失がない確率で除したもののグラフである。

0197

低腫瘍分画試料(0.58%)について、様々な起こりうる腫瘍分画の対数オッズ比を示すグラフである。図33は、図32Aの低腫瘍分画試料のグラフを拡大したものである。

0198

実施例6に記載する3つの異なる方法を用いた腫瘍生検材料中の一塩基多様体の検出限界を示すグラフである。

0199

実施例6に記載する3つの異なる方法を用いた血漿試料中の一塩基多様体の検出限界を示すグラフである。

0200

CNVを検出するように設計された約28,000本のプライマーのライブラリーを用いてゲノムDNA(図36A)または単一の細胞に由来するDNA(図36B)を分析したグラフである。中央に存在する1本ではなく2本のバンドがCNVの存在を示している。x軸はSNPの直線位置を表し、y軸は総リード数におけるアレルAのリードの分画を表す。

0201

CNVを検出するように設計された約3,000本のプライマーのライブラリーを用いてゲノムDNA(図37A)または単一の細胞に由来するDNA(図37B)を分析したグラフである。中央に存在する1本ではなく2本のバンドがCNVの存在を示している。x軸はSNPの直線位置を表し、y軸は総リード数におけるアレルAのリードの分画を表す。

0202

約3,000座位のDORにおける均一性を示すグラフである。

0203

ゲノムDNAおよび単一の細胞に由来するDNAについて、誤り呼び出しの評価基準を比較した表である。

0204

転移型変異および転換型変異の誤り率を示すグラフである。

0205

PlasmArtで決定したCoNVERGeの感度を示すグラフである。(a)は、22q11.2欠失および一致型正常細胞株に由来するDNAを含むPlasmArt試料のCoNVERGeで算出された平均アレル不均衡率(AAI)と実際の入力分画との相関関係である。(b)は、0〜9.09%の腫瘍DNA分画を含む、染色体2pおよび2qのCNVおよび一致型正常HCC2218BL細胞を含むHCC2218乳癌細胞に由来するDNAを含むPlasmArt試料の算出されたAAIと実際の腫瘍DNA入力との相関関係である。(c)は、0〜5.66%の腫瘍DNA分画を含む、染色体1pおよび1qのCNVおよび一致型正常HCC1954BL細胞を含むHCC1954乳癌細胞に由来するDNAを含むPlasmArt試料の算出されたAAIと実際の腫瘍DNA入力の相関関係である。(d)は、(c)で用いたHCC1954細胞のアレル頻度のプロットである。(a)、(b)、および(c)では、データ点および誤差範囲エラーバー)は、それぞれ3〜8個の反復の平均値および標準偏差(SD)を示す。

0206

PlasmArt基準に関する詳細の一例を示しており、下部には断片の寸法分布を示すグラフを含む。

0207

左は、微少欠失および癌パネル妥当性のためのPlasmArt合成ctDNA標準試料から得た結果の希釈曲線である。右のパネルは、オッズ比のプロットとして、DNA分画の腫瘍の最尤推定を示す。
図43Bは、転換事象が検出されたプロットである。図43Cは、転移事象が検出されたプロットである。

0208

ctDNAの%が異なる様々な試料について、異なる染色体領域のCNVを示すプロットである。

0209

ctDNA量(%)が異なる様々な卵巣癌試料について、異なる染色体領域のCNVを示すプロットである。

0210

ctDNA中のSNV、またはSNVおよび/またはCNVの組み合わせを有する乳癌または肺癌の患者のパーセントを示す表である。

0211

異なる段階の乳癌における、血漿試料中に含まれる腫瘍に特異的なSNVおよび/またはCNV(%)を示すグラフと、その右側のデータ関連表である。

0212

異なる下位段階の乳癌における、血漿試料中に含まれる腫瘍に特異的なSNVおよび/またはCNV(%)を示すグラフと、その右側のデータ関連表である。

0213

異なる段階の肺癌における、血漿試料中に含まれる腫瘍に特異的なSNVおよび/またはCNV(%)を示すグラフと、その右側のデータ関連表である。

0214

異なる下位段階の肺癌における、血漿試料中に含まれる腫瘍に特異的なSNVおよび/またはCNV(%)を示すグラフと、その右側のデータ関連表である。

0215

腫瘍のクローンおよび準クローンの不均一性について分析された一次肺腫瘍組織学所見履歴を示す。
全ゲノムの配列決定およびAmpliSEQによるアッセイによる生検された肺腫瘍の多様性アレル頻度(VAF)の同一性を示す表である。

0216

血漿に由来するctDNAを用いて、腫瘍の不均一性を克服するための一塩基付加(SNA)変異のクローンおよび準クローンの両方の同定を示す。

0217

AmpliSeqで見逃されたが、血漿由来のctDNA中で同定されたSNV変異である一次腫瘍のSNVを検出するための、AmpliSeqおよびmmPCR−NGSによるVAF呼び出しを比較した表である。

0218

図54Aは、一次肺腫瘍におけるVAF(%)を示すプロットである。図54Bは、AmpliSeqによるVAFとNateraによるVAFを比較した直線回帰プロットである。

0219

プライマー濃度が限定された場合のSNVの84プレックスPCRプライマー反応のプール1/4のグラフである。

0220

プライマー濃度が限定された場合のSNVの84プレックスPCRプライマー反応のプール2/4のグラフである。

0221

プライマー濃度が限定された場合のSNVの84プレックスPCRプライマー反応のプール3/4グラフである。

0222

プライマー濃度が限定された場合のSNVの84プレックスPCRプライマー反応のプール4/4のグラフである。

0223

15PCRサイクルの84プレックスPCR反応においてSNV転移および転換変異を検出した場合の検出限界(LOD)とリード深度(DOR)のプロットである。

0224

20PCRサイクルの84プレックスPCR反応においてSNV転移および転換変異を検出した場合の検出限界(LOD)とリード深度(DOR)のプロットである。

0225

25PCRサイクルの84プレックスPCR反応においてSNV転移および転換変異を検出した場合の検出限界(LOD)とリード深度(DOR)のプロットである。

0226

腫瘍細胞のゲノムDNAと単一細胞のゲノムDNAの感度を比較したプロットである。上部は腫瘍細胞のゲノムDNAを示す。下部は単一細胞のゲノムDNAを示す。

0227

図63aのSNPを対象とした大多重PCR(mmPCR)アッセイにおける各種癌試料中のCNVの分析の作業フローを示す。図63b〜図63fは、乳癌細胞株と一致型正常細胞株についてCoNVERGeアッセイとマイクロアレイアッセイでの比較を示す。

0228

生の冷凍FF)乳癌試料およびホルマリン固定パラフィン埋め込み(FFPE)乳癌試料と一致型対照との比較を示す。図a〜hは、乳癌細胞株と一致型軟膜gDNA対照試料に対するCoNVERGeアッセイとマイクロアレイアッセイを比較したものである。

0229

CoNVERGeアッセイを用いて染色体コピー数を反映させて、単一細胞中のCNVを検出したアレル頻度のプロットである。図65a〜65cは乳癌単一細胞の3つの反復の分析である。図65dは、注目領域でのCNVがないBリンパ球細胞株の分析である。

0230

CoNVERGeアッセイを用いて染色体コピー数を反映させて、実際の血漿試料中のCNVを検出したアレル頻度のプロットである。図66aは、段階IIの乳癌の血漿無細胞DNA試料およびその一致型腫瘍生検材料gDNAである。図66bは、末期の卵巣癌の血漿無細胞DNA試料およびその一致型腫瘍生検材料gDNAである。図66cは、5つの末期の卵巣癌血漿および一致型組織試料におけるCNV検出により求められた腫瘍の不均一性を示す表である。

0231

乳癌の染色体位置および変異による変化を示す。
同上。
同上。
同上。

0232

3168mmPCR反応に用いられたSNPの多数アレル頻度(図68A)および少数アレル頻度(図68B)を示す。

0233

本発明の態様を行うのに有用なシステム設計X00の一例を示す。

0234

本発明の態様を行うためのコンピュータシステムの一例を示す。 記載したこれらの図面に態様が開示されているが、考察で述べたように、他の態様もまた企図されている。本開示は、典型として例示的な態様を示したものであり、限定ではない。当業者であれば、本明細書において開示される態様の原則の範囲と主旨を逸脱しない範囲で、多くの他の修正および態様を工夫することが可能である。

0235

一側面において、本発明は一般に、少なくとも特に染色体分節または完全な染色体の欠失または重複等のコピー数多様性の有無を決定する改良された方法に関する。前記方法は、小さい欠失または重複の検出に特に有用である。このような小さい欠失または重複は、関連する染色体分節から入手可能なデータ量が少ないために従来の方法を用いて高い特異性と感度で検出することが困難な可能性がある。前記方法は、改良された分析方法、改良されたバイオアッセイ方法、および改良された分析方法と改良されたバイオアッセイ方法の組み合わせを含む。本発明の方法はまた、検査される細胞または核酸分子に存在する百分率が小さい欠失または重複を検出するのに用いることができる。これにより、病気の発症前(例えば、前癌性段階等)あるいは病気の初期段階(例えば、多数の病気の細胞(例えば、癌細胞)に欠失または重複が蓄積する前等)に欠失または重複を検出することができる。病気または障害と関連づけられた欠失または重複をより正確検出することにより、その病気または障害の診断、予知、防止、遅延、安定化、または治療を行うための改良された方法を提供することができる。数種の欠失または重複は、癌あるいはいくつかの精神障害または身体障害と関連づけられることが知られている。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社堀場製作所の「 エクソソーム表面分子を特定する方法」が 公開されました。( 2020/10/29)

    【課題・解決手段】本発明はエクソソーム表面分子に対する結合性分子が固相化された担体をカゼイン溶液またはカゼイン分解物溶液でブロックおよび洗浄すること、ならびに該担体とエクソソームを含む被験試料の接触前... 詳細

  • 株式会社資生堂の「 レチノイドの副作用に対する感受性の決定方法」が 公開されました。( 2020/10/29)

    【課題・解決手段】SNP解析により遺伝要素に基づいて対象のレチノイドの副作用に対する感受性を決定する方法、レチノイドの副作用に対する感受性を決定するコンピュータ、及び当該コンピュータを制御するプログラ... 詳細

  • 公立大学法人福島県立医科大学の「 大腸がんの予後バイオマーカー」が 公開されました。( 2020/10/29)

    【課題・解決手段】大腸がん患者の予後を予測するための、及び/又は大腸がん患者に対する抗がん剤の有効性を判定するためのバイオマーカーを提供する。GALNT6タンパク質若しくはそのペプチド断片、又はGAL... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ