図面 (/)

技術 2型糖尿病のリスクを判定する方法

出願人 ジェネシスヘルスケア株式会社
発明者 宇田川ヨスバニ黄鶴佐藤バラン伊里
出願日 2019年4月16日 (1年10ヶ月経過) 出願番号 2019-077459
公開日 2020年10月29日 (3ヶ月経過) 公開番号 2020-174538
状態 特許登録済
技術分野 生物学的材料の調査,分析 突然変異または遺伝子工学 酵素、微生物を含む測定、試験
主要キーワード 負相関 判定モデル 併合後 ガウシアンカーネル 多層パーセプトロン 生活改善 回帰木 リスク判定
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2020年10月29日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (14)

課題

2型糖尿病リスクを判定する方法を提供すること。

解決手段

rs3925584、rs7579899、rs11552708、rs7571816、rs9298506、rs11746443、rs314253、rs12688220、rs5955543、及びrs1934179を少なくとも含む一塩基多型セットの遺伝子型情報に基づいて、2型糖尿病のリスクを判定する、方法。

概要

背景

疾患のリスクの判定に用いるために、一塩基多型(以下、「SNP」ともいう。)と疾患との関連性の特定が進められている。NCBI SNP Databaseは、ヒトのSNPをまとめたデータベースであり、SNPにrs番号を付して管理している。本明細書におけるrs番号も、このNCBI SNP Databaseにおける登録番号を意味するものとする。

本明細書においてrs番号で特定されるSNPと、当該SNPに関連する疾患、病態又は状態等として非特許文献等で開示されているものとの関係は、以下のとおりである。
rs3925584: 血液中マグネシウム濃度に関するSNP(非特許文献 1)
rs7579899:腎臓がんに関するSNP(非特許文献 2)
rs11552708: 血液中のIgM濃度に関するSNP(非特許文献 3)
rs7571816:身長に関するSNP(非特許文献 4)
rs9298506:脳動脈瘤に関するSNP(非特許文献 5)
rs11746443:腎臓結石尿路結石)に関するSNP(非特許文献 6)
rs314253:肝臓酵素ベル(ALP)に関するSNP(非特許文献 7)
rs12688220:膵炎に関するSNP(非特許文献 8)
rs5955543:腎芽細胞腫ウィルムス腫瘍)に関するSNP(非特許文献 9)
rs1934179:尿道下裂に関するSNP(非特許文献 10)

概要

2型糖尿病のリスクを判定する方法を提供すること。rs3925584、rs7579899、rs11552708、rs7571816、rs9298506、rs11746443、rs314253、rs12688220、rs5955543、及びrs1934179を少なくとも含む一塩基多型セットの遺伝子型情報に基づいて、2型糖尿病のリスクを判定する、方法。

目的

すなわち、本実施形態の方法において、本SNPセットを分析して本疾患のリスクを判定することで、高精度が高い、あるいは予測能力が高いリスクの判定方法を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

rs3925584、rs7579899、rs11552708、rs7571816、rs9298506、rs11746443、rs314253、rs12688220、rs5955543、及びrs1934179を少なくとも含む一塩基多型セットの遺伝子型情報に基づいて、2型糖尿病リスクを判定する、方法。

技術分野

0001

本発明は2型糖尿病リスクを判定する方法に関する。

背景技術

0002

疾患のリスクの判定に用いるために、一塩基多型(以下、「SNP」ともいう。)と疾患との関連性の特定が進められている。NCBI SNP Databaseは、ヒトのSNPをまとめたデータベースであり、SNPにrs番号を付して管理している。本明細書におけるrs番号も、このNCBI SNP Databaseにおける登録番号を意味するものとする。

0003

本明細書においてrs番号で特定されるSNPと、当該SNPに関連する疾患、病態又は状態等として非特許文献等で開示されているものとの関係は、以下のとおりである。
rs3925584: 血液中マグネシウム濃度に関するSNP(非特許文献 1)
rs7579899:腎臓がんに関するSNP(非特許文献 2)
rs11552708: 血液中のIgM濃度に関するSNP(非特許文献 3)
rs7571816:身長に関するSNP(非特許文献 4)
rs9298506:脳動脈瘤に関するSNP(非特許文献 5)
rs11746443:腎臓結石尿路結石)に関するSNP(非特許文献 6)
rs314253:肝臓酵素ベル(ALP)に関するSNP(非特許文献 7)
rs12688220:膵炎に関するSNP(非特許文献 8)
rs5955543:腎芽細胞腫ウィルムス腫瘍)に関するSNP(非特許文献 9)
rs1934179:尿道下裂に関するSNP(非特許文献 10)

先行技術

0004

Meyer TE, VerwoertGC, Hwang SJ, GlazerNL, Smith AV, van Rooij FJ, et al. Genome-wide association studies of serum magnesium, potassium, and sodium concentrations identify six Loci influencing serum magnesium levels.PLoS Genet. 2010;6: e1001045.
Purdue MP, Johansson M, Zelenika D, Toro JR, Scelo G, MooreLE, et al. Genome-wide association study of renal cell carcinoma identifies two susceptibility loci on 2p21 and 11q13.3. Nat. Genet. 2011;43: 60-5.
Yang M, Wu Y, Lu Y, Liu C, Sun J, Liao M, et al. Genome-wide scan identifies variant in TNFSF13 associated with serumIgMin a healthy Chinese male population. PLoS ONE 2012;7: e47990.
Okada Y, Kamatani Y, Takahashi A, Matsuda K, Hosono N, Ohmiya H, et al. A genome-wide association study in 19 633 Japanese subjects identifiedLHX3-QSOX2 and IGF1 as adult height loci. Hum. Mol. Genet. 2010;19: 2303-12.
Yasuno K, Bilguvar K, Bijlenga P, LowSK, Krischek B, Auburger G, et al. Genome-wide association study of intracranial aneurysm identifies three new risk loci. Nat. Genet. 2010;42: 420-5.
Urabe Y, Tanikawa C, Takahashi A, Okada Y, Morizono T, Tsunoda T, et al. A genome-wide association study of nephrolithiasis in the Japanese population identifies novel susceptible Loci at 5q35.3, 7p14.3, and 13q14.1. PLoS Genet. 2012;8: e1002541.
Chambers JC, Zhang W, Sehmi J, Li X, Wass MN, Van der Harst P, et al. Genome-wide association study identifies loci influencing concentrations of liver enzymes in plasma. Nat. Genet. 2011;43: 1131-8.
Whitcomb DC, LaRusch J, Krasinskas AM, Klei L, Smith JP, Brand RE, et al. Common genetic variants in the CLDN2 and PRSS1-PRSS2 loci alter risk for alcohol-related and sporadic pancreatitis. Nat. Genet. 2012;44: 1349-54.
Turnbull C, PerdeauxER, Pernet D, Naranjo A, Renwick A, Seal S, et al. A genome-wide association study identifies susceptibility loci for Wilms tumor. Nat. Genet. 2012;44: 681-4.
van der ZandenLF, van Rooij IA, Feitz WF, Knight J, Donders AR, Renkema KY, et al. Common variants in DGKK are strongly associated with risk of hypospadias. Nat. Genet. 2011;43: 48-50.

発明が解決しようとする課題

0005

本発明は、2型糖尿病(以下、「本疾患」ともいう。)のリスクを判定する方法を提供することを課題とする。

課題を解決するための手段

0006

本発明者らは上記課題を解決するために鋭意検討した。その結果、これまで一見すると本疾患との関連性がないと認められる個々の一塩基多型を、一つのまとまったセットとしてみたときに、本疾患との関連性があることを見出した。そして、その関連性を用いることで、本疾患のリスクを判定する本発明を完成するに至った。

0007

すなわち、本発明の方法では、本疾患との関連性を見出した、rs3925584、rs7579899、rs11552708、rs7571816、rs9298506、rs11746443、rs314253、rs12688220、rs5955543、及びrs1934179を少なくとも含む一塩基多型セット(以下、「本SNPセット」ともいう。)の遺伝子型情報に基づいて、本疾患のリスクを判定する。

0008

本発明の方法においては、「一塩基多型セット」とは、複数の一塩基多型の一つのまとまったセットを意味し、この一つのセットにより本疾患との関連性が見出されている。

0009

また、本発明の方法における「遺伝子型情報」とは、一塩基多型における2つのホモ接合型(AA,BB)と、ヘテロ接合型(AB)に分類して示される、一塩基多型の遺伝子型(Genotype)の情報を意味し、「本SNPセットの遺伝子型情報」とは、本SNPセットにおいて特定される各一塩基多型の遺伝子型情報を一まとまりとしたセットを意味し、言い換えれば、各rs番号で示される塩基配列中の各SNPの多型となる塩基に関する情報のセットである。本SNPセットの遺伝子型情報は、図1において示すとおりである。

発明の効果

0010

本発明によれば、本疾患のリスクを判定することができる。

図面の簡単な説明

0011

本SNPセットの遺伝子型情報を示す。
本SNPセットの遺伝子型情報にSNP毎の接合型対応付ける値の関係を示した変換テーブルの一例を示す。
本SNPセットを用いたモデルROC曲線とAUCを示す。また、N個のSNPを含む本SNPセットから1つのSNPを任意に抜いたN−1個のSNPを含むSNPセットを、「比較SNPセット」ともいい、各比較SNPセットを表す場合には、比較SNPセット1、比較SNPセット2と、記載する。
比較SNPセット1を用いたモデルのROC曲線とAUCを示す。
比較SNPセット2を用いたモデルのROC曲線とAUCを示す。
比較SNPセット3を用いたモデルのROC曲線とAUCを示す。
比較SNPセット4を用いたモデルのROC曲線とAUCを示す。
比較SNPセット5を用いたモデルのROC曲線とAUCを示す。
比較SNPセット6を用いたモデルのROC曲線とAUCを示す。
比較SNPセット7を用いたモデルのROC曲線とAUCを示す。
比較SNPセット8を用いたモデルのROC曲線とAUCを示す。
比較SNPセット9を用いたモデルのROC曲線とAUCを示す。
比較SNPセット10を用いたモデルのROC曲線とAUCを示す。

0012

本発明の実施の形態について説明する。以下の実施形態は、本発明を説明するための例示であり、本発明をこの実施形態にのみ限定する趣旨ではない。本発明は、その要旨を逸脱しない限り、様々な形態で実施することができる。

0013

本実施形態において、2型糖尿病(以前はインスリン非依存性糖尿病あるいは成人型糖尿病と呼ばれていたものを含む。)は、インスリン分泌低下とインスリン感受性の低下が主体となる糖尿病である。この両因子関与の程度は症例によって異なっており、インスリン分泌低下を主体とするものと、インスリン抵抗性が主体で、それにインスリンの相対的不足を伴うものなどがある。

0014

また、本実施形態において、本疾患は、一般には、本疾患に関するする医学会の公表するガイドラインに沿って診断される疾患、医療用医薬品添付文書において、効能・効果の欄に記載される疾患、あるいは、医薬医療業界において汎用される用語として理解される疾患の少なくともいずれかを意味するものと解することができる。

0015

本実施形態の方法においては、一見すると本疾患との関連性がないと認められる所定数の一塩基多型セットを用いて、本疾患のリスクを判定する。

0016

本疾患のリスクとは、本疾患の罹りやすさや罹りにくさなどの本疾患に罹る可能性をいう。「リスクを判定する」とは、例えば、現在または将来において本疾患に罹る可能性をいくつかのレベルに分けて出力することや、数値により出力することを含む。本疾患のリスクの判定には、疾患に罹りやすい傾向にあるのか、罹りにくい傾向にあるのかといった、疾患に対する遺伝的要因あるいは遺伝的感受性についての評価が含まれる。

0017

なお、本疾患のリスクを判定するにあたっては、本疾患のリスクの判定を受ける対象者が、本疾患のリスクの判定時において、実際に本疾患に罹患しているか(発症しているか)否かは問わない。

0018

本実施形態の方法では、本SNPセットで特定される各SNPの遺伝子型を2つのホモ接合型(AA,BB)と、ヘテロ接合型(AB)に分類した遺伝子型のセットである、本SNPセットの遺伝子型情報を用いる。そして、本SNPセットの遺伝子型情報に基づいて、対象者の本疾患のリスクを判定する。

0019

本実施形態の方法で用いる本SNPセットは、本疾患との関連性が従来認められていなかったSNPを含むセットである。すなわち、通常は、本SNPセットに含まれるSNPを個別に分析したとしても、本疾患のリスクを判定することはできない。しかしながら、本実施形態の方法では、本SNPセットに含まれる各SNPの遺伝子型情報を一まとまりのセットとして分析することにより、本疾患のリスクを判定することができる。また、本SNPセットを分析した場合と、比較SNPセットを分析した場合とを比較すると、本SNPセットを分析した場合の方が統計的に有意な結果が得られている。すなわち、本実施形態の方法において、本SNPセットを分析して本疾患のリスクを判定することで、高精度が高い、あるいは予測能力が高いリスクの判定方法を提供することができる。

0020

以下、本SNPセットに含まれる各SNPに関連して、rs番号と、各SNPが存在する染色体番号(性染色体の場合には、XかYで示す)と、各SNPの染色体上の位置と、rs番号に対応する塩基配列と、を列記する。なお、各rs番号で示される塩基配列中において、SNPは[]で囲って示す。例えば、[A/G]と表記した場合には、その塩基配列の位置においてA又はGの一塩基多型があることを示す。また、各SNPに関する塩基配列や疾患などの情報は、例えば、rs番号に基づいてNCBI SNP Databaseを検索することで得られる。それらの情報は当該Databaseにより参照可能であり、また、本明細書で援用する。なお、以下に記す染色体上の位置は、assembly genomeのバージョンGRCh37に対応するものである。

0021

rs3925584
染色体番号 11
染色体上の位置 30760335
塩基配列TCCCGGAATTTAAGTTTTGAGTTAC[A/G]CAGAGGAAGTAGAACTTTGTAGTCA(配列番号1)

0022

rs7579899
染色体番号 2
染色体上の位置 46537604
塩基配列AACTGTCATTGCACACCCTGTACA[A/G]AGCACTGCGACCAAGCTGTTCCTTG(配列番号2)

0023

rs11552708
染色体番号 17
染色体上の位置 7462555
塩基配列CAGGAGAGAGGTGAGCCGGCTGCAG[A/G]GGACAGGAGGCCCCTCCCAGAATGG(配列番号3)

0024

rs7571816
染色体番号 2
染色体上の位置 233077064
塩基配列TGTAATGCTTAGACACAATTGCTTC[A/G]TTTGTTTTGTCCATTTTCATAGTTG(配列番号4)

0025

rs9298506
染色体番号 8
染色体上の位置 55437524
塩基配列GTTTTCCTCAGACAGGACCTTGTCA[A/G]CGCTTTCAAATATGTAGGCTGTTTG(配列番号5)

0026

rs11746443
染色体番号 5
染色体上の位置 176798306
塩基配列ACAGCTGTGGCCCAGGAGGAAGGGG[A/G]TCCAGGTGGGAGGCAAACACTAACT(配列番号6)

0027

rs314253
染色体番号 17
染色体上の位置 7091650
塩基配列AGTTGAGAGTTTCATGCAAAAGACC[A/G]ACCCAGGGGTAGTGATTCTGTGGAT(配列番号7)

0028

rs12688220
染色体番号 X
染色体上の位置 106244767
塩基配列ATGTCCTTTGAGCATCATTTTTTAC[T/C]CCCATTGGGTGCTTTACATTTGTCT(配列番号8)

0029

rs5955543
染色体番号 X
染色体上の位置 17698397
塩基配列GGCTGATTATCCCCATGGGAGGAAG[A/G]GGCTGCTGAGGGAAGTGCATGGGCC(配列番号9)

0030

rs1934179
染色体番号 X
染色体上の位置 50182184
塩基配列TGTATTTCTTCCAATAGTGACTGGC[T/C]TTTAGGAGCCAATTGATAGAAAAAT(配列番号10)

0031

本実施形態の方法において、本SNPセットを構成する各SNPはrs番号により特定される塩基配列を参照することによって特定可能であるが、本明細書において記載するrs番号が他のrs番号と併合され、新たなrs番号が付与された場合には、本明細書において該当するrs番号は、併合後のrs番号及び併合される他のrs番号をも意味する。また、本明細書において記載するrs番号が複数のrs番号の併合により付与された番号である場合には、本明細書において該当するrs番号は、その他の元となるrs番号をも意味する。

0032

また、SNPに関する各rs番号で示される上記塩基配列は、特定の塩基配列として示しているが、人種相違等によって、当該塩基配列において該当するSNP以外の部分における塩基配列は変更されてもよい。

0033

本実施形態の方法は、いずれの人種の被検者に対しても用いることができるが、特に、アジア人に好適に用いることができる。アジア人の中でも日本人等の東アジア人の被検者により好適に用いることができる。また、本実施形態の方法は、いずれの性別の被検者に対しても用いてもよい。

0034

以下、本SNPセットの遺伝子型情報を分析することにより本疾患のリスクを判定する方法の一態様について説明する。但し、判定方法は、以下に限定されない。

0035

はじめに、対象者の試料を用いて、試料中の本SNPセットに含まれる各SNPの遺伝子型を特定する。SNPの検出に用いる試料としては、染色体DNAを含む試料であれば特に制限されない。このような試料としては、例えば、唾液、血液、尿等の体液サンプル口腔粘膜などの細胞サンプル毛髪等の体毛などが挙げられる。SNPの検出には、これらの試料から常法により単離した染色体DNAを直接使用してもよいし、単離した染色体DNAを増幅して、増幅後の染色体DNAを使用してもよい。

0036

SNPの検出は、通常の遺伝子多型解析方法によって行うことができる。例えば、DNAチップ法(DNAマイクロアレイ)、サンガー法を用いた従来型シーケンサーや次世代シーケンサー(NGS;Next Generation Sequencer)などを用いたシーケンス解析PCR(Polymerase Chain Reaction)、ハイブリダイゼーションインベーダー法などが挙げられるが、これらに限定されない。

0037

DNAチップ法では、SNP部位を含む多数のDNA断片プローブ)を基板上に配置したDNAチップを用い、染色体DNAをチップ上のプローブとハイブリダイズさせて、結合部位蛍光又は電流により検出することにより、染色体DNAの配列を解析する。SNP解析に用いられるDNAチップとしては、SNP部位を含む塩基配列を検出可能なオリゴヌクレオチドプローブが配置されたチップが挙げられる。

0038

また、シーケンス解析は通常のサンガー法により行うことができる。例えば、多型を示す塩基の5'側の数十塩基の位置に設定したプライマーを使用してシーケンス反応を行い、その解析結果から、該当する位置がどの種類の塩基であるかを決定することができる。なお、シーケンス反応の前に、あらかじめSNP部位を含む断片をPCRなどによって増幅しておくことが好ましい。効率の観点からはNGS技術を使用してもよい。

0039

また、SNPの検出は、例えば従来のPCRによる増幅の有無を調べることによって行うことができる。例えば、多型を示す塩基を含む領域に対応する配列を有し、かつ、3'末端が各多型に対応するプライマーをそれぞれ用意する。それぞれのプライマーを使用してPCRを行い、増幅産物の有無によってどのタイプの多型であるかを決定することができる。また、LAMP法(Loop−Mediated Isothermal Amplification;特許第3313358号明細書)、NASBA法(Nucleic Acid Sequence−Based Amplification;特許2843586号明細書)、ICAN法(Isothermal and Chimeric primer−initiated Amplification of Nucleic acids;特許第3433929号公報)などによって増幅の有無を調べることもできる。その他、単鎖増幅法やNGSを用いた解析法を用いてもよい。

0040

また、SNP部位を含むDNA断片を増幅し、増幅産物の電気泳動における移動度の違いによってどのタイプの多型であるかを決定することもできる。このような方法としては、例えば、PCR−SSCP(single−strand conformation polymorphism)法(Genomics. 1992 Jan 1;12(1):139−146.)などが挙げられる。具体的には、まず、目的のSNPを含むDNAを増幅し、増幅したDNAを一本鎖DNA解離させる。次いで、解離させた一本鎖DNAを非変性ゲル上で分離し、分離した一本鎖DNAのゲル上での移動度の違いによってどのタイプの多型であるかを決定することができる。

0041

さらに、多型を示す塩基が制限酵素認識配列に含まれる場合は、制限酵素による切断の有無によって解析することもできる(RFLP(Restriction Fragment Length Polymorphism)法)。この場合、まず、DNA試料を制限酵素により切断する。次いで、DNA断片を分離し、検出されたDNA断片の大きさによってどのタイプの多型であるかを決定することができる。

0042

また、ハイブリダイゼーションの有無を調べることによって多型の種類を解析することも可能である。すなわち、各塩基に対応するプローブを用意し、いずれのプローブにハイブリダイズするかを調べることによってSNPがいずれの塩基であるかを調べることもできる。

0043

このようにして、本SNPセットの各SNPに関して、対象者の遺伝子型データを決定することができる。なおここで、「対象者の遺伝子型データ」とは、対象者の有する遺伝子型情報をいう。

0044

次いで、本SNPセットの遺伝子型情報に基づいて、本疾患のリスクを判定する。リスクの判定には、任意のモデルを用いることができる。モデルとしては、特に制限されないが、例えば、本SNPセットの遺伝子型情報を用いて、対象者の遺伝子型データから算出される特徴量を入力とし、本疾患のリスクを出力とするロジスティック回帰モデルを用いることができる。当該ロジスティック回帰モデルは、予め、本疾患に罹患したヒトの遺伝子型データと、本疾患に罹患していないヒトの遺伝子型データと、を学習データとして用いてパラメータ機械学習している。

0045

また、疾患のリスクを判定するモデルとしては、ロジスティック回帰モデルに代えて、多層パーセプトロンCNN(Convolutional Neural Network)及びRNN(Recurrent Neural Network)などのニューラルネットワークガウシアンカーネル等の任意のカーネル関数を用いるサポートベクターマシーン回帰木としてモデル化したランダムフォレスト重回帰分析隠れマルコフモデルなどを利用したモデル、統計モデル確率モデルなど種々の他のモデルを採用することもできる。また、種々のモデルを組み合わせて総合的な判定を行うモデルを採用することもできる。

0046

次いで、モデルを用いた本疾患のリスク判定の一例について説明する。まず、本疾患のリスクの判定をする対象者の遺伝子型データを、モデルに入力可能な特徴量に変換する。本実施形態の方法における特徴量は、例えば、本SNPセットの各SNPについて、対象者の遺伝子型データがホモ接合型(AA)、ホモ接合型(BB)、又はヘテロ接合型(AB)のいずれであるかを示すパラメータである。遺伝子型は、相同染色体のSNPが共にG(グアニン)であることを示す“GG”や、一方がG(グアニン)で、他方がA(アデニン)であることを示す“AG”などヌクレオチドにより表記されることが一般的であるため、対象者の遺伝子型データを、本SNPセットの遺伝子型情報を用いるモデルに入力可能なパラメータに変換する。しかし、モデルが、このようなパラメータへの変換の必要がないものである場合には、上記変換は必要とされない。

0047

対象者の遺伝子型データの特徴量への変換は、例えば、本SNPセットに含まれるSNP1つ1つに関して、対象者の遺伝子型データに値を付すことにより行うことができる。例えば、各SNPについて、対象者の遺伝子型データがホモ接合型(AA)、ホモ接合型(BB)、又はヘテロ接合型(AB)のいずれに該当するのかに応じて、そのSNPに値(例えば、0又は1)を対応づける。これにより、対象者の遺伝子型データを特徴量に変換することができる。なお、以下では、各SNPに対応させる値を0又は1とした場合を例に説明するが、SNPに対応させる値は0又は1の2つの値に限られるものではない。

0048

接合型に対応づける値はSNPごとに決めることができる。例えば、あるSNPは、対象者の遺伝子型データがホモ接合型(AA)である場合に値1を対応付け、ホモ接合型(BB)及びヘテロ接合型(AB)である場合に値0を対応付けるようにし、他のSNPは、対象者の遺伝子型データがヘテロ接合型(AB)である場合に値1を対応付け、ホモ接合型(AA)及びホモ接合型(BB)である場合に値0を対応付けるようにしてもよい。そのほか、対象者の遺伝子型データがヘテロ接合型(AB)及びホモ接合型(BB)である場合に値1を対応付け、ホモ接合型(AA)である場合に値0を対応付けるようにしてもよい。

0049

上記のように、対象者の遺伝子型データを特徴量に変換することができる。この特徴量への変換において対応付けに使用する値は、任意に決定することができる。例えば、上記非特許文献に基づいて、もともと各SNPが関連する疾患に関係の高い遺伝子型に対して値1を対応付けるようにし、かつ、各SNPが関連する疾患に関係の低い遺伝子型に対して値0を対応付けるようにすることができる。

0050

このような、SNPごとの接合型とその接合型に対応付ける値の関係は、図1のような本SNPセットの遺伝子型情報をもとに、例えば、図2のような変換テーブルとして表すこともできる。図2の変換テーブルでは、網掛けをした遺伝子型と一致する場合にはそのSNPに対応付ける値を1とし、一致しない場合には対応付ける値を0とする。なお、図1及び2の具体的な遺伝子型の表記において、Aはアデニン、Gはグアニン、Cはシトシン、Tはチミンを示す。但し、特徴量の変換テーブルの形式は、図2に限定されるものではない。

0051

最後に、本SNPセットの遺伝子型情報に基づいて、対象者の本疾患のリスクを判定する。より具体的には、本SNPセットの遺伝子型情報に基づく変換テーブルを用いて、対象者の遺伝子型データを、モデルに入力可能に変換した特徴量として算出し、当該特徴量を所定の判定モデルに入力し、対象者の本疾患のリスクを判定することができる。

0052

判定モデルにおいて、特徴量には、本SNPセットのSNPごとに、本疾患のリスクと正の相関があることを表す重みづけや、本疾患のリスクと負の相関があることを表す重みづけをすることができる。例えば、rs3925584、rs7579899、rs11746443、及びrs12688220に対応付けた値(特徴量)ついては、本疾患のリスクと正の相関があることを表す重みづけを行い、rs11552708、rs7571816、rs9298506、rs314253、rs5955543、及びrs1934179に対応付けた値(特徴量)ついては、本疾患のリスクと負の相関があることを表す重みづけを行うことができる。

0053

例えば、特徴量に対して重みづけを行う場合には、rs3925584の遺伝子型がAG、rs7579899の遺伝子型がAA、rs11746443の遺伝子型がAG、及びrs12688220の遺伝子型がTTである場合に、本疾患のリスクと正の相関があることを表す重みづけを行い、rs11552708の遺伝子型がGG、rs7571816の遺伝子型がAA、rs9298506の遺伝子型がAG、rs314253の遺伝子型がAG、rs5955543の遺伝子型がAG、及びrs1934179の遺伝子型がTCである場合に、本疾患のリスクと負の相関があることを表す重みづけを行うことができる。また、特徴量として値0を対応付けた各SNPの遺伝子型の場合には、本疾患のリスクと相関がない或いは無視しうる程度に低いものと評価することができる。

0054

このような、本疾患のリスクとの相関を表す重みづけは、本疾患に罹患したヒトの遺伝子型データと、本疾患に罹患していないヒトの遺伝子型データと、を学習データとして用いてパラメータを機械学習することにより特定される。この際、あるモデルにおいて、あるSNPが本疾患のリスクと正の相関があることを表す重み付けがなされるとした場合、他のモデルにおいても同様にそのSNPは本疾患のリスクと正の相関があることを表す重み付けがなされることが通常である。すなわち、モデルの種類等によって、あるSNPにおいて本疾患のリスクとの相関関係が逆になるような事態は想定し難い。なお、重みづけの具体的な値はモデルによって異なり、特に制限されるものではない。

0055

ここで、本SNPセットのなかで本疾患のリスクと正の相関があることを表す重みづけを行うSNPのまとまりを「正相関SNPセット」といい、本疾患のリスクと負の相関があることを表す重みづけを行うSNPのまとまりを「負相関SNPセット」という。本SNPセットは、正相関SNPセットと負相関SNPセットとを含むものであり、このような本SNPセットの遺伝子型情報に基づくことにより、対象者の本疾患のリスクを、リスクが上昇する要因とリスクが低下する要因の両面を総合して判定することができる。

0056

上記のようにして得られる判定結果は、本疾患の専門医が本疾患を診断する際の補助としても用いられる。また、上記のようにして判定した本疾患のリスクと、対象者からのアンケート結果とに基づいて、本疾患のリスクの判定結果は補正されしてもよい。また、本疾患のリスクと、対象者からのアンケート結果とに基づいて、対象者に対して、生活改善に関するアドバイスを出力してもよい。

0057

本発明は、プライマーやプローブなどの検査試薬を提供することもできる。このようなプローブとしては、上記SNP部位を含み、ハイブリダイズの有無によってSNP部位の塩基の種類を判定できるプローブが挙げられる。また、プライマーとしては、上記SNP部位を増幅するためのPCRに用いることのできるプライマー、又は上記SNP部位をシーケンス解析するために用いることのできるプライマーが挙げられる。本実施形態の検査試薬はこれらのプライマーやプローブに加えて、PCR用のポリメラーゼバッファー、ハイブリダイゼーション用試薬などを含むものであってもよい。

0058

以下、本実施形態を実施例によりさらに具体的に説明する。但し、本実施形態はこれらの実施例に限定されない。

0059

本SNPセットと本疾患との関連性を、以下のように検証した。

0060

遺伝子解析サービス利用者7万3千人以上から、利用者の同意のもと、唾液試料と、各種疾患の罹患情報を収集した。罹患情報とは、例えば、本疾患に罹患している場合に1、罹患していない場合に0となる数値である。唾液試料から、利用者ごとの遺伝子型データを特定し、利用者の遺伝子型データと各種罹患情報とを対応付けたデータベースを構築した。このデータベースの中から、本疾患に罹患している被検者337名と、罹患していないコントロール337名との症例対照セットを構築した。

0061

次いで、被検者及びコントロールの本SNPセットの各SNPの遺伝子型を、2つのホモ接合型(AA,BB)と、ヘテロ接合型(AB)に分類した。そして、遺伝子型が図2に示す網掛けをした変換テーブルの遺伝子型と一致する場合には、xiの値を1とし、一致しない場合には0として、x1〜xNを以下の数式(1)で表されるロジスティック回帰モデルの説明変数とした。例えば、rs3925584の場合は、遺伝子型が“AG”であるときにx1の値を1とし、遺伝子型が“AA”又は“GG”であるときにはx1の値を0とした。なお、本実施例ではN=10である。また、以下の数式で表されるロジスティック回帰モデルの目的変数は、本疾患に罹患している確率を表す0から1の間の値p(罹患情報)とした。



α=0.1

0062

1.AUCによるモデルの検証
本SNPセットを用いた判定方法の精度について説明する。上記データベースから、テスト用に、利用者の遺伝子型情報と罹患情報とを対応付けたデータセットを作成した。データセットにおける各利用者の本SNPセットの各SNPの遺伝子型を、ホモ接合型(AA,BB)と、ヘテロ接合型(AB)に分類し、分類した各遺伝子型図2に示す網掛けをした遺伝子型と一致する場合には、xiの値を1と評価し、一致しない場合には0と評価して、x1〜xNを特徴量として算出した。

0063

利用者毎の本SNPセットに関する特徴量を上記ロジスティック回帰モデル(以下、「判定モデル」ともいう。)に入力し、各利用者が本疾患に罹患しているか否かを予測し、その偽陽性率真陽性率を算出し、ROC(Receiver Operating Characteristic)曲線とAUC(Area Under the Curve)をそれぞれ求めた。より具体的には、判定モデルについて5分割交差検証を行い、5つのROC曲線(ROC fold 1からROC fold 5)を求めて、その平均(Mean ROC)と標準偏差(±1std. dev.)を求めた。図3中の破線(Luck)は、本疾患に罹患しているか否かをランダムに出力する場合であり、予測能力が無いモデルのROC曲線に対応している。

0064

また、同様にして、本SNPセットから1つのSNPを除いた各比較SNPセットに対して、上記と同様にそれぞれロジスティック回帰モデル(以下、「比較判定モデル」ともいう。)を作成した。そして、各比較SNP関する特徴量を各比較判定モデルに入力し、各利用者が本疾患に罹患しているか否かを予測し、偽陽性率と真陽性率を算出し、ROC曲線とAUCをそれぞれ求めた。その結果を図4以降に示す。

0065

本SNPセットを用いて本疾患を判定した場合、AUCは0.79±0.03であり、ランダムな出力の場合(AUC=0.5)と比べて有意に高く、本SNPセットを用いる判定モデルの予測能力が高いことが確認できる。

0066

一方、各比較SNPセットを用いる比較判定モデルの場合、AUCは本SNPセットを用いる場合よりも低い。従って、各比較SNPセットを用いる比較判定モデルのAUCは、ランダムな出力の場合(AUC=0.5)よりも高いものの、本SNPセットを用いる判定モデルのAUC(0.79±0.03)よりも総じて低いことが確認できる。

0067

よって、本SNPセットに含まれるSNP全てを用いて判定することで、本SNPセットから1つのSNPを除いた各比較SNPセットを用いる場合よりも、本疾患に罹患しているか否かを高精度で予測できることが分かった。

0068

2.ウィルコクソン順位和検定による検証
本SNPセットを用いる判定モデルが、各比較SNPセットを用いる比較判定モデルよりも有意に優れたモデルであることを確かめるために、ノンパラメトリック検定一種であるウィルコクソンの順位和検定を行った。具体的には、本SNPセットを用いる判定モデルのAUCと、各比較SNPセットを用いる比較判定モデルのAUCとに差が無いという帰無仮説を設定し、有意水準を0.01としてウィルコクソンの順位和検定を行った。

0069

その結果、p値はいずれも3.96×10-18であり、帰無仮説が棄却されることが確認された。すなわち、本SNPセットを用いる判定モデルのAUCと、各比較SNPセットを用いる比較判定モデルのAUCとは、統計的に有意な差があり、本SNPセットを用いる判定モデルは、各比較SNPセットを用いる比較判定モデルよりも優れたモデルであるといえる。

実施例

0070

上記のとおり、本実施形態の方法は、本疾患に罹患しているか否かを予測する精度が、ランダムな予測の場合の精度よりも有意に高いという効果を有する。また、本実施形態の方法は、本SNPセットの遺伝子型情報に基づく本疾患の判定の結果と、比較SNPセットの遺伝子型情報に基づく本疾患の判定の結果との間に、有意な差があるという効果を有する。当該効果は、本SNPセットの遺伝子型情報と本疾患の間に、これまで見出されていなかった潜在的な相関性があることに基づくものであると考えられる。上記で例示したロジスティック回帰モデルやその他のモデルは、本SNPセットの遺伝子型情報を前提として、本疾患に罹患したヒトと本疾患に罹患していないヒトの遺伝子型に関するデータと罹患情報を学習データとして用いてパラメータを機械学習することなどにより得られるものである。すなわち、いずれのモデルも上記潜在的な相関性を表す一つの表現型に過ぎず、本実施形態の方法の実施において使用されるモデルの種類は特に限定されるものではない。

0071

本発明の方法は、医療やヘルスケアに関連する分野において、本疾患のリスクを判定し、その予防および/または治療に貢献するものである。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 国立大学法人東北大学の「 相同組換え修復活性の定量法」が 公開されました。( 2020/12/17)

    【課題・解決手段】細胞における相同組換え修復活性の測定方法は、部位特異的ヌクレアーゼにより、細胞内の標的ゲノムDNA領域の二本鎖を特定部位で切断すること、細胞にタグ配列を含むドナーベクターを導入し、相... 詳細

  • 長瀬産業株式会社の「 エルゴチオネインの製造方法」が 公開されました。( 2020/12/17)

    【課題・解決手段】安価かつ大量にエルゴチオネインを製造する方法および該方法に使用する細菌を提供する。エルゴチオネインもしくはその関連物質、またはこれらの混合物の製造方法であって、エルゴチオネイン生産能... 詳細

  • 神戸天然物化学株式会社の「 形質転換植物、およびその利用」が 公開されました。( 2020/12/17)

    【課題・解決手段】本発明の目的は、活性型VD3の前駆体である7−デヒドロコレステロールの産生量が増加した形質転換植物およびその利用技術を提供することである。異なる2種類の第1および第2の7−デヒドロコ... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ