図面 (/)

技術 表現型推定システム及び表現型推定プログラム

出願人 株式会社エムティーアイ株式会社スタージェン
発明者 鎌谷直之
出願日 2015年10月9日 (5年1ヶ月経過) 出願番号 2015-200797
公開日 2017年4月13日 (3年7ヶ月経過) 公開番号 2017-073052
状態 特許登録済
技術分野 特定用途計算機
主要キーワード 母平均 二分法 発症確率 部分区間 観察値 インタフェースデバイス インタフェースボード 推定対象
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2017年4月13日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (8)

課題

人や動植物等の遺伝型に基づいて表現型を精度よく推定すること。

解決手段

対象の疾患についての遺伝型Aaの遺伝型AAに対するオッズ比r1と、遺伝型aaの遺伝型Aaに対するオッズ比r2と、aアレル頻度pと、リスク母平均mの区間推定値とを用い、各遺伝型のリスクd1〜d3を求める。さらに、推定対象個人の遺伝型に対応するリスクの母平均mに対する比率相対リスクとして算定する。母平均mの区間内における個人の相対リスクの分布を評価し、その結果に応じて確実に相対リスクの高低判別できることを条件に相対リスクの高低を推定結果として出力する。そして、相対リスクの高低が不正確となる場合には、その旨を推定結果として出力する。

概要

背景

従来、人や動植物等のゲノム配列や遺伝子を解析する技術が開発されている(例えば特許文献1参照。)。かかるゲノム配列や遺伝子解析により形質に関連する座位における遺伝型等の情報が特定されれば、特定された一つの、あるいは複数の座位の遺伝型の情報によりどのような表現型が現れるかを推定可能になると期待されている。ここで形質とは、個体に関する、ゲノム配列や遺伝子以外の任意の属性であり、特定の病気のあるなし、身体的特徴検査結果など様々な対象を含む。表現型とは特定の形質に属する具体的な属性である。例えば、糖尿病が形質であり、「糖尿病である」「糖尿病でない」はそれぞれが形質に属する表現型である。これらは質的形質であるが、身長などは量的形質である。身長は形質であるが「身長176.3 cm」は表現型である。以下、一般に質的形質については主として、任意の特定の疾患について述べるが、必ずしもそれに限るわけではなく、例えば、眼の色、血液型などの疾患と関係が無い場合も含む。

例えば、特定の疾患について遺伝の影響があるならば、個人の特定の座位(一つであろうと複数であろうと)の遺伝型から発症リスクを計算して平均の発症率と比較し、発症のリスクが平均よりも高い、あるいは平均よりも低い、といった情報を提供することができる。ここで、ある形質に属する質的表現型が「ある疾患がある・ない」などの場合、「疾患がある」比率発現率という。また、母集団での発現率を母比率とよぶ。

また、疾患の発症や薬剤の効果や副作用などのような質的表現型に限らず、身長や検査値などの量的表現型についても遺伝型からの推定が期待される。このように、遺伝型から各種表現型を推定することができれば、疾患の予防や治療方針の決定、生活習慣の改善などに非常に有益である。

概要

人や動植物等の遺伝型に基づいて表現型を精度よく推定すること。対象の疾患についての遺伝型Aaの遺伝型AAに対するオッズ比r1と、遺伝型aaの遺伝型Aaに対するオッズ比r2と、aアレル頻度pと、リスクの母平均mの区間推定値とを用い、各遺伝型のリスクd1〜d3を求める。さらに、推定対象の個人の遺伝型に対応するリスクの母平均mに対する比率を相対リスクとして算定する。母平均mの区間内における個人の相対リスクの分布を評価し、その結果に応じて確実に相対リスクの高低判別できることを条件に相対リスクの高低を推定結果として出力する。そして、相対リスクの高低が不正確となる場合には、その旨を推定結果として出力する。

目的

例えば、特定の疾患について遺伝の影響があるならば、個人の特定の座位(一つであろうと複数であろうと)の遺伝型から発症のリスクを計算して平均の発症率と比較し、発症のリスクが平均よりも高い、あるいは平均よりも低い、といった情報を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

所定の質的表現型に影響を与える座位における各アレル比率または各遺伝型の比率と、前記質的表現型に関する遺伝型間のオッズ比と、前記質的表現型の母比率の区間推定値とを用い、前記遺伝型の各々について前記質的表現型の発現率算定する発現率算定手段と、対象となる遺伝型の入力を受け付ける対象遺伝型受付手段と、前記対象となる遺伝型について、前記発現率算定手段で算出された前記母比率の区間における前記質的表現型の発現率の分布を評価し、前記質的表現型の発現傾向を推定する推定手段と、前記推定手段による推定結果を出力する出力手段とを備えたことを特徴とする表現型推定システム

請求項2

前記推定手段は、前記対象となる遺伝型における前記質的表現型の発現率と前記質的表現型の母比率との大小関係が前記母比率の区間の範囲内で反転しないことを条件に、前記対象となる遺伝型における前記質的表現型の発現傾向を推定することを特徴とする請求項1に記載の表現型推定システム。

請求項3

前記所定の質的表現型に複数の座位が影響する場合に、前記発現率算定手段は、それぞれの座位の遺伝型の各々について前記質的表現型の発現率を算定し、前記対象遺伝型受付手段は、前記複数の座位における遺伝型の組合せを対象の遺伝型の組合せとして受け付け、前記推定手段は、前記対象となる遺伝型の組合せについて前記母比率の区間における前記質的表現型の発現率の分布を評価し、前記質的表現型の発現傾向を推定することを特徴とする請求項1又は2に記載の表現型推定システム。

請求項4

前記発現率算定手段は、前記遺伝型における特定のアレル頻度と、異なる遺伝型における前記質的表現型に関する遺伝型間のオッズ比と、前記質的表現型の母比率の区間推定値とを用い、前記遺伝型の各々について前記質的表現型の発現率を算定することを特徴とする請求項1〜3のいずれか一つに記載の表現型推定システム。

請求項5

量的表現型に影響を与える座位の数とアレルの効果の相加性の有無とに基づいて前記量的表現型を分類する分類手段と、対象となる遺伝型の入力を受け付ける対象遺伝型受付手段と、前記分類手段による分類結果を用い、前記対象となる遺伝型を含む場合の前記量的表現型の推定値の分布を評価し、該推定値の分布を母平均と比較して前記量的表現型の発現傾向を推定する推定手段と、前記推定手段による推定結果を出力する出力手段とを備えたことを特徴とする表現型推定システム。

請求項6

前記分類手段は、前記相加性がない場合に対応する第1の分類、前記座位が単独で前記相加性がある場合に対応する第2の分類、前記座位が複数で前記相加性がある場合に対応する第3の分類のいずれかに前記量的表現型を分類し、前記推定手段は、前記分類結果に応じて異なる演算処理を行って前記推定値の分布を評価することを特徴とする請求項5に記載の表現型推定システム。

請求項7

コンピュータに、対象となる遺伝型の入力を受け付ける対象遺伝型受付ステップと、所定の質的表現型に影響を与える座位における各アレルの比率または各遺伝型の比率と、前記質的表現型に関する遺伝型間のオッズ比と、前記質的表現型の母比率の区間推定値とを用い、前記遺伝型の各々について前記質的表現型の発現率を算定する発現率算定ステップと、前記対象となる遺伝型について、前記発現率算定ステップで算出された前記母比率の区間における前記質的表現型の発現率の分布を評価し、前記質的表現型の発現傾向を推定する推定ステップと、前記推定ステップによる推定結果を出力する出力ステップとを実行させることを特徴とする表現型推定プログラム

請求項8

コンピュータに、量的表現型に影響を与える座位の数とアレルの効果の相加性の有無とに基づいて前記量的表現型を分類する分類ステップと、対象となる遺伝型の入力を受け付ける対象遺伝型受付ステップと、前記分類ステップによる分類結果を用い、前記対象となる遺伝型を含む場合の前記量的表現型の推定値の分布を評価し、該推定値の分布を母平均と比較して前記量的表現型の発現傾向を推定する推定ステップと、前記推定ステップによる推定結果を出力する出力ステップとを実行させることを特徴とする表現型推定プログラム。

技術分野

0001

この発明は、人や動植物等の遺伝型に基づいて表現型推定する表現型推定システム及び表現型推定プログラムに関する。

背景技術

0002

従来、人や動植物等のゲノム配列や遺伝子を解析する技術が開発されている(例えば特許文献1参照。)。かかるゲノム配列や遺伝子解析により形質に関連する座位における遺伝型等の情報が特定されれば、特定された一つの、あるいは複数の座位の遺伝型の情報によりどのような表現型が現れるかを推定可能になると期待されている。ここで形質とは、個体に関する、ゲノム配列や遺伝子以外の任意の属性であり、特定の病気のあるなし、身体的特徴検査結果など様々な対象を含む。表現型とは特定の形質に属する具体的な属性である。例えば、糖尿病が形質であり、「糖尿病である」「糖尿病でない」はそれぞれが形質に属する表現型である。これらは質的形質であるが、身長などは量的形質である。身長は形質であるが「身長176.3 cm」は表現型である。以下、一般に質的形質については主として、任意の特定の疾患について述べるが、必ずしもそれに限るわけではなく、例えば、眼の色、血液型などの疾患と関係が無い場合も含む。

0003

例えば、特定の疾患について遺伝の影響があるならば、個人の特定の座位(一つであろうと複数であろうと)の遺伝型から発症リスクを計算して平均の発症率と比較し、発症のリスクが平均よりも高い、あるいは平均よりも低い、といった情報を提供することができる。ここで、ある形質に属する質的表現型が「ある疾患がある・ない」などの場合、「疾患がある」比率発現率という。また、母集団での発現率を母比率とよぶ。

0004

また、疾患の発症や薬剤の効果や副作用などのような質的表現型に限らず、身長や検査値などの量的表現型についても遺伝型からの推定が期待される。このように、遺伝型から各種表現型を推定することができれば、疾患の予防や治療方針の決定、生活習慣の改善などに非常に有益である。

先行技術

0005

特開2009−125009号公報

発明が解決しようとする課題

0006

しかしながら、従来の技術では、遺伝型から表現型を精度よく推定することは困難であった。質的表現型では、例えば上述のように「発症のリスクが平均よりも何倍高い、あるいは平均よりも何分の1低い」といった形で推定結果を得ることが望ましいが、平均のリスクを正確に知ること自体が困難なことも多く、実際は対象者のリスクが平均よりも高いにも関わらず誤って平均よりも低いと推定してしまう危険がある。このように、誤った推定結果を導くと、誤った対処により深刻な事態を引き起こしかねない。このため、特に健康管理医療においては、推定の精度を向上し、その信頼性を高めることが非常に重要な課題となっている。

0007

また、量的表現型については、形質が量的であることから、遺伝型がどの程度の影響を与えているかを判別することが困難であり、推定と結果の開示の手法自体が確立されていないのが実状である。このため、量的表現型に対する推定をいかにしておこなうかが課題となっている。

0008

なお、これらの課題は、人の遺伝型を健康管理や医療に利用する場合に限らず、例えば動植物の遺伝型から表現型を推定する場合にも同様に生ずる課題である。

0009

本発明は、上記従来技術の課題を解決するためになされたものであって、人や動植物等の遺伝型に基づいて表現型を精度よく推定する表現型推定システム及び表現型推定プログラムを提供することを目的とする。

課題を解決するための手段

0010

上述した課題を解決し、目的を達成するため、本発明は、所定の質的表現型に影響を与える座位における各アレルの比率または各遺伝型の比率と、前記質的表現型と遺伝型に関するオッズ比と、前記質的表現型の母比率の区間推定値とを用い、前記遺伝型の各々について、前記質的表現型の発現率を算定する発現率算定手段と、対象となる遺伝型の入力を受け付ける対象遺伝型受付手段と、前記対象となる遺伝型について前記発現率算定手段で算出された前記母比率の区間における前記質的表現型の発現率の分布を評価し、前記質的表現型の発現傾向を推定する推定手段と、前記推定手段による推定結果を出力する出力手段とを備えたことを特徴とする。

0011

また、本発明は、上記発明において、前記推定手段は、前記対象となる遺伝型における前記質的表現型の発現率と前記質的表現型の母比率との大小関係が前記母比率の区間の範囲内で反転しないことを条件に、前記対象となる遺伝型における前記質的表現型の発現傾向を推定することを特徴とする。

0012

また、本発明は、上記発明において、前記所定の質的表現型に複数の座位が影響する場合に、前記発現率算定手段は、それぞれの座位の遺伝型の各々について前記質的表現型の発現率を算定し、前記対象遺伝型受付手段は、前記複数の座位における遺伝型の組合せを対象の遺伝型の組合せとして受け付け、前記推定手段は、前記対象となる遺伝型の組合せについて前記母比率の区間における前記質的表現型の発現率の分布を評価し、前記質的表現型の発現傾向を推定することを特徴とする。

0013

また、本発明は、上記発明において、前記発現率算定手段は、前記遺伝型における特定のアレル頻度と、異なる遺伝型における前記質的表現型に関する遺伝型間のオッズ比と、前記質的表現型の母比率の区間推定値とを用い、前記遺伝型の各々について前記質的表現型の発現率を算定することを特徴とする。

0014

また、本発明は、量的表現型に影響を与える座位の数とアレルの効果の相加性の有無とに基づいて前記量的表現型を分類する分類手段と、対象となる遺伝型の入力を受け付ける対象遺伝型受付手段と、前記分類手段による分類結果を用い、前記対象となる遺伝型を含む場合の前記量的表現型の推定値の分布を評価し、該推定値の分布を母平均と比較して前記量的表現型の発現傾向を推定する推定手段と、前記推定手段による推定結果を出力する出力手段とを備えたことを特徴とする。

0015

また、本発明は、上記発明において、前記分類手段は、前記相加性がない場合に対応する第1の分類、前記座位が単独で前記相加性がある場合に対応する第2の分類、前記座位が複数で前記相加性がある場合に対応する第3の分類のいずれかに前記量的表現型を分類し、前記推定手段は、前記分類結果に応じて異なる演算処理を行って前記推定値の分布を評価することを特徴とする。

0016

また、本発明の表現型推定プログラムは、コンピュータに、対象となる遺伝型の入力を受け付ける対象遺伝型受付ステップと、所定の質的表現型に影響を与える座位における各アレルの比率または各遺伝型の比率と、前記質的表現型と遺伝型に関するオッズ比と、前記質的表現型の母比率の区間推定値とを用い、前記遺伝型の各々について前記質的表現型の発現率を算定する発現率算定ステップと、前記対象となる遺伝型について、前記発現率算定ステップで算出された前記母比率の区間における前記質的表現型の発現率の分布を評価し、前記質的表現型の発現傾向を推定する推定ステップと前記推定ステップによる推定結果を出力する出力ステップとを実行させることを特徴とする。

0017

また、本発明の表現型推定プログラムは、コンピュータに、量的表現型に影響を与える座位の数とアレルの効果の相加性の有無とに基づいて前記量的表現型を分類する分類ステップと、対象となる遺伝型の入力を受け付ける対象遺伝型受付ステップと、前記分類ステップによる分類結果を用い、前記対象となる遺伝型を含む場合の前記量的表現型の推定値の分布を評価し、該推定値の分布を母平均と比較して前記量的表現型の発現傾向を推定する推定ステップと、前記推定ステップによる推定結果を出力する出力ステップとを実行させることを特徴とする。

発明の効果

0018

本発明によれば、所定の質的表現型に影響を与える座位における各アレルまたは各遺伝型の比率と、前記質的表現型と遺伝型に関するオッズ比と、質的表現型の母比率の区間推定値とを用い、遺伝型の各々について質的表現型の発現率を算定し、対象となる遺伝型について、前記算出された母比率の区間における質的表現型の発現率の分布を評価することで質的表現型の発現傾向を推定し、推定結果を出力するよう構成したので、遺伝型に基づいて質的表現型を精度よく推定することができる。

0019

また、本発明によれば、量的表現型に影響を与える座位の数とアレルの効果の相加性の有無とに基づいて量的表現型を分類し、分類結果を用いて対象となる遺伝型を含む場合の量的表現型の推定値の分布を評価し、該推定値の分布を母平均と比較して量的表現型の発現傾向を推定し、推定結果を出力するよう構成したので、遺伝型に基づいて量的表現型を精度よく推定することができる。

図面の簡単な説明

0020

図1は、本実施例に係る質的表現型の推定についての説明である。
図2は、表現型推定システムのシステム構成を示す図である。
図3は、質的表現型推定部の処理手順を示すフローチャートである。
図4は、図3に示したリスク評価処理の処理手順を示すフローチャートである。
図5は、量的表現型推定部の処理手順を示すフローチャートである。
図6は、i座位の座位による効果の母平均からの偏位とアレル頻度の関係についての説明図である。この場合は単独座位の場合を考えるのでi=1としてよい。
図7は、表現型推定プログラムの実施例である。

0021

以下に、添付図面を参照して、本発明に係る表現型推定システム及び表現型推定プログラムの好適な実施例を詳細に説明する。

0022

図1は、本実施例に係る質的表現型の推定についての説明である。図1では、説明を簡明にするため、単独座位が疾患の発症に影響する場合を例に説明を行い、複数座位が影響する場合については後述する。

0023

まず、疾患の発症に影響する座位の2つのアレルをA,aとする。また、2つのアレルのうち、aを注目するアレルとする。この場合、遺伝型AA,Aa,aaの中に含まれるアレルaの数は、それぞれ0,1,2となる。

0024

本実施例に係る表現型推定システムは、対象の疾患についての遺伝型Aaの遺伝型AAに対するオッズ比r1と、遺伝型aaの遺伝型Aaに対するオッズ比r2と、aアレル頻度pと、リスク(疾患発症リスク)の母平均mとを入力として用いる。

0025

リスクの母平均mは、対象の疾患の有病率罹患率などから推定する。このリスクの母平均mを一意に特定することは困難なことも多いが、疫学調査メタ解析により、例えば95%信頼区間など、区間推定値として得ることは比較的容易である。そこで、表現型推定システムは、区間として推定されたリスクの母平均mを用いる。

0026

表現型推定システムは、r1、r2、p、mを用い、各遺伝型のリスクを求める。遺伝型リスクd1は、遺伝型AAである場合のリスク、すなわち発症確率である。同様に、遺伝型リスクd2は、遺伝型Aaである場合の発症確率であり、遺伝型リスクd3は、遺伝型aaである場合の発症確率である。なお、d1〜d3の算定処理については追って詳述する。

0027

さらに、表現型推定システムは、推定の対象とする個人の遺伝型について入力を受け付ける。そして、個人の遺伝型に対応する遺伝型リスクの母平均mに対する比率を相対リスク(疾患発症という表現型の発現率)として算定する。

0028

表現型推定システムは、相対リスクを母平均mの区間の範囲内においてそれぞれ算定し、相対リスクの母平均mに対する分布を示すグラフを生成する。図1に示したグラフは、横軸が母平均mの区間であり、縦軸が相対リスクである。

0029

表現型推定システムは、母平均mの区間内において、常に相対リスクが1以下であれば、個人のリスクは平均よりも低いとの推定結果を出力する。また、母平均mの区間内において、常に相対リスクが1以上であれば、個人のリスクは平均よりも高いとの推定結果を出力する。

0030

しかしながら、母平均mの区間内において、相対リスクが1をまたぐ、すなわち、母平均mの区間内で相対リスクと母平均との大小関係が反転するならば、表現型推定システムは、「個人のリスクの判別が適切に行えない」との推定結果を出力する。
このように相対リスクが1をまたぐことがあることは知られていなかった。しかし、発明者は、プログラムを作成し、シミュレーションを繰り返すことにより相対リスクを計算するという実験を鋭意重ねた結果、複数座位の場合、相対リスクが1をまたぐことが稀に有ることを発見した。

0031

母平均mの区間は、その範囲内に母平均mの実際の値が含まれる可能性が高いことを示すものであり、換言するならば、母平均mの実際の値は区間内のどこに位置するかを特定できない。従って、区間内において相対リスクが1をまたぐ場合には、母平均mの実際の値によって相対リスクが高いか低いか定まり、いずれであるかを識別できないのである。

0032

なお、相対リスクが1となる母平均mの値は特定可能であるので、「母平均mの実際の値がこの範囲であれば個人のリスクは平均よりも低く、この範囲であれば個人のリスクは平均よりも高い」との推定結果を出力することは可能である。

0033

このように、本実施例に係る表現型推定システムは、リスクの母平均mの区間推定値を用い、区間内における個人の相対リスクの分布を評価し、その結果に応じて確実に相対リスクの高低が判別できることを条件に相対リスクの高低を推定結果として出力する。そして、相対リスクの高低が不正確となる場合には、その旨を推定結果として出力するので、個人の相対リスクを精度よく推定し、信頼性を向上することができる。

0034

次に、表現型推定システムのシステム構成について説明する。図2は、表現型推定システムのシステム構成を示す図である。図2に示すように、表現型推定システムは、表現型推定装置20にデータベース10(記憶手段)及び遺伝型分析装置30を接続した構成を有する。表現型推定装置20とデータベース10との間や、表現型推定装置20と遺伝型分析装置30との間には、所定のネットワークを介してもよい。

0035

データベース10は、表現型基礎データ11及び遺伝型データ12を蓄積している。表現型基礎データ11は、各種表現型について、表現型の種別、母比率や母平均、関連座位などを示すデータである。表現型の種別とは、例えば、疾患の名称などであり、表現型を特定するとともに、質的表現型であるか量的表現型であるか、アレルの効果に相加性があるか否かを示す。質的表現型の母比率については区間推定値、量的表現型の母平均については母集団における期待値を用いる。なお、質的表現型の確率、例えば疾患の発症のリスクについては母平均を用いる。この場合の母平均は、発症している状態を「1」、発症していない状態を「0」とした母比率に一致する。関連座位は、表現型に影響を与える座位である。関連座位は、表現型によって単独である場合と複数である場合がある。

0036

遺伝型データ12は、複数の表現型基礎データ11のうち、少なくともいずれか1つで関連座位として示された座位の遺伝型についてのデータである。遺伝型データ12は、座位を特定するデータに加え、注目アレルとその頻度、影響を与える表現型についてのオッズ比など表現型の推定に用いる各種データを含む。なお、複数の質的表現型に影響を与える場合には、それぞれの質的表現型についてのオッズ比を遺伝型データ12に含めておく。

0037

遺伝型分析装置30は、被験者となる個人から提出されたサンプルを用い、被験者の遺伝型を分析する装置である。分析の対象となるのは、表現型の推定に使用する1又は複数の座位である。遺伝型分析装置30は、分析により得られた遺伝型を表現型推定装置20に送信する。複数の座位について分析を行った場合には、複数の遺伝型の組合せが表現型推定装置20に送信されることになる。また、遺伝型分析装置30は、表現型推定装置20から表現型の推定結果を受信し、被験者に対して出力する。遺伝型分析装置30は必ずしも本システムに含まれている必要はなく、外部の信頼できる遺伝型分析装置により得られた遺伝型を入力、あるいは送信する場合もある。

0038

表現型推定装置20は、遺伝型から表現型を推定する装置であり、質的表現型推定部21及び量的表現型推定部22を有する。質的表現型推定部21は、質的表現型の推定を行う処理部であり、遺伝型リスク算定部21a、相対リスク算定部21b及びリスク評価部21cを有する。

0039

遺伝型リスク算定部21aは、対象となる質的表現型に影響を与える座位について、r1、r2、p、mを用い、各遺伝型の遺伝型リスクd1〜d3を算定する処理を行う。r1、r2、p、mは、データベース10から取得する。

0040

相対リスク算定部21bは、遺伝型分析装置30から受信した遺伝型と、遺伝型リスク算定部21aが算定した遺伝型リスクd1〜d3とを用い、個人の遺伝型によって定まるリスクの母平均mに対する比率を相対リスクとして算定する。

0041

リスク評価部21cは、相対リスクの母平均mに対する分布を評価し、質的表現型の発現傾向を推定する処理部である。具体的には、リスク評価部21cは、母平均mの区間内において、常に相対リスクが1以下であれば、「個人のリスクは平均よりも低い」との推定結果を出力する。また、母平均mの区間内において、常に相対リスクが1以上であれば、「個人のリスクは平均よりも高い」との推定結果を出力する。低い、高いだけではなく平均に比較した相対的なリスクを出力してもよい。そして、母平均mの区間内において、相対リスクが1をまたぐ、すなわち、母平均mの区間内で相対リスクと母平均との大小関係が反転するならば、リスク評価部21cは、「個人のリスクの判別が適切に行えない」との推定結果を出力する。あるいは相対リスクが1をまたぐ母平均mの値を出力してもよい。リスク評価部21cは、推定結果を遺伝型分析装置30に送信し、遺伝型分析装置30から被験者に出力させる。

0042

量的表現型推定部22は、量的表現型の推定を行う処理部であり、量的表現型分類部22a、相加性単独座位パターン変量評価部22b、相加性複数座位パターン変量評価部22c及び非相加性パターン変量評価部22dを有する。

0043

量的表現型分類部22aは、対象となる量的表現型を関連座位の数とアレルの効果の相加性の有無とに基づいて分類する処理部である。具体的には、量的表現型分類部22aは、「関連座位が単独で相加性がある」、「関連座位が複数で相加性がある」、「相加性がない」のいずれかに量的表現型を分類する。

0044

量的表現型の分類結果が「関連座位が単独で相加性がある」であるならば、相加性単独座位パターン変量評価部22bが量的表現型の発現傾向を推定する。量的表現型の分類結果が「関連座位が複数で相加性がある」であるならば、相加性複数座位パターン変量評価部22cが量的表現型の発現傾向を推定する。そして、量的表現型の分類結果が「相加性がない」であるならば、非相加性パターン変量評価部22dが量的表現型の発現傾向を推定する。

0045

相加性単独座位パターン変量評価部22b、相加性複数座位パターン変量評価部22c及び非相加性パターン変量評価部22dは、演算の手法はそれぞれ個別であるが、遺伝型分析装置30から受信した遺伝型を含む場合の量的表現型の推定値の分布の標準偏差を計算し、表現型の母平均からの偏位を求め、個人の表現型の推定値と母平均とを比較して大小傾向を判定する。

0046

相加性単独座位パターン変量評価部22b、相加性複数座位パターン変量評価部22c及び非相加性パターン変量評価部22dは、判定した大小傾向を推定結果として遺伝型分析装置30に送信し、遺伝型分析装置30から被験者に出力させる。

0047

次に、質的表現型推定部21の処理手順について説明する。図3は、質的表現型推定部21の処理手順を示すフローチャートである。

0048

まず、遺伝型リスク算定部21aは、対象となる表現型について表現型基礎データ11をデータベース10から読み出す。遺伝型リスク算定部21aは、読み出した表現型基礎データ11の関連座位の数をnとし、母平均mの区間を100の部分区間に分割する。部分区間は区間番号j(1≦j≦100)により識別する。また、n個の関連座位については、座位番号i(1≦i≦n)により識別する。

0049

遺伝型リスク算定部21aは、母平均の区間番号jを「1」に初期化し(ステップS101)、関連座位の座位番号iを「1」に初期化する(ステップS102)。その後、遺伝型リスク算定部21aは、座位番号iの遺伝型について遺伝型データ12をデータベース10から読み出し、注目アレルの頻度pと遺伝型のオッズ比r1,r2を特定する。そして、遺伝型リスク算定部21aは、r1、r2、p、mから、区間番号jにおける座位番号iの遺伝型リスクd1,d2,d3を算定する(ステップS103)。なお、ここで使用するmは、母平均の区間推定値のうち、区間番号jの部分区間に対応する値である。例えば、区間番号jの部分区間における最大の値を用いればよい。

0050

ステップS103の後、遺伝型リスク算定部21aは、座位番号i=nであるか否かを判定する(ステップS104)。座位番号iがn未満であるならば(ステップS104;No)、遺伝型リスク算定部21aは、座位番号iをインクリメントし(ステップS105)、ステップS103に移行する。

0051

座位番号i=nであるならば(ステップS104;Yes)、相対リスク算定部21bは、区間番号jにおける座位番号1〜nの遺伝型リスクを用い、区間番号jにおける相対リスクを算定し(ステップS106)、算定した相対リスクを記憶する(ステップS107)。

0052

ステップS107の後、相対リスク算定部21bは、区間番号j=100であるか否かを判定する(ステップS108)。区間番号jが100未満であるならば(ステップS108;No)、相対リスク算定部21bは、区間番号jをインクリメントし(ステップS109)、ステップS102に移行する。

0053

区間番号j=100であるならば(ステップS108;Yes)、リスク評価部21cは、区間番号1〜100の相対リスクをプロットし、グラフを生成する(ステップS110)。そして、リスク評価部21cは、母平均mの区間推定値に対する相対リスクの分布を評価し、質的表現型の発現傾向を推定するリスク評価処理を行い(ステップS111)、処理を終了する。

0054

次に、図3のステップS103に示した遺伝型リスクの算定について詳細に説明する。遺伝型AA,Aa,aaに対応した遺伝型リスクをd1,d2,d3とすれば、オッズ比r1,r2は次のような関係にある。






また、Hardy-Weinberg平衡を満たすとすれば、次の関係が成立する。

0055

これらの関係から、d1,d3を消去してまとめると、d2についての3次式になり、カルダノ法を用いてd2を求めることができる。

0056

具体的には、遺伝型リスク算定部21aは、あらかじめ次の値を計算する。

0057

2つのオッズ比r1 、r2 がともに1であるときは、遺伝型リスク算定部21aは、



の値を結果とする。

0058

r1=1かつr2≠1であれば、遺伝型リスク算定部21aは、



を計算し、遺伝型リスク(d1,d2,d3)を次の値とする。

0059

r1≠1かつr2=1であれば、遺伝型リスク算定部21aは、



を計算し、遺伝型リスク(d1,d2,d3)を次の値とする。

0060

残るr1≠1かつr2≠1の場合には、遺伝型リスク算定部21aは、まずd2に関する3次方程式係数C2、C3、C4を使い、3次方程式



の根を、カルダノ法を用いて計算する。3次方程式を解いた場合、3重根の場合を除いて、解は次の3つのケースが考えられる。
(1)2つの実数根でそのうち1つは重根
(2)1つの実数根と2つの複素数
(3)3つの異なる実数根

0061

しかし、上述したオッズ比r1,r2の関係と、Hardy-Weinberg平衡に基づく関係とを用いてd2に関する3次方程式を求め、係数C2、C3、C4を定めると、 (1)(2)(3)のどのケースでも少なくとも1つ開区間(0,1)内の根が存在する。その値をd2とする。

0062

カルダノ法で計算された開区間(0,1)の値d2を用い、






から遺伝型リスク(d1,d2,d3)が得られる。

0063

次に、図3のステップS106に示した相対リスクの算定について詳細に説明する。相対リスク算定部21bは、ステップS106において、区間番号jにおける相対リスクPs/mを算定する。ここで、Psは個人のリスクであり、関連座位が複数あるならば、各関連座位の遺伝型リスクを統合したリスクとなる。

0064

相対リスク算定部21bは、座位番号iの遺伝型リスク(d1,d2,d3)の値を用い、個人のリスクをPi=dkとする。dkは、個人の遺伝型(AA,Aa,aa)に応じて遺伝型リスク(d1,d2,d3)から定まる値である。

0065

座位番号i=1,2,…,nを統合した個人リスクPsについては、次のような関係式が得られる。



この式から、個人リスクのオッズ値



の関係が成り立ち、個人リスクPsは、



により得られる。相対リスク算定部21bは、このPsを区間番号jにおける母平均mの値で除算し、相対リスクとして出力する。

0066

次に、図3のステップS111に示したリスク評価処理について詳細に説明する。図4は、図3に示したリスク評価処理の処理手順を示すフローチャートである。リスク評価部21cは、まず、母平均mの区間内(1≦j≦100)において、相対リスクが1をまたぐ部分があるか否かを判定する(ステップS201)。

0067

母平均mの区間内で、相対リスクが1をまたぐ部分があるならば(ステップS201;Yes)、リスク評価部21cは、相対リスクが1をまたぐときの母平均mの値を二分法で計算して示すが、リスク判別不適と判定し、「個人のリスクの判別が適切に行えない」との推定結果を出力して(ステップS205)、リスク評価処理を終了する。

0068

母平均mの区間内で、相対リスクが1をまたぐ部分がなければ(ステップS201;No)、リスク評価部21cは、母平均mの区間内において、常に相対リスクが1以下であるか否かを判定する(ステップS202)。

0069

母平均mの区間内において、常に相対リスクが1以下であるならば(ステップS202;Yes)、リスク評価部21cはリスク低と判定し、「被験者の個人のリスクは平均よりも低い」との推定結果を出力して(ステップS204)、リスク評価処理を終了する。

0070

母平均mの区間内において、常に相対リスクが1以上であるならば(ステップS202;No)、リスク評価部21cはリスク高と判定し、「被験者の個人のリスクは平均よりも高い」との推定結果を出力して(ステップS203)、リスク評価処理を終了する。

0071

次に、量的表現型推定部22の処理手順について説明する。図5は、量的表現型推定部22の処理手順を示すフローチャートである。まず、量的表現型分類部22aは、対象となる表現型について表現型基礎データ11をデータベース10から読み出す。

0072

量的表現型分類部22aは、対象となる表現型の種別を特定し(ステップS301)、アレルの効果に相加性があるか否かを判定する(ステップS302)。アレルの効果に相加性がなければ(ステップS302;No)、量的表現型分類部22aは、対象の表現型を「相加性がない」に分類し、ステップS306に移行する。

0073

ステップS306では、非相加性パターン変量評価部22dが量的表現型の発現傾向を推定し、推定結果を出力して処理を終了する。

0074

アレルの効果に相加性があるならば(ステップS302;Yes)、量的表現型分類部22aは、対象の表現型の関連座位が単独であるか否かを判定する(ステップS303)。関連座位の数が単独であるならば(ステップS303;Yes)、量的表現型分類部22aは、対象の表現型を「関連座位が単独で相加性がある」に分類し、ステップS304に移行する。一方、関連座位の数が複数であるならば(ステップS303;No)、量的表現型分類部22aは、対象の表現型を「関連座位が複数でアレルに相加性がある」に分類し、ステップS305に移行する。

0075

ステップS304では、相加性単独座位パターン変量評価部22bが量的表現型の発現傾向を推定し、推定結果を出力して処理を終了する。そして、ステップS305では、相加性複数座位パターン変量評価部22cが量的表現型の発現傾向を推定し、推定結果を出力して処理を終了する。

0076

次に、量的表現型の発現傾向の推定について、詳細に説明する。まず、相加性単独座位パターン変量評価部22bによる推定について説明する。相加性単独座位パターン変量評価部22bは、線形モデルの一つの係数β1、aアレル頻度p、単独座位の遺伝型により変化する値Xを用いる。Xは、相加性がある場合には遺伝型(AA,Aa,aa)におけるアレルaの数となり、0,1,2のいずれかをとる。この単独座位によるQへの効果β1Xを座位の効果と呼ぶ。

0077

Xが観察された時のQを変数Q1とする。

0078

Q1の期待値をE(Q1)とする。相加性単独座位パターン変量評価部22bは、E(Q1)と母集団の平均値(母平均)E(Q)との差E(Q1)−E(Q)を計算する。これは観察された座位の効果の平均からの偏位を表す変数である。

0079

この差(偏位)E(Q1)−E(Q)はこの座位の遺伝型によって異なる。
x=0であれば、
E(Q1)−E(Q)=−2pβ1
x=1であれば、
E(Q1)−E(Q)=β1(1−2p)
x=2であれば、
E(Q1)−E(Q)=2β1(1−p)
で偏位が計算される。

0080

この偏位をE(Q1)−E(Q)の分散2β12p(1-p)の平方根(即ち標準偏差)で割った値を、標準化された偏位という。



この値によって、個人の遺伝型から推定された個人の表現型が母平均より大きいか小さいか、およびその程度はどのくらいかを評価することができる。相加性単独座位パターン変量評価部22bは、この評価の結果を推定結果として出力する。

0081

次に、相加性複数座位パターン変量評価部22cによる推定について説明する。複数座位の遺伝型による効果が相加的に量的表現型Qに影響すると仮定し、多変量線形モデル
Q=β0+β1X1+β2X2+・・・+βnXn+ε
を仮定する。εの平均は0とする。そして、その期待値は



で、これを母平均とする。また、座位番号iのXiが観察値xiの時の表現型をQiとし、



がQiの期待値になる。なお、xiは座位番号iのXiの観察値である。

0082

座位番号iでのQiの期待値の母平均からの偏位は、次のような式で計算できる。ここで、piは座位番号iのaアレル頻度である。
E(Qi)−E(Q)=βi(xi−2pi)

0083

全ての座位についてこの偏位を合計した値が、全座位の効果の和の期待値E(Qs)の母平均からの偏位である。すなわち、



となる。

0084

全座位の効果の和に定数項β0を加えた変数Qeの分散V(Qe)(全座位の効果の分散に等しい)は



となる。そこで、標準化された、個人の量的表現型推定値と母平均との偏位は次のように計算できる。



相加性複数座位パターン変量評価部22cは、この値を評価に用い、母平均より大きいか小さいか、またはそれに加え、その程度はどのくらいかを推定結果として出力する。

0085

次に、アレルの効果についての非相加性パターン変量評価部22dによる推定について説明する。非相加性パターン変量評価部22dは、量的表現型Qの多変量線形モデル
Q=β0+β1X1+β2X2+・・・+βnXn+ε
を用いる。相加性複数座位パターンの場合と同様にi座位の遺伝型を観察した上での量的表現型を変数Qiとし、推定値E(Qi)を、座位番号iの遺伝型(AA,Aa,aa)毎に次の記号で表すこととする。
E(Qi|AA)=μAA
E(Qi|Aa)=μAa
E(Qi|aa)=μaa
ただし、μAA, μAa, μaaは座位により異なるが、ここでは座位を示すiは省略した。相加性がない場合、遺伝型AAの場合、Xiは、相加性がある場合と同様に0とする。また、相加性がない場合、遺伝型aaのXiは、相加性がある場合と同様に2とする。しかし、相加性がない場合、遺伝型Aaの遺伝型値Xiは、



の値をとる。ここで座位を示すiは省略してある。

0086

非相加性パターン変量評価部22d、まず、各座位(座位番号i)の遺伝型を観察した場合の表現型Qiの期待値の母集団の平均からの偏位
E(Qi)−E(Q)
を計算するが、座位番号iの遺伝型によって、計算法が異なる。

0087

遺伝型AAであれば、
E(Qi)−E(Q)=−2D1pi−(D1+D2−2D1)pi2
遺伝型Aaであれば、
E(Qi)−E(Q)=D1−2D1pi−(D1+D2−2D1)pi2
遺伝型aaであれば、
E(Qi)−E(Q)=D1+D2−2D1pi−(D1+D2−2D1)pi2
となる。この時のpiはi座位におけるaアレル頻度、D1,D2は次の値である。
D1=μAa−μAA
D2=μaa−μAa
ただし、μAA, μAa, μaaは座位により異なるが、ここでは座位を示すiは省略した。即ち、E(Qi)はi座位の遺伝型によって変化するが、その期待値は
Ni=2 pi (1-pi) D1+pi2 D2である。

0088

この偏位をすべての座位iについて合計すると次のように、すべての座位の遺伝型を観察した場合の表現型の推定値の母平均からの偏位E(Qs)−E(Q)が求まる。

0089

E(Qi)は元々変数ではなく値である。しかし、i座位の観察された遺伝型によって決まるxiが変化することにより異なった値を取る。従って、E(Qi)をXiの変数として見ることが可能である。このようにE(Qi)をXiの変数として見た場の分散は偏位E(Qi)−E(Q)の分散と同じなので、全座位についてこの分散を加えると、



となる。ここでD1i、D2iはi座位におけるD1, D2である。そして、



が標準化された個人の量的表現型推定値と母平均の偏位として得られる。非相加性パターン変量評価部22dは、この偏位を評価に用い、母平均より大きいか小さいか、およびその程度はどのくらいかを推定結果として出力する。

0090

次に、「関連座位が単独で相加性がある」場合を例に、アレル頻度pと座位による効果の母平均からの偏位の関係を説明する。図6は、アレル頻度pと座位による効果の母平均からの偏位の関係についての説明図である。

0091

図6の横軸はアレルaの頻度pである。図のQiは、ここでは単独座位の場合を考えるのでi=1とする。座位による効果の、母平均からの偏位E(Q1)−E(Q)は3つの遺伝型について、次の式で与えられる。



Xへの係数β1=1とすると、遺伝型AA,Aa,aaの場合、それぞれ−2p,1−2p,2(1−p)である。座位の効果の和に定数項β0を加えた変数Qeの分散はV(Qe)=2β12p(1−p)の式より2p(1−p)が得られる。縦軸の0,1,2より傾き−2で右に伸びた3つの直線は、β1=1のときそれぞれ遺伝型AA,Aa,aaの場合の偏位E(Q1)−E(Q)を示す。内側の楕円は1SD(推定量の標準偏差の1倍)を、外側の楕円は2SD(標準偏差の2倍)を示している。この図から、特定のpの時の各遺伝型の場合の偏位と標準偏差との関連が変化することがわかる。例えば、p=0.3の時を図に示すが、AA,Aaの遺伝型値の母平均からの偏位は −1SD,+1SDの間に収まり、 aaでは+2SDを超える。
以上の分析により単一座位であっても量的表現型の母平均からの偏位を考えることは有意義であることが示された。

0092

これまでの説明では、表現型推定システムを例示して説明を行ったが、本発明は表現型推定プログラムとして実施することも可能である。図7は、表現型推定プログラムの実施例である。図7に示したコンピュータ40は、CPU41、メモリ42、HDD(Hard Disk Drive)43、インタフェースボード44を有する。

0093

HDD43は、磁気ディスクに質的表現型推定プログラム、量的表現型推定プログラム、表現型基礎データ及び遺伝型データを保持する。コンピュータ40が質的表現型推定プログラムや量的表現型推定プログラムをメモリ42に展開して実行すると、質的表現型推定プロセス42aや量的表現型推定プロセス42bが実行されることとなる。質的表現型推定プロセス42a及び量的表現型推定プロセス42bは、図2に示した質的表現型推定部21及び量的表現型推定部22にそれぞれ対応する処理を行なう。

0094

このように、コンピュータ40は、質的表現型推定プログラムや量的表現型推定プログラムを読み出して実行することで、表現型推定装置として動作することができる。なお、各プロセスが使用するデータはインタフェースボード44を介して外部から取得することができ、また、各プロセスが出力するデータはインタフェースボード44を介して外部に出力することができる。インタフェースボード44には、ディスプレイキーボードカメラなどの各種インタフェースデバイスが接続される。なお、図7ではHDDにプログラムを格納する場合を例に説明したが、CD(Compact Disc)など任意の記録媒体をプログラムの格納先として用いることができる。

0095

上述してきたように、本実施例に係る表現型推定システムは、所定の質的表現型に影響を与える座位における各アレルまたは各遺伝型の比率と、質的表現型の母比率の区間推定値とを用い、遺伝型の各々について質的表現型の発現率を算定し、対象となる遺伝型について母比率の区間における質的表現型の発現率の分布を評価することで質的表現型の発現傾向を推定し、推定結果を出力する。このため、遺伝型に基づいて質的表現型を精度よく推定することができる。

0096

また、本実施例に係る表現型推定システムは、量的表現型に影響を与える座位の数とアレルの効果の相加性の有無とに基づいて量的表現型を分類し、分類結果を用いて対象となる遺伝型を含む場合の量的表現型の推定値の分布を評価し、該推定値の分布を母平均と比較して量的表現型の発現傾向を推定し、推定結果を出力するする。このため、遺伝型に基づいて量的表現型を精度よく推定することができる。

0097

なお、本実施例は発明を限定するものではなく、適宜変形して実施することができる。例えば、データベース10、表現型推定装置20及び遺伝型分析装置30の機能を備えた単一の装置として実施してもよい。

実施例

0098

また、疾患のリスクに限らず、各種形質の発現について本発明を適用することができる。さらに、人の遺伝型に限らず、動植物など任意の生体の遺伝型から表現型を推定することができる。

0099

以上のように、本発明に係る表現型推定システム及び表現型推定プログラムは、遺伝型に基づいて表現型を精度よく推定することに適している。

0100

10データベース
11表現型基礎データ
12遺伝型データ
20 表現型推定装置
21 質的表現型推定部
21a 遺伝型リスク算定部
21b相対リスク算定部
21cリスク評価部
22 量的表現型推定部
22a 量的表現型分類部
22b相加性単独座位パターン変量評価部
22c 相加性複数座位パターン変量評価部
22d 非相加性パターン変量評価部
30遺伝型分析装置
40コンピュータ
41 CPU
42メモリ
42a 質的表現型推定プロセス
42b 量的表現型推定プロセス
43 HDD
44 インタフェースボード

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ