図面 (/)

技術 ヘルスケア・リスク推定システム及び方法

出願人 富士通株式会社
発明者 デラトーレ・ビクトールビリャソン-テラサス・ボリス
出願日 2017年1月30日 (4年9ヶ月経過) 出願番号 2017-014692
公開日 2017年9月28日 (4年1ヶ月経過) 公開番号 2017-174406
状態 特許登録済
技術分野 検索装置 医療・福祉事務
主要キーワード 合致精度 ディジタル電子回路 体調悪化 医療文書 希少種 リスク推定 針治療 装置形態
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2017年9月28日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (10)

課題

ヘルスケアリスク推定ステムを提供する。

解決手段

潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含むリスク関連ターム収集部、タームの標準的な語彙を利用して、類義語及び同義語を含むように、医師によるタームを標準化及び拡張する医療エンティティリコンシリエーター、拡張されたタームにリンクされる一群文書を、医療文書データベースから取得するトピック検出及びタグ付け部、一群の文書からエンティティを抽出し、各々の文書を標準化された語彙に調整するNERモジュール及び取得された一群の文書中の2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける関係抽出部を有し、それらの関係を保存するリスク・ナレッジグラフを生成する。

概要

背景

医薬において、リスクは、患者又は患者集団の健康に対してマイナス成果をもたらす確率として考えることが可能である。健康リスク要因は、人が病気又は健康障害を助長する確率を増やす属性、特性又は体調悪化として観察されることが可能である。

医薬における重要なタスクのうちの1つは、リスクの評価である。このタスクは、これらの要因定量化とともに、厳格薬学研究から得られる科学的な知識を当てにしている。しかしながら、現在のリスク評価ソリューションは、通常、リスク評価に対する非常に限られた医学的知識しか考慮に入れておらず、多くの場合、このリスクに関連する知識はそのソリューションの中でハードコード化されている。

臨床診察では、様々な状態を発展させる患者のリスクを推定するために、多くのプロトコルが設計されている。しかしながら、多くの場合、所与の患者に対する健康のリスクは、単純なリストとして表現されているが、実際には、これらのリスクは相互に結び付いている。様々なリスク間の結び付き(又はリンク)は、様々なレベルで(すなわち、様々な形式で及び/又は様々なウェイトで)設定されることが可能である。例えば、患者の遺伝的背景に含まれるリスク、薬の逆効果生活スタイル等は、全て異なるリンクである。

最近、健康の研究団体が、ゲノム毒薬物、被爆及び疾患のデータ等のような有用な健康データの収集及びそれに対するアクセス提供が順調に進行している。リスク評価の分野に、これらの大量のデータを適用する際に障害は、特に、被爆、薬物、処置及び病気における関係を発見するために、非常に多数の定期刊行物、非常に多数のデータベース、多数のオントロジを収集し、不要なものを削除し(clean)及び処理する方法、ツール及び技術が不足していることである。

概要

ヘルスケアリスク推定ステムを提供する。潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含むリスク関連ターム収集部、タームの標準的な語彙を利用して、類義語及び同義語を含むように、医師によるタームを標準化及び拡張する医療エンティティリコンシリエーター、拡張されたタームにリンクされる一群文書を、医療文書データベースから取得するトピック検出及びタグ付け部、一群の文書からエンティティを抽出し、各々の文書を標準化された語彙に調整するNERモジュール及び取得された一群の文書中の2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける関係抽出部を有し、それらの関係を保存するリスク・ナレッジグラフを生成する。

目的

リスク・ナレッジ・グラフは、(1人以上の医師からの)医師の知識と公のデータとを混合(又は融合)し、リスク、リスク要因に対する関係及び処置を提示する際にユーザーにとって計り知れない新たな情報群を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

ヘルスケアリスク推定ステムであって:医師によるタームの入力を受け入れリスク関連ターム収集部であって、前記医師によるタームは、潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含む、リスク関連ターム収集部;タームの標準的な語彙を利用して、類義語及び同義語を含むように、前記医師によるタームを標準化及び拡張する医療エンティティリコンシリエーター;拡張されたタームにリンクされる一群文書を、医療文書データベースから取得するトピック検出及びタグ付け部;前記一群の文書からエンティティを抽出する固有表現抽出−分解−曖昧性解消(NERD)モジュールであって、各々の文書は標準化された語彙に調整されている、NERDモジュール;及び取得された一群の文書中の文書における2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける関係抽出部;を有し、前記ヘルスケア・リスク推定システムは、前記エンティティ及びスコアが付されたそれらの関係を保存するリスク・ナレッジグラフを生成するように構成される、ヘルスケア・リスク推定システム。

請求項2

前記リスク・ナレッジ・グラフを表示し、生成されたグラフをマニュアルでキュレートするための医師の入力を受け入れるナレッジ・グラフ・キュレータを更に有する請求項1に記載のヘルスケア・リスク推定システム。

請求項3

前記リスク関連ターム収集部は、リスク、リスク要因及び処置のカテゴリ毎のタームのリストとして、タームを受け入れるように構成される、請求項1又は2に記載のヘルスケア・リスク推定システム。

請求項4

前記トピック検出及びタグ付け部は、前記文書の起源を考慮するように構成されている、請求項1ないし3のうちの何れか一項に記載のヘルスケア・リスク推定システム。

請求項5

前記リスク・ナレッジ・グラフは、前記エンティティの起源も保存する、請求項1ないし4のうちの何れか一項に記載のヘルスケア・リスク推定システム。

請求項6

前記リスク関連ターム収集部は、前記タームの標準的な語彙による前記医師による注釈を受け入れるように構成され、前記注釈は、リスク、リスク要因及び処置のカテゴリにおける語彙をラベル付けする、請求項1ないし5のうちの何れか一項に記載のヘルスケア・リスク推定システム。

請求項7

前記トピック検出及びタグ付け部は、リスク、リスク要因及び処置のカテゴリに応じて前記文書にタグ付けするように構成される、請求項1ないし6のうちの何れか一項に記載のヘルスケア・リスク推定システム。

請求項8

前記NERDモジュールは、標準的な語彙のタームと、抽出されたリンクした文書中の対応するタームとの間の合致精度を反映するように、各々のエンティティのスコアを付ける、請求項1ないし7のうちの何れか一項に記載のヘルスケア・リスク推定システム。

請求項9

ユーザーによるタームの入力を受け入れるユーザー入力部と、前記ユーザーに表示するためにグラフのうち関連する部分を選択するサブグラフ選択モジュールとを更に有する、請求項1ないし8のうちの何れか一項に記載のヘルスケア・リスク推定システム。

請求項10

或る言語でタームを受け入れ、当該タームを、前記標準的な語彙の言語で同義語に翻訳する翻訳モジュールを更に有する、請求項1ないし9のうちの何れか一項に記載のヘルスケア・リスク推定システム。

請求項11

コンピュータにより実行されるヘルスケア・リスク推定方法であって:医師によるタームの入力を受け入れる工程であって、前記医師によるタームは、潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含む、工程;タームの標準的な語彙を利用して、類義語及び同義語を含むように、前記医師によるタームを標準化及び拡張する工程;拡張されたタームにリンクされる一群の文書を、医療文書データベースから取得する工程;前記一群の文書からエンティティを抽出する工程であって、各々の文書は標準化された語彙に調整されている、工程;及び取得された一群の文書中の文書における2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける工程;を有し、リスク・ナレッジ・グラフは、前記エンティティ及びスコアが付されたそれらの関係を保存する、ヘルスケア・リスク推定方法。

請求項12

請求項11に記載のヘルスケア・リスク推定方法をコンピュータに実行させるコンピュータ・プログラム

技術分野

0001

本発明は、個人又は対象(通常、「患者」と言及される)のヘルスケアを評価することに関連する。患者は人間であってもよいし、あるいは、希少種族(rare breed)の検体又はペットでさえあってもよいものの試料などのような動物であってもよい。多くの状況において、患者は既に不調を煩っているかもしれないが、それ以外において患者は今のところ健康的である。本発明は、医療健康管理及び獣医学などに広く適用可能である。

背景技術

0002

医薬において、リスクは、患者又は患者集団の健康に対してマイナス成果をもたらす確率として考えることが可能である。健康リスク要因は、人が病気又は健康障害を助長する確率を増やす属性、特性又は体調悪化として観察されることが可能である。

0003

医薬における重要なタスクのうちの1つは、リスクの評価である。このタスクは、これらの要因定量化とともに、厳格薬学研究から得られる科学的な知識を当てにしている。しかしながら、現在のリスク評価ソリューションは、通常、リスク評価に対する非常に限られた医学的知識しか考慮に入れておらず、多くの場合、このリスクに関連する知識はそのソリューションの中でハードコード化されている。

0004

臨床診察では、様々な状態を発展させる患者のリスクを推定するために、多くのプロトコルが設計されている。しかしながら、多くの場合、所与の患者に対する健康のリスクは、単純なリストとして表現されているが、実際には、これらのリスクは相互に結び付いている。様々なリスク間の結び付き(又はリンク)は、様々なレベルで(すなわち、様々な形式で及び/又は様々なウェイトで)設定されることが可能である。例えば、患者の遺伝的背景に含まれるリスク、薬の逆効果生活スタイル等は、全て異なるリンクである。

0005

最近、健康の研究団体が、ゲノム毒薬物、被爆及び疾患のデータ等のような有用な健康データの収集及びそれに対するアクセス提供が順調に進行している。リスク評価の分野に、これらの大量のデータを適用する際に障害は、特に、被爆、薬物、処置及び病気における関係を発見するために、非常に多数の定期刊行物、非常に多数のデータベース、多数のオントロジを収集し、不要なものを削除し(clean)及び処理する方法、ツール及び技術が不足していることである。

0006

本発明の第1側面の実施形態によれば、ヘルスケア・リスク推定ステムが提供され、本システムは:
医師によるタームの入力を受け入れるリスク関連ターム収集部であって、前記医師によるタームは、潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含む、リスク関連ターム収集部;
タームの標準的な語彙を利用して、類義語及び同義語を含むように、前記医師によるタームを標準化及び拡張する医療エンティティリコンシリエーター;
拡張されたタームにリンクされる一群文書を、医療文書データベースから取得するトピック検出及びタグ付け部;
前記一群の文書からエンティティを抽出する固有表現抽出−分解−曖昧性解消(NERD)モジュールであって、各々の文書は標準化された語彙に調整されている、NERDモジュール;及び
取得された一群の文書中の文書における2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける関係抽出部;
を有し、前記ヘルスケア・リスク推定システムは、前記エンティティ及びスコアが付されたそれらの関係を保存するリスク・ナレッジグラフを生成するように構成される、ヘルスケア・リスク推定システムである。

0007

リスク・ナレッジ・グラフは、(1人以上の医師からの)医師の知識と公のデータとを混合(又は融合)し、リスク、リスク要因に対する関係及び処置を提示する際にユーザーにとって計り知れない新たな情報群を提供する。

0008

本システムは、リスク・ナレッジ・グラフを表示し、生成されたグラフをマニュアルでキュレートする(curate)ための医師の入力を受け入れるナレッジ・グラフ・キュレータを更に有してもよい。

0009

リスク関連ターム収集部は、リスク、リスク要因及び処置のカテゴリ毎に、タームのリスト(又は複数のリスト)としてタームを受け入れるように構成されてもよい。これは、プレーンテキストの入力であってもよく、医師(又は複数の医師)は、例えばターム間のリンク等のような何らかの他の情報を入力する必要がない。

0010

トピック検出部(及びタグ付け部)は、例えば、文書が由来する定期刊行物は何であるか、刊行物の日付は何時であるか等のような文書の起源(provenance)を考慮するように構成されることが可能である。この起源は、スコアを付けるため及び後の他の目的で考慮に入れることが可能である。

0011

この場合、リスク・ナレッジ・グラフは、エンティティの起源も保存することが可能である。これは、そのような外的な情報をユーザーに提供することが可能である。

0012

リスク関連ターム収集部(又はシステムの他のコンポーネント)は、タームの標準的な語彙による医師による注釈を受け入れるように構成されてもよく、注釈は、リスク、リスク要因及び処置のカテゴリにおける語彙をラベル付けしている。この情報は、上記のように入力される注釈に起因して有用になるかもしれない。このタグ付けプロセスは重要であり、その理由は、タグ付けが文書のメイントピック識別することが可能だからであり、従って、システムは、主要なトピックと文書の固有表現(named entity)との間の関連性を作成することが可能になる。これはコンテキストを取り扱う特殊な方法の1つである。

0013

一実施形態では、NERDモジュールは、標準的な語彙のタームと、抽出されたリンクした文書中の対応するターム(又は複数のターム)との間の合致精度を反映するように、各々のエンティティのスコアを付ける。

0014

本システムは、ユーザーによるタームの入力を受け入れるユーザー入力部、及び/又は、ユーザーに表示するためにグラフのうち関連する部分を選択するサブグラフ選択モジュールを更に有してもよい。例えば、この機能はグラフィカル・ユーザー・インターフェース(GUI)を利用して提供されてもよい。

0015

本システムは、或る言語でタームを受け入れ、当該タームを、標準的な語彙の言語における同義語に翻訳する翻訳モジュールを更に有してもよい。

0016

本発明の別の側面の実施形態によれば、コンピュータにより実行されるヘルスケア・リスク推定方法が提供され、本方法は:
医師によるタームの入力を受け入れる工程であって、前記医師によるタームは、潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含む、工程;
タームの標準的な語彙を利用して、類義語及び同義語を含むように、前記医師によるタームを標準化及び拡張する工程;
拡張されたタームにリンクされる一群の文書を、医療文書データベースから取得する工程;
前記一群の文書からエンティティを抽出する工程であって、各々の文書は標準化された語彙に調整されている、工程;及び
取得された一群の文書中の文書における2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける工程;
を有し、リスク・ナレッジ・グラフは、前記エンティティ及びスコアが付されたそれらの関係を保存する、方法である。

0017

本発明の別の側面の実施形態によれば、コンピュータで実行される場合に、上記の方法を実行するコンピュータ・プログラムが提供される。

0018

本発明の好適な実施形態による方法又はコンピュータ・プログラムは、上記の装置形態の任意の組み合わせを構成することが可能であり、関連するシステムの具体的な部分に関する制限を受けない。これらの更なる実施形態による方法又はコンピュータ・プログラムは、処理及びメモリ能力を要するコンピュータで実行されるものとして説明されることが可能である。

0019

好ましい実施形態による装置は、所定の機能を実行するように構成又は配置され、或いは単に実行するように説明される。その構成又は配置は、ハードウェアミドルウェア又は適切な他の何らかのシステムにより使用されることが可能である。好ましい実施形態では、構成又は配置はソフトウェアによるものであってもよい。

0020

従って、一側面によればプログラムが提供され、プログラムは、少なくとも1つのコンピュータにロードされると、上記のシステムの詳細のうちの何れか又はそれらの任意の組み合わせによるシステムとなるように、コンピュータを構築する。

0021

別の側面によればプログラムが提供され、そのプログラムは、少なくとも1つのコンピュータにロードされると、上記の方法の詳細のうちの何れか又はそれらの任意の組み合わせによる方法ステップを実行するように、少なくとも1つのコンピュータを構築する。

0022

一般に、コンピュータは、設定される機能を提供するように構成又は配置されるようにリスト化された要素を有する。例えば、コンピュータは、メモリ、プロセッサ及びネットワーク・インターフェースを含んでいてもよい。

0023

本発明は、ディジタル電子回路で実現されることが可能であり、或いは、コンピュータ・ハードウェア、ファームウェア、ソフトウェアで実現されることが可能であり、或いは、それらの組み合わせで実現されることも可能である。本発明は、コンピュータ・プログラム又はコンピュータ・プログラム・プロダクトとして実現されることが可能であり、例えば、1つ以上のハードウェア・モジュールによる動作又はそれらを制御するために、マシン読み取り可能な記憶デバイス等のような非一時的な情報キャリア或いは伝送される信号に具体的に組み込まれるコンピュータ・プログラムとして実現されてもよい。コンピュータ・プログラムは、スタンドアローン・プログラム、コンピュータ・プログラムの一部分、或いは、1つより多いコンピュータ・プログラム等の形式であるとすることが可能であり、かつ、コンパイルされる又はインタープリットされる言語を含む任意の形式のプログラミング言語で書き込まれることが可能であり、コンピュータ・プログラムは、スタンド・アローン・プログラムとして、モジュールとして、コンポーネントとして、サブルーチンとして、或いは、データ処理環境で使用するのに適した他のユニットとしての形態を含む任意の形態で配備されることが可能である。コンピュータ・プログラムは、1つのモジュールで実行されるように、1つのサイトにおける複数のモジュールにおいて実行されるように、或いは、複数のサイトにわたって分散されて通信ネットワークにより相互接続されるように配備されることが可能である。

0024

本発明の方法ステップは、入力データに処理を施して出力を生成することにより本発明の機能を実行するように、コンピュータ・プログラムを実行する1つ以上のプログラム可能なプロセッサにより実行されることが可能である。本発明による装置は、プログラム可能なハードウェアとして又は特定目的の論理回路として実現されることが可能であり、例えば、FPGA(フィールドプログラマブルゲートアレイ)又はASIC(特定用途向け集積回路)を含んでもよい。

0025

コンピュータ・プログラムの実行に相応しいプロセッサは、例えば、汎用及び専用双方のマイクロプロセッサ、任意の種類のディジタル・コンピュータの任意の1つ以上のプロセッサを含んでよい。一般に、プロセッサは、リードオンリ・メモリ又はランダム・アクセス・メモリ又はそれら双方から、命令及びデータを受信する。コンピュータの本質的な要素は、命令を実行するプロセッサであり、プロセッサは、命令及びデータを保存する1つ以上のメモリ・デバイスに結合される。

0026

本発明は特定の実施形態の観点から説明される。他の実施形態も特許請求の範囲に属する。例えば、本発明の目的は、異なる順序で実行され、それでも所望の結果をもたらすことが可能である。

0027

オブジェクト指向プログラミング技術を利用することなく、複数のテストスクリプトバージョン編集及び起動されることが可能であり;例えば、スクリプト・オブジェクトの要素は、構造化されたデータベース又はファイル・システムで組織化されることが可能であり、スクリプト・オブジェクトにより実行されるように記述されるオペレーションは、テスト制御プログラムにより実行されることが可能である。

0028

本発明の要素は、「モジュール」及び「ユニット」という用語及び機能的な定義を利用して記述されている。当業者は、そのような用語及びそれらの均等物は、個別的ではあるが、規定された機能を提供するように組み合わせるシステムの一部を指してもよいことを認めるであろう。また、システムのうち同じ物理的な部分が、規定される機能のうちの2つ以上を提供してもよい。

0029

例えば、別々に規定される手段は、必要に応じて、同じメモリ及び/又はプロセッサを利用して実現されてもよい。

0030

以下、本発明の好ましい特徴が、単なる一例として、添付図面に関連して説明される。

図面の簡単な説明

0031

本発明の一般的な実施形態におけるコンポーネントのブロック図。
一般的な実施形態における方法のフローチャートを示す図。
詳細な実施形態における主要なシステム・コンポーネントのブロック図。
医療エンティティ・リコンシリエーション基礎的な具体例を示す図。
PUBMED文書のトピック・タグ付け及び検出を説明するためのブロック図。
NERDを説明するためのブロック図。
関係推定を説明するためのブロック図。
情報グラフからの引用を説明するための図。
本発明の実施形態に相応しいハードウェアを示す図。

実施例

0032

概して、本願の発明者等は、健康管理の分野において、次のような洞察に至った:
・リスク要因、並びに、薬、治療及び病気に対する関連性とともに健康リスクを表現するための標準的な手法は存在しないこと。

0033

・リスクに関するデータ及びリスク要因を取得し、キュレートし、リコンサイル(reconcile)し、及び、インテグレート(integrate)するための方法及びツールが欠如していること。

0034

従って、実施形態は、次のことを目指している:
・リスク及びリスク要因に対する関連する概念を識別すること、並びに、潜在的にはこれらの定義を医者により確認すること。

0035

・リスク要因、並びに、薬、治療及び病気に対するそれらの関連性とともにヘルス・リスクのグラフを作成すること。データは、リスク評価に関する医者の専門知識とともに、文献及び公のデータソースから取り出されることが可能である。

0036

精密医療(precision medicine)は、個々の患者/対象に対して特化されたヘルスケアのカスタム化を目的とする医療モデルである。これは、遺伝子、肉体生体組織、環境及び生活様式における個人的な相違を考慮に入れる疾患治療、処置及び予防のための新しいアプローチである。この文脈において、本実施形態は、リスク要因、関連する処置、病気及び薬とともに健康リスクのナレッジ・グラフ(Knowledge Graph)を作成することを目指している。

0037

本願では以下の定義が使用される:
健康リスク:平均的な疾患率又は致死率より高く関連付けられる病気の前兆。病気の前兆は、人口統計学変数、所定の個々人の行動、家族的及び個人的な病歴、及び、所定の生理学的な変化を含む。

0038

健康リスク要因:リスクを増やす状態、行動又はその他の要因(例えば、鬱病自殺のリスク要因である)。

0039

医学的処置:患者の管理及び世話であり、例えば、メンタル・ヘルスの分野における看護生理的な介護、及び、専門家によるメンタル・ヘルス・リハビリテーション等を含む。このターム(又は用語)は、「代替的な」医学的処置、及び、薬剤(例えば、望まれる場合に、ホメオパシー療法/催眠療法/針治療などが処方されてもよい)を含んでもよい。

0040

診断:病気の兆し及び症状から、病気又は状態の性質及び状況の検査による判断するプロセス。

0041

ドラッグ:病気の兆候又は状態を、処置又は予防又は緩和する薬。

0042

発明者等が認識している範囲内では、健康リスクを取り扱うための標準的なリソースは存在しておらず、医学的機関の中で及び特定の領域に関する単なるリストのようなその場しのぎのリソースしか存在していない。

0043

概要
・例えばICD9及びICD10(病気の国際分類の第9版及び第10版)のように病気に関してスタンダードが存在するのと同様な仕方で、健康リスクを表現するスタンダードは存在していない;リスクの簡易なリストが存在するに過ぎず、それらは特定の医療機関又は領域に特化したものである;
・医療雑誌刊行物、データベース及びオントロジから、リスク及びリスク因子に関するデータを、取得、キュレート、リコンサイル及びインテグレートするための方法及びツールが欠如している。

0044

本実施形態は、病気、治療、薬及び兆候に対する関連性及びリスク要因とともに、医学的リスクのナレッジ・グラフを生成する。

0045

図1は、一般的な実施形態によるヘルスケア・リスク推定システムを示し、本システムは、本質的には健康リスク・エンジン10を有し、そのエンジンは、医者からの入力を受け入れ、(i)タームの標準的な語彙の形式で、及び、(ii)ヘルスケア・ドメイン、看護、獣医学、健康管理、医療及び科学の文献による文書ライブラリの形式で、オープンデータに接続される。以下において個々のモジュールが更に説明されるが、簡明化のため、健康リスク・エンジンの中に明示されていない。

0046

リスク関連ターム収集部は、医者による(又は医者のグループからの)タームの入力を受け入れる。これらの医者からのタームは、潜在的な病気の形式でリスクに関連するターム、病気の可能性を増やすリスク要因に関連するターム、及び、医学的状況に対する治療に関するタームを含む。

0047

医療エンティティ・リコンシリエーターは、タームの標準的な語彙を利用して、類似するターム及び同義のタームを包含するように、医者からのタームを標準化及び拡張するために使用される。例えば、SNMEDオントロジが使用されてもよく、この点については後述される。

0048

トピック・ディテクタは、検索可能な医療文献データベース(例えば、PUBMED)から、拡張されたタームにリンクされる一群の文書を抽出するために使用される。本質的には、このコンポーネントは、文書の内容(例えば、文書の要約)と、標準化されたタームとを比較し、厳密にそれらのタームを含む文書、又は、それらのタームに非常に合致する文書を選択する。

0049

固有表現抽出、分解及び曖昧性解消(named entity recognition, resolution and disambiguation:NERD)モジュールは、各々がスコアを有し且つ各々が標準化されたタームに整合する一群の文書からエンティティを抽出する。すなわち、エンティティは、例えば、SNOMED語彙から取得されてもよいが、文書内容に合致している。

0050

関係推定部は、文書中の2つのエンティティの共起性(co-occurrence)、及び、抽出された一群の文書中の内容に基づいて、エンティティ間の関係にスコアを付ける。例えば、これは、既存の共起性メトリック及び適切な他の任意の技法を使用することが可能である。

0051

ヘルスケア・リスク推定システムは、エンティティ及びそれらのスコアが付された関係(又はリレーション)を保存するリスク・ナレッジ・グラフ80を生成するように構成される。グラフは、上述したパーツにより生成されてもよい。そして、グラフは、(例えば、他の医者であるかもしれない)ユーザーに表示されることが可能である。例えば、ユーザーは、リスク、リスク要因及び処置などのようなタームを入力し、かつ、PUBMEDライブラリに黙示的に保存されているナレッジ(又は知識又は情報)に基づいて、リンクされたタームのサブグラフ及びリンクの強さ(strength)を受信してもよい。

0052

図2は対応するフローチャートを示す。S10において、システムは医師によるタームの入力を受け入れる。ステップS20において、これらは、拡張及び標準化のために、広範囲に及ぶ標準語彙とともにリコンサイルされる。ステップS30において、拡張されたタームにリンクされるもののような関連する文書が、文書データベースから取得される。ステップS40において、一群の文書からエンティティが取得され、各々のエンティティは標準語彙に整合している。ステップS50において、エンティティ間の関係が、取得された一群の文書中の文書における2つ(又はそれ以上の)エンティティの共起性に基づいて採点される(スコアが付される);最終的に、ステップS60において、エンティティ及びそれらのスコアが付された関係を保存するリスク・ナレッジ・グラフが生成される。例えば、(文書全体ではなく)文書IDの形式で、エンティティの起源が保存されてもよい。上述したように、上記のステップはグラフを一緒に提供してもよく、その場合、別個のステップS60は不要になる。

0053

詳細な実施形態は以下のメインモジュールから構成されてもよい:
・医師の知識から、一群のリスク関連タームを収集するモジュール。

0054

・スノメド(Systemized Nomenclature of Medicine:SNOMED(薬の体系化された命名法))によるエンティティに対して、関連タームをリコンサイルする。

0055

・一群のリスク関連定義から初期ナレッジ・モデルを生成し、SNOMEDの概念にリンクするモジュール。

0056

・識別されたSNOMED概念に基づいて、PUBMED文書により、リスク・トピック文書識別を実行するモジュール。PUBMEDは、アメリカ国立医学図書館(US National Library of Medicine:NLM)のサービスであり、看護、獣医学、健康管理、薬、及び、科学の記事に対する自由なアクセスを提供する。

0057

・上記のモジュールからの結果の文書に関し、固有表現抽出、分解及び曖昧性解消(NERD)を実行するモジュール。

0058

・上記のモジュールから抽出されたエンティティに関し、関係の推定を実行するモジュール。

0059

・医師の支援とともに、エンティティ及び関係をキュレート及びリファインするモジュール。

0060

前提とする概念のうちの1つは、使用されるデータは、広範囲に及ぶ様々なリスク及びリスク要因をカバーしていることであり;本実施形態は所定の医薬の領域に限定されない。例えば、「SNOMEDCT」(医学用語)は、一般に医学及び健康管理の領域に使用可能である標準化された多言語語彙である。PUBMEDも、「USNLM」として広く普及しており、一般に適用可能である。

0061

簡単に言えば、詳細な実施形態のうちのシステム又は健康リスク・エンジン10は、以下に説明され且つ図3に示される6つのメインモジュールを有する。

0062

<リスク関連ターム収集部20>
このコンポーネントは、健康管理に従事する者、医師、看護師及び獣医学従事者などのうちの1人以上(以下、「医師等」と言及される)との相互作用担当し、医師等は、リスクに関連付けられるターム(リスク関連ターム)のシード(seed)をシステムに入力する。医師等により、タームは以下の3つのメイングループグループ化されてもよい:
・リスクに関連するターム;
・リスク要因に関連するターム;及び
・治療に関連するターム。

0063

リスクの定義によれば、健康リスクは、患者の健康に対してマイナスの影響を及ぼす確率であり、マイナスの影響は特定の病気であってもよいし、或いは、死とすることさえ可能である。従って、リスク・グループに属するタームは、潜在的な病気(又は状態、通常的には、病又は障害を含む)のリストになる言葉である。

0064

タームは、医師により下位のグループに細分されて入力されてもよい。

0065

リスク因子は、例えば、以下のサブグループにグループ化されてもよい:
・環境
・層/環境
・・年齢
・・性別
・・家系(又は血筋)
・・場所
・・宗教
・人間のゲノムにハードコード化される状態に対する傾向、遺伝
・(以下のような傾向を有する)行動
・・タバコ喫煙
・・不健康な食事
・・運動不足
・・アルコール摂取
・・危険な性行為
生物医学(患者の健康に影響を及ぼし得る医師の診断及び状態を含む)
・・糖尿病
・・妊娠
・・高血圧
・・空腹時の異常血糖値
・最後に、「治療(又は処置)」は以下のサブグループにグループ化されることが可能である:
投薬(投与方法及び投与量を含む)
手術手順
頻度及び期間を含む管理方法
上記は、医師の専門性により示唆される仮の初期ターム群であるに過ぎず、この段階でこれらは網羅的なものでも完全なリストでもないことは、言及に値する。

0066

このコンポーネントは、改善された一群のタームを収集してシステムに保存してもよい。

0067

<医療エンティティ・リコンシリエーション>
このコンポーネントは、同じ現実世界の対象についての複数の表現を識別することを目指しており、言い換えれば、2つの異なるデータソースにおける等価なタームを識別する。この特定の場合、医師から収集したタームとSNOMEDとの間でマッチング/アライメントを実行することにより、タームの標準的な多言語語彙が、個人のケアに関連付けられる。コンポーネントの成果は、SNOMEDの観点から注釈される、医師により提案される、改善された一群のタームを有することになる。例えば、「高血圧」は、医師により示唆されるリスク・タームに由来するタームであって、SNOMEDのうちの「高血圧障害」、「全身動脈」(疾患)に対応するタームである。リコンシリエーションは、SNOMEDを採用し、医師のタームを潜在的な同義語としておく。コンプロセスは、2つの異なるソースからのタームを整合させるための既存の利用可能なアプローチを当てにすることが可能である。図4は上記の例を示す。

0068

<トピック検出及びタグ付けプロセッサ40>
SNOMED語彙の観点から入力情報を突合すると、一群のPUBMEDの文書を抽出し、トピック検出を実行し、かつ、SNOMEDタームに従ってそれらのタグ付けを行う状態に段階に至る。基本的には、このコンポーネントは、関連するカテゴリを検出及びタグ付けし、関連するカテゴリは、以前に識別された以下のものである:
・リスク(それが含む記述を伴う)
・リスク要因(医師により識別されるタームを含む)
・治療(識別されたサブカテゴリを伴う)。

0069

コンポーネントの出力は、これらのカテゴリのうちのそれぞれによるPUBMED文書グループクラスタになる。文書は、1つ以上のカテゴリに含まれることが可能である。図5はこのコンポーネントの一般的なフローを示す。

0070

<NERDプロセッサ50>
このコンポーネントは、以前に生成されたPUBMED文書の各クラスタから、医療エンティティを認識して曖昧さを除外することを担当する。コンポーネントの出力は、SNOMED概念に整合する、それらのスコアを伴う一群の抽出されたエンティティである。図6はコンポーネントについてのフローを示す。このコンポーネントは、医療エンティティのリコンシリエーション・コンポーネントの何らかの機能を再利用する。

0071

<関係推定部60>
このコンポーネントの主な目的は、以前に識別されたエンティティの「関係」を推定することである。推定された「関係」は、その「関係」が存在していた文献の数に基づくスコアも有する。これは、例えば、双方のエンティティを含む文書数を文書の総数除算したものに基づき;且つコンテキストに基づく共起性スコアに関する既存の利用可能なアプローチを当てにすることが可能である。

0072

図7はコンポーネントの相互作用を示す。この特定の例では、コンポーネントは、「不安神経症」と「鬱病」との間の関係を、0.7というスコアの併存症として識別し、「鬱病」と「セルトラリン」との間の関係を「処置」として識別ことが可能であり、後者の理由は鬱病の処方薬がしばしばセルトラリンであることに起因する。

0073

ラベルは、ターム収集部又は他のモジュールを利用して、リスク、リスク要因及び処置とともに、SNOMEDの以前の注釈により利用可能である。例えば、2つのリスク同士の間のリンクに「併存症(co-morbidity)」というラベルが付され、リスクとリスク要因との間のリンクに「リスク要因」というラベルが付され、処置とリスク又はリスク要因との間のリンクに「処置」というラベルが付される。

0074

<ナレッジ・グラフ・キュレータ70>
最後のモジュールは、抽出されたエンティティをそれらの関係によって統合することを目指すものであり、スコア情報及び起源情報をリスク・ナレッジ・グラフに統合することを含む。この起源情報(provenance information)は、関係の識別を支援する関連文書IDを含む。

0075

システムは、非常に直感的な方法で医師にリスク・ナレッジ・グラフを提示し、そして医師は生成されたグラフのうちの何らかの潜在的な矛盾(inconsistencies)をマニュアルでキュレート及び決定することが可能である。

0076

本発明の実施形態は、医師のサポートとともに、リスク・ナレッジ・グラフ80の生成を許容する仕組みを提供し、そのグラフは更に精密な方法で患者のリスクを識別するための基礎となる。グラフは、エンジンと同じロケーションに保存されてもよいし、或いは、別々に提供されてもよい。エンジン及び/又はグラフは、クラウドで提供されてもよい。

0077

図8はグラフのうちの僅かな部分を示し、リスク(黒みがかった灰色の影が付されている)、リスク要因及び処置を示す。各々のエンティティはスコア(例えば、不安神経症−0.9)を有し、スコアは、抽出された一群の文書中の文書全体に対する類似度(similarity)を示す。1は全ての関連文書における同じタームがあること示す。一群の文書における共起性を利用して及び/又はそれらのコンテキスト(又は文脈)に基づいて、上述したエンティティ同士の間の関係及びスコアとともに、リンクにラベルが付されている。

0078

図9は、データ・ストレージサーバのようなコンピューティング・デバイスのブロック図であり、そのコンピューティング・デバイスは、本発明を組み込み、実施形態による方法を実現するために使用される。コンピューティング・デバイスは、コンピュータ・プロセシング・ユニット(CPU)993、ランダム・アクセス・メモリ(RAM)995のようなメモリ、ハード・ディスク996のようなストレージを有する。選択的に、コンピューティング・デバイスは、実施形態によるそのような他のコンピューティング・デバイスと通信するためのネットワーク・インターフェース999を含む。例えば、実施形態はそのようなコンピューティング・デバイスのネットワークにより構成されてもよい。選択的に、コンピューティング・デバイスは、リード・オンリ・メモリ994、キーボード及びマウス998のような1つ以上の入力手段、及び、1つ以上のモニタ997のようなディスプレイ・ユニットも含む。コンポーネントは、バス992を介して互いに接続されることが可能である。

0079

CPU993は、コンピューティング・デバイスを制御し、処理オペレーションを実行するように構成される。RAM995は、CPU993により読み込まれる及び書き込まれるデータを保存する。ストレージ・ユニット996は、例えば、不揮発性ストレージ・ユニットであってもよく、データを保存するように構成される。

0080

ディスプレイ・ユニット997は、コンピューティング・デバイスにより保存されたデータの表現を表示し、カーソル及びダイアログボックスを表示し、コンピューティング・デバイスに保存されるデータ及びプログラムとユーザー/医師との間で動作されるやり取りを映す。入力手段998は、コンピューティング・デバイスにデータ及び命令を入力することを、ユーザー/医師が実行できるようにする。

0081

ネットワーク・インターフェース(ネットワークI/F)999は、インターネット等のようなネットワークに接続され、ネットワークを介して、そのような他のコンピューティング・デバイスに接続することが可能である。ネットワークI/F999は、ネットワークを介して、他の装置から/への、データ入力/出力を制御する。マイクロフォンスピーカプリンタ電源ユニットファンケーススキャナトラックボール等のような他のペリフェラル・デバイスが、コンピューティング・デバイスに含まれてもよい。

0082

本発明を組み込む方法は、図9に示されるようなコンピューティング・デバイスで実行されてもよい。そのようなコンピューティング・デバイスは、図9に示される全てのコンポーネントを有する必要はなく、それらのコンポーネントのうちの一部分により構成されてもよい。本発明を組み込む方法は、ネットワークを介して1つ以上のデータ・ストレージ・サーバと通信する単独のコンピューティング・デバイスにより実行されてもよい。コンピューティング・デバイスは、データ・グラフの少なくとも一部を保存するデータ・ストレージそのものであってもよい。本発明を組み込む方法は、互いに協調して動作する複数のコンピューティング・デバイスにより実行されてもよい。複数のコンピューティング・デバイスのうちの1つ以上は、データ・グラフの少なくとも一部を保存するデータ・ストレージ・サーバであってもよい。

0083

以上の実施の形態に関し、更に以下の付記を開示する。

0084

(付記1)
ヘルスケア・リスク推定システムであって:
医師によるタームの入力を受け入れるリスク関連ターム収集部であって、前記医師によるタームは、潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含む、リスク関連ターム収集部;
タームの標準的な語彙を利用して、類義語及び同義語を含むように、前記医師によるタームを標準化及び拡張する医療エンティティ・リコンシリエーター;
拡張されたタームにリンクされる一群の文書を、医療文書データベースから取得するトピック検出及びタグ付け部;
前記一群の文書からエンティティを抽出する固有表現抽出−分解−曖昧性解消(NERD)モジュールであって、各々の文書は標準化された語彙に調整されている、NERDモジュール;及び
取得された一群の文書中の文書における2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける関係抽出部;
を有し、前記ヘルスケア・リスク推定システムは、前記エンティティ及びスコアが付されたそれらの関係を保存するリスク・ナレッジ・グラフを生成するように構成される、ヘルスケア・リスク推定システム。

0085

(付記2)
前記リスク・ナレッジ・グラフを表示し、生成されたグラフをマニュアルでキュレートするための医師の入力を受け入れるナレッジ・グラフ・キュレータを更に有する付記1に記載のヘルスケア・リスク推定システム。

0086

(付記3)
前記リスク関連ターム収集部は、リスク、リスク要因及び処置のカテゴリ毎のタームのリストとして、タームを受け入れるように構成される、請求項1又は2に記載のヘルスケア・リスク推定システム。

0087

(付記4)
前記トピック検出及びタグ付け部は、前記文書の起源を考慮するように構成されている、請求項1ないし3のうちの何れか一項に記載のヘルスケア・リスク推定システム。

0088

(付記5)
前記リスク・ナレッジ・グラフは、前記エンティティの起源も保存する、付記1ないし4のうちの何れか一項に記載のヘルスケア・リスク推定システム。

0089

(付記6)
前記リスク関連ターム収集部は、前記タームの標準的な語彙による前記医師による注釈を受け入れるように構成され、前記注釈は、リスク、リスク要因及び処置のカテゴリにおける語彙をラベル付けする、請求項1ないし5のうちの何れか一項に記載のヘルスケア・リスク推定システム。

0090

(付記7)
前記トピック検出及びタグ付け部は、リスク、リスク要因及び処置のカテゴリに応じて前記文書にタグ付けするように構成される、付記1ないし6のうちの何れか一項に記載のヘルスケア・リスク推定システム。

0091

(付記8)
前記NERDモジュールは、標準的な語彙のタームと、抽出されたリンクした文書中の対応するタームとの間の合致精度を反映するように、各々のエンティティのスコアを付ける、付記1ないし7のうちの何れか一項に記載のヘルスケア・リスク推定システム。

0092

(付記9)
ユーザーによるタームの入力を受け入れるユーザー入力部と、前記ユーザーに表示するためにグラフのうち関連する部分を選択するサブグラフ選択モジュールとを更に有する、付記1ないし8のうちの何れか一項に記載のヘルスケア・リスク推定システム。

0093

(付記10)
或る言語でタームを受け入れ、当該タームを、前記標準的な語彙の言語で同義語に翻訳する翻訳モジュールを更に有する、付記1ないし9のうちの何れか一項に記載のヘルスケア・リスク推定システム。

0094

(付記11)
コンピュータにより実行されるヘルスケア・リスク推定方法であって:
医師によるタームの入力を受け入れる工程であって、前記医師によるタームは、潜在的な障害の形態にあるリスクに関連するタームと、障害の可能性を増やすリスク要因に関連するタームと、医学的状態についての処置に関連するタームとを含む、工程;
タームの標準的な語彙を利用して、類義語及び同義語を含むように、前記医師によるタームを標準化及び拡張する工程;
拡張されたタームにリンクされる一群の文書を、医療文書データベースから取得する工程;
前記一群の文書からエンティティを抽出する工程であって、各々の文書は標準化された語彙に調整されている、工程;及び
取得された一群の文書中の文書における2つのエンティティの共起性に基づいて、エンティティ間の関係にスコアを付ける工程;
を有し、リスク・ナレッジ・グラフは、前記エンティティ及びスコアが付されたそれらの関係を保存する、ヘルスケア・リスク推定方法。

0095

(付記12)
付記11に記載のヘルスケア・リスク推定方法をコンピュータに実行させるコンピュータ・プログラム。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ