図面 (/)

技術 生成方法、生成プログラム、および生成装置

出願人 富士通株式会社
発明者 上田明彦朝永惇紙谷希
出願日 2012年3月14日 (9年2ヶ月経過) 出願番号 2012-057609
公開日 2013年9月26日 (7年8ヶ月経過) 公開番号 2013-191068
状態 特許登録済
技術分野 有機低分子化合物及びその製造 CAD
主要キーワード 変換規則テーブル 分子力学法 骨格データ 試薬データ 変換元データ 分子構造データ 特定済 平面方程式
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2013年9月26日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

化合物の2次元構造データの生成の効率化を図ること。

解決手段

頂点データにおける原子混成属性タイプが特定されると、結合しあう頂点データの混成属性タイプの組み合わせから、頂点データ間の結合タイプも特定される。そして、混成属性タイプと結合タイプが特定された抽象骨格データ101を2次元変換することより、クエリとなる2次元構造データ110が得られる。2次元化合物構造データ102についても、各原子を示す頂点データは、混成属性タイプを示す頂点データに変換される。これにより、クエリと混成属性タイプが特定された特定済み2次元化合物構造データ120とを比較することができ、クエリを包含する特定済み2次元化合物構造データ120が探索される。特定済み2次元化合物構造データ120が探索されると、変換前の2次元化合物構造データ102が特定される。

概要

背景

生体内標的タンパク質に結合する生理活性化合物を、検索する従来方法が開示されている(たとえば、下記特許文献1を参照。)。当該従来方法は、質問分子であるクエリに対し原子数原子タイプ、結合タイプ環構造数等のパラメータを与え、データベースの中から条件を満たす分子を絞り込んで標的タンパク質への結合の可否を判断する。

概要

化合物の2次元構造データの生成の効率化をること。各頂点データにおける原子混成属性タイプが特定されると、結合しあう頂点データの混成属性タイプの組み合わせから、頂点データ間の結合タイプも特定される。そして、混成属性タイプと結合タイプが特定された抽象骨格データ101を2次元変換することより、クエリとなる2次元構造データ110が得られる。2次元化合物構造データ102についても、各原子を示す頂点データは、混成属性タイプを示す頂点データに変換される。これにより、クエリと混成属性タイプが特定された特定済み2次元化合物構造データ120とを比較することができ、クエリを包含する特定済み2次元化合物構造データ120が探索される。特定済み2次元化合物構造データ120が探索されると、変換前の2次元化合物構造データ102が特定される。

目的

本発明は、化合物の2次元構造データの生成の効率化を図ることを目的とする

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

コンピュータが、前記コンピュータがアクセス可能記憶装置から、原子の種類が未定義である複数の頂点データが結合された3次元抽象骨格データを取得し、取得された抽象骨格データにおける各頂点データの結合関係に基づいて、前記各頂点データに対応する原子の混成属性タイプを特定し、混成属性タイプが特定された頂点データ群から選ばれた結合しあう2つの頂点データに対応する原子の混成属性タイプの組み合わせにより、前記2つの頂点データに対応する原子間の結合タイプを特定し、前記抽象骨格データを構成する前記2つの頂点データ間の結合を示すリンクデータに特定された結合タイプが付与され、前記各頂点データに前記各頂点データに対応する原子の混成属性タイプが付与された、前記抽象骨格データに対し、2次元変換を行うことにより、2次元構造データを生成する、処理を実行することを特徴とする生成方法

請求項2

前記混成属性タイプを特定する処理は、前記複数の頂点データのうち、混成属性タイプが未決定であり、かつ、環状結合頂点データ群を選択し、選択された前記環状結合頂点データ群の各頂点データが同一平面上に存在するか否かを判定し、同一平面上に存在すると判定された場合、前記環状結合頂点データ群の各頂点データに対応する原子の混成属性タイプを、アロマティックに決定する、処理を含むことを特徴とする請求項1に記載の生成方法。

請求項3

前記選択する処理は、混成属性タイプが未決定な第1の頂点データと、前記第1の頂点データと結合しあう第2の頂点データおよび第3の頂点データと、前記第2の頂点データと結合しあう第4の頂点データと、により構成される4連結頂点データを選択し、前記決定する処理は、選択された4連結頂点データの位置関係に基づいて、前記第1の頂点データに対応する原子の混成属性タイプを決定することを特徴とする請求項2に記載の生成方法。

請求項4

前記判定する処理は、前記4連結頂点データが一直線上に配列されているか否かを判定し、前記決定する処理は、一直線上に配列されていると判定された場合、前記第1の頂点データに対応する原子の混成属性タイプを、Spに決定することを特徴とする請求項3に記載の生成方法。

請求項5

前記判定する処理は、前記4連結頂点データが一直線上に配列されていない場合、同一平面上に存在するか否かを判定し、前記決定する処理は、同一平面上に存在すると判定された場合、前記第1の頂点データに対応する原子の混成属性タイプを、Sp2またはSp3のいずれか一方の混成属性タイプに決定することを特徴とする請求項4に記載の生成方法。

請求項6

前記判定する処理は、前記4連結頂点データが一直線上に配列されていない場合、同一平面上に存在するか否かを判定し、前記決定する処理は、同一平面上に存在しないと判定された場合、前記第1の頂点データに対応する原子の混成属性タイプを、Sp3に決定することを特徴とする請求項4に記載の生成方法。

請求項7

前記コンピュータが、化合物ごとに、化合物の2次元的な分子構造を示す2次元化合物構造データと、当該2次元化合物構造データの各頂点データに対応する原子の混成属性タイプが特定され、かつ、頂点データ間のリンクデータの結合タイプが特定されている特定済み2次元化合物構造データと、が関連付けて記憶されているデータベースから、生成された2次元構造データを含む特定済み2次元化合物構造データを検索し、検索された特定済み2次元化合物構造データに関連付けられている2次元化合物構造データを、前記データベースから抽出し、抽出された2次元化合物構造データを出力する、処理を実行することを特徴とする請求項1〜6のいずれか一つに記載の生成方法。

請求項8

前記コンピュータが、前記コンピュータがアクセス可能なデータベースから化合物の2次元的な分子構造を示す2次元化合物構造データを指定し、指定された2次元化合物構造データを構成する原子を示す頂点データの各々を、他の頂点データとの結合関係に基づいて、対応する混成属性タイプを示す頂点データに変換し、前記2次元化合物構造データに、変換により得られた、前記特定済み2次元化合物構造データを関連付けて、前記データベースに格納する、処理を実行し、前記検索する処理は、格納後のデータベースから、前記2次元構造データを含む特定済み2次元化合物構造データを検索することを特徴とする請求項7に記載の生成方法。

請求項9

前記コンピュータが、前記2次元化合物構造データの中から環式化合物を示す環式化合物データを検出する処理を実行し、前記変換する処理は、検出された環式化合物データを構成する原子を示す頂点データの各々を、前記環式化合物に対応する混成属性タイプを示す頂点データに変換することを特徴とする請求項8に記載の生成方法。

請求項10

前記コンピュータが前記2次元化合物構造データの中から3重結合により結合されている一対の頂点データを検出する処理を実行し、前記変換する処理は、検出された一対の頂点データの各々を、Spを示す頂点データに変換することを特徴とする請求項8に記載の生成方法。

請求項11

前記コンピュータが、前記2次元化合物構造データの中から2重結合により結合されている一対の頂点データを検出する処理を実行し、前記変換する処理は、検出された一対の頂点データの各々を、Sp2を示す頂点データに変換することを特徴とする請求項8に記載の生成方法。

請求項12

前記コンピュータが、前記2次元化合物構造データの中から1重結合により結合されている一対の頂点データを検出する処理を実行し、前記変換する処理は、検出された一対の頂点データの各々を、Sp3を示す頂点データに変換することを特徴とする請求項8に記載の生成方法。

請求項13

コンピュータが、前記コンピュータがアクセス可能なデータベースから化合物の2次元的な分子構造を示す2次元化合物構造データを指定し、指定された2次元化合物構造データを構成する原子を示す頂点データの各々を、他の頂点データとの結合関係に基づいて、対応する混成属性タイプを示す頂点データに変換し、前記2次元化合物構造データに、変換後の2次元化合物構造データを関連付けて、前記データベースに格納する、処理を実行することを特徴とする生成方法。

請求項14

コンピュータに、前記コンピュータがアクセス可能な記憶装置から、原子の種類が未定義である複数の頂点データが結合された3次元の抽象骨格データを取得し、取得された抽象骨格データにおける各頂点データの結合関係に基づいて、前記各頂点データに対応する原子の混成属性タイプを特定し、混成属性タイプが特定された頂点データ群から選ばれた結合しあう2つの頂点データに対応する原子の混成属性タイプの組み合わせにより、前記2つの頂点データに対応する原子間の結合タイプを特定し、前記抽象骨格データを構成する前記2つの頂点データ間の結合を示すリンクデータに特定された結合タイプが付与され、前記各頂点データに前記各頂点データに対応する原子の混成属性タイプが付与された、前記抽象骨格データに対し、2次元変換を行うことにより、2次元構造データを生成する、処理を実行させることを特徴とする生成プログラム

請求項15

コンピュータに、前記コンピュータがアクセス可能なデータベースから化合物の2次元的な分子構造を示す2次元化合物構造データを指定し、指定された2次元化合物構造データを構成する原子を示す頂点データの各々を、他の頂点データとの結合関係に基づいて、対応する混成属性タイプを示す頂点データに変換し、前記2次元化合物構造データに、変換後の2次元化合物構造データを関連付けて、前記データベースに格納する、処理を実行させることを特徴とする生成プログラム。

請求項16

記憶装置から、原子の種類が未定義である複数の頂点データが結合された3次元の抽象骨格データを取得する取得部と、前記取得部によって取得された抽象骨格データにおける各頂点データの結合関係に基づいて、前記各頂点データに対応する原子の混成属性タイプを特定する混成属性タイプ特定部と、前記混成属性タイプ特定部によって混成属性タイプが特定された頂点データ群から選ばれた結合しあう2つの頂点データに対応する原子の混成属性タイプの組み合わせにより、前記2つの頂点データに対応する原子間の結合タイプを特定する結合タイプ特定部と、前記抽象骨格データを構成する前記2つの頂点データ間の結合を示すリンクデータに前記結合タイプ特定部によって特定された結合タイプが付与され、前記各頂点データに前記各頂点データに対応する原子の混成属性タイプが付与された、前記抽象骨格データに対し、2次元変換を行うことにより、2次元構造データを生成する生成部と、を有することを特徴とする生成装置

請求項17

データベースから化合物の2次元的な分子構造を示す2次元化合物構造データを指定する指定部と、前記指定部によって指定された2次元化合物構造データを構成する原子を示す頂点データの各々を、他の頂点データとの結合関係に基づいて、対応する混成属性タイプを示す頂点データに変換する変換部と、前記2次元化合物構造データに、前記変換部による変換後の2次元化合物構造データを関連付けて、前記データベースに格納する格納部と、を有することを特徴とする生成装置。

技術分野

0001

本発明は、生成方法生成プログラム、および生成装置に関する。

背景技術

0002

生体内標的タンパク質に結合する生理活性化合物を、検索する従来方法が開示されている(たとえば、下記特許文献1を参照。)。当該従来方法は、質問分子であるクエリに対し原子数原子タイプ、結合タイプ環構造数等のパラメータを与え、データベースの中から条件を満たす分子を絞り込んで標的タンパク質への結合の可否を判断する。

先行技術

0003

特許第3928000号公報

発明が解決しようとする課題

0004

しかしながら、上述した従来方法では、検索に先立って、質問分子であるクエリに対し原子タイプや結合タイプといったパラメータを指定する必要がある。したがって、ユーザは、クエリを具体化しなければならず、クエリ生成の効率が低減するという問題がある。また、この煩雑なクエリ生成による検索漏れや、2次元構造スクリーニングにより立体的に標的タンパク質へ結合の可能性のある候補化合物をとりこぼす可能性があり、効率の良い化合物探索が行えないなどの問題がある。

0005

本発明は、化合物の2次元構造データの生成の効率化を図ることを目的とする。

課題を解決するための手段

0006

本発明の一側面によれば、原子の種類が未定義である複数の頂点データ抽象原子)が結合された3次元の抽象骨格データを取得し、取得された抽象骨格データにおける各頂点データの結合関係に基づいて、前記各頂点データに対応する原子の混成属性タイプを特定し、混成属性タイプが特定された頂点データ群から選ばれた結合しあう2つの頂点データに対応する原子の混成属性タイプの組み合わせにより、前記2つの頂点データに対応する原子間の結合タイプを特定し、前記抽象骨格データを構成する前記2つの頂点データ間の結合を示す骨格データに特定された結合タイプが付与され、前記各頂点データに前記各頂点データに対応する原子の混成属性タイプが付与された、前記抽象骨格データに対し、2次元変換を行うことにより、2次元構造データを生成する生成方法、生成プログラム、および生成装置が提案される。

0007

また、本発明の一側面によれば、データベースから化合物の2次元的な分子構造を示す2次元化合物構造データを指定し、指定された2次元化合物構造データを構成する原子を示す頂点データの各々を、他の頂点データとの結合関係に基づいて、対応する混成属性タイプを示す頂点データに変換し、前記2次元化合物構造データに、変換後の2次元化合物構造データを関連付けて、前記データベースに格納する生成方法、生成プログラム、および生成装置が提案される。

発明の効果

0008

本発明の一側面によれば、化合物の2次元構造データの生成の効率化を図ることができるという効果を奏する。また、標的タンパク質に立体的に結合の可能性のある化合物データを網羅的に検索する事ができるという効果を奏する。

図面の簡単な説明

0009

図1は、化合物探索の一例を示す説明図である。
図2は、実施の形態にかかる生成装置のハードウェア構成例を示すブロック図である。
図3は、生成装置の機能的構成例を示すブロック図である。
図4は、抽象骨格データの一例を示す説明図である。
図5は、抽象骨格データの頂点データ群のデータ構造例を示す説明図である。
図6は、抽象骨格データの骨格データ群のデータ構造例を示す説明図である。
図7は、結合タイプ特定テーブルの一例を示す説明図である。
図8は、2次元変換後の頂点データ群のデータ構造例を示す説明図である。
図9は、2次元構造データの一例を示す説明図である。
図10は、DBの記憶内容の一例を示す説明図である。
図11は、第1の変換規則テーブルの一例を示す説明図である。
図12は、第2の変換規則テーブルの一例を示す説明図である。
図13は、変換部による2次元化合物構造データの変換例を示す説明図である。
図14は、格納部による格納後のDBの記憶内容の一例を示す説明図である。
図15は、生成装置によるクエリ生成処理手順例を示すフローチャートである。
図16は、図15に示した抽象骨格データからの混成属性タイプ特定処理(ステップS1502)の詳細な処理手順例を示すフローチャートである。
図17は、図16に示した第1の混成属性タイプ決定処理(ステップS1601)の詳細な処理手順例を示すフローチャートである。
図18は、図16に示した第2の混成属性タイプ決定処理(ステップS1602)の詳細な処理手順例を示すフローチャートである。
図19は、図15に示した原子間の結合タイプ特定処理(ステップS1503)の詳細な処理手順例を示すフローチャートである。
図20は、生成装置によるDB生成処理手順例を示すフローチャートである。
図21は、図20に示した指定2次元化合物構造データからの混成属性タイプ特定処理(ステップS2003)の詳細な処理手順例を示すフローチャートである。
図22は、図21に示した第3の混成属性タイプ決定処理(ステップS2101)の詳細な処理手順例を示すフローチャートである。
図23は、図21に示した第4の混成属性タイプ決定処理(ステップS2102)の詳細な処理手順例を示すフローチャートである。
図24は、生成装置による化合物探索処理手順例を示すフローチャートである。

実施例

0010

以下に添付図面を参照して、この発明にかかる生成方法、生成プログラム、および生成装置の実施の形態を詳細に説明する。本実施の形態において、混成属性タイプの表記は、以下の通りとする。
Aromatic:AR
Sp Hybridzation(以下、「Sp」):S1
Sp2 Hybridzation(以下、「Sp2」):S2
Sp3 Hybridzation(以下、「Sp3」):S3
Sp2 or Sp3 Hybridzation:SS

0011

<化合物探索の一例>
図1は、化合物探索の一例を示す説明図である。化合物探索を行うためにはクエリが必要である。本実施の形態では、抽象骨格データ101がクエリの元データとなる。抽象骨格データ101とは、原子の種類が未定義の3次元の分子構造データである。共結晶の3次元活性構造データを抽象骨格データ101として用いてもよい。抽象骨格データ101の頂点データは、原子を示す。本実施の形態では、たとえば、新規構造の化合物の設計を行わずに新規構造の化合物に相当するクエリを生成するため、原子の混成属性タイプに着目し、抽象骨格データ101の骨格から、頂点データにおける原子の混成属性タイプが特定される。

0012

また、各頂点データにおける原子の混成属性タイプが特定されると、結合しあう頂点データの混成属性タイプの組み合わせから、頂点データ間の結合タイプも特定される。そして、混成属性タイプと結合タイプが特定された抽象骨格データ101を2次元変換することより、クエリとなる2次元構造データ110が得られる。このように、ユーザが、原子数、原子タイプ、結合タイプ、環構造数等のパラメータを意識することなく、抽象骨格データ101を与えるだけで、クエリが生成される。

0013

また、化合物ライブラリには、2次元化合物構造データ102が格納されている。本実施の形態では、2次元化合物構造データ102についても、各原子を示す頂点データは、混成属性タイプを示す頂点データに変換される。なお、2次元化合物構造データ102の原子間の結合タイプは既知である。

0014

これにより、クエリと混成属性タイプが特定された特定済み2次元化合物構造データ120とを比較することができ、クエリを包含する特定済み2次元化合物構造データ120が探索される。特定済み2次元化合物構造データ120が探索されると、変換前の2次元化合物構造データ102が特定される。このように、ユーザが、原子タイプや結合タイプといったパラメータを意識することなく、化合物探索が実行される。したがって、化合物探索の効率化を図ることができる。このあと、探索された2次元化合物構造データ102を3次元構造に変換して候補化合物とし、標的蛋白質の3次元構造データとの結合可能性を評価することができる。候補化合物である3次元化合物構造データは、クエリの生成元である抽象骨格データ101と同じ3次元の骨格を持つため、そのまま標的タンパク質との相互作用を計算に用いることができる。

0015

(生成装置のハードウェア構成例)
図2は、実施の形態にかかる生成装置のハードウェア構成例を示すブロック図である。図2において、生成装置は、CPU(Central Processing Unit)201と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203と、磁気ディスクドライブ204と、磁気ディスク205と、光ディスクドライブ206と、光ディスク207と、ディスプレイ208と、I/F(Interface)209と、キーボード210と、マウス211と、スキャナ212と、プリンタ213と、を備えている。また、各構成部はバス200によってそれぞれ接続されている。

0016

ここで、CPU201は、生成装置の全体の制御を司る。ROM202は、ブートプログラムなどのプログラムを記憶している。RAM203は、CPU201のワークエリアとして使用される。磁気ディスクドライブ204は、CPU201の制御にしたがって磁気ディスク205に対するデータのリードライトを制御する。磁気ディスク205は、磁気ディスクドライブ204の制御で書き込まれたデータを記憶する。

0017

光ディスクドライブ206は、CPU201の制御にしたがって光ディスク207に対するデータのリード/ライトを制御する。光ディスク207は、光ディスクドライブ206の制御で書き込まれたデータを記憶したり、光ディスク207に記憶されたデータをコンピュータに読み取らせたりする。

0018

ディスプレイ208は、カーソルアイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する。このディスプレイ208は、たとえば、液晶ディスプレイプラズマディスプレイなどを採用することができる。

0019

インターフェース(以下、「I/F」と略する。)209は、通信回線を通じてLAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどのネットワーク214に接続され、このネットワーク214を介して他の装置に接続される。そして、I/F209は、ネットワーク214と内部のインターフェースを司り、外部装置からのデータの入出力を制御する。I/F209には、たとえばモデムLANアダプタなどを採用することができる。

0020

キーボード210は、文字数字、各種指示などの入力のためのキーを備え、データの入力をおこなう。また、タッチパネル式入力パッドテンキーなどであってもよい。マウス211は、カーソルの移動や範囲選択、あるいはウィンドウの移動やサイズの変更などをおこなう。ポインティングデバイスとして同様に機能を備えるものであれば、トラックボールジョイスティックなどであってもよい。

0021

スキャナ212は、画像を光学的に読み取り、生成装置内に画像データを取り込む。なお、スキャナ212は、OCR(Optical Character Reader)機能を持たせてもよい。また、プリンタ213は、画像データや文書データ印刷する。プリンタ213には、たとえば、レーザプリンタインクジェットプリンタを採用することができる。なお、光ディスクドライブ206、光ディスク207、ディスプレイ208、キーボード210、マウス211、スキャナ212、およびプリンタ213の少なくともいずれか1つは、なくてもよい。

0022

<生成装置の機能的構成例>
図3は、生成装置の機能的構成例を示すブロック図である。生成装置300は、取得部301と、混成属性タイプ特定部302と、結合タイプ特定部303と、生成部304と、を有し、クエリとなる2次元構造データ110を生成する。また、生成装置300は、指定部305と、検出部306と、変換部307と、格納部308と、を有し、混成属性タイプが特定された特定済み2次元化合物構造データ120を生成する。また、生成装置300は、検索部309と、抽出部310と、出力部311と、を有し、化合物ライブラリを用いた化合物探索を実行する。

0023

取得部301、混成属性タイプ特定部302、結合タイプ特定部303、生成部304、指定部305、検出部306、変換部307、格納部308、検索部309、抽出部310、および出力部311は、具体的には、たとえば、図2に示したROM202、RAM203、磁気ディスク205、光ディスク207などの記憶装置に記憶されたプログラムをCPU201に実行させることにより、または、I/F209により、その機能を実現する。また、化合物ライブラリは、具体的には、たとえば、図2に示したROM202、RAM203、磁気ディスク205、光ディスク207などの記憶装置により、その機能を実現する。

0024

まず、取得部301は、記憶装置に記憶されている抽象骨格データ101を取得する。抽象骨格データ101は、上述したように、原子の種類が未定義の3次元の分子構造データである。抽象骨格データ101の一例を図4に示す。

0025

図4は、抽象骨格データ101の一例を示す説明図である。図4に示した抽象骨格データ101は、原子の種類が未定義の30個の頂点データp1〜p30が、結合しあう頂点データどうしで結合されて構成される。具体的には、たとえば、抽象骨格データ101は、リンクデータr1〜r34により30個の頂点データp1〜p30が結合されて構成される。

0026

図5は、抽象リンクデータ101の頂点データ群のデータ構造例を示す説明図である。頂点データ群のデータ構造500において、抽象骨格データ101は、頂点データごとに、3次元の座標値と、結合先と、混成属性タイプと、を有する。結合先とは、結合しあう相手側の頂点データである。混成属性タイプについては、まだ設定されていない。図5の(A)は、初期状態を示しているため、混成属性タイプは未決定である。

0027

図6は、抽象骨格データ101のリンクデータ群のデータ構造例を示す説明図である。リンクデータ群のデータ構造600において、抽象骨格データ101は、リンクデータごとに、結合しあう頂点データ対と、結合タイプと、を有する。図6の(A)は、初期状態を示しているため、結合タイプは未決定である。

0028

図3戻り、混成属性タイプ特定部302は、取得部301によって取得された抽象骨格データ101における各頂点データの結合関係に基づいて、各頂点データに対応する原子の混成属性タイプを特定する。具体的には、たとえば、混成属性タイプ特定部302は、選択部321と、判定部322と、決定部323と、を有する。

0029

選択部321は、複数の頂点データのうち、混成属性タイプが未決定であり、かつ、環状結合頂点データ群(以下、「環状結合頂点データ群」)を選択する。具体的には、例えば、抽象骨格データ101のデータ構造を参照することにより、環状結合頂点データ群を選択する。図4の例では、たとえば、頂点データp1〜p6、p5〜p10、p13〜p18、p22〜p27、p26〜p30が、それぞれ環状結合頂点データ群として選択される。

0030

判定部322は、選択部321によって選択された環状結合頂点データ群の各頂点データが同一平面上に存在するか否かを判定する。具体的には、たとえば、判定部322は、環状結合頂点データ群の座標値が同一平面上にあるか否かを判定する。より具体的には、判定部322は、頂点データ群の3個の頂点データを含む平面を平面方程式により生成する。そして、残りの頂点データが、生成された平面上に位置するか否かを判定する。

0031

決定部323は、判定部322によって同一平面上に存在すると判定された場合、環状結合頂点データ群の各頂点データに対応する原子の混成属性タイプを、アロマティックに決定する。図4の例では、頂点データp1〜p6、p5〜p10、p13〜p18、p22〜p27、p26〜p30のうち、頂点データp1〜p6、p5〜p10、p13〜p18、p22〜p27に対応する原子の混成属性タイプがアロマティックに決定される。図5の(B)のデータ構造では、初期状態からアロマティック(図5中、「AR」で表記)に決定された状態を示している。

0032

この選択部321、判定部322、および決定部323による一連の処理により、環状結合頂点データ群の各頂点データに対応する原子の混成属性タイプをアロマティックであるか非アロマティックであるか特定することができる。

0033

また、選択部321は、混成属性タイプが未決定な第1の頂点データと、第1の頂点データと結合しあう第2の頂点データおよび第3の頂点データと、第2の頂点データと結合しあう第4の頂点データと、により構成される4連結頂点データを選択する。具体的には、たとえば、選択部321は、環状結合頂点データ群の各頂点データに対応する原子の混成属性タイプについてアロマティックであるか非アロマティックであるかの特定後に、4連結頂点データ群を選択する。

0034

図4の例では、頂点データp10〜p13が4連結頂点データとして選択される。4連結頂点データ群である頂点データp10〜p13のうち、頂点データp11が、混成属性タイプが未決定な第1の頂点データであり、頂点データp12が、第1の頂点データと結合しあう第2の頂点データであり、頂点データp10が、第1の頂点データと結合しあう第3の頂点データであり、頂点データp13が、第2の頂点データと結合しあう第4の頂点データである。4連結頂点データ群である頂点データp10〜p13のうち、頂点データp10、p13に対応する原子の混成属性タイプは、すでにアロマティックに決定されている。

0035

この場合、決定部323は、選択部321によって選択された4連結頂点データの位置関係に基づいて、第1の頂点データに対応する原子の混成属性タイプを決定する。具体的には、たとえば、判定部322が、4連結頂点データの座標値を参照して、4連結頂点データが一直線上に配列されているか否かを判定する。決定部323は、判定部322によって一直線上に配列されていると判定された場合、第1の頂点データに対応する原子の混成属性タイプを、「S1」に決定する。上記の例では、4連結頂点データ群である頂点データp10〜p13が一直線上にある場合、頂点データp11に対応する原子の混成属性タイプが、「S1」に決定される。

0036

判定部322によって一直線上に配列されていないと判定された場合、判定部322は、4連結頂点データが同一平面上に存在するか否かを判定する。具体的には、たとえば、判定部322は、4連結頂点データの座標値が同一平面上にあるか否かを判定する。より具体的には、判定部322は、4連結頂点データから選ばれた3個の頂点データを含む平面を平面方程式により生成する。そして、残りの1個の頂点データが、生成された平面上に位置するか否かを判定する。

0037

決定部323は、判定部322によって同一平面上に存在すると判定された場合、第1の頂点データに対応する原子の混成属性タイプを、S2またはS3のいずれか一方の混成属性タイプに決定する。上記の例では、4連結頂点データ群である頂点データp10〜p13が同一平面上にある場合、頂点データp11に対応する原子の混成属性タイプが、「SS」に決定される。

0038

一方、決定部323は、判定部322によって同一平面上に存在しないと判定された場合、第1の頂点データに対応する原子の混成属性タイプを、「S3」に決定する。上記の例では、4連結頂点データ群である頂点データp10〜p13が同一平面上にない場合、頂点データp11に対応する原子の混成属性タイプが、「S3」に決定される。図5の(C)のデータ構造500は、図5の(B)の状態から、混成属性タイプが未決定の頂点データに対し、「S1」,「SS」,「S3」のいずれかが決定された状態を示している。

0039

この選択部321、判定部322、および決定部323による一連の処理により、4連結頂点データのうち第1の頂点データに対応する原子の混成属性タイプを、「S1」,「SS」,「S3」のいずれかに決定することができる。

0040

図3に戻り、結合タイプ特定部303は、混成属性タイプ特定部302によって混成属性タイプが特定された頂点データ群から選ばれた結合しあう2つの頂点データに対応する原子の混成属性タイプの組み合わせにより、2つの頂点データに対応する原子間の結合タイプを特定する。具体的には、たとえば、結合タイプ特定部303は、結合タイプ特定テーブルを参照することにより、結合しあう2つの頂点データに対応する原子間の結合タイプを特定する。

0041

図7は、結合タイプ特定テーブルの一例を示す説明図である。結合タイプ特定テーブル700では、結合しあう一方の頂点データに対応する原子の混成属性タイプと、他方の頂点データに対応する原子の混成属性タイプと、の組み合わせにより、「aromatic」、「single」(1重結合)、「double」(2重結合)、「triple」(3重結合)の中から結合タイプが特定される。図6の(B)は、結合タイプの特定後におけるデータ構造を示している。

0042

また、頂点データp19,p20についての混成属性タイプはともに「SS」である。したがって、頂点データp19,p20を結合相手とするリンクデータr21〜r23については、以下のように処理される。

0043

リンクデータr21の場合、頂点データp18に対応する原子の混成属性タイプは「AR」であるため、頂点データp19に対応する原子の混成属性タイプがS2である場合、結合はありえないことになる。したがって、この場合は、頂点データp19に対応する混成属性タイプ「SS」は、「S3」に確定される。そして、「AR」と「S3」の組み合わせの場合、「single」(1重結合)であるため、リンクデータr21の結合タイプは1重結合に決定される。

0044

また、リンクデータr23の場合、結合しあう一方の頂点データp20に対応する原子の混成属性タイプは「SS」であり、他方の頂点データp21に対応する原子の混成属性タイプは「S3」である。この組み合わせの場合、「SS」が「S2」であっても「S3」であっても、「single」(1重結合)であるため、リンクデータr23の結合タイプは1重結合に決定される。

0045

また、リンクデータr22の場合、結合しあう一方の頂点データp19に対応する原子の混成属性タイプは「SS」から「S3」になり、また、他方の頂点データp20に対応する原子の混成属性タイプは「SS」である。この組み合わせの場合、「SS」が「S2」であっても「S3」であっても、「single」(1重結合)であるため、リンクデータr22の結合タイプは1重結合に決定される。

0046

図3に戻り、生成部304は、抽象骨格データ101を構成する2つの頂点データ間の結合を示すリンクデータに結合タイプ特定部303によって特定された結合タイプが付与され、各頂点データに各頂点データに対応する原子の混成属性タイプが付与された、抽象リンクデータ101に対し2次元変換を行うことにより、2次元構造データ110を生成する。生成される2次元構造データ110が、化合物探索のクエリになる。具体的には、たとえば、生成部304は、抽象骨格データ101の頂点データ群のデータ構造500に記憶されている3次元の座標値を2次元の座標値に変換する。

0047

図8は、2次元変換後の頂点データ群のデータ構造例を示す説明図である。2次元変換を行う場合、環状に連結された頂点データ群のうち、混成属性タイプがアロマティックである頂点データ群は、同一平面上に位置する。したがって、生成部304は、環状に連結された頂点データ群については、互いに平行になるように、すなわち、同一平面上に位置するように、座標変換する。図4の例では、環状結合頂点データp1〜p6、p5〜p10、p13〜p18、p22〜p27が同一平面上に配置されることになる。

0048

また、混成属性タイプがアロマティックでない環状結合頂点データ群については、いずれかのリンクデータが、混成属性タイプがアロマティックである環状結合頂点データ群と同一平面上に位置するように、生成部304は座標変換する。図4の例では、混成属性タイプがアロマティックでない環状結合頂点データp26〜p30については、リンクデータr30が、混成属性タイプがアロマティックである環状結合頂点データp22〜p27と同一平面上に配置されることになる。

0049

また、生成部304は、残余の頂点データについて、リンクデータの長さを保つように、混成属性タイプがアロマティックである環状結合頂点データ群と同一平面上に座標変換する。これにより、3次元で表現されている抽象骨格データ101が2次元変換される。なお、2次元変換については、上述した変換例に限らず、他の公知の手法を採用してもよい。

0050

このように、生成部304は、図6の(B)に示したリンクデータ群の各結合タイプと、図8に示した頂点データ群の変換後の座標値と結合先と混成属性タイプにより、2次元構造データ110を生成することができる。

0051

図9は、2次元構造データ110の一例を示す説明図である。図9では、混成属性タイプが「SS」である頂点データが1つであるため、実際には、SS=S2とSS=S3の2つの2次元構造データ110が生成されることになる。なお、図9では混成属性タイプが「SS」である頂点データが1つであるため、2通りの2次元構造データ110が得られるが、「SS」の個数がN個である場合、2N通りの2次元構造データ110が得られることになる。このように、取得部301、混成属性タイプ特定部302、結合タイプ特定部303、および生成部304による一連の処理により、化合物探索のクエリとなる2次元構造データ110が生成されることになる。

0052

つぎに、2次元化合物構造データ102を生成するための機能について説明する。生成装置300は、DB320と、指定部305と、検出部306と、変換部307と、格納部308と、を有し、混成属性タイプが特定された2次元化合物構造データ102を生成する。DB(Data Base)320は、2次元化合物構造データ102を記憶する化合物ライブラリである。

0053

図10は、DB320の記憶内容の一例を示す説明図である。DB320には、2次元化合物構造データ102が記憶されている。2次元化合物構造データ102は、化合物の2次元的な分子構造を示すデータである。2次元化合物構造データ102では、化合物を構成する原子や分子が特定されており、かつ、原子間の結合タイプも特定されている。

0054

図3に戻り、指定部305は、DB320から化合物の2次元的な分子構造を示す2次元化合物構造データ102を指定する。具体的には、指定部305は、DB320の中から、原子を示す頂点データが混成属性タイプに変換されていない2次元化合物構造データ102を指定する。具体的には、たとえば、指定部305は、頂点データに対応する原子の混成属性タイプが特定された2次元化合物構造データ(以下、特定済み2次元化合物構造データ120)がDB320において関連付けられていない2次元化合物構造データ102を指定する。

0055

検出部306は、2次元化合物構造データの中から環式化合物を示す環式化合物データ、3重結合により結合されている一対の頂点データ、2重結合により結合されている一対の頂点データ、1重結合により結合されている一対の頂点データを検出する。検出されたデータは、後述する第1の変換規則テーブル、第2の変換規則テーブルを参照して、混成属性タイプを示すデータに変換される。

0056

変換部307は、指定部305によって指定された2次元化合物構造データ102を構成する原子を示す頂点データの各々を、他の頂点データとの結合関係に基づいて、対応する混成属性タイプを示す頂点データに変換する。具体的には、たとえば、変換部307は、以下に示す変換規則テーブルを参照することにより、2次元化合物構造データ102を変換する。

0057

図11は、第1の変換規則テーブルの一例を示す説明図である。第1の変換規則テーブル1100は、環式化合物の2次元化合物構造データ102の変換規則を規定する。具体的には、たとえば、左欄の変換元データが検出部306により検出されると、右欄の変換後データに変換される。

0058

図12は、第2の変換規則テーブル1200の一例を示す説明図である。第2の変換規則テーブル1200は、連結しあう2つの原子の結合タイプに着目した変換規則を規定する。具体的には、たとえば、左欄の変換元データが検出部306により検出されると、右欄の変換後データに変換される。

0059

図13は、変換部307による2次元化合物構造データ102の変換例を示す説明図である。変換部307は、第1の変換規則テーブル1100および第2の変換規則テーブル1200を参照することにより、2次元化合物構造データ102を変換する。図13の右側の2次元化合物構造データが、特定済み2次元化合物構造データ120であり、各原子の混成属性タイプが特定されている。

0060

図3に戻り、格納部308は、2次元化合物構造データ102に、変換部307による変換後の2次元化合物構造データを関連付けて、データベースに格納する。具体的には、たとえば、格納部308は、特定済み2次元化合物構造データ120を、その変換元となった2次元化合物構造データ102と関連付けてDB320に格納する。

0061

図14は、格納部308による格納後のDB320の記憶内容の一例を示す説明図である。図14において、変換元である2次元化合物構造データ102と、特定済み2次元化合物構造データ120と、が関連付けて記憶されている。したがって、クエリにより特定済み2次元化合物構造データ120がヒットすると、その特定済み2次元化合物構造データ120に関連付けられている2次元化合物構造データ102がDB320から抽出されることになる。

0062

このように、指定部305、変換部307、および格納部308による一連の処理により、特定済み2次元化合物構造データ120を生成して、DB320に、変換元の2次元化合物構造データ102に関連付けて格納することができる。

0063

また、図3に戻り、生成装置300は、検索部309と、抽出部310と、出力部311と、を有し、DB320を用いた化合物探索を実行する。まず、検索部309は、DB320から、生成部304によって生成された2次元構造データ110を含む特定済み2次元化合物構造データ120を検索する。具体的には、たとえば、検索部309は、クエリとなる2次元構造データ110を包含(完全一致含む)する特定済み2次元化合物構造データ120を検索する。

0064

抽出部310は、検索部309によって検索された特定済み2次元化合物構造データ120に関連付けられている2次元化合物構造データ102を、DB320から抽出する。また、抽出部310は、検索部309によって検索された特定済み2次元化合物構造データ120に関連付けられている2次元化合物構造データ102のうち、抽出条件に該当する2次元化合物構造データ102を抽出することとしてもよい。抽出条件としては、たとえば、置換基官能基を含む構造や、特定の置換基や特定の官能基を含む構造といった条件が設定される。これにより、抽出される2次元化合物構造データ102を絞り込むことができる。

0065

また、抽出条件として、クエリから所定数分のリンクデータの結合までの構造といった条件が設定される。所定数はユーザが任意に設定可能である。たとえば、ワンボンドまでの構造とすることができる。クエリを包含する2次元化合物構造データ102であっても、クエリ以外の分子構造が大きいと標的蛋白質に収まらないことがあるため、抽出条件を設定することにより、抽出される2次元化合物構造データ102の大きさを制限することができる。

0066

出力部311は、抽出部310によって抽出された2次元化合物構造データ102を出力する。出力形式としては、たとえば、ディスプレイ208への表示、プリンタ213への印刷、外部装置への送信、生成装置300内の記憶装置への格納がある。このように、検索部309、抽出部310、および出力部311による一連の処理により、特定済み2次元化合物構造データ120に関連付けられている2次元化合物構造データ102を得ることができる。

0067

<生成処理手順>
つぎに、生成装置300による生成処理手順についてフローチャートを用いて説明する。図15図19のフローチャートは、取得部301、混成属性タイプ特定部302、結合タイプ特定部303、および生成部304によるクエリ生成の処理手順を示す。図20図23のフローチャートは、指定部305、変換部307、および格納部308によるDB生成の処理手順を示す。図24のフローチャートは、検索部309、抽出部310、および出力部311による化合物探索の処理手順を示す。

0068

図15は、生成装置300によるクエリ生成処理手順例を示すフローチャートである。生成装置300は、まず、取得部301により、抽象リンクデータ101を読み込み(ステップS1501)、混成属性タイプ特定部302により、抽象リンクデータ101からの混成属性タイプ特定処理を実行する(ステップS1502)。抽象リンクデータ101からの混成属性タイプ特定処理(ステップS1502)の詳細については、図16において説明する。

0069

つぎに、生成装置300は、結合タイプ特定部303により、原子間の結合タイプ特定処理を実行する(ステップS1503)。原子間の結合タイプ特定処理(ステップS1503)の詳細については、図19において説明する。そして、生成装置300は、生成部304によりクエリとなる2次原構造データを生成する(ステップS1504)。これにより、クエリ生成処理が終了する。

0070

図16は、図15に示した抽象骨格データ101からの混成属性タイプ特定処理(ステップS1502)の詳細な処理手順例を示すフローチャートである。生成装置300は、混成属性タイプ特定部302により、第1の混成属性タイプ決定処理を実行し(ステップS1601)、つぎに、第2の混成属性タイプ決定処理を実行する(ステップS1602)。第1の混成属性タイプ決定処理(ステップS1601)の詳細については、図17において説明する。第2の混成属性タイプ決定処理(ステップS1602)の詳細については、図18において説明する。

0071

図17は、図16に示した第1の混成属性タイプ決定処理(ステップS1601)の詳細な処理手順例を示すフローチャートである。生成装置300は、抽象骨格データ101の中から未選択の環状結合頂点データ群があるか否かを判断する(ステップS1701)。未選択の環状結合頂点データ群がある場合(ステップS1701:Yes)、生成装置300は、選択部321により、未選択の環状結合頂点データ群を選択する(ステップS1702)。つぎに、生成装置300は、判定部322により、選択された環状結合頂点データ群の各頂点データが同一平面上にあるか否かを判定する(ステップS1703)。同一平面上にない場合(ステップS1703:No)、ステップS1701に戻る。

0072

一方、同一平面上にある場合(ステップS1703:Yes)、生成装置300は、決定部323により、環状結合頂点データ群の各頂点データに対応する原子の混成属性タイプを、アロマティック(AR)に決定する(ステップS1704)。決定された混成属性タイプは、対応する頂点データに関連付けて、頂点データ群のデータ構造500に格納される。このあと、ステップS1701に戻る。そして、ステップS1701において、未選択の環状結合頂点データ群がない場合(ステップS1701:No)、第2の混成属性タイプ決定処理(ステップS1602)に移行する。

0073

図18は、図16に示した第2の混成属性タイプ決定処理(ステップS1602)の詳細な処理手順例を示すフローチャートである。生成装置300は、まず、混成属性タイプが未決定の頂点データがあるか否かを判断する(ステップS1801)。混成属性タイプが未決定の頂点データがある場合(ステップS1801:Yes)、生成装置300は、選択部321により、未決定の頂点データを1つ選択する(ステップS1802)。

0074

つぎに、生成装置300は、選択された頂点データ(以下、「選択頂点データ」)の結合先となる頂点データ(以下、「結合先頂点データ」)を検出する(ステップS1803)。そして、生成装置300は、選択頂点データおよび結合先頂点データを中心とする4連結頂点データを特定する(ステップS1804)。生成装置300は、判定部322により、4連結頂点データが一直線上にあるか否かを判定する(ステップS1805)。一直線上にある場合(ステップS1805:Yes)、生成装置300は、決定部323により、選択頂点データに対応する原子の混成属性タイプを「S1」に決定する(ステップS1806)。決定された混成属性タイプは、選択頂点データに関連付けて、頂点データ群のデータ構造500に格納される。このあと、ステップS1801に戻る。

0075

一方、ステップS1805において、一直線上にないと判定された場合(ステップS1805:No)、生成装置300は、判定部322により、4連結頂点データが同一平面上にあるか否かを判定する(ステップS1807)。同一平面上にある場合(ステップS1807:Yes)、生成装置300は、選択頂点データに対応する原子の混成属性タイプを「SS」に決定する(ステップS1808)。決定された混成属性タイプは、選択頂点データに関連付けて、頂点データ群のデータ構造500に格納される。このあと、ステップS1801に戻る。

0076

一方、ステップS1807において、同一平面上にないと判定された場合(ステップS1807:No)、生成装置300は、選択頂点データに対応する原子の混成属性タイプを「S3」に決定する(ステップS1809)。決定された混成属性タイプは、選択頂点データに関連付けて、頂点データ群のデータ構造500に格納される。このあと、ステップS1801に戻る。また、ステップS1801において、混成属性タイプが未決定の頂点データがないと判断された場合(ステップS1801:No)、第2の混成属性タイプ決定処理(ステップS1602)を終了し、図15の原子間の結合タイプ特定処理(ステップS1503)に移行する。これにより、各頂点データに対応する原子の混成属性タイプが抽象骨格データ101から特定されることになる。

0077

図19は、図15に示した原子間の結合タイプ特定処理(ステップS1503)の詳細な処理手順例を示すフローチャートである。生成装置300は、まず、未選択の結合しあう頂点データ対が抽象骨格データ101にあるか否かを判断し(ステップS1901)、未選択の結合しあう頂点データ対がある場合(ステップS1901:Yes)、未選択の結合しあう頂点データ対を1組選択する(ステップS1902)。

0078

つぎに、生成装置300は、図7に示した結合タイプ特定テーブル700を参照して、選択された結合しあう頂点データ対の各混成属性タイプにより、選択された頂点データ対を結合させるリンクデータの結合タイプを特定する(ステップS1903)。特定された結合タイプは、選択された頂点データ対を結合させるリンクデータに関連付けて、リンクデータ群のデータ構造600に格納される。このあと、ステップS1901に戻る。

0079

そして、ステップS1901において、未選択の結合しあう頂点データ対がない場合(ステップS1901:No)、原子間の結合タイプ特定処理(ステップS1503)を終了し、図15のクエリ生成(ステップS1504)に移行する。これにより、各リンクデータの結合タイプが特定されることになる。

0080

また、たとえば、ステップS1902の選択では、生成装置300は、混成属性タイプ「SS」を含まない頂点データ対から優先的に選択する。混成属性タイプ「SS」を含まない頂点データ対がない場合は、生成装置300は、いずれか一方の頂点データの混成属性タイプが「SS」となる頂点データ対を選択する。いずれか一方の頂点データの混成属性タイプが「SS」となる頂点データ対もない場合は、生成装置300は、結合しあう頂点データ対の双方の混成属性タイプが「SS」となる頂点データ対を選択する。

0081

このような優先的な選択をおこなうことにより、当初は混成属性タイプが「SS」であった頂点データの混成属性タイプが、「S2」または「S3」に確定する場合がある。たとえば、頂点データp19は、当初は「SS」であったが、結合先の頂点データに対応する原子の混成属性タイプが「AR」であるため、「S2」はあり得ない混成属性タイプとなり、「S3」に確定することになる。

0082

このように、クエリ生成処理により、利用者は、原子タイプや結合タイプのパラメータを意識しなくても、化合物探索に利用できるクエリを得ることができる。

0083

図20は、生成装置300によるDB生成処理手順例を示すフローチャートである。生成装置300は、まず、DB320の中に未指定の2次元化合物構造データ102があるか否かを判断する(ステップS2001)。未指定の2次元化合物構造データ102がある場合(ステップS2001:Yes)、生成装置300は、指定部305により、未指定の2次元化合物構造データ102を1つ指定する(ステップS2002)。つぎに、生成装置300は、検出部306および変換部307により、指定された2次元化合物構造データ102(以下、「指定2次元化合物構造データ102」)からの混成属性タイプ特定処理を実行する(ステップS2003)。指定2次元化合物構造データ102からの混成属性タイプ特定処理(ステップS2003)の詳細については、図21において説明する。

0084

このあと、生成装置300は、格納部308により、指定2次元化合物構造データ102からの混成属性タイプ特定処理(ステップS2003)で得られた特定済み2次元化合物構造データ120を、指定2次元化合物構造データ102に関連付けてDB320に格納する(ステップS2004)。そして、ステップS2001に戻る。ステップS2001において、未指定の2次元化合物構造データ102がない場合(ステップS2001:No)、DB生成処理を終了する。これにより、2次元化合物構造データ102と特定済み2次元化合物構造データ120とを関連付けたDB320を生成することができる。

0085

図21は、図20に示した指定2次元化合物構造データ102からの混成属性タイプ特定処理(ステップS2003)の詳細な処理手順例を示すフローチャートである。生成装置300は、まず、第3の混成属性タイプ決定処理を実行し(ステップS2101)、つぎに、第4の混成属性タイプ決定処理を実行する(ステップS2102)。第3の混成属性タイプ決定処理(ステップS2101)の詳細については、図22において説明する。また、第4の混成属性タイプ決定処理(ステップS2102)の詳細については、図23において説明する。

0086

図22は、図21に示した第3の混成属性タイプ決定処理(ステップS2101)の詳細な処理手順例を示すフローチャートである。生成装置300は、まず、検出部306により、指定2次元化合物構造データ102の中の未選択の環式化合物を示す環式化合物データを検出する(ステップS2201)。未選択の環式化合物データが検出された場合(ステップS2201:Yes)、生成装置300は、未選択の環式化合物データを選択する(ステップS2202)。そして、生成装置300は、変換部307により第1の変換規則テーブル1100を参照して、選択された環式化合物データを構成する頂点データを、該当する混成属性タイプを示す頂点データに変換する(ステップS2203)。具体的には、たとえば、頂点データのデータ構造(不図示)に、該当する混成属性タイプが関連付けされる。このあと、ステップS2201に戻る。

0087

ステップS2201において、未選択の環式化合物データが検出されない場合(ステップS2201:No)、第4の混成属性タイプ決定処理(ステップS2102)に移行する。このように、第3の混成属性タイプ決定処理(ステップS2101)により、環式化合物データの混成属性タイプが特定されることになる。

0088

図23は、図21に示した第4の混成属性タイプ決定処理(ステップS2102)の詳細な処理手順例を示すフローチャートである。生成装置300は、まず、検出部306により、指定2次元化合物構造データ102の中の3重結合により結合しあう頂点データ対を検出する(ステップS2301)。3重結合により結合しあう頂点データ対が検出された場合(ステップS2301:Yes)、生成装置300は、変換部307により第2の変換規則テーブル1200を参照して、検出された頂点データ対を、該当する混成属性タイプを示す頂点データ対に変換する(ステップS2302)。

0089

具体的には、たとえば、頂点データ対の各頂点データのデータ構造(不図示)に、該当する混成属性タイプが関連付けされる。このあと、ステップS2301に戻る。これにより、3重結合についての混成属性タイプが、2重結合および1重結合よりも優先的に決定される。

0090

一方、ステップS2301において、3重結合により結合しあう頂点データ対が検出されなかった場合(ステップS2301:No)、生成装置300は、検出部306により、指定2次元化合物構造データ102の中の2重結合により結合しあう頂点データ対を検出する(ステップS2303)。2重結合により結合しあう頂点データ対が検出された場合(ステップS2303:Yes)、生成装置300は、変換部307により第2の変換規則テーブル1200を参照して、検出された頂点データ対を、該当する混成属性タイプを示す頂点データ対に変換する(ステップS2304)。

0091

具体的には、たとえば、頂点データ対の各頂点データのデータ構造(不図示)に、該当する混成属性タイプが関連付けされる。このあと、ステップS2303に戻る。これにより、2重結合についての混成属性タイプが、1重結合よりも優先的に決定される。

0092

一方、ステップS2303において、2重結合により結合しあう頂点データ対が検出されなかった場合(ステップS2303:No)、生成装置300は、検出部306により、指定2次元化合物構造データ102の中の1重結合により結合しあう頂点データ対を検出する(ステップS2305)。1重結合により結合しあう頂点データ対が検出された場合(ステップS2305:Yes)、生成装置300は、変換部307により第2の変換規則テーブル1200を参照して、検出された頂点データ対を、該当する混成属性タイプを示す頂点データ対に変換する(ステップS2306)。具体的には、たとえば、頂点データ対の各頂点データのデータ構造(不図示)に、該当する混成属性タイプが関連付けされる。このあと、ステップS2305に戻る。

0093

一方、ステップS2305において、1重結合により結合しあう頂点データ対が検出されなかった場合(ステップS2305:No)、第4の混成属性タイプ決定処理(ステップS2102)を終了する。このように、第4の混成属性タイプ決定処理(ステップS2102)により、1重結合〜3重結合についての混成属性タイプが特定された特定済み2次元化合物構造データ120が得られることになる。

0094

図24は、生成装置300による化合物探索処理手順例を示すフローチャートである。生成装置300は、まず、クエリを読み込み(ステップS2401)、抽出条件が設定されている場合には抽出条件も読み込む(ステップS2402)。そして、生成装置300は、未選択の特定済み2次元化合物構造データ120がDB320にあるか否かを判断する(ステップS2403)。未選択の特定済み2次元化合物構造データ120がある場合(ステップS2403:Yes)、生成装置300は、未選択の特定済み2次元化合物構造データ120をDB320から選択する(ステップS2404)。そして、生成装置300は、検索部309により、選択された特定済み2次元化合物構造データ120がクエリを包含するか否かを判断する(ステップS2405)。

0095

包含しない場合(ステップS2405:No)、ステップS2403に戻る。一方、包含する場合(ステップS2405:Yes)、生成装置300は、抽出部310により、選択された特定済み2次元化合物構造データ120に関連付けられている2次元化合物構造データ102をDB320から抽出する(ステップS2406)。そして、ステップS2403に戻る。一方、ステップS2403において、未選択の特定済み2次元化合物構造データ120がない場合(ステップS2403:No)、生成装置300は、出力部311により、抽出された2次元化合物構造データ102を出力する(ステップS2407)。これにより、化合物探索を終了する。このように、化合物探索処理により、利用者は、原子タイプや結合タイプのパラメータを意識せずに、化合物探索の結果を得ることができる。

0096

なお、化合物探索により得られた2次元化合物構造データ102のうちクエリに該当する頂点データについては、クエリの生成元となる抽象骨格データ101の座標値を適用することにより、3次元変換される。また、クエリ以外の分子構造については、2次元化合物構造データ102の原子タイプと結合タイプを元にして、3次元変換される。これにより、2次元化合物構造データ102は、3次元化合物構造データに変換される。このあと、3次元化合物構造データを、標的蛋白質の3次元構造データに与え、分子力学法などを用いて標的蛋白質内における化合物の評価が行われることになる。

0097

このように、従来では、コンピュータを利用した試薬探索において、1つの試薬を計算するのに2〜3分の時間を必要とし、大規模試薬データベース(たとえば、10の6乗規模)のドッキングによる評価では、半年から1年もかかっている。すなわち、現実的には実験同様、一部の試薬構造しか評価できないのが、実情である。これに対し、本実施の形態では、原子タイプや結合タイプを指定せず、抽象骨格データ101の形状に着目して混成属性タイプや結合タイプを特定することにより、化合物探索に用いられるクエリを効率的に生成することができる。これにより、標的蛋白質の評価の効率化を図ることができる。

0098

また、環状結合頂点データ群の各々が同一平面上にあるか否かにより、混成属性タイプがアロマティックに決定されるため、一度に複数の頂点データに対応する原子の混成属性タイプを決定することができ、クエリ生成の効率化を図ることができる。

0099

また、4連結頂点データの形状から、S1、SS、S3といった混成属性タイプが決定されるため、原子タイプが指定されていなくても、混成属性タイプが特定される。したがって、クエリ生成の効率化を図ることができる。

0100

また、検索対象となる2次元化合物構造データ102についても、混成属性タイプを特定することにより、クエリを用いた化合物探索を可能にすることができる。したがって、原子タイプや結合タイプが指定されていなくても、抽象骨格データ101とDB320内の2次元化合物構造データ102があれば、効率的な化合物探索を実行することができる。これにより、標的蛋白質の評価の効率化を図ることができる。

0101

また、化合物探索において抽出条件を設定しておくことにより、抽出される2次元化合物構造データを絞り込むことができるため、効率的な化合物探索を実行することができる。これにより、標的蛋白質の評価の効率化を図ることができる。

0102

また、上述した実施の形態では、クエリ生成、DB生成、および化合物探索を、1台の生成装置300で実現したが、クエリ生成、DB生成、および化合物探索をそれぞれ異なるコンピュータにより実現し、各コンピュータをネットワークで接続したシステムであってもよい。また、クエリ生成、DB生成、および化合物探索のうちいずれか2つを実現するコンピュータと、残余の1つを実現するコンピュータとをネットワークで接続したシステムであってもよい。また、DB320は、インターネットなどのネットワーク上で公開されている既存の化合物ライブラリを用いてもよい。

0103

以上説明したように、本実施の形態によれば、クエリ生成の効率化を図ることができ、化合物探索、ひいては、標的蛋白質の評価の効率化を図ることができる。

0104

なお、本実施の形態で説明した生成方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本生成プログラムは、ハードディスクフレキシブルディスクCD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。

0105

上述した実施の形態に関し、さらに以下の付記を開示する。

0106

(付記1)コンピュータが、
前記コンピュータがアクセス可能な記憶装置から、原子の種類が未定義である複数の頂点データが結合された3次元の抽象骨格データを取得し、
取得された抽象骨格データにおける各頂点データの結合関係に基づいて、前記各頂点データに対応する原子の混成属性タイプを特定し、
混成属性タイプが特定された頂点データ群から選ばれた結合しあう2つの頂点データに対応する原子の混成属性タイプの組み合わせにより、前記2つの頂点データに対応する原子間の結合タイプを特定し、
前記抽象骨格データを構成する前記2つの頂点データ間の結合を示すリンクデータに特定された結合タイプが付与され、前記各頂点データに前記各頂点データに対応する原子の混成属性タイプが付与された、前記抽象骨格データに対し、2次元変換を行うことにより、2次元構造データを生成する、
処理を実行することを特徴とする生成方法。

0107

(付記2)前記混成属性タイプを特定する処理は、
前記複数の頂点データのうち、混成属性タイプが未決定であり、かつ、環状結合頂点データ群を選択し、
選択された前記環状結合頂点データ群の各頂点データが同一平面上に存在するか否かを判定し、
同一平面上に存在すると判定された場合、前記環状結合頂点データ群の各頂点データに対応する原子の混成属性タイプを、アロマティックに決定する、
処理を含むことを特徴とする付記1に記載の生成方法。

0108

(付記3)前記選択する処理は、
混成属性タイプが未決定な第1の頂点データと、前記第1の頂点データと結合しあう第2の頂点データおよび第3の頂点データと、前記第2の頂点データと結合しあう第4の頂点データと、により構成される4連結頂点データを選択し、
前記決定する処理は、
選択された4連結頂点データの位置関係に基づいて、前記第1の頂点データに対応する原子の混成属性タイプを決定することを特徴とする付記2に記載の生成方法。

0109

(付記4)前記判定する処理は、
前記4連結頂点データが一直線上に配列されているか否かを判定し、
前記決定する処理は、
一直線上に配列されていると判定された場合、前記第1の頂点データに対応する原子の混成属性タイプを、Spに決定することを特徴とする付記3に記載の生成方法。

0110

(付記5)前記判定する処理は、
前記4連結頂点データが一直線上に配列されていない場合、同一平面上に存在するか否かを判定し、
前記決定する処理は、
同一平面上に存在すると判定された場合、前記第1の頂点データに対応する原子の混成属性タイプを、Sp2またはSp3のいずれか一方の混成属性タイプに決定することを特徴とする付記4に記載の生成方法。

0111

(付記6)前記判定する処理は、
前記4連結頂点データが一直線上に配列されていない場合、同一平面上に存在するか否かを判定し、
前記決定する処理は、
同一平面上に存在しないと判定された場合、前記第1の頂点データに対応する原子の混成属性タイプを、Sp3に決定することを特徴とする付記4に記載の生成方法。

0112

(付記7)前記コンピュータが、
化合物ごとに、化合物の2次元的な分子構造を示す2次元化合物構造データと、当該2次元化合物構造データの各頂点データに対応する原子の混成属性タイプが特定され、かつ、頂点データ間のリンクデータの結合タイプが特定されている特定済み2次元化合物構造データと、が関連付けて記憶されているデータベースから、生成された2次元構造データを含む特定済み2次元化合物構造データを検索し、
検索された特定済み2次元化合物構造データに関連付けられている2次元化合物構造データを、前記データベースから抽出し、
抽出された2次元化合物構造データを出力する、
処理を実行することを特徴とする付記1〜6のいずれか一つに記載の生成方法。

0113

(付記8)前記抽出する処理は、
前記特定済み2次元化合物構造データに関連付けられている2次元化合物構造データのうち、抽出条件に該当する2次元化合物構造データを、前記データベースから抽出することを特徴とする付記7に記載の生成方法。

0114

(付記9)前記コンピュータが、
前記コンピュータがアクセス可能なデータベースから化合物の2次元的な分子構造を示す2次元化合物構造データを指定し、
指定された2次元化合物構造データを構成する原子を示す頂点データの各々を、他の頂点データとの結合関係に基づいて、対応する混成属性タイプを示す頂点データに変換し、
前記2次元化合物構造データに、変換により得られた、前記特定済み2次元化合物構造データを関連付けて、前記データベースに格納する、処理を実行し、
前記検索する処理は、
格納後のデータベースから、前記2次元構造データを含む特定済み2次元化合物構造データを検索することを特徴とする付記7または8に記載の生成方法。

0115

(付記10)前記コンピュータが、
前記2次元化合物構造データの中から環式化合物を示す環式化合物データを検出する処理を実行し、
前記変換する処理は、
検出された環式化合物データを構成する原子を示す頂点データの各々を、前記環式化合物に対応する混成属性タイプを示す頂点データに変換することを特徴とする付記9に記載の生成方法。

0116

(付記11)前記コンピュータが
前記2次元化合物構造データの中から3重結合により結合されている一対の頂点データを検出する処理を実行し、
前記変換する処理は、
検出された一対の頂点データの各々を、Spを示す頂点データに変換することを特徴とする付記9に記載の生成方法。

0117

(付記12)前記コンピュータが、
前記2次元化合物構造データの中から2重結合により結合されている一対の頂点データを検出する処理を実行し、
前記変換する処理は、
検出された一対の頂点データの各々を、Sp2を示す頂点データに変換することを特徴とする付記9に記載の生成方法。

0118

(付記13)前記コンピュータが、
前記2次元化合物構造データの中から1重結合により結合されている一対の頂点データを検出する処理を実行し、
前記変換する処理は、
検出された一対の頂点データの各々を、Sp3を示す頂点データに変換することを特徴とする付記9に記載の生成方法。

0119

(付記14)コンピュータが、
前記コンピュータがアクセス可能なデータベースから化合物の2次元的な分子構造を示す2次元化合物構造データを指定し、
指定された2次元化合物構造データを構成する原子を示す頂点データの各々を、他の頂点データとの結合関係に基づいて、対応する混成属性タイプを示す頂点データに変換し、
前記2次元化合物構造データに、変換後の2次元化合物構造データを関連付けて、前記データベースに格納する、
処理を実行することを特徴とする生成方法。

0120

(付記15)前記コンピュータが、
前記2次元化合物構造データの中から環式化合物を示す環式化合物データを検出する処理を実行し、
前記変換する処理は、
検出された環式化合物データを構成する原子を示す頂点データの各々を、前記環式化合物に対応する混成属性タイプを示す頂点データに変換することを特徴とする付記14に記載の生成方法。

0121

(付記16)前記コンピュータが、
前記2次元化合物構造データの中から3重結合により結合されている一対の頂点データを検出する処理を実行し、
前記変換する処理は、
検出された一対の頂点データの各々を、Spを示す頂点データに変換することを特徴とする付記14に記載の生成方法。

0122

(付記17)前記コンピュータが、
前記2次元化合物構造データの中から2重結合により結合されている一対の頂点データを検出する処理を実行し、
前記変換する処理は、
検出された一対の頂点データの各々を、Sp2を示す頂点データに変換することを特徴とする付記14に記載の生成方法。

0123

(付記18)前記コンピュータが、
前記2次元化合物構造データの中から1重結合により結合されている一対の頂点データを検出する処理を実行し、
前記変換する処理は、
検出された一対の頂点データの各々を、Sp3を示す頂点データに変換することを特徴とする付記14に記載の生成方法。

0124

(付記19)コンピュータに、
前記コンピュータがアクセス可能な記憶装置から、原子の種類が未定義である複数の頂点データが結合された3次元の抽象骨格データを取得し、
取得された抽象骨格データにおける各頂点データの結合関係に基づいて、前記各頂点データに対応する原子の混成属性タイプを特定し、
混成属性タイプが特定された頂点データ群から選ばれた結合しあう2つの頂点データに対応する原子の混成属性タイプの組み合わせにより、前記2つの頂点データに対応する原子間の結合タイプを特定し、
前記抽象骨格データを構成する前記2つの頂点データ間の結合を示すリンクデータに特定された結合タイプが付与され、前記各頂点データに前記各頂点データに対応する原子の混成属性タイプが付与された、前記抽象骨格データに対し、2次元変換を行うことにより、2次元構造データを生成する、
処理を実行させることを特徴とする生成プログラム。

0125

(付記20)コンピュータに、
前記コンピュータがアクセス可能なデータベースから化合物の2次元的な分子構造を示す2次元化合物構造データを指定し、
指定された2次元化合物構造データを構成する原子を示す頂点データの各々を、他の頂点データとの結合関係に基づいて、対応する混成属性タイプを示す頂点データに変換し、
前記2次元化合物構造データに、変換後の2次元化合物構造データを関連付けて、前記データベースに格納する、
処理を実行させることを特徴とする生成プログラム。

0126

(付記21)記憶装置から、原子の種類が未定義である複数の頂点データが結合された3次元の抽象骨格データを取得する取得部と、
前記取得部によって取得された抽象骨格データにおける各頂点データの結合関係に基づいて、前記各頂点データに対応する原子の混成属性タイプを特定する混成属性タイプ特定部と、
前記混成属性タイプ特定部によって混成属性タイプが特定された頂点データ群から選ばれた結合しあう2つの頂点データに対応する原子の混成属性タイプの組み合わせにより、前記2つの頂点データに対応する原子間の結合タイプを特定する結合タイプ特定部と、
前記抽象骨格データを構成する前記2つの頂点データ間の結合を示すリンクデータに前記結合タイプ特定部によって特定された結合タイプが付与され、前記各頂点データに前記各頂点データに対応する原子の混成属性タイプが付与された、前記抽象骨格データに対し、2次元変換を行うことにより、2次元構造データを生成する生成部と、
を有することを特徴とする生成装置。

0127

(付記22)データベースから化合物の2次元的な分子構造を示す2次元化合物構造データを指定する指定部と、
前記指定部によって指定された2次元化合物構造データを構成する原子を示す頂点データの各々を、他の頂点データとの結合関係に基づいて、対応する混成属性タイプを示す頂点データに変換する変換部と、
前記2次元化合物構造データに、前記変換部による変換後の2次元化合物構造データを関連付けて、前記データベースに格納する格納部と、
を有することを特徴とする生成装置。

0128

101抽象骨格データ
102 2次元化合物構造データ
110 2次元構造データ
120特定済み2次元化合物構造データ
300生成装置
301 取得部
302混成属性タイプ特定部
303 結合タイプ特定部
304 生成部
305 指定部
306 検出部
307 変換部
308 格納部
309検索部
310 抽出部
311 出力部
321 選択部
322 判定部
323 決定部
700 結合タイプ特定テーブル
1100 第1の変換規則テーブル
1200 第2の変換規則テーブル

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ