図面 (/)

技術 疎結合多重計算機システムにおける障害復旧システム、障害復旧方法、および障害復旧プログラムを記憶する媒体

出願人 日本電気株式会社
発明者 山岸裕治
出願日 1996年4月25日 (24年7ヶ月経過) 出願番号 1996-105201
公開日 1997年2月7日 (23年10ヶ月経過) 公開番号 1997-034853
状態 特許登録済
技術分野 エラー時の再試行 ハードウェアの冗長性 マルチプロセッサ
主要キーワード 多重計算 定期保守 計算機識別情報 障害復旧システム 各計算機毎 配置装置 待機系計算機 ホットスタンバイシステム
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1997年2月7日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (7)

目的

疎結合多重計算機システムのどの計算機障害が発生しても、利用者が該障害により影響を受けることなく業務を続行することができるようにする。

構成

計算機1は、共有データ20を更新するトランザクションの処理の開始時に、排他手段11に自身が該共有データ20を使用する旨登録し、更新記録保持手段31に共有データ20の更新前のデータである更新処理情報を出力した後、該共有データ20を更新し、トランザクション終了時に更新記録保持手段31の更新処理情報を削除する。障害通知手段50から計算機1がトランザクション終了前に障害となったことを通知された計算機2または3は、排他手段11に自身が該共有データ20を使用する旨登録し、更新記録保持手段31に格納されている更新処理情報の内、「リカバリ不要」となっていないものを元にして、該共有データ20を復旧し、該更新処理情報を「リカバリ不要」とする。

概要

背景

IMS/VS EXTENDED RECOVERYFACILITY(XRF): GENERALINFORMATION, GG24-3150-00,IBM World Trade Corporation,March 1987」には、計算機障害が発生しても利用者が該障害の影響を受けることなく業務を続行することができる信頼性の高い計算機システムである、疎結合多重計算機システムを利用したホットスタンバイシステムが記載されている。

このホットスタンバイシステムは、業務処理を実施する稼動系計算機(以下、稼働系とする)と、稼動系に障害が発生した場合に、復旧処理を行う待機系計算機(以下、待機系とする)との2つの系により構成される。稼動系が各計算機間で共有しているデータを更新中に該稼動系に障害が発生した場合、稼働系によって中途半端に更新されたデータを待機系が更新前の状態に復旧した後、待機系が新たに稼動系に切り替わり、業務を継続して実行する。

概要

疎結合多重計算機システムのどの計算機に障害が発生しても、利用者が該障害により影響を受けることなく業務を続行することができるようにする。

計算機1は、共有データ20を更新するトランザクションの処理の開始時に、排他手段11に自身が該共有データ20を使用する旨登録し、更新記録保持手段31に共有データ20の更新前のデータである更新処理情報を出力した後、該共有データ20を更新し、トランザクション終了時に更新記録保持手段31の更新処理情報を削除する。障害通知手段50から計算機1がトランザクション終了前に障害となったことを通知された計算機2または3は、排他手段11に自身が該共有データ20を使用する旨登録し、更新記録保持手段31に格納されている更新処理情報の内、「リカバリ不要」となっていないものを元にして、該共有データ20を復旧し、該更新処理情報を「リカバリ不要」とする。

目的

本発明の目的は、疎結合多重計算機システムを構成する計算機のいずれかに障害が発生しても、利用者が該障害により影響を受けることなく業務を続行することができる信頼性の高い計算機システムを提供することにある。

本発明の他の目的は、疎結合多重計算機システムを構成する計算機のいずれかに障害が発生しても、他に正常に動作している計算機が存在している場合にはそれらの内のいずれかの計算機によって、障害が発生した計算機によって更新されたデータを更新前の状態に復旧することができるようにすることにある。

さらに本発明の他の目的は、障害が発生した計算機によって更新されたデータを更新前の状態に復旧する計算機が、該復旧処理を行うために必要とする情報を障害が発生する前に受け取らなくても、該復旧処理を行うことができるようにすることにある。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

複数の計算機と、前記複数の計算機間共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備え、前記複数の計算機のそれぞれは、業務実施時において、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報を削除することを特徴とする疎結合多重計算機システムにおける障害復旧システム

請求項2

前記複数の各計算機のそれぞれは、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報を元にして前記共有データを更新前の状態に復旧することを特徴とする請求項1記載の疎結合多重計算機システムにおける障害復旧システム。

請求項3

複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備え、前記複数の計算機のそれぞれは、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報を削除し、前記排他手段から自計算機の識別子を削除することを特徴とする疎結合多重計算機システムにおける障害復旧システム。

請求項4

前記複数の各計算機のそれぞれは、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報を元にして前記共有データを更新前の状態に復旧し、前記排他手段に登録されている自計算機の識別子を削除することを特徴とする請求項3記載の疎結合多重計算機システムにおける障害復旧システム。

請求項5

複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機毎に、該計算機の識別子と該計算機の復旧処理が行われているか否かを示す情報とを含むリカバリ情報と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備え、前記複数の計算機のそれぞれは、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報にリカバリ不要の識別子を付し、前記排他手段から自計算機の識別子を削除することを特徴とする疎結合多重計算機システムにおける障害復旧システム。

請求項6

前記複数の計算機のそれぞれは、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記リカバリ情報を参照して復旧処理が行われているか否かを判定し、復旧処理が行われていないと判定した場合には、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記リカバリ情報に復旧処理を行う旨を登録し、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報の内、リカバリ不要の識別子が付されていないものを元にして前記共有データを更新前の状態に復旧し、該更新処理情報にリカバリ不要の識別子を付し、前記排他手段に登録されている自計算機の識別子を削除し、該他の計算機の前記リカバリ情報を削除することを特徴とする請求項5記載の疎結合多重計算機システムにおける障害復旧システム。

請求項7

複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記複数の計算機毎に、前記更新記録保持手段が設定されている装置の装置名を保持する更新記録管理手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機毎に、該計算機の識別子、該計算機が保持している前記更新記録管理手段が設定されている装置の装置名、該計算機の復旧処理が行われているか否かを示す情報、および該復旧処理を行っている他の計算機の計算機識別子を含むリカバリ情報と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備え、前記複数の計算機のぞれぞれは、業務開始時において、自計算機の識別子と自計算機の前記更新記録管理手段を設定した装置の装置名を格納した前記リカバリ情報を作成し、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報にリカバリ不要の識別子を付し、前記排他手段から自計算機の識別子を削除することを特徴とする疎結合多重計算機システムにおける障害復旧システム。

請求項8

前記複数の計算機のそれぞれは、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記リカバリ情報を参照して復旧処理が行われているか否かを判定し、復旧処理が行われていないと判定した場合には、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記リカバリ情報に復旧処理を行う旨および自計算機の識別子を登録し、該他の計算機の前記リカバリ情報を参照して前記更新記録保持手段が設定されている装置の装置名を認識し、該更新記録保持手段に格納されている前記更新処理情報の内、リカバリ不要の識別子が付されていないものを元にして前記共有データを更新前の状態に復旧し、該更新処理情報にリカバリ不要の識別子を付し、前記排他手段に登録されている自計算機の識別子を削除し、該他の計算機の前記リカバリ情報を削除することを特徴とする請求項7記載の疎結合多重計算機システムにおける障害復旧システム。

請求項9

前記複数の計算機のそれぞれは、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機が復旧処理を行っている旨登録されている前記リカバリ情報が存在するか否かを判定し、存在する場合には、該リカバリ情報に対応する計算機によって更新された前記共有データについても、該他の計算機によって更新された該共有データを復旧する処理と同様にして、更新前の状態に復旧することを特徴とする請求項8記載の疎結合多重計算機システムにおける障害復旧システム。

請求項10

複数の計算機と、該複数の計算機間で共有される共有データと、該複数の各計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれは、業務実施時において、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報を削除することを特徴とする疎結合多重計算機システムにおける障害復旧方法

請求項11

前記複数の計算機のそれぞれは、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報を元にして前記共有データを更新前の状態に復旧することを特徴とする請求項10記載の疎結合多重計算機システムにおける障害復旧方法。

請求項12

複数の計算機と、該複数の計算機間で共有される共有データと、該複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれは、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報を削除し、前記排他手段から自計算機の識別子を削除することを特徴とする疎結合多重計算機システムにおける障害復旧方法。

請求項13

前記複数の計算機のそれぞれは、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報を元にして前記共有データを更新前の状態に復旧し、前記排他手段に登録されている自計算機の識別子を削除することを特徴とする請求項12記載の疎結合多重計算機システムにおける障害復旧方法。

請求項14

複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機毎に、該計算機の識別子と該計算機の復旧処理が行われているか否かを示す情報とを含むリカバリ情報と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれは、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報にリカバリ不要の識別子を付し、前記排他手段から自計算機の識別子を削除することを特徴とする疎結合多重計算機システムにおける障害復旧方法。

請求項15

前記複数の計算機のそれぞれは、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記リカバリ情報を参照して復旧処理が行われているか否かを判定し、復旧処理が行われていないと判定した場合には、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記リカバリ情報に復旧処理を行う旨を登録し、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報の内、リカバリ不要の識別子が付されていないものを元にして前記共有データを更新前の状態に復旧し、該更新処理情報にリカバリ不要の識別子を付し、前記排他手段に登録されている自計算機の識別子を削除し、該他の計算機の前記リカバリ情報を削除することを特徴とする請求項14記載の疎結合多重計算機システムにおける障害復旧方法。

請求項16

複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記複数の計算機毎に、前記更新記録保持手段が設定されている装置の装置名を保持する更新記録管理手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機毎に、該計算機の識別子、該計算機が保持している前記更新記録管理手段が設定されている装置の装置名、該計算機の復旧処理が行われているか否かを示す情報、および該復旧処理を行っている他の計算機の計算機識別子を含むリカバリ情報と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれは、業務開始時において、自計算機の識別子と自計算機の前記更新記録管理手段を設定した装置の装置名を格納した前記リカバリ情報を作成し、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報にリカバリ不要の識別子を付し、前記排他手段から自計算機の識別子を削除することを特徴とする疎結合多重計算機システムにおける障害復旧方法。

請求項17

前記複数の計算機のそれぞれは、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記リカバリ情報を参照して復旧処理が行われているか否かを判定し、復旧処理が行われていないと判定した場合には、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記リカバリ情報に復旧処理を行う旨および自計算機の識別子を登録し、該他の計算機の前記リカバリ情報を参照して前記更新記録保持手段が設定されている装置の装置名を認識し、該更新記録保持手段に格納されている前記更新処理情報の内、リカバリ不要の識別子が付されていないものを元にして前記共有データを更新前の状態に復旧し、該更新処理情報にリカバリ不要の識別子を付し、前記排他手段に登録されている自計算機の識別子を削除し、該他の計算機の前記リカバリ情報を削除することを特徴とする請求項16記載の疎結合多重計算機システムにおける障害復旧方法。

請求項18

前記複数の計算機のそれぞれは、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機が復旧処理を行っている旨登録されている前記リカバリ情報が存在するか否かを判定し、存在する場合には、該リカバリ情報に対応する計算機によって更新された前記共有データについても、該他の計算機によって更新された該共有データを復旧する処理と同様にして、更新前の状態に復旧することを特徴とする請求項17記載の疎結合多重計算機システムにおける障害復旧方法。

請求項19

複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれが、業務実施時において、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報を削除するプログラムを記憶する媒体を含むことを特徴とする疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体。

請求項20

前記媒体に記憶された前記プログラムが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報を元にして前記共有データを更新前の状態に復旧することを特徴とする請求項19記載の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体。

請求項21

複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれが、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報を削除し、前記排他手段から自計算機の識別子を削除するプログラムを記憶する媒体を含むことを特徴とする疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体。

請求項22

前記媒体に記憶された前記プログラムが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報を元にして前記共有データを更新前の状態に復旧し、前記排他手段に登録されている自計算機の識別子を削除することを特徴とする請求項21記載の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体。

請求項23

複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機毎に、該計算機の識別子と該計算機の復旧処理が行われているか否かを示す情報とを含むリカバリ情報と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれが、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報にリカバリ不要の識別子を付し、前記排他手段から自計算機の識別子を削除するプログラムを記憶する媒体を含むことを特徴とする疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体。

請求項24

前記媒体に記憶された前記プログラムが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記リカバリ情報を参照して復旧処理が行われているか否かを判定し、復旧処理が行われていないと判定した場合には、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記リカバリ情報に復旧処理を行う旨を登録し、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報の内、リカバリ不要の識別子が付されていないものを元にして前記共有データを更新前の状態に復旧し、該更新処理情報にリカバリ不要の識別子を付し、前記排他手段に登録されている自計算機の識別子を削除し、該他の計算機の前記リカバリ情報を削除することを特徴とする請求項23記載の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体。

請求項25

複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記複数の計算機毎に、前記更新記録保持手段が設定されている装置の装置名を保持する更新記録管理手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機毎に、該計算機の識別子、該計算機が保持している前記更新記録管理手段が設定されている装置の装置名、該計算機の復旧処理が行われているか否かを示す情報、および該復旧処理を行っている他の計算機の計算機識別子を含むリカバリ情報と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれが、業務開始時において、自計算機の識別子と自計算機の前記更新記録管理手段を設定した装置の装置名を格納した前記リカバリ情報を作成し、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報にリカバリ不要の識別子を付し、前記排他手段から自計算機の識別子を削除するプログラムを記憶する媒体を含むことを特徴とする疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体。

請求項26

前記媒体に記憶された前記プログラムが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記リカバリ情報を参照して復旧処理が行われているか否かを判定し、復旧処理が行われていないと判定した場合には、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記リカバリ情報に復旧処理を行う旨および自計算機の識別子を登録し、該他の計算機の前記リカバリ情報を参照して前記更新記録保持手段が設定されている装置の装置名を認識し、該更新記録保持手段に格納されている前記更新処理情報の内、リカバリ不要の識別子が付されていないものを元にして前記共有データを更新前の状態に復旧し、該更新処理情報にリカバリ不要の識別子を付し、前記排他手段に登録されている自計算機の識別子を削除し、該他の計算機の前記リカバリ情報を削除することを特徴とする請求項25記載の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体。

請求項27

前記媒体に記憶された前記プログラムが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機が復旧処理を行っている旨登録されている前記リカバリ情報が存在するか否かを判定し、存在する場合には、該リカバリ情報に対応する計算機によって更新された前記共有データについても、該他の計算機によって更新された該共有データを復旧する処理と同様にして、更新前の状態に復旧することを特徴とする請求項26記載の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体。

技術分野

0001

本発明は、疎結合多重計算機システムにおける障害復旧システム障害復旧方法、および障害復旧プログラムを記憶する媒体に関する。

背景技術

0002

IMS/VS EXTENDED RECOVERYFACILITY(XRF): GENERALINFORMATION, GG24-3150-00,IBM World Trade Corporation,March 1987」には、計算機障害が発生しても利用者が該障害の影響を受けることなく業務を続行することができる信頼性の高い計算機システムである、疎結合多重計算機システムを利用したホットスタンバイシステムが記載されている。

0003

このホットスタンバイシステムは、業務処理を実施する稼動系計算機(以下、稼働系とする)と、稼動系に障害が発生した場合に、復旧処理を行う待機系計算機(以下、待機系とする)との2つの系により構成される。稼動系が各計算機間で共有しているデータを更新中に該稼動系に障害が発生した場合、稼働系によって中途半端に更新されたデータを待機系が更新前の状態に復旧した後、待機系が新たに稼動系に切り替わり、業務を継続して実行する。

発明が解決しようとする課題

0004

この従来のホットスタンバイシステムにおいては、障害が発生した計算機によって中途半端に更新されたデータを更新前の状態に復旧するために必要となる情報を、復旧処理を行う他の計算機に予め渡しておく準備処理が必要であった。

0005

しかしながら、この従来のホットスタンバイシステムにおいては、この準備処理が何らかの原因で行えなかった場合には、稼動系で障害が発生しても、待機系が稼働系によって更新されたデータを復旧するために必要な情報を得ることができないため、該復旧処理を行うことができないという問題点がある。

0006

また、稼働系と待機系が1対1に構成されているため、定期保守作業等を実施するために待機系の計算機を停止している場合には、復旧処理を行うことができないという問題点がある。

0007

本発明の目的は、疎結合多重計算機システムを構成する計算機のいずれかに障害が発生しても、利用者が該障害により影響を受けることなく業務を続行することができる信頼性の高い計算機システムを提供することにある。

0008

本発明の他の目的は、疎結合多重計算機システムを構成する計算機のいずれかに障害が発生しても、他に正常に動作している計算機が存在している場合にはそれらの内のいずれかの計算機によって、障害が発生した計算機によって更新されたデータを更新前の状態に復旧することができるようにすることにある。

0009

さらに本発明の他の目的は、障害が発生した計算機によって更新されたデータを更新前の状態に復旧する計算機が、該復旧処理を行うために必要とする情報を障害が発生する前に受け取らなくても、該復旧処理を行うことができるようにすることにある。

課題を解決するための手段

0010

本発明の第1の疎結合多重計算機システムにおける障害復旧システムは、複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備え、前記複数の計算機のそれぞれが、業務実施時において、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報を削除することを特徴とする。

0011

本発明の第2の疎結合多重計算機システムにおける障害復旧システムは、第1の疎結合多重計算機システムにおける障害復旧システムにおいて、前記複数の各計算機のそれぞれが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報を元にして前記共有データを更新前の状態に復旧することを特徴とする。

0012

本発明の第3の疎結合多重計算機システムにおける障害復旧システムは、複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備え、前記複数の計算機のそれぞれが、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報を削除し、前記排他手段から自計算機の識別子を削除することを特徴とする。

0013

本発明の第4の疎結合多重計算機システムにおける障害復旧システムは、第3の疎結合多重計算機システムにおける障害復旧システムにおいて、前記複数の各計算機のそれぞれが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報を元にして前記共有データを更新前の状態に復旧し、前記排他手段に登録されている自計算機の識別子を削除することを特徴とする。

0014

本発明の第5の疎結合多重計算機システムにおける障害復旧システムは、複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機毎に、該計算機の識別子と該計算機の復旧処理が行われているか否かを示す情報とを含むリカバリ情報と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備え、前記複数の計算機のそれぞれが、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報にリカバリ不要の識別子を付し、前記排他手段から自計算機の識別子を削除することを特徴とする。

0015

本発明の第6の疎結合多重計算機システムにおける障害復旧システムは、第5の疎結合多重計算機システムにおける障害復旧システムにおいて、前記複数の計算機のそれぞれが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記リカバリ情報を参照して復旧処理が行われているか否かを判定し、復旧処理が行われていないと判定した場合には、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記リカバリ情報に復旧処理を行う旨を登録し、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報の内、リカバリ不要の識別子が付されていないものを元にして前記共有データを更新前の状態に復旧し、該更新処理情報にリカバリ不要の識別子を付し、前記排他手段に登録されている自計算機の識別子を削除し、該他の計算機の前記リカバリ情報を削除することを特徴とする。

0016

本発明の第7の疎結合多重計算機システムにおける障害復旧システムは、複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記複数の計算機毎に、前記更新記録保持手段が設定されている装置の装置名を保持する更新記録管理手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機毎に、該計算機の識別子、該計算機が保持している前記更新記録管理手段が設定されている装置の装置名、該計算機の復旧処理が行われているか否かを示す情報、および該復旧処理を行っている他の計算機の計算機識別子を含むリカバリ情報と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備え、前記複数の計算機のぞれぞれが、業務開始時において、自計算機の識別子と自計算機の前記更新記録管理手段を設定した装置の装置名を格納した前記リカバリ情報を作成し、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報にリカバリ不要の識別子を付し、前記排他手段から自計算機の識別子を削除することを特徴とする。

0017

本発明の第8の疎結合多重計算機システムにおける障害復旧システムは、第7の疎結合多重計算機システムにおける障害復旧システムにおいて、前記複数の計算機のそれぞれが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記リカバリ情報を参照して復旧処理が行われているか否かを判定し、復旧処理が行われていないと判定した場合には、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記リカバリ情報に復旧処理を行う旨および自計算機の識別子を登録し、該他の計算機の前記リカバリ情報を参照して前記更新記録保持手段が設定されている装置の装置名を認識し、該更新記録保持手段に格納されている前記更新処理情報の内、リカバリ不要の識別子が付されていないものを元にして前記共有データを更新前の状態に復旧し、該更新処理情報にリカバリ不要の識別子を付し、前記排他手段に登録されている自計算機の識別子を削除し、該他の計算機の前記リカバリ情報を削除することを特徴とする。

0018

本発明の第9の疎結合多重計算機システムにおける障害復旧システムは、第8の疎結合多重計算機システムにおける障害復旧システムにおいて、前記複数の計算機のそれぞれが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機が復旧処理を行っている旨登録されている前記リカバリ情報が存在するか否かを判定し、存在する場合には、該リカバリ情報に対応する計算機によって更新された前記共有データについても、該他の計算機によって更新された該共有データを復旧する処理と同様にして、更新前の状態に復旧することを特徴とする。

0019

本発明の第1の疎結合多重計算機システムにおける障害復旧方法は、複数の計算機と、該複数の計算機間で共有される共有データと、該複数の各計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれが、業務実施時において、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報を削除することを特徴とする。

0020

本発明の第2の疎結合多重計算機システムにおける障害復旧方法は、第1の疎結合多重計算機システムにおける障害復旧方法において、前記複数の計算機のそれぞれが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報を元にして前記共有データを更新前の状態に復旧することを特徴とする。

0021

本発明の第3の疎結合多重計算機システムにおける障害復旧方法は、複数の計算機と、該複数の計算機間で共有される共有データと、該複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれが、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報を削除し、前記排他手段から自計算機の識別子を削除することを特徴とする。

0022

本発明の第4の疎結合多重計算機システムにおける障害復旧方法は、第3の疎結合多重計算機システムにおける障害復旧方法において、前記複数の計算機のそれぞれが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報を元にして前記共有データを更新前の状態に復旧し、前記排他手段に登録されている自計算機の識別子を削除することを特徴とする。

0023

本発明の第5の疎結合多重計算機システムにおける障害復旧方法は、複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機毎に、該計算機の識別子と該計算機の復旧処理が行われているか否かを示す情報とを含むリカバリ情報と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれが、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報にリカバリ不要の識別子を付し、前記排他手段から自計算機の識別子を削除することを特徴とする。

0024

本発明の第6の疎結合多重計算機システムにおける障害復旧方法は、第5の疎結合多重計算機システムにおける障害復旧方法において、前記複数の計算機のそれぞれが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記リカバリ情報を参照して復旧処理が行われているか否かを判定し、復旧処理が行われていないと判定した場合には、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記リカバリ情報に復旧処理を行う旨を登録し、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報の内、リカバリ不要の識別子が付されていないものを元にして前記共有データを更新前の状態に復旧し、該更新処理情報にリカバリ不要の識別子を付し、前記排他手段に登録されている自計算機の識別子を削除し、該他の計算機の前記リカバリ情報を削除することを特徴とする。

0025

本発明の第7の疎結合多重計算機システムにおける障害復旧方法は、複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記複数の計算機毎に、前記更新記録保持手段が設定されている装置の装置名を保持する更新記録管理手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機毎に、該計算機の識別子、該計算機が保持している前記更新記録管理手段が設定されている装置の装置名、該計算機の復旧処理が行われているか否かを示す情報、および該復旧処理を行っている他の計算機の計算機識別子を含むリカバリ情報と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれが、業務開始時において、自計算機の識別子と自計算機の前記更新記録管理手段を設定した装置の装置名を格納した前記リカバリ情報を作成し、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報にリカバリ不要の識別子を付し、前記排他手段から自計算機の識別子を削除することを特徴とする。

0026

本発明の第8の疎結合多重計算機システムにおける障害復旧方法は、第7の疎結合多重計算機システムにおける障害復旧方法において、前記複数の計算機のそれぞれが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記リカバリ情報を参照して復旧処理が行われているか否かを判定し、復旧処理が行われていないと判定した場合には、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記リカバリ情報に復旧処理を行う旨および自計算機の識別子を登録し、該他の計算機の前記リカバリ情報を参照して前記更新記録保持手段が設定されている装置の装置名を認識し、該更新記録保持手段に格納されている前記更新処理情報の内、リカバリ不要の識別子が付されていないものを元にして前記共有データを更新前の状態に復旧し、該更新処理情報にリカバリ不要の識別子を付し、前記排他手段に登録されている自計算機の識別子を削除し、該他の計算機の前記リカバリ情報を削除することを特徴とする。

0027

本発明の第9の疎結合多重計算機システムにおける障害復旧方法は、第8の疎結合多重計算機システムにおける障害復旧方法において、前記複数の計算機のそれぞれが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機が復旧処理を行っている旨登録されている前記リカバリ情報が存在するか否かを判定し、存在する場合には、該リカバリ情報に対応する計算機によって更新された前記共有データについても、該他の計算機によって更新された該共有データを復旧する処理と同様にして、更新前の状態に復旧することを特徴とする。

0028

本発明の第1の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体は、複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれが、業務実施時において、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報を削除するプログラムを記憶する媒体を含むことを特徴とする。

0029

本発明の第2の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体は、第1の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体において、前記媒体に記憶された前記プログラムが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報を元にして前記共有データを更新前の状態に復旧することを特徴とする。

0030

本発明の第3の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体は、複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれが、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報を削除し、前記排他手段から自計算機の識別子を削除するプログラムを記憶する媒体を含むことを特徴とする。

0031

本発明の第4の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体は、第3の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体において、前記媒体に記憶された前記プログラムが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報を元にして前記共有データを更新前の状態に復旧し、前記排他手段に登録されている自計算機の識別子を削除することを特徴とする。

0032

本発明の第5の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体は、複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機毎に、該計算機の識別子と該計算機の復旧処理が行われているか否かを示す情報とを含むリカバリ情報と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれが、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報にリカバリ不要の識別子を付し、前記排他手段から自計算機の識別子を削除するプログラムを記憶する媒体を含むことを特徴とする。

0033

本発明の第6の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体は、第5の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体において、前記媒体に記憶された前記プログラムが、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記リカバリ情報を参照して復旧処理が行われているか否かを判定し、復旧処理が行われていないと判定した場合には、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記リカバリ情報に復旧処理を行う旨を登録し、該他の計算機の前記更新記録保持手段に格納されている前記更新処理情報の内、リカバリ不要の識別子が付されていないものを元にして前記共有データを更新前の状態に復旧し、該更新処理情報にリカバリ不要の識別子を付し、前記排他手段に登録されている自計算機の識別子を削除し、該他の計算機の前記リカバリ情報を削除することを特徴とする。

0034

本発明の第7の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体は、複数の計算機と、前記複数の計算機間で共有される共有データと、前記複数の計算機毎に、前記共有データの更新前の状態を更新処理情報として保持する更新記録保持手段と、前記複数の計算機毎に、前記更新記録保持手段が設定されている装置の装置名を保持する更新記録管理手段と、前記共有データに対して更新処理を行っている計算機の識別子を登録する排他手段と、前記複数の計算機毎に、該計算機の識別子、該計算機が保持している前記更新記録管理手段が設定されている装置の装置名、該計算機の復旧処理が行われているか否かを示す情報、および該復旧処理を行っている他の計算機の計算機識別子を含むリカバリ情報と、前記複数の計算機のいずれかに何らかの障害が発生したことを、障害が発生していない他の計算機に通知する障害通知手段とを備えた疎結合多重計算機システムにおいて、前記複数の計算機のそれぞれが、業務開始時において、自計算機の識別子と自計算機の前記更新記録管理手段を設定した装置の装置名を格納した前記リカバリ情報を作成し、業務実施時において、前記排他手段に他の計算機の識別子が登録されていない場合にのみ、該排他手段に自計算機の識別子を登録し、前記共有データの更新前の状態を前記更新処理情報として前記更新記録保持手段に格納した後に、該共有データを更新し、業務終了時において、前記更新処理情報にリカバリ不要の識別子を付し、前記排他手段から自計算機の識別子を削除するプログラムを記憶する媒体を含むことを特徴とする。

0035

本発明の第8の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体は、第7の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体において、前記媒体に記憶された前記プログラムは、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機の前記リカバリ情報を参照して復旧処理が行われているか否かを判定し、復旧処理が行われていないと判定した場合には、前記排他手段に登録されている該他の計算機の識別子を削除して自計算機の識別子を登録し、該他の計算機の前記リカバリ情報に復旧処理を行う旨および自計算機の識別子を登録し、該他の計算機の前記リカバリ情報を参照して前記更新記録保持手段が設定されている装置の装置名を認識し、該更新記録保持手段に格納されている前記更新処理情報の内、リカバリ不要の識別子が付されていないものを元にして前記共有データを更新前の状態に復旧し、該更新処理情報にリカバリ不要の識別子を付し、前記排他手段に登録されている自計算機の識別子を削除し、該他の計算機の前記リカバリ情報を削除することを特徴とする。

0036

本発明の第9の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体は、第8の疎結合多重計算機システムにおける障害復旧プログラムを記憶する媒体において、前記媒体に記憶された前記プログラムは、さらに、前記障害通知手段から他の計算機に障害が発生した旨の通知を受信した時に、該他の計算機が復旧処理を行っている旨登録されている前記リカバリ情報が存在するか否かを判定し、存在する場合には、該リカバリ情報に対応する計算機によって更新された前記共有データについても、該他の計算機によって更新された該共有データを復旧する処理と同様にして、更新前の状態に復旧することを特徴とする。

発明を実施するための最良の形態

0037

以下本発明の一実施例について、図を参照しながら詳細に説明する。

0038

図1を参照すると、本発明の一実施例である疎結合多重計算機システムにおける障害復旧システムは、疎結合多重計算機システムを構成する計算機1、計算機2、および計算機3と、すべての計算機間で共有する共有データ20と、共有データ20に対して更新処理を行っている計算機を管理する排他手段11と疎結合多重計算機システムを構成するいずれかの計算機で障害が発生した場合に、他の正常に動作している計算機が復旧処理を行うために必要なリカバリ情報を保持するリカバリ情報保持手段12とを含む多重計算機制御手段10と、各計算機における業務処理により共有データ20が更新された時に該更新処理情報を各計算機毎に保持する更新記録保持手段31、32、および33と、各計算機毎に保持している更新記録保持手段31、32、および33に関する情報を各計算機において保持する更新記録管理手段41、42、および43と、計算機に障害が発生した場合に、その障害発生を他のすべての計算機に報告する障害通知手段50とから構成されている。

0039

なお、疎結合多重計算機システムでは、システムを構成する各計算機を識別するために、各計算機毎に固有の計算機識別子を保持しており、計算機1は計算機識別子として1、計算機2は計算機識別子として2、計算機3は計算機識別子として3の値をそれぞれ保持している。

0040

共有データ20は、すべての計算機でアクセス可能ディスク装置上に配置される。

0041

更新記録保持手段31、32、および33は、端末等から入力されたある論理的な単位の処理(以下、トランザクションとする)が、何らかの原因により処理を中断された場合に、該処理の過程において更新されたデータを更新前の状態に戻すロールバック処理を行うための更新前のデータの情報を保持するもので、各計算機毎に設定されるが、すべての計算機でアクセスすることができるディスク装置上に配置される。

0042

ただし、他の計算機の更新記録保持手段に対してアクセスを行うのは、復旧処理を行う計算機が、障害が発生した計算機の更新記録保持手段に対してアクセスする時だけである。

0043

更新記録管理手段41、42、および43は、それぞれ更新記録保持手段31、32、および33を配置しているディスク装置の装置名等の情報を保持し、各計算機に接続されたディスク装置上に配置され、通常の運用中は、自計算機からのみアクセスすることができるものであり、他の計算機からは該ディスク装置にアクセスすることはできない。

0044

図2を参照すると、リカバリ情報保持手段12は、計算機毎のリカバリ情報121、122、および123を含む。

0045

図3を参照すると、これらのリカバリ情報121、122、および123は、それぞれの計算機の計算機識別子が設定される計算機識別子情報12−1と、復旧処理状態を示すリカバリ処理状態情報12−2と、更新記録管理手段41、42、および43を配置している装置の装置名を示す更新記録管理手段配置装置名情報12−3とを含む。

0046

図4を参照すると、リカバリ処理状態情報12−2は、それぞれの計算機の復旧処理が行われている(「1」)か否(「0」)かを示す復旧処理識別情報12−2−1と、復旧処理を行っている計算機の計算機識別子である復旧処理計算機識別情報12−2−2とを含む。

0047

次に本発明の一実施例の動作について、図1〜図7を参照して説明する。

0048

計算機1は、業務処理を開始する前に、リカバリ情報保持手段12内に、計算機1のリカバリ情報121を設定する(ステップ61)。

0049

リカバリ情報121には、計算機1のリカバリ情報であることを示すために計算機1の計算機識別子「1」を計算機識別子情報12−1に設定し、さらに更新記録管理手段41を配置している装置の装置名を更新記録管理手段配置装置名情報12−3に設定する。

0050

計算機1は、業務処理を開始し、共有データ20に対する更新要求が発生すると、排他手段11に他の計算機が該共有データ20を使用しているという情報が格納されているか否かを判定し(ステップ62)、他の計算機が使用していないと判定した場合には、排他手段11に自身が該共有データ20を使用する旨登録し(ステップ63)、更新記録保持手段31に共有データ20の更新前のデータを更新処理情報として出力した(ステップ64)後、該共有データ20を更新する(ステップ65)。

0051

計算機1は、あるトランザクションの処理が終了すると、更新記録保持手段31に保持する更新処理情報に図示しない「リカバリ不要」の識別子を付す(ステップ66)とともに、共有データ20を使用している旨の情報を排他手段11から削除する(ステップ67)。

0052

同様にして、業務処理を実施する計算機2および計算機3においても、共有データ20へのアクセスを行いながら業務処理を行う。

0053

計算機1において障害が発生すると、障害通知手段50は、疎結合多重計算機システムを構成する他の計算機2および計算機3に対して、計算機1の障害発生を通知する。この通知には、障害を発生した計算機1の計算機識別子「1」が含まれている。

0054

障害通知を受けた計算機2および計算機3は、障害通知に含まれる計算機識別子「1」をキーにしてリカバリ情報保持手段12内のリカバリ情報121を識別し、さらに該リカバリ情報121のリカバリ処理状態情報12−2内の復旧処理識別情報12−2−1が、他の計算機により計算機1の復旧処理がすでに実施されていることを示しているか否かを判定する(ステップ71)。

0055

計算機2および計算機3は、計算機1の復旧処理が未だ行われていないと判定した場合には、排他手段11に登録されている計算機1が共有データ20を使用している旨の情報を削除し(ステップ72)、自身が使用する旨の情報を登録する(ステップ73)とともに、リカバリ情報121のリカバリ処理状態情報12−2内の復旧処理識別情報12−2−1に復旧処理中であることを示す「1」を設定し(ステップ74)、さらに復旧処理計算機識別子情報12−2−2に自計算機の計算機識別子(「2」または「3」)を設定することにより計算機1を復旧処理実施中の状態とし(ステップ75)、自計算機にて計算機1の復旧処理を開始する。

0056

一方、障害が発生した計算機1のリカバリ情報121がリカバリ情報保持手段12内に見つからない場合、もしくは、リカバリ情報121のリカバリ処理状態情報12−2内の復旧処理識別情報12−2−1が、他の計算機により計算機1の復旧処理がすでに実施されていることを示している場合には、自計算機による復旧処理は不要と判断し、復旧処理は行わない。

0057

次に計算機2および計算機3は、障害が発生した計算機1の更新記録管理手段41を配置している装置の装置名を、リカバリ情報121の更新記録管理手段配置装置名情報12−3から取得し、この計算機1の更新記録管理手段41を配置している装置を自計算機に取り込む。

0058

さらに計算機2および計算機3は、取り込んだ装置内の更新記録管理手段41を参照して、更新記録保持手段31を配置している装置の装置名を得る(ステップ76)。

0059

上述のとおり、この更新記録保持手段31には、計算機1による共有データ20の更新処理情報が格納されているが、この更新処理情報にはトランザクションの処理が終了して「リカバリ不要」となっている情報も含まれている。

0060

計算機2および計算機3は、更新記録保持手段31に格納されている更新処理情報の内、「リカバリ不要」となっていないもの、すなわちトランザクションが中断したために共有データ20に対する更新処理が中途半端になったことを示す更新処理情報を元にして、該共有データ20を復旧する(ステップ77)。

0061

以上の復旧処理が終了したならば、計算機2および計算機3は、共有データ20の復旧に用いた更新記録保持手段31内の更新処理情報を「リカバリ不要」とし(ステップ78)、排他手段11から自身が共有データ20を使用している旨の情報を削除し(ステップ79)、リカバリ情報保持手段12から計算機1のリカバリ情報121を削除し(ステップ7A)、さらに、計算機1から取り込んだ更新記録管理手段41を保持する装置を自計算機から解放する(ステップ7B)。

0062

このように他の計算機によって障害が発生した計算機1によって更新された共有データ20が復旧された後、該計算機1を再起動することができる。

0063

また、計算機1で障害が発生し、計算機2が復旧処理を行っている途中において、計算機2にも障害が発生した場合には、計算機2によって更新された共有データ20の復旧処理を計算機3が行う。

0064

計算機3は、上述のとおり、計算機2によって更新された共有データ20を復旧するとともに、リカバリ情報保持手段12内に存在する計算機毎のリカバリ情報をサーチし、復旧処理識別情報12−2−1が1で、かつ、復旧処理計算機識別情報12−2−2が障害を発生した計算機2の計算機識別子である2となっているものが存在していた場合、このリカバリ情報(この場合リカバリ情報121)に対応する計算機(計算機1)によって更新された共有データ20をも復旧する必要があると認識し、これも同様に復旧する。

0065

このようにして、復旧処理を行っている計算機に障害が発生した場合でも、該計算機によって更新された共有データを復旧することができる。

0066

すべての計算機は、自身に障害が発生せずに業務処理の終了を行う場合に、排他手段11から自身が共有データ20を使用している旨の情報を削除し、リカバリ情報保持手段12から、自計算機のリカバリ情報を削除する。例えば、計算機1が業務処理を終了する時、計算機1のリカバリ情報121をリカバリ情報保持手段12から削除する。

0067

以降、計算機1にて障害が発生し、障害通知手段50により計算機2および計算機3に、その障害発生が通知されても、リカバリ情報保持手段12内に計算機1のリカバリ情報121が存在しないため、計算機2、計算機3のいずれの計算機も計算機1の復旧処理を行わない。

0068

以上により、本発明の一実施例である疎結合多重計算機システムにおける障害復旧システムの処理が終了する。

0069

本発明の一実施例である疎結合多重計算機システムにおける障害復旧システムは、疎結合多重計算機システムを構成する計算機のいずれかに障害が発生しても、他に正常に動作している計算機が存在している場合にはそれらの内のいずれかの計算機によって、障害が発生した計算機によって更新されたデータを更新前の状態に復旧することができる効果を有している。

0070

また、本発明の他の実施例である疎結合多重計算機システムにおける障害復旧プログラムは、上述した障害復旧システムと同等の処理を行うことができ、さらに該プログラムは、メモリディスクフロッピーディスク、およびCD−ROM等の記憶媒体に記憶することができる。

発明の効果

0071

以上説明したように、本発明の疎結合多重計算機システムにおける障害復旧システム、障害復旧方法、および障害復旧プログラムを記憶する媒体によれば、疎結合多重計算機システムを構成する計算機のいずれかに障害が発生しても、利用者が該障害により影響を受けることなく業務を続行することができる信頼性の高い計算機システムを提供することができる効果を有している。

0072

また、疎結合多重計算機システムを構成する計算機のいずれかに障害が発生しても、他に正常に動作している計算機が存在している場合にはそれらの内のいずれかの計算機によって、障害が発生した計算機によって更新されたデータを更新前の状態に復旧することができる効果を有している。

0073

さらに、障害が発生した計算機によって更新されたデータを更新前の状態に復旧する計算機が、該復旧処理を行うために必要とする情報を障害が発生する前に受け取っておくという、事前の準備処理が不要となる効果を有している。

0074

さらに、計算機間をチャネルおよび通信回線によって接続する必要がないため、安価な疎結合多重計算機システムを構築することができるという効果を有している。

図面の簡単な説明

0075

図1図1は本発明の一実施例である疎結合多重計算機システムにおける障害復旧システムの構成を示す図である。
図2図2は本発明の一実施例におけるリカバリ情報保持手段12の内容を示す図である。
図3図3は本発明の一実施例におけるリカバリ情報121、122、および123の内容を示す図である。
図4図4は本発明の一実施例におけるリカバリ処理状態情報12−2の内容を示す図である。
図5図5は本発明の一実施例における計算機1の共有データ20に対する更新処理を示す流れ図である。
図6図6は本発明の一実施例における計算機2および計算機3が計算機によって更新された共有データ20を更新前の状態に復旧する処理を示す流れ図である。

--

0076

1計算機
2 計算機
3 計算機
10多重計算機制御手段
11排他手段
12リカバリ情報保持手段
20共有データ
31更新記録保持手段
32 更新記録保持手段
33 更新記録保持手段
41 更新記録管理手段
42 更新記録管理手段
43 更新記録管理手段
50障害通知手段
121 計算機1のリカバリ情報
122 計算機1のリカバリ情報
123 計算機1のリカバリ情報
12−1 計算機識別子情報
12−2リカバリ処理状態情報
12−3 更新記録管理手段配置装置名情報
12−2−1復旧処理識別情報
12−2−2 復旧処理計算機識別情報

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ