図面 (/)

技術 リソースキャパシティ予測装置、方法およびプログラム

出願人 日本電気株式会社
発明者 大野允裕
出願日 2012年2月27日 (8年8ヶ月経過) 出願番号 2012-039829
公開日 2013年9月5日 (7年2ヶ月経過) 公開番号 2013-175085
状態 特許登録済
技術分野 デバッグ/監視
主要キーワード 平均復旧時間 推定データベース 見直し要求 SLタイプ 組み込み型装置 不稼働率 収集頻度 ソフトウエアリソース
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2013年9月5日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

監視状況が異なるリソース監視情報からITサービスに必要なリソースキャパシティを精度よく予測できるリソースキャパシティ予測装置を提供する。

解決手段

ログ信頼度算出手段81は、コンピュータから、リソースの監視状況に関する第一のログを取得し、第一のログに含まれるコンピュータの複数の時刻における監視状況の情報に基づいて、複数の時刻におけるログの信頼度を算出する。リソース使用率推移推定手段82は、コンピュータから、リソースの使用に関する第二のログおよびコンピュータのサービスレベル項目の測定に関する第三のログを取得し、第二のログに含まれるコンピュータの複数の時刻におけるリソースの使用率の情報と、第三のログに含まれるコンピュータの複数の時刻におけるサービスレベル項目の測定値の情報と、複数の時刻におけるログの信頼度とに基づいて、コンピュータのリソースの使用率を推定する。

概要

背景

ITサービスネットワーク経由で提供する利用形態の一つに、XaaS(X as a Service)がある。XaaSでは、サービス提供者サービスを利用するクライアントとの間で、ITサービスの品質や内容の目標値を設定した指標であるサービスレベル項目を含む契約締結されることが多い。

サービス提供者は、ITサービスのサービスレベル項目に設定した目標値を満たすように、ITサービスに必要となるリソースキャパシティを過不足なく管理することが望ましい。さらに、ITサービスのサービスレベル項目が複数ある場合、サービス提供者は、それぞれに設定した目標値をすべて満たすことが望ましい。

サイジングは、ITサービスの提供前に必要なリソースキャパシティを見積もる手法である。サイジングでは、ITサービス提供前のテスト環境で得られたリソースの監視情報に基づいてリソースキャパシティの見積りが行われる。

一方、サイジングによってリソースキャパシティを見積ったとしても、ITサービスの利用状況や各種プログラム稼働状況エラー発生状況などを含めた監視状況をITサービスの提供前に正確に想定することは困難である。すなわち、テスト環境で事前に想定してリソースの監視情報を取得し、このリソースの監視情報に基づいてリソースキャパシティを予測したとする。しかし、このリソースキャパシティは、実稼働環境におけるリソースの監視情報に基づいて予測されたリソースキャパシティと一致しない場合が多い。

そのため、サービス提供者は、ITサービスの提供後、実稼働環境で得られたリソースの監視情報からITサービスの需要ピークリソース使用率推移推定し、ITサービスの需要のピークの変動に合わせ、必要となるリソースキャパシティを調整する必要がある。

特許文献1には、リソースの監視情報からトランザクションごとのリソースキャパシティを予測するシステムが記載されている。特許文献1に記載されたシステムは、コンピュータの複数の時刻におけるリソース使用率の監視情報と、その複数の時刻におけるトランザクションごとの処理数の監視情報とに基づいて、一定時間ごとのリソース使用率の平均値と、一定時間ごとの各トランザクションの処理量とを求める。そして、特許文献1に記載されたシステムは、得られたリソース使用率の平均値およびトランザクションごとの処理量を用いた重回帰分析を行うことにより、トランザクションごとのリソース使用率を推定する。

そして、特許文献1に記載されたシステムは、この推定されたトランザクションごとのリソース使用率に基づいて、すべてのトランザクションのうち最も高いリソース使用率を、ITサービスに必要となるリソースキャパシティとして予測する。

概要

監視状況が異なるリソースの監視情報からITサービスに必要なリソースキャパシティを精度よく予測できるリソースキャパシティ予測装置を提供する。ログ信頼度算出手段81は、コンピュータから、リソースの監視状況に関する第一のログを取得し、第一のログに含まれるコンピュータの複数の時刻における監視状況の情報に基づいて、複数の時刻におけるログの信頼度を算出する。リソース使用率推移推定手段82は、コンピュータから、リソースの使用に関する第二のログおよびコンピュータのサービスレベル項目の測定に関する第三のログを取得し、第二のログに含まれるコンピュータの複数の時刻におけるリソースの使用率の情報と、第三のログに含まれるコンピュータの複数の時刻におけるサービスレベル項目の測定値の情報と、複数の時刻におけるログの信頼度とに基づいて、コンピュータのリソースの使用率を推定する。

目的

本発明は、監視状況が異なるリソースの監視情報からITサービスに必要なリソースキャパシティを精度よく予測できるリソースキャパシティ予測装置、リソースキャパシティ予測方法およびリソースキャパシティ予測プログラムを提供する

効果

実績

技術文献被引用数
0件
牽制数
1件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

複数のコンピュータから構成されるコンピュータシステムリソースキャパシティ予測するリソースキャパシティ予測装置であって、前記コンピュータから、リソースの監視状況に関する第一のログを取得し、当該第一のログに含まれる当該コンピュータの複数の時刻における監視状況の情報に基づいて、複数の時刻におけるログの信頼度を算出するログ信頼度算出手段と、前記コンピュータから、リソースの使用に関する第二のログおよび当該コンピュータのサービスレベル項目の測定に関する第三のログを取得し、前記第二のログに含まれる当該コンピュータの複数の時刻におけるリソースの使用率の情報と、前記第三のログに含まれる当該コンピュータの複数の時刻におけるサービスレベル項目の測定値の情報と、前記ログ信頼度算出手段により算出された複数の時刻におけるログの信頼度とに基づいて、当該コンピュータのリソースの使用率を推定するリソース使用率推移推定手段とを備えたことを特徴とするリソースキャパシティ予測装置。

請求項2

ITサービスのサービスレベル項目の目標値を含むサービス関連情報を参照し、リソース使用率推移推定手段により推定されたコンピュータのサービスレベル項目の測定値に対する当該コンピュータのリソースの使用率の推定結果に基づいて、当該ITサービスのサービスレベル項目の目標値をすべて満たすリソースキャパシティを予測するリソースキャパシティ予測手段を備えた請求項1に記載のリソースキャパシティ予測装置。

請求項3

リソース使用率推移推定手段は、ログ信頼度算出手段により算出された複数の時刻におけるログの信頼度が一定の条件を満たす場合に、当該コンピュータのリソースの使用率を推定する請求項1または請求項2に記載のリソースキャパシティ予測装置。

請求項4

リソースの監視状況に関する第一のログは、ITサービスの利用状況を示すデータ、ITサービスを保守するための常駐プログラム稼働状況を示すデータ、ネットワーク通信状況を示すデータ、コンピュータの各種リソースの使用に関するログの収集頻度欠損頻度遅延頻度を示すデータ、コンピュータが監視する監視データ精密さ度合いを示す監視インフラストラクチャ種別カテゴリを示すデータのいずれか複数を含むデータである請求項1から請求項3のうちのいずれか1項に記載のリソースキャパシティ予測装置。

請求項5

リソース使用率推移推定手段は、取得した第二のログの中うち、信頼度が閾値以上のログを選択する請求項1から請求項4のうちのいずれか1項に記載のリソースキャパシティ予測装置。

請求項6

ログ信頼度算出手段は、第一のログに含まれる、監視状況の種類に応じて測定される複数の時刻における各測定値のうち、測定値のばらつき具合が大きい測定値ほどログの信頼度の算出式重み係数を重くする算出式に基づいて、ログの信頼度を算出する請求項1から請求項5のうちのいずれか1項に記載のリソースキャパシティ予測装置。

請求項7

複数のコンピュータから構成されるコンピュータシステムのリソースキャパシティを予測するリソースキャパシティ予測方法であって、前記コンピュータから、リソースの監視状況に関する第一のログを取得し、前記第一のログに含まれる前記コンピュータの複数の時刻における監視状況の情報に基づいて、複数の時刻におけるログの信頼度を算出し、前記コンピュータから、リソースの使用に関する第二のログおよび当該コンピュータのサービスレベル項目の測定に関する第三のログを取得し、前記第二のログに含まれる前記コンピュータの複数の時刻におけるリソースの使用率の情報と、前記第三のログに含まれる前記コンピュータの複数の時刻におけるサービスレベル項目の測定値の情報と、算出された複数の時刻におけるログの信頼度とに基づいて、前記コンピュータのリソースの使用率を推定することを特徴とするリソースキャパシティ予測方法。

請求項8

ITサービスのサービスレベル項目の目標値を含むサービス関連情報を参照し、推定されたコンピュータのサービスレベル項目の測定値に対するコンピュータのリソースの使用率の推定結果に基づいて、当該ITサービスのサービスレベル項目の目標値をすべて満たすリソースキャパシティを予測する請求項7に記載のリソースキャパシティ予測方法。

請求項9

複数のコンピュータから構成されるコンピュータシステムのリソースキャパシティを予測する予測コンピュータに適用されるリソースキャパシティ予測プログラムであって、前記予測コンピュータに、前記コンピュータから、リソースの監視状況に関する第一のログを取得し、当該第一のログに含まれる当該コンピュータの複数の時刻における監視状況の情報に基づいて、複数の時刻におけるログの信頼度を算出するログ信頼度算出処理、および、前記コンピュータから、リソースの使用に関する第二のログおよび当該コンピュータのサービスレベル項目の測定に関する第三のログを取得し、前記第二のログに含まれる当該コンピュータの複数の時刻におけるリソースの使用率の情報と、前記第三のログに含まれる当該コンピュータの複数の時刻におけるサービスレベル項目の測定値の情報と、前記ログ信頼度算出処理で算出された複数の時刻におけるログの信頼度とに基づいて、当該コンピュータのリソースの使用率を推定するリソース使用率推移推定処理を実行させるためのリソースキャパシティ予測プログラム。

請求項10

予測コンピュータに、ITサービスのサービスレベル項目の目標値を含むサービス関連情報を参照し、リソース使用率推移推定処理で推定されたコンピュータのサービスレベル項目の測定値に対する当該コンピュータのリソースの使用率の推定結果に基づいて、当該ITサービスのサービスレベル項目の目標値をすべて満たすリソースキャパシティを予測するリソースキャパシティ予測処理を実行させる請求項9に記載のリソースキャパシティ予測プログラム。

技術分野

0001

本発明は、IT(Information Technology)サービスに必要なリソースキャパシティ予測するリソースキャパシティ装置、リソースキャパシティ予測方法およびリソースキャパシティ予測プログラムに関する。

背景技術

0002

ITサービスネットワーク経由で提供する利用形態の一つに、XaaS(X as a Service)がある。XaaSでは、サービス提供者とサービスを利用するクライアントとの間で、ITサービスの品質や内容の目標値を設定した指標であるサービスレベル項目を含む契約締結されることが多い。

0003

サービス提供者は、ITサービスのサービスレベル項目に設定した目標値を満たすように、ITサービスに必要となるリソースキャパシティを過不足なく管理することが望ましい。さらに、ITサービスのサービスレベル項目が複数ある場合、サービス提供者は、それぞれに設定した目標値をすべて満たすことが望ましい。

0004

サイジングは、ITサービスの提供前に必要なリソースキャパシティを見積もる手法である。サイジングでは、ITサービス提供前のテスト環境で得られたリソースの監視情報に基づいてリソースキャパシティの見積りが行われる。

0005

一方、サイジングによってリソースキャパシティを見積ったとしても、ITサービスの利用状況や各種プログラム稼働状況エラー発生状況などを含めた監視状況をITサービスの提供前に正確に想定することは困難である。すなわち、テスト環境で事前に想定してリソースの監視情報を取得し、このリソースの監視情報に基づいてリソースキャパシティを予測したとする。しかし、このリソースキャパシティは、実稼働環境におけるリソースの監視情報に基づいて予測されたリソースキャパシティと一致しない場合が多い。

0006

そのため、サービス提供者は、ITサービスの提供後、実稼働環境で得られたリソースの監視情報からITサービスの需要ピークリソース使用率推移推定し、ITサービスの需要のピークの変動に合わせ、必要となるリソースキャパシティを調整する必要がある。

0007

特許文献1には、リソースの監視情報からトランザクションごとのリソースキャパシティを予測するシステムが記載されている。特許文献1に記載されたシステムは、コンピュータの複数の時刻におけるリソース使用率の監視情報と、その複数の時刻におけるトランザクションごとの処理数の監視情報とに基づいて、一定時間ごとのリソース使用率の平均値と、一定時間ごとの各トランザクションの処理量とを求める。そして、特許文献1に記載されたシステムは、得られたリソース使用率の平均値およびトランザクションごとの処理量を用いた重回帰分析を行うことにより、トランザクションごとのリソース使用率を推定する。

0008

そして、特許文献1に記載されたシステムは、この推定されたトランザクションごとのリソース使用率に基づいて、すべてのトランザクションのうち最も高いリソース使用率を、ITサービスに必要となるリソースキャパシティとして予測する。

先行技術

0009

特開2006−24017号公報

発明が解決しようとする課題

0010

実稼働環境では、繁忙期閑散期などのITサービスの利用状況、ITサービスを保守するためのウイルスチェックアップデート状況、スキャンデスクなどの常駐プログラムの稼働状況、実際のデータ転送量通信障害頻度などのネットワーク通信状況監視される。これらの監視対象の状況は、時々刻々と変化するため、監視により得られる監視情報には、様々な状況の情報が混在する。

0011

異なる監視状況におけるリソースの監視情報が混在すると、同じ期間におけるリソースの監視情報であっても、リソースの監視情報の傾向が異なってしまう。例えば、ITサービスの利用がピークか否か、どの常駐プログラムが稼働していたか否か、ネットワーク疎通エラーがあるか否かなどによって、同じ過去1週間分の期間のCPU使用率であっても、その平均値はまったく異なってしまう。

0012

このように、一般的な監視方法では、監視状況が異なっていても、同じ監視状況とみなしてリソースの監視情報が取得される。そして、このリソースの監視情報から、ITサービスに必要となるリソースが推定される。そのため、リソースキャパシティを精度よく予測できないという問題がある。

0013

具体的には、監視状況が異なっていても同じ監視状況とみなされたリソースの監視情報は、リソース使用率の平均や分散、測定誤差などの傾向が異なる。そのため、このような監視情報からITサービスに必要となるリソースを推定すると、推定結果のばらつきが大きくなってしまうという問題がある。

0014

そこで、本発明は、監視状況が異なるリソースの監視情報からITサービスに必要なリソースキャパシティを精度よく予測できるリソースキャパシティ予測装置、リソースキャパシティ予測方法およびリソースキャパシティ予測プログラムを提供することを目的とする。

課題を解決するための手段

0015

本発明によるリソースキャパシティ予測装置は、複数のコンピュータから構成されるコンピュータシステムのリソースキャパシティを予測するリソースキャパシティ予測装置であって、コンピュータから、リソースの監視状況に関する第一のログを取得し、第一のログに含まれるコンピュータの複数の時刻における監視状況の情報に基づいて、複数の時刻におけるログの信頼度を算出するログ信頼度算出手段と、コンピュータから、リソースの使用に関する第二のログおよびコンピュータのサービスレベル項目の測定に関する第三のログを取得し、第二のログに含まれるコンピュータの複数の時刻におけるリソースの使用率の情報と、第三のログに含まれるコンピュータの複数の時刻におけるサービスレベル項目の測定値の情報と、ログ信頼度算出手段により算出された複数の時刻におけるログの信頼度とに基づいて、コンピュータのリソースの使用率を推定するリソース使用率推移推定手段とを備えたことを特徴とする。

0016

本発明によるリソースキャパシティ予測方法は、複数のコンピュータから構成されるコンピュータシステムのリソースキャパシティを予測するリソースキャパシティ予測方法であって、コンピュータから、リソースの監視状況に関する第一のログを取得し、第一のログに含まれるコンピュータの複数の時刻における監視状況の情報に基づいて、複数の時刻におけるログの信頼度を算出し、コンピュータから、リソースの使用に関する第二のログおよびコンピュータのサービスレベル項目の測定に関する第三のログを取得し、第二のログに含まれるコンピュータの複数の時刻におけるリソースの使用率の情報と、第三のログに含まれるコンピュータの複数の時刻におけるサービスレベル項目の測定値の情報と、算出された複数の時刻におけるログの信頼度とに基づいて、コンピュータのリソースの使用率を推定することを特徴とする。

0017

本発明によるリソースキャパシティ予測プログラムは、複数のコンピュータから構成されるコンピュータシステムのリソースキャパシティを予測する予測コンピュータに適用されるリソースキャパシティ予測プログラムであって、予測コンピュータに、コンピュータから、リソースの監視状況に関する第一のログを取得し、第一のログに含まれるコンピュータの複数の時刻における監視状況の情報に基づいて、複数の時刻におけるログの信頼度を算出するログ信頼度算出処理、および、コンピュータから、リソースの使用に関する第二のログおよびコンピュータのサービスレベル項目の測定に関する第三のログを取得し、第二のログに含まれるコンピュータの複数の時刻におけるリソースの使用率の情報と、第三のログに含まれるコンピュータの複数の時刻におけるサービスレベル項目の測定値の情報と、ログ信頼度算出処理で算出された複数の時刻におけるログの信頼度とに基づいて、コンピュータのリソースの使用率を推定するリソース使用率推移推定処理を実行させることを特徴とする。

発明の効果

0018

本発明によれば、監視状況が異なるリソースの監視情報からITサービスに必要なリソースキャパシティを精度よく予測できる。

図面の簡単な説明

0019

リソースキャパシティ予測装置が適用される分散システムの構成例を示す説明図である。
リソース管理装置の例を示すブロック図である。
リソースキャパシティ予測装置の例を示すブロック図である。
コンピュータシステムの例を示す説明図である。
サービスDBに格納されるサービス関連データ表の例を示す説明図である。
実行状態DBに格納される実行履歴表の例を示す説明図である。
リソースDBに格納されるリソース管理表の例を示す説明図である。
監視履歴DBに格納される監視状況ログデータ表の例を示す説明図である。
監視履歴DBに格納されるログデータ表の例を示す説明図である。
キャパシティ推定DBに格納されるリソース推移推定データ表の例を示す説明図である。
キャパシティ推定DBに格納されるリソースキャパシティ予測データ表の例を示す説明図である。
ログ信頼度の例を示す説明図である。
リソース管理装置がリソースキャパシティ予測を行う動作の例を示すフローチャートである。
リソースキャパシティ予測装置の動作の例を示すフローチャートである。
ログ信頼度算出部の動作の例を示すフローチャートである。
リソース使用率推移推定部の動作の例を示すフローチャートである。
リソースキャパシティ予測部の動作の例を示すフローチャートである。
リソースキャパシティ予測装置およびリソース管理装置のハードウェア構成の例を示す説明図である。
本発明によるリソースキャパシティ予測装置の概要を示すブロック図である。

実施例

0020

以下、本発明の実施形態を図面を参照して説明する。

0021

本実施形態では、ITサービスの処理を実行するコンピュータの複数の時刻における監視状況に関するログ、そのコンピュータの複数の時刻におけるサービスレベル項目の測定に関するログ、そのコンピュータの複数の時刻における各種リソースの使用に関するログが使用される。また、本発明では、監視状況に関するログの信頼度にも着目する。

0022

なお、本実施形態において、監視状況に関するログには、繁忙期や閑散期などのITサービスの利用状況を示すデータ、ITサービスを保守するためのウイルスチェックやアップデート、常駐プログラム(例えば、スキャンデスク)の稼働状況を示すデータ、ネットワーク通信状況(例えば、実際のデータ転送量、通信障害頻度)を示すデータなどが含まれる。すなわち、監視状況に関するログは、ITサービスを提供するコンピュータシステムを形成する各要素の状況を示すログであるということができる。

0023

また、本実施形態において、サービスレベル項目の測定に関するログには、スループット、平均リクエスト応答時間、平均トランザクション処理時間、トランザクション数稼働率不稼働率平均復旧時間平均故障間隔などが含まれる。すなわち、サービスレベル項目の測定に関するログは、サービスレベル項目の評価に用いられる各種リソースによる測定値、および、その測定値に基づいて算出される指標であるということができる。

0024

また、本実施形態において、リソースの使用に関するログには、リソースの使用率(例えば、CPU使用率、メモリ使用量記憶装置の記憶容量、ネットワーク使用量)などが含まれる。

0025

そして、本実施形態のリソースキャパシティ予測装置は、これらのログを解析して、サービスレベル項目に対する各種リソースの使用状態の推移を推定し、サービスレベル項目の目標値をすべて満たす各種リソースのキャパシティを予測する。なお、各種リソースのキャパシティを予測することを、単にリソースキャパシティ予測と記すこともある。このリソースキャパシティ予測により、ITサービスに必要となるリソースキャパシティを適切に調整できるようにする。

0026

リソースキャパシティ予測の対象は、CPU使用率、メモリ使用量、記憶装置の記憶容量、ネットワーク使用量など、種々の資源である。なお、本実施形態では、主として、CPU使用率についてのリソースキャパシティ予測をする場合を例に説明する。また、以下に例示する実施形態は、特許請求の範囲にかかる発明を限定するものではない。また、以下に例示する実施形態で説明されている特徴の組み合わせの全てが、発明の解決手段に必須であるとは限らない。

0027

まず、本実施形態のリソースキャパシティ予測装置が適用される分散システムの構成を説明する。図1は、本実施形態のリソースキャパシティ予測装置が適用される分散システムの構成例を示す説明図である。

0028

図1に例示する分散システムは、コンピュータシステム10と、リソース管理装置20と、リソースキャパシティ予測装置30と、ユーザ端末40とを備えている。リソース管理装置20は、リソースキャパシティ予測装置30およびコンピュータシステム10にそれぞれ接続される。

0029

コンピュータシステム10は、ITサービスの処理を実行するために用いられる1または複数のリソースを有している。コンピュータシステム10は、少なくとも1つ以上のリソースを組み合わせてユーザが指定したITサービスの処理を実行する。

0030

リソース管理装置20は、ITサービスの処理を実行するためのコンピュータシステム10内のリソースを管理する。リソース管理装置20は、ユーザからITサービスの実行要求を受けて、ユーザにより指定されたITサービスの処理を実行するためのコンピュータシステム10内のリソースを少なくとも1つ確保する。そして、リソース管理装置20は、確保したリソースを用いてITサービスの処理を実行させる。

0031

また、リソース管理装置20は、ITサービスのために確保されたリソースキャパシティが適切か否かを見直す要求をユーザから受け、リソースキャパシティ予測装置30に、そのITサービスに必要となるリソースキャパシティを予測するように指示する。

0032

また、リソース管理装置20は、リソースキャパシティ予測装置30により予測されたリソースキャパシティの予測結果を取得する。確保されたリソースキャパシティと予測結果とに違いがある場合、リソース管理装置20は、確保されたリソースキャパシティを予測結果のリソースキャパシティへと変更するか否かをユーザに問い合わせる。そして、リソース管理装置20は、リソースキャパシティを変更する旨の指示を受けたことに応じてリソースキャパシティを追加または削除する。

0033

リソースキャパシティ予測装置30は、リソース管理装置20から、ITサービスのために確保されたリソースキャパシティが適切か否かを見直す要求を受信すると、ITサービスのサービスレベル項目の目標値を満たすために、ITサービスに必要なリソースキャパシティを予測する。

0034

ユーザ端末40は、ユーザによるITサービスの実行要求やリソースキャパシティの見直し要求、リソースキャパシティ変更指示をリソース管理装置に送信する。また、ユーザ端末40は、リソース管理装置20やリソースキャパシティ予測装置30、コンピュータシステム10の実行結果を受信するために用いられる。

0035

通信ネットワーク網99は、例えば、インターネット網イントラネット網ローカルエリアネットワーク網などにより実現される。これらは、単独で用いられてもよく、混在して用いられてもよい。通信ネットワーク網99は、リソース管理装置20とユーザ端末40とを接続する。

0036

次に、図1に例示する分散システムの動作を説明する。図1に例示する分散システム(以下、単に分散システムと記す。)は、ユーザからのITサービスの実行要求に応じて、コンピュータシステム内の少なくとも1つのハードウエアリソースまたはソフトウエアリソースを所定の時間確保して、ユーザが指定したITサービスの処理を実行する。なお、分散システムは、ハードウエアリソースとソフトウエアリソースの両方を所定の時間確保してもよい。

0037

そして、分散システムは、ITサービスのために確保されたリソースキャパシティが適切か否かを見直す要求に応じて、ITサービスのサービスレベル項目の目標値を満たすためにITサービスに必要なリソースキャパシティを予測する。

0038

ITサービスのために確保されたリソースキャパシティと、予測されたITサービスに必要なリソースキャパシティとに違いがある場合、分散システムは、確保されたリソースキャパシティを、予測したリソースキャパシティへ変更するか否かをユーザに問い合わせる。そして、リソースキャパシティを変更する旨の指示を受けたことに応じて、分散システムは、リソースキャパシティを追加または削除する。

0039

次に、図1に例示するリソース管理装置20の構成を説明する。図2は、リソース管理装置の例を示すブロック図である。図2に例示するリソース装置20は、フロントエンド処理部21と、サービスデータベース22(以下、サービスDB22と記す。)と、監視履歴データベース23(以下、監視履歴DB23と記す。)と、キャパシティ推定データベース24(以下、キャパシティ推定DB24)と、リソースデータベース25(以下、リソースDB25と記す。)と、実行管理部26と、実行状態データベース27(以下、実行状態DB27と記す。)とを備えている。

0040

フロントエンド処理部21は、通信ネットワーク網99を介したユーザ端末40との間のインタラクション、ITサービスの実行指示、リソースキャパシティの予測指示、リソースキャパシティの推定結果の確認、リソースキャパシティの変更指示、実行状態DB27に格納された実行履歴の追加および更新を行う。

0041

フロントエンド処理部21は、要求受付部211と、問合せ部212と、リソース確保部213とを含む。

0042

要求受付部211は、ユーザが実行を希望するITサービスの処理内容と、そのITサービスのサービスレベル項目の目標値を含む実行要求を、ユーザ端末40から受け付ける。そして、要求受付部211は、そのITサービスの処理を実行するコンピュータシステム10内のリソースを少なくとも1つ確保し、そのリソースを用いてITサービスの処理を実行させるように、リソース確保部213に指示する。

0043

また、要求受付部211は、ユーザがリソースキャパシティの見直しを希望するITサービスの識別子を含む見直し要求を、ユーザ端末40から受け付ける。そして、要求受付部211は、そのITサービスに必要なリソースキャパシティの予測をリソースキャパシティ予測装置30に指示する。

0044

また、要求受付部211は、ITサービスごとに受け付けた要求に対する処理(以下、ITサービスの要求受付処理と記す。)の実行状態に応じて、後述する実行状態DB27に格納された実行履歴表に対して、ITサービスの実行履歴レコードの追加または更新を行う。

0045

問合せ部212は、要求受付部211がリソースキャパシティ予測装置30に指示したITサービスのリソースキャパシティ予測結果がキャパシティ推定DB24に格納されているか否かを確認する。予測結果が格納されていた場合、問合せ部212は、そのITサービスのために確保しているリソースキャパシティと、その予測結果とを比較する。

0046

ITサービスのために確保しているリソースキャパシティと、その予測結果とに違いがある場合、問合せ部212は、そのITサービスのために確保しているリソースキャパシティを、予測結果のリソースキャパシティへ変更するか否かをユーザに問い合わせる。問合せ部212は、ユーザがリソースキャパシティの変更を希望するITサービスの識別子を含む変更指示をユーザ端末40から受け取ると、そのITサービスのリソースキャパシティの追加および削除をリソース確保部213に指示する。

0047

また、問合せ部212は、ユーザに問い合わせた内容に応答する処理(以下、ITサービスの問合せ処理と記す。)の実行状態に応じて、後述する実行状態DB27に格納された実行履歴表に対して、ITサービスの実行履歴レコードの追加または更新を行う。

0048

リソース確保部213は、要求受付部211と問合せ部212とからリソースの確保要求を受け付ける。そして、リソース確保部213は、要求受付部211または問合せ部212が指定したITサービスの処理を実行するために用いられるリソースを確保するため、後述するリソースDB25に対してリソース管理表の追加または更新を行う。

0049

また、リソース確保部213は、ITサービスで用いられるリソースを確保する処理(以下、ITサービスのリソース確保処理と記す。)の実行状態に応じて、後述する実行状態DB27に格納された実行履歴表に対して、ITサービスの実行履歴レコードの追加または更新を行う。

0050

サービスDB22は、ユーザから要求されたITサービスの関連情報をサービス関連データ表として記憶する。ITサービスの関連情報とは、ITサービスのサービスレベル項目に対して設定される目標値を含む情報である。なお、各サービスレベル項目の目標値を満たすために、サービスの提供に用いられるリソースのリソースキャパシティが決定される。

0051

監視履歴DB23は、コンピュータの各種リソースの監視状況に関するログを監視状況ログデータ表として記憶する。また、監視履歴DB23は、コンピュータのサービスレベル項目の測定結果および各種リソースの使用に関するログをログデータ表として記憶する。

0052

キャパシティ推定DB24は、リソースキャパシティ予測装置30の予測結果をリソース推移推定データ表およびリソースキャパシティ予測データ表として記憶する。

0053

リソースDB25は、コンピュータシステム10の各種リソースの確保情報リソース管理データ表として記憶する。

0054

実行管理部26は、リソースDB25が記憶するリソース管理表を参照して、コンピュータシステム10が提供する各ITサービスで用いられる各種リソースを確保するために実行される処理を管理する。

0055

また、実行管理部26は、ITサービスのリソース確保処理の実行状態に応じて、リソースDB25に対して、リソース管理表の追加または更新を行う。また、実行管理部26は、ITサービスのリソース確保処理の実行状態に応じて、実行状態DB27に記憶された実行履歴表におけるITサービスの実行履歴レコードの追加または更新を行う。

0056

実行状態DB27は、リソース管理装置20で実行される各処理の実行状態を示す情報を実行履歴表として記憶する。

0057

図2に例示するリソース管理装置20を用いることで、ITサービスを実行するために確保したリソースキャパシティに過不足がある場合、ユーザの承認を受けてリソースキャパシティ予測装置30が予測したリソースキャパシティへ変更できる。すなわち、ITサービスに必要なリソースキャパシティを適切に調整することができる。

0058

次に、本実施形態のリソースキャパシティ予測装置の構成を説明する。図3は、本実施形態のリソースキャパシティ予測装置の例を示すブロック図である。リソースキャパシティ予測装置30は、予測処理管理部31と、監視状況ログ取得部32と、ログ信頼度算出部33と、ログ取得部34と、リソース使用率推移推定部35と、リソースキャパシティ予測部36とを備えている。

0059

予測処理管理部31は、リソース管理装置20のフロントエンド処理部21からリソースキャパシティの予測指示を受け付ける。また、予測処理管理部31は、リソースキャパシティの予測処理に係わる監視状況ログ取得部32、ログ信頼度算出部33、ログ取得部34、リソース使用率推移推定部35およびリソースキャパシティ予測部36への実行指示を行う。また、予測処理管理部31は、実行指示を行った対象の実行状態を取得することで、リソースキャパシティの予測処理が実行されることを管理する。

0060

また、予測処理管理部31は、ITサービスの関連情報をサービスDB22から取得し、監視状況ログ取得部32とログ取得部34とリソース使用率推移推定部35とリソースキャパシティ予測部36へと送信する。

0061

監視状況ログ取得部32は、予測処理管理部31の指示により、ITサービスの処理を実行するコンピュータの監視状況に関するログを監視履歴DB23から取得し、リソース使用率推移推定部35へ送信する。

0062

ログ信頼度算出部33は、予測処理管理部31の指示により、ITサービスの処理を実行するコンピュータの各種リソースの監視状況に関するログを解析して、ITサービスの処理を実行するコンピュータのログの信頼度を算出し、リソース使用率推移推定部35へ送信する。なお、ログの信頼度の算出方法は、後述する。

0063

ログ取得部34は、予測処理管理部31の指示により、ITサービスの処理を実行するコンピュータのサービスレベル項目の測定に関するログと、各種リソースの使用に関するログとを監視履歴DB23から取得し、リソース使用率推移推定部35へ送信する。

0064

リソース使用率推移推定部35は、予測処理管理部31の指示により、ITサービスの処理を実行するコンピュータのログの信頼度と、ITサービスの処理を実行するコンピュータのサービスレベル項目の測定に関するログと、各種リソースの使用に関するログとから、信頼度が高いコンピュータのサービスレベル項目の測定に関するログと、各種リソースの使用に関するログを特定する。そして、リソース使用率推移推定部35は、それらのログに基づいて、サービスレベル項目の測定値に対するリソースの使用率を推定する。また、リソース使用率推移推定部35は、推定結果をキャパシティ推定DB24に格納する。なお、リソースの使用率の推定方法は、後述する。

0065

リソースキャパシティ予測部36は、予測処理管理部31の指示により、サービスレベル項目の測定値に対するリソースの使用率の推定結果をキャパシティ推定DB24から取得する。リソースキャパシティ予測部36は、ITサービスの各サービスレベル項目に設定された目標値をすべて満たす、ITサービスに必要なリソースキャパシティを予測する。また、リソースキャパシティ予測部36は、予測結果をキャパシティ推定DB24に格納する。なお、リソースキャパシティの予測方法は、後述する。

0066

すなわち、上述するリソースキャパシティ予測装置30では、リソース使用率推移推定部35が、ITサービスの処理を実行するコンピュータの監視状況に関するログから算出されたコンピュータのログの信頼度と、ITサービスのサービスレベル項目の測定に関するログと、コンピュータの各種リソースの使用に関するログを解析する。また、リソース使用率推移推定部35が、信頼度が高いコンピュータのサービスレベル項目の測定に関するログと、各種リソースの使用に関するログを特定する。そして、リソース使用率推移推定部35が、それらのログに基づいて、サービスレベル項目の測定値に対する各種リソースの使用率を推定する。

0067

そして、リソースキャパシティ予測部36が、この推定結果に基づいて、サービスレベル項目に設定された目標値をすべて満たすリソースキャパシティを予測する。このような構成により、監視状況が異なるリソースの監視情報からITサービスに必要なリソースキャパシティを精度よく予測できる。

0068

次に、図1に例示するコンピュータシステム10の構成を説明する。図4は、コンピュータシステムの例を示す説明図である。図4に示す例では、コンピュータシステム10の論理的な構成を示している。

0069

コンピュータシステム10は、複数のコンピュータ(処理ノード11)から構成される。コンピュータシステム10は、例えば、クラウドコンピューティングシステムグリッドコンピューティングシステム並列分散コンピュータ、スーパーコンピュータサーバコンピュータパーソナルコンピュータ、およびこれらの任意の数同士の組み合わせ等によって実現される。

0070

コンピュータシステム10は、情報処理を実行するために用いられる1または複数のリソースを有する。コンピュータシステム10が有するリソース111は、物理または論理プロセッサ、物理または論理メモリ、物理または論理ストレージ、物理または論理通信インターフェイス情報処理装置、および計算機クラスタ、その他の情報処理を実行するために使用されるハードウエアリソースであってよい。

0071

また、コンピュータシステム10が有するリソース111は、一例として同時に使用可能なユーザ数が制限されたアプリケーションプログラム、およびオペレーティングシステム、その他のソフトウエアリソースであってもよい。

0072

1または複数の処理ノード11のそれぞれは、ITサービスの処理を実行するために協働する仮想的なコンピュータシステムであってもよい。この仮想的なコンピュータシステムは、1または複数のリソース111を組み合わせて構成される。

0073

各処理ノード11が有する1または複数のリソースは、ユーザの承認を受けて、ITサービスを実行するためにリソース管理装置20の実行管理部26により確保される。それぞれのリソース111は、1つのリソースまたは2以上のリソース(例えば、CPUとメモリハードディスク)またはこれらのリソース等の一部のみを占有することによって構成される。

0074

それぞれのリソース111は、ITサービスの処理の一部または全部を実行する実行部112と、実行部112のリソースの監視状況と使用状態およびサービスレベル項目を監視してそれらの監視結果をリソース管理装置20の監視履歴DB23へと送信する監視部113とを含む。また、コンピュータシステム10は、いずれのITサービスの処理に対しても確保されていないリソース111を1または複数含んでもよい。

0075

次に、サービスDB22に格納されるサービス関連データ表の内容を説明する。図5は、サービスDBに格納されるサービス関連データ表の例を示す説明図である。図5に例示するサービス関連データ表は、「サービスID」項目と、「サービスレベル(以下、SLと記すこともある。)タイプ」項目と、「SL要求値」項目と、「インフラストラクチャ(以下、インフラと記す。)ID」項目と、「リソースタイプ」項目と、「開始日時」項目と、「終了日時」項目とを含む。また、サービス関連データ表は、「安全係数」項目を含んでいてもよい。

0076

「サービスID」は、ITサービスを一意に識別するための識別情報である。「SLタイプ」は、ITサービスのサービスレベル項目の識別情報である。「SL要求値」は、ITサービスのサービスレベル項目の目標値である。「インフラID」は、ITサービスの処理を実行するコンピュータの識別情報である。「リソースタイプ」は、ITサービスの処理を実行するコンピュータのリソースの識別情報である。「開始日時」は、ITサービスの開始日時を示す情報である。「終了日時」は、ITサービスの終了日時を示す情報である。「安全係数」は、予測値補正に用いられる係数である。

0077

例えば、図5の第2行目に例示するサービス関連データは、以下の内容を示す。具体的には、サービスID「SID001」で識別されるITサービスが、「Throughput 100,000 (Tx/sec)」のサービスレベル項目の目標値があることを示す。また、そのITサービスの処理では、「WEB001」で識別されるコンピュータの「CPU」リソースが、「2011/03/01 8:00:00 〜 2012/2/29 20:00:00」の期間利用されることを示す。さらに、「WEB001」で識別されるコンピュータの「CPU」リソースの予測結果は、安全係数「1.30」で補正される。つまり、この予測結果は、1.30倍されることを示す。

0078

サービスDB22のサービス関連データ表には、要求受付部211がユーザ端末40から受け付けた実行要求に含まれるITサービスの関連情報が格納される。この実行要求には、ユーザが実行を希望するITサービスの処理内容と、ITサービスのサービスレベル項目の目標値が含まれる。サービスDB22のサービス関連データ表に格納されたITサービスのサービス関連情報は、ITサービスの識別子を検索キーとして、リソースキャパシティ予測装置30によって取得される。

0079

次に、実行状態DB27に格納される実行履歴表の内容を説明する。図6は、実行状態DBに格納される実行履歴表の例を示す説明図である。図6に例示する実行履歴表は、「要求ID」項目と、「サービスID」項目と、「終了フラグ」項目と、「ステータス」項目と、「更新日時」項目とを含む。

0080

「要求ID」は、ユーザの要求を一意に識別するための識別情報である。「終了フラグ」は、要求処理がすべて終了したか否かを示す情報である。「ステータス」は、要求処理の進捗状態を示す情報である。「更新日時」は、上記の「ステータス」を更新した日時を示す情報である。

0081

例えば、図6の第2行目に例示する実行履歴レコードは、サービスID「SID001」で識別されるITサービスの実行履歴であり、このユーザの要求処理はすべて終了した実行履歴であることを示す。また、図6の第2行目に例示する実行履歴は、その要求の最終ステータスが「リソース確保処理完了通知済み」であり、「2011/12/01 8:00:00」に更新されたことを示す。

0082

実行状態DB27の実行履歴表には、ITサービスの要求受付処理の実行状態に応じて、要求受付部211により、そのITサービスの実行履歴レコードが追加または更新される。

0083

また、実行状態DB27の実行履歴表には、ITサービスの問合せ処理の実行状態に応じて、問合せ部212により、そのITサービスの実行履歴レコードが追加または更新される。

0084

また、実行状態DB27の実行履歴表には、ITサービスのリソース確保処理の実行状態に応じて、リソース確保部213により、そのITサービスの実行履歴レコードが追加または更新される。

0085

また、実行状態DB27の実行履歴表には、ITサービスのリソース確保処理の実行状態に応じて、実行管理部26により、そのITサービスの実行履歴レコードが追加または更新される。

0086

また、ユーザが閲覧を希望するITサービスの実行履歴表がユーザ端末40により参照される。

0087

次に、リソースDB25に格納されるリソース管理表の内容を説明する。図7は、リソースDBに格納されるリソース管理表の例を示す説明図である。図7に例示するリソース管理表は、「リソースステータス」項目と、「サービスID」項目と、「インフラID」項目と、「リソースタイプ」項目と、「確保可能リソース量」項目と、「確保リソース量」項目と、「開始日時」項目と、「終了日時」項目とを含む。

0088

「リソースステータス」は、ITサービスの処理を実行するために用いられるコンピュータにおける各種リソースの確保処理の実行状態を示す情報である。「サービスID」は、ITサービスを一意に識別するための識別情報である。「インフラID」は、コンピュータを一意に識別するための識別情報である。「リソースタイプ」は、上記の「インフラID」で識別されるコンピュータの各種リソースを一意に識別するための識別情報である。「確保可能リソース量」は、上記の「リソースタイプ」で識別されるリソースで使用されていないリソース量を示す情報である。「確保リソース量」は、上記の「サービスID」で識別されるITサービスで、上記の「リソースタイプ」で識別されるリソースが使用するリソース量を示す情報である。「開始日時」は、上記の「サービスID」で識別されるITサービスで上記の「確保リソース量」の使用が開始できる日時を示す情報である。「終了日時」は、上記の「サービスID」で識別されるITサービスで上記の「確保リソース量」の使用が終了する日時を示す情報である。

0089

例えば、図7の第2行目に例示するリソース管理データは、サービスID「SID001」で識別されるITサービスのリソースを管理するためのデータであることを示す。また、図7の第2行目に例示するリソース管理データの「リソースステータス」が、そのITサービスを処理するため、実行管理部26が確保リソース量「2vCPU」を確保する処理の実行中であることを示す。

0090

また、図7の第2行目に例示するリソース管理データは、「WEB001」で識別されるコンピュータの「CPU」リソースが、「2011/03/01 8:00:00 〜 2012/2/29 20:00:00」の期間利用されることを示す。さらに、図7の第2行目に例示するリソース管理データは、「WEB001」で識別されるコンピュータの「CPU」リソースの確保可能リソース量「2vCPU」が、そのITサービスを処理するために、さらに2vCPUを追加して利用できることを示す。

0091

リソースDB25には、要求受付部211からリソースを確保する要求を受け付けたリソース確保部213により、要求受付部211が指定したITサービスの処理を実行するために用いられるリソースを確保するため、リソース管理表が追加または更新される。

0092

また、リソースDB25のリソース管理表は、実行管理部26によって参照され、コンピュータシステム10上における各ITサービスのための各種リソースの確保処理の実行管理に用いられる。

0093

また、リソースDB25には、ITサービスのリソース確保処理の実行状態に応じて、実行管理部26により、リソース管理表が追加または更新される。

0094

次に、監視履歴DB23に格納される監視状況ログデータ表の内容を説明する。図8は、監視履歴DBに格納される監視状況ログデータ表の例を示す説明図である。図8に例示する監視状況ログデータ表は、「ログID」項目と、「インフラID」項目と、「ログ状況タイプ」項目と、「ログ状況測定値」項目とを含む。

0095

「ログID」は、ITサービスの処理を実行するために用いられるコンピュータの各種リソースの監視状況に関するログを収集した日時を一意に識別するための識別情報である。「インフラID」は、上記コンピュータを一意に識別するための識別情報である。「ログ状況タイプ」は、監視状況の種類を一意に識別するための識別情報である。「ログ状況測定値」は、上記の「ログ状況タイプ」で識別される監視状況の種類について測定された結果を示す値である。

0096

「ログ状況測定値」には、測定された結果を示す値が高品質な状況を示すほど高い値を示すように、その値が変換され、格納される。具体的には、「ログ状況タイプ」には、測定された結果の値が大きいほど高品質な状況を示すタイプと、測定された結果の値が小さいほど高品質な状況を示すタイプがある。測定された結果の値が大きいほど高品質な状況を示すタイプの場合、「ログ状況測定値」には、測定された結果を示す値がそのまま格納される。

0097

一方、測定された結果の値が小さいほど高品質な状況を示すタイプの場合、「ログ状況測定値」には、最も低品質な状況を示す値から、測定された結果を示す値を減算した値が格納される。例えば、あるログ状況タイプにおいて、最も高品質な状況を示す値が0で、最も低品質な状況を示す値が100であるとする。ここで、測定された結果を示す値が0.99の場合、ログ状況測定値には、99.01(=100−0.99)が格納される。

0098

このため、ログ状況タイプごとに、測定された結果を示す値が大きいほど高品質か低品質かを判別する情報、最も高品質な状況を示す値および最も低品質な状況を示す値が、参照可能な情報として予め定められる。

0099

監視状況ログデータは、コンピュータの各種リソースの監視状況に関するログである。監視状況ログデータは、図8に例示するように、繁忙期や閑散期などのITサービスの利用状況を示すデータ、ITサービスを保守するためのウイルスチェックやアップデート、スキャンデスクなどの常駐プログラムの稼働状況を示すデータ、実際のデータ転送量(実効スループット)や通信障害頻度などのネットワーク通信状況を示すデータ、コンピュータの各種リソースの使用に関するログの収集頻度欠損頻度、遅延頻度を示すデータ、コンピュータの監視インフラストラクチャ種別カテゴリ(以下、監視インフラ種別カテゴリと記す。)を示すデータなどである。

0100

監視インフラ種別カテゴリとは、コンピュータの監視データを収集する(すなわち、コンピュータを監視する)運用管理ソフトウェアの種類を、測定誤差に基づいて分類した際に付与される数値データを意味する。監視データの精密さ(すなわち、測定誤差)は、運用管理ソフトウェアごとに異なるため、監視状況の信頼性に影響する。そのため、監視インフラ種別カテゴリを、監視状況の信頼性に影響するパラメータとして利用することができる。すなわち、監視インフラ種別カテゴリは、コンピュータが監視する監視データの精密さの度合いを示す値ということができる。

0101

具体的には、コンピュータを監視する運用管理ソフトウェアは、サーバやネットワーク、アプリケーションを監視するためのソフトウェアであり、例えば、NECWebSAM MCOperations(NEC,WebSAM,MCOperationsは、いずれも登録商標。)などが挙げられる。

0102

例えば、運用管理ソフトウェアの測定誤差が少ないほど、数値データを高く付与する変換表が予め定められ、この変換表に基づいて各運用管理ソフトウェアが監視するデータの精密さが数値化される。例えば、上述するNECWebSAM MCOperationsに数値データとして「3」を付与し、他の運用管理ソフトウェアに数値データとして「2」や「1」を付与してもよい。

0103

例えば、図8の第2行目に例示する監視状況ログデータは、2011/11/11 11:00:00に収集されたログデータであり、この収集時刻を示す値「2011/11/11 11:00:00」をUNIX(登録商標)時間に変換した値である「1320976800.000」が「ログID」として用いられていることを示す。また、図8の第2行目に例示する監視状況ログデータは、インフラID「WEB001」で識別されるコンピュータから収集した監視状況「収集間隔(min)」が「10.00」であることを示すログデータである。

0104

ITサービスの処理を実行するコンピュータの監視状況に関するログは、監視状況ログ取得部32によって、そのコンピュータの選別子であるインフラIDを検索キーとして監視履歴DB23から取得される。

0105

また、監視履歴DB23には、コンピュータシステム10の実行部112により、監視されたコンピュータの監視状況が格納される。

0106

次に、監視履歴DB23に格納されるログデータ表の内容を説明する。図9は、監視履歴DBに格納されるログデータ表の例を示す説明図である。図9に例示するログデータ表は、「ログID」項目と、「ログタイプ」項目と、「インフラID」項目と、「測定値」項目とを含む。

0107

「ログID」は、ITサービスの処理を実行するコンピュータのサービスレベル項目の測定に関するログおよび各種リソースの使用に関するログを収集した日時を一意に識別するための識別情報である。「ログタイプ」は、サービスレベル項目を測定する種類、または、使用されるリソースの種類を一意に識別するための識別情報である。「インフラID」は、上記コンピュータを一意に識別するための識別情報である。「測定値」は、「ログタイプ」により識別される種類について測定した結果を示す値である。

0108

ログデータは、コンピュータのサービスレベル項目の測定に関するログと、各種リソースの使用に関するログとを含む。

0109

コンピュータのサービスレベル項目の測定に関するログは、スループット、平均リクエスト応答時間、平均トランザクション処理時間、トランザクション数、稼働率、不稼働率、平均復旧時間、平均故障間隔等を示すデータである。

0110

各種リソースの使用に関するログは、CPU使用率、使用CPUコア数、メモリ使用量、メモリ使用率、記憶装置の記憶容量、記憶装置の記憶容量使用率、ネットワーク使用量、ネットワーク使用率等を示すデータである。

0111

例えば、図9の第2行目に例示するログデータは、2011/11/11 11:00:00に収集されたログデータであり、この収集時刻を示す値「2011/11/11 11:00:00」をUNIX(登録商標)時間に変換した値である「1320976800.000」が「ログID」として用いられていることを示す。

0112

また、図9の第2行目に例示するログデータは、インフラID「LB001」で識別されるコンピュータから収集されたログタイプ「Throughput」の値が「38000」であることを示すログデータである。

0113

ITサービスの処理を実行するコンピュータのサービスレベル項目の測定に関するログと各種リソースの使用に関するログは、ログ取得部34によって、そのコンピュータの識別であるインフラIDを検索キーとして監視履歴DB23から取得される。

0114

また、監視履歴DB23には、コンピュータシステム10の実行部112により、コンピュータのサービスレベル項目の測定結果と各種リソースの使用状態が監視結果として格納される。

0115

次に、キャパシティ推定DB24に格納されるリソース推移推定データ表の内容を説明する。図10は、キャパシティ推定DBに格納されるリソース推移推定データ表の例を示す説明図である。リソース推移推定データ表は、「サービスID」項目と、「SLタイプ」項目と、「リソースタイプ」項目と、「インフラID」項目と、「関係式」項目と、「ログ信頼度」項目とを含む。

0116

「サービスID」は、ITサービスを一意に識別するための識別情報である。「SLタイプ」は、ITサービスのサービスレベル項目の識別情報である。「リソースタイプ」は、ITサービスの処理を実行するコンピュータのリソースの識別情報である。「インフラID」は、ITサービスの処理を実行するコンピュータの識別情報である。「関係式」は、上記「SLタイプ」で識別されるサービスレベル項目の値に対する、上記「リソースタイプ」で識別されるリソースの値の変動を表す。なお、関係式の算出方法は、後述する。「ログ信頼度」は、上記「関係式」を推定する際に用いられたログの信頼度を示す値である。

0117

例えば、図10の第2行目に例示するリソース推移推定データは、サービスID「SID001」で識別されるITサービスのリソースの使用率の推移を推定したデータであることを示す。また、図10の第2行目に例示するリソース推移推定データは、「Throughput」の値に対する「WEB001」で識別されるコンピュータのリソース「CPU」の変動を示す関係式が、ログの信頼度「+0.20」であるログを用いて推定した結果、「y=0.0004499781x+3.545466」と推定されたことを示す。

0118

キャパシティ推定DB24のリソース推移推定データ表には、リソース使用率推移推定部35によって、ITサービスのサービスレベル項目に対するリソースの使用率の推移を示す推定結果が格納される。

0119

また、ITサービスの各サービスレベル項目に対するリソースの使用率の推移を示す推定結果は、リソースキャパシティ予測部36によって、ITサービスの識別子であるサービスIDを検索キーとして、キャパシティ推定DB24のリソース推移推定データ表から取得される。

0120

次に、キャパシティ推定DB24に格納されるリソースキャパシティ予測データ表の内容を説明する。図11は、キャパシティ推定DBに格納されるリソースキャパシティ予測データ表の例を示す説明図である。リソースキャパシティ予測データ表は、「サービスID」項目と、「SLタイプ」項目と、「SL要求値」項目と、「リソースタイプ」項目と、「インフラID」項目と、「予測推定値」項目とを含む。

0121

「サービスID」は、ITサービスを一意に識別するための識別情報である。「SLタイプ」は、ITサービスのサービスレベル項目の識別情報である。「SL要求値」は、ITサービスのサービスレベル項目の目標値である。「リソースタイプ」は、ITサービスの処理を実行するコンピュータのリソースの識別情報である。「インフラID」は、ITサービスの処理を実行するコンピュータの識別情報である。「予測推定値」は、上記「SLタイプ」で識別されるサービスレベル項目の要求値(目標値)である「SL要求値」を満たすために必要な、上記「インフラID」で識別されるコンピュータの上記「リソースタイプ」で識別されるリソースのリソースキャパシティを推定した値である。

0122

例えば、図11の第2行目に例示するリソースキャパシティ予測データは、サービスID「SID001」で識別されるITサービスのリソースキャパシティを予測したデータであることを示す。また、図11の第2行目に例示するリソースキャパシティ予測データは、サービスレベル項目の目標値「Throughput 100,000 (Tx/sec)」を満たすために、「WEB001」で識別されるコンピュータに必要な「CPU」リソースが、「48.54328」であるという予測結果を示す。

0123

キャパシティ推定DB24のリソースキャパシティ予測データ表には、リソースキャパシティ予測部36によって、ITサービスのサービスレベル項目の目標値を満たすために必要なリソースキャパシティの予測結果が格納される。

0124

また、要求受付部211がリソースキャパシティ予測装置30に対して指示したITサービスのリソースキャパシティの予測結果は、問合せ部212によって、ITサービスの識別子であるサービスIDを検索キーとして、キャパシティ推定DB24のリソースキャパシティ予測データ表から取得される。

0125

なお、図12は、ログ信頼度の例を示す説明図である。図12に例示するように、ログ信頼度は、ログ信頼度算出部33によってログIDごとに算出される。

0126

次に、図1に例示するリソース管理装置20の動作を説明する。図13は、図1に例示する分散システムのリソース管理装置20がリソースキャパシティ予測を行う動作の例を示すフローチャートである。

0127

なお、コンピュータシステム10の各種リソースの確保状態に合わせて、実行管理部26がリソースDB25にリソース管理表の追加または更新を行うことで、コンピュータシステム10の各種リソースの確保状態と一致したリソース管理表がリソースDB25に格納されているとする。

0128

まず、要求受付部211は、ITサービスのために確保されたリソースキャパシティが適切か否かを見直す要求をユーザ(具体的には、ユーザ端末40)から受け付ける。要求受付部211は、ITサービスのリソースキャパシティ分析処理に関する要求受付の実行履歴を、実行状態DB27に追加する。要求受付部211は、リソースキャパシティ予測装置30に、ITサービスに必要なリソースキャパシティを予測するように指示する。要求受付部211は、ITサービスのリソースキャパシティ分析処理に関する実行履歴のステータスを「キャパシティ分析処理待ち」に更新する(ステップS101)。

0129

次に、リソースキャパシティ予測装置30は、リソース管理装置20から、ITサービスのリソースキャパシティの予測指示を受け付ける。リソースキャパシティ予測装置30は、ITサービスのサービスレベル項目の目標値を満たすために、ITサービスに必要なリソースキャパシティを予測する。そして、リソースキャパシティ予測装置30は、リソースキャパシティの予測結果を、キャパシティ推定DB24に格納する(ステップS102)。

0130

次に、問合せ部212は、ITサービスのために確保されたリソースキャパシティと予測結果とに違いがあるか否かを比較する(ステップS103)。リソースキャパシティの違いがある場合(ステップS103におけるYES)、ステップS104へ進む。一方、リソースキャパシティの違いがない場合(ステップS103におけるNO)、ステップS107へ進む。

0131

リソースキャパシティの違いがある場合(ステップS103におけるYES)、問合せ部212は、確保されたリソースキャパシティを予測結果のリソースキャパシティへ変更するか否かをユーザに問い合わせる。そして、問合せ部212は、ITサービスのリソースキャパシティ分析処理に関する実行履歴のステータスを、「キャパシティ変更問合せ中」に更新する(ステップS104)。

0132

一方、リソースキャパシティの違いがない場合(ステップS103におけるNO)、問合せ部212は、ITサービスのリソースキャパシティ分析処理に関する実行履歴のステータスを、「キャパシティ分析処理完了」に更新する。また、問合せ部212は、実行履歴の終了フラグをすべての分析処理が終了したことを示すフラグに更新する。問合せ部212は、ユーザ端末40にリソース分析処理が完了したことを通知し、実行履歴のステータスを、「キャパシティ分析処理完了通知済み」に更新する(ステップS107)。

0133

ステップS104の処理が行われた後、問合せ部212が、リソースキャパシティを変更する旨の指示を受けたか否か判断する(ステップS105)。リソースキャパシティを変更する旨の指示を受けた場合(ステップS105におけるYES)、ステップS106へ進む。一方、リソースキャパシティを変更しない旨の指示を受けた場合(ステップS105におけるNO)、ステップS107へ進む。

0134

リソースキャパシティを変更しない旨の指示を受けた場合(ステップS105におけるNO)、問合せ部212は、ITサービスのリソースキャパシティ分析処理に関する実行履歴のステータスを、「キャパシティ変更問合せ完了」に更新する。また、問合せ部212は、実行履歴の終了フラグをすべての分析処理が終了したことを示すフラグに更新する。問合せ部212は、ユーザ端末40にリソース分析処理が完了したことを通知し、実行履歴のステータスを、「キャパシティ変更問合せ完了通知済み」に更新する(ステップS107)。

0135

一方、リソースキャパシティを変更する旨の指示を受けた場合(ステップS105におけるYES)、問合せ部212は、確保されたリソースキャパシティを予測結果のリソースキャパシティへ変更するように、リソース確保部213に指示する。そして、問合せ部212は、ITサービスのリソースキャパシティ分析処理に関する実行履歴のステータスを、「リソース確保処理開始」に更新する。

0136

さらに、実行管理部26は、リソースDB25のリソース管理表における各ステータスを定期的に確認する。ステータスが「要求受付」であるリソース管理データがある場合、実行管理部26は、そのリソース管理データのステータスを「確保処理中」に更新する。また、実行管理部26は、そのリソース管理データに設定された「確保リソース量」になるように、コンピュータのリソースの確保処理を実行する。そして、実行管理部26は、リソースの確保処理が終了したときに、そのリソース管理データのステータスを「正常」に更新する。さらに、実行管理部26は、ITサービスの実行履歴のステータスを、「リソース確保処理完了」に更新する(ステップS106)。

0137

ステップS106の処理の後、リソース確保部213は、実行状態DB27の実行履歴表におけるステータスが「リソース確保処理完了」である実行履歴を定期的に確認する。そして、リソース確保部213は、その実行履歴の終了フラグをすべての分析処理が終了したことを示すフラグに更新する。リソース確保部213は、ユーザ端末40にリソース確保処理が完了したことを通知し、実行履歴のステータスを、「リソース確保処理完了通知済み」に更新する(ステップS107)。

0138

次に、本実施形態のリソースキャパシティ予測装置の動作を説明する。図14は、本実施形態のリソースキャパシティ予測装置の動作の例を示すフローチャートである。

0139

予測処理管理部31は、リソース管理装置20のフロントエンド処理部21から、ITサービスのリソースキャパシティの予測指示を受け付ける。そして、予測処理管理部31は、ITサービスの関連情報をサービスDB22から取得する。また、予測処理管理部31は、監視状況ログ取得部32およびログ取得部34に対し、ログを取得するよう指示する(ステップS201)。

0140

監視状況ログ取得部32は、予測処理管理部31の指示により、ITサービスの処理を実行するコンピュータの複数の時刻における監視状況に関するログを監視履歴DB23から取得し、リソース使用率推移推定部35へ送信する。また、監視状況ログ取得部32は、予測処理管理部31に、監視状況ログの取得が完了したことを通知する(ステップS202)。

0141

予測処理管理部31は、監視状況ログの取得が完了したことを監視状況ログ取得部32から受けると、ITサービスのリソースに関するログの信頼度を算出するようにログ信頼度算出部33へ指示する。

0142

ログ信頼度算出部33は、予測処理管理部31の指示により、ITサービスの処理を実行するコンピュータの複数の時刻における各種リソースの監視状況に関するログを解析する。そして、ログ信頼度算出部33は、ITサービスの処理を実行するコンピュータの複数の時刻におけるログの信頼度を算出し、リソース使用率推移推定部35へ送信する。また、ログ信頼度算出部33は、予測処理管理部31に、ログの信頼度の算出が完了したことを通知する(ステップS203)。

0143

一方、ログ取得部34は、予測処理管理部31の指示により、ITサービスの処理を実行するコンピュータの複数の時刻におけるサービスレベル項目の測定に関するログと、そのコンピュータの複数の時刻における各種リソースの使用に関するログを、監視履歴DB23から取得し、リソース使用率推移推定部35へ送信する。また、ログ取得部34は、予測処理管理部31に、ログの取得が完了したことを通知する(ステップS204)。

0144

ステップS203およびステップS204の処理の後、予測処理管理部31は、ログ取得部34からの取得完了と、ログ信頼度算出部33からの算出完了の通知を受けて、ITサービスを実行するコンピュータの各種リソースの使用率の推移を推定するようにリソース使用率推移推定部35へ指示する。

0145

リソース使用率推移推定部35は、予測処理管理部31の指示により、ITサービスの処理を実行するコンピュータの複数の時刻におけるログの信頼度と、ITサービスの処理を実行するコンピュータの複数の時刻におけるサービスレベル項目の測定に関するログと、そのコンピュータの複数の時刻における各種リソースの使用に関するログとから、信頼度が高いコンピュータのサービスレベル項目の測定に関するログと、各種リソースの使用に関するログを特定する。そして、リソース使用率推移推定部35は、それらのログに基づいて、サービスレベル項目の測定値に対するコンピュータのリソースの使用率を推定する。なお、ここで、後述するリソースキャパシティ予測部36が用いる安全係数を調整しておいてもよい。

0146

また、リソース使用率推移推定部35は、推定結果をキャパシティ推定DB24に格納する。また、リソース使用率推移推定部35は、各種リソースの使用率の推移推定が完了したことを予測処理管理部31に通知する(ステップS205,S206)。

0147

予測処理管理部31は、各種リソースの使用率の推移推定が完了したことをリソース使用率推移推定部35から受けて、リソースキャパシティ予測部36に、リソースキャパシティを予測するように指示する。リソースキャパシティ予測部36は、予測処理管理部31の指示により、ITサービスの各サービスレベル項目に対するリソースの使用率の推定結果をキャパシティ推定DBから取得する。そして、リソースキャパシティ予測部36は、そのITサービスの各サービスレベル項目に設定された目標値をすべて満たすリソースキャパシティを予測する。

0148

リソースキャパシティ予測部31は、予測結果をキャパシティ推定DB24に格納する。また、リソースキャパシティ予測部31は、リソースキャパシティの予測が完了したことを予測処理管理部31に通知する(ステップS207)。

0149

次に、本実施形態のログ信頼度算出部33の動作を詳述する。図15は、ログ信頼度算出部の動作の例を示すフローチャートである。ログ信頼度算出部33は、予測処理管理部31の指示を受けて、ログ信頼度の算出処理を開始する。なお、ログ信頼度算出部33は、監視状況ログ取得部32から、ITサービスの処理を実行するコンピュータの複数の時刻における監視状況に関するログを受け取っているとする。

0150

ログ信頼度算出部33は、監視状況に関するログに対して、ログ状況タイプ(すなわち、監視状況の種類)ごとに、ログ状況測定値(すなわち、監視状況の種類に応じて測定される値)の平均値と、標準偏差値と、変動係数とをそれぞれ算出する(ステップS301)。

0151

ログ信頼度算出部33は、ログ状況測定値のばらつきが大きいログ状況タイプほど注目すべきログ状況タイプであると仮定して、各ログ状況タイプの変動係数の比に基づいて各ログ状況タイプの重みを設定する。例えば、3つのログ状況タイプの変動係数が0.4,0.6,1.0であるとする。すべてのログ状況の重みの総和を1とした場合、それぞれの重みは、0.2,0.3,0.5になる(ステップS302)。

0152

ログ信頼度算出部33は、ステップS301で算出された平均値xargと、標準偏差値xstdev、およびステップS302で算出された重みwを用いて、同じログIDで識別される監視状況ログを対象に、以下に示す式1および式2に基づいて、ログ信頼度を算出する。以下に示す式1は、ログ信頼度の算出式である。また、以下に示す式2は、ログ状況測定値を標準化するための式である。

0153

0154

ログ信頼度算出部33は、図12に例示するログ信頼度をログIDごとに算出し、リソース使用率推移推定部35へ送信する。また、ログ信頼度算出部33は、予測処理管理部31に、ログの信頼度の算出が完了したことを通知する。

0155

次に、本実施形態のリソース使用率推移推定部35の動作を詳述する。図16は、リソース使用率推移推定部の動作の例を示すフローチャートである。リソース使用率推移推定部35は、予測処理管理部31の指示により、ITサービスのサービスレベル項目に対する各種リソースの使用率の推移を推定する処理を開始する。

0156

なお、リソース使用率推移推定部35は、予測処理管理部31からITサービスの関連情報を受け取り、ログ取得部34からITサービスのサービスレベル項目の測定に関するログおよび各種リソースの使用率に関するログを受け取り、ログ信頼度算出部33から、ITサービスのログの信頼度のデータを受け取っているとする。

0157

また、リソース使用率推移推定部35には、ログの信頼度を高いと判定するための閾値(以下、信頼度閾値と記す。)が設定されているものとする。また、リソース使用率推移推定部35には、一定以上の頻度があるか否かを判定するための後述する閾値(Counter配列の閾値。以下、頻度閾値と記す。)が設定されているものとする。

0158

リソース使用率推移推定部35は、ログの信頼度閾値に基づいて、閾値以上のログの信頼度を有するサービスレベル項目の測定に関するログと、各種リソースの使用に関するログのみを選択する(ステップS401)。

0159

リソース使用率推移推定部35は、ITサービスの関連情報から、異なるSLタイプと異なるリソースタイプとを1組とする対応表を作成する。そして、リソース使用率推移推定部35は、1組(SLタイプ、リソースタイプ)のログデータを、ステップS401で選択したログから取得できるか否か判断する(ステップS402)。取得できる場合はステップS403に進む。

0160

選択した組のログデータを取得できる場合(ステップS402における「取得できる場合」)、リソース使用率推移推定部35は、SLタイプをX軸としリソースタイプをY軸とする2次元空間を、ハフ変換によって、(角度θ,距離ρ)の2次元空間に変換する。そして、リソース使用率推移推定部35は、角度θおよび距離ρを2次元配列に格納する。具体的には、リソース使用率推移推定部35は、(x1,y1)に対して、ρ=x1・cosθ+y1・sinθを満たす(θ1,ρ1)を算出する。

0161

そして、リソース使用率推移推定部35は、算出した(θ1,ρ1)を、Counter[θ][ρ]配列にそれぞれ格納する。すなわち、Counter[θ][ρ]配列には、角度θと距離ρの頻度の値が格納されることになる。

0162

なお、角度θの探索範囲を、0からπまで、またはπ/2からπまでとしてもよい。また、リソース使用率推移推定部35は、距離ρが0以上の距離ρ1の場合にのみ、算出した(θ1,ρ1)を、Counter[θ][ρ]配列にそれぞれ格納するようにしてもよい(ステップS403)。

0163

リソース使用率推移推定部35は、Counter[θ][ρ]配列から、Counter配列の閾値(すなわち、頻度閾値)に基づいて、一定頻度以上である最大角度θ1’と距離ρ1’を求める。なお、角度θの探索範囲を、0からπまで、またはπ/2からπまでとしてもよい。また、距離ρの探索範囲を、0からx軸の最大値とy軸の最大値の二乗和dまで、または−dからdまでとしてもよい(ステップS404)。

0164

リソース使用率推移推定部35は、ステップS404で求めた(θ1’,ρ1’)を、ハフ逆変換によって、(角度θ,距離ρ)の2次元空間から、SLタイプをX軸としリソースタイプをY軸とする2次元空間に変換する。

0165

具体的には、リソース使用率推移推定部35は、(θ1’,ρ1’) に対して、以下に示す式3を満たす(a1,b1)を算出する。すなわち、この式3に示す関係式が、サービスレベル項目の測定値に対するコンピュータのリソースの使用率ということができる。

0166

y=a1・x+b1=−1/tanθ1’・x+ρ1’/sinθ1’・・・(式3)

0167

そして、リソース使用率推移推定部35は、1組(SLタイプX、リソースタイプY)の関係式であるy=a1・x+b1の推定結果をキャパシティ推定DB24に格納する。ここで格納された推定結果が、図10に例示する「関係式」に相当する。その後、リソース使用率推移推定部35は、S402以降の処理を繰り返す。

0168

ステップS402において、選択した組のログデータを取得できない場合(ステップS402における「取得できない場合」)、リソース使用率推移推定部35は、ITサービスのサービスレベル項目に対する各種リソースの使用率の推定処理が完了したことを予測処理管理部31へ通知する。

0169

次に、本実施形態のリソースキャパシティ予測部36の動作を詳述する。図17は、リソースキャパシティ予測部の動作の例を示すフローチャートである。リソースキャパシティ予測部36は、予測処理管理部31の指示により、ITサービスの各サービスレベル項目の目標値をすべて満たすリソースキャパシティを予測する処理を開始する。

0170

なお、キャパシティ推定DB24は、ITサービスの各サービスレベル項目に対する各種リソースの使用率の推移推定結果(すなわち、関係式)を格納しているとする。この推移推定結果は、リソースキャパシティ予測部36により参照される。また、リソースキャパシティ予測部36は、各リソースタイプの暫定予測値を格納する配列を備えているとする。暫定予測値の初期値は0とする。

0171

リソースキャパシティ予測部36は、ITサービスの関連情報から、SLタイプとSL要求値(すなわち、サービスレベル項目の目標値)を1組とするサービスレベル対応表を作成する(ステップS501)。

0172

リソースキャパシティ予測部36は、ステップS501で作成したサービスレベル対応表から、1組のSLタイプとSL要求値を取得できるか否か判断する(ステップS502)。取得できる場合はステップS503へ進み、取得できなかった場合はステップS505へ進む。

0173

1組のSLタイプとSL要求値を取得できた場合(ステップS502におけるYES)、リソースキャパシティ予測部36は、ステップS502で取得した1組のSLタイプとSL要求値に対応する、各リソースタイプの関係式を取得する。そして、リソースキャパシティ予測部36は、SL要求値と関係式とから、リソースキャパシティ予測値を算出する(ステップS503)。

0174

例えば、図11に例示するように、SLタイプ「Throughput」のSL要求値が「100000」であるとする。また、SLタイプ「Throughput」およびインフラID「WEB001」のリソースタイプ「CPU」の関係式が、図10に例示する関係式「y=0.0004499781x+3.545466」であるとする。このとき、リソースキャパシティ予測部36は、リソースキャパシティ予測値を「48.54328(=0.0004499781*100000+3.545466)」と算出する。

0175

リソースキャパシティ予測部36は、ステップS503で算出したそれぞれのリソースタイプのリソースキャパシティ予測値と、各リソースタイプの暫定予測値とを比較する。ステップS503で算出したリソースキャパシティ予測値が暫定予測値より大きければ、リソースキャパシティ予測部36は、その予測値を暫定予測値として更新する。一方、ステップS503で算出したリソースキャパシティ予測値が暫定予測値より小さい場合は、リソースキャパシティ予測部36は、暫定予測値を更新しない。その後、リソースキャパシティ予測部36は、ステップS502以降の処理を繰り返す。

0176

ステップS502において、1組のSLタイプとSL要求値を取得できなかった場合(ステップS502におけるNO)、リソースキャパシティ予測部36は、各リソースタイプの暫定予測値を予測値として確定する。

0177

なお、各リソースタイプの安全係数を予め設定しておき、リソースキャパシティ予測部36は、各リソースの暫定予測値を安全係数で補正した補正予測値を予測値として確定してもよい。例えば、安全係数が「1.3」で、リソースキャパシティ暫定予測値が「48.54328」の場合、リソースキャパシティ予測値は、「63.106264(=48.54328*1.3)」と算出される(ステップS505)。

0178

ソースキャパシティ推定部36は、推定結果をキャパシティ推定DB24に格納する。また、リソースキャパシティ予測部36は、リソースキャパシティの推定が完了したことを予測処理管理部31へ通知する。

0179

以上のように、本実施形態によれば、ログ信頼度算出部33が、コンピュータシステムを構成する各コンピュータから、リソースの監視状況に関するログを取得し、このログに含まれるコンピュータの複数の時刻における監視状況の情報に基づいて、複数の時刻におけるログの信頼度を算出する。そして、リソース使用率推移推定部35が、上記各コンピュータから、リソースの使用に関するログおよびサービスレベル項目の測定に関するログを取得し、複数の時刻におけるリソースの使用率の情報およびサービスレベル項目の測定値の情報と、ログ信頼度算出部33が算出した複数の時刻におけるログの信頼度とに基づいて、コンピュータのリソースの使用率を推定する。よって、監視状況の異なるリソースの監視情報から、ITサービスに必要となるリソースキャパシティを、精度よく予測できる。

0180

また、リソースキャパシティ予測部36が、ITサービスのサービスレベル項目の目標値を含むサービス関連データを参照し、リソース使用率推移推定部35の推定結果(関係式)に基づいて、ITサービスのサービスレベル項目の目標値をすべて満たすリソースキャパシティを予測してもよい。

0181

すなわち、本実施形態では、ログ信頼度算出部33が、コンピュータから、リソースの監視状況に関するログを取得し、これらのログに含まれる複数の時刻における各種リソースの監視状況の情報に基づいて、複数の時刻におけるログの信頼度を算出する。なお、ここでの監視状況は、繁忙期や閑散期などのITサービスの利用状況を示すデータ、ITサービスを保守するためのウイルスチェックやアップデート、スキャンデスクなどの常駐プログラムの稼働状況を示すデータ、および、実際のデータ転送量や通信障害頻度などのネットワーク通信状況を示すデータを含む。

0182

また、本実施形態では、リソース使用率推移推定部35が、サービスレベル項目の測定に関するログとリソースの使用に関するログとをコンピュータから取得する。また、リソース使用率推移推定部35が、これらのログに含まれる複数の時刻におけるサービスレベル項目の測定値の情報と、コンピュータの複数の時刻におけるリソースの使用率の情報と、ログ信頼度算出部33により算出された複数の時刻におけるログの信頼度に基づいて、ログの信頼度が一定値以上であるコンピュータのサービスレベル項目の測定に関するログおよび各種リソースの使用に関するログを特定する。そして、リソース使用率推移推定部35が、それらのログに基づいてサービスレベル項目の測定値に対する各種リソースの使用率を推定する。なお、ここでのサービスレベル項目の測定値は、スループット、平均リクエスト応答時間、平均トランザクション処理時間、トランザクション数、稼働率、不稼働率、平均復旧時間、平均故障間隔等を含む。また、ここでのリソースの使用率は、CPU使用率、メモリ使用量、記憶装置の記憶容量、ネットワーク使用量等を含む。

0183

さらに、本実施形態では、リソースキャパシティ予測部36が、サービスレベル項目の目標値を含むサービス関連データを参照し、リソース使用率推移推定部35により推定されたコンピュータのサービスレベル項目の測定値に対するコンピュータのリソースの使用率の推定結果に基づいて、サービスレベル項目の目標値をすべて満たすリソースキャパシティを予測する。

0184

本実施形態のリソースキャパシティ予測装置30は、これらの要素を含むことにより、監視状況が異なるリソースの監視情報からITサービスに必要なリソースキャパシティを精度よく予測できる

0185

次に、本実施形態のリソースキャパシティ予測装置のハードウェア構成を説明する。図18は、図1に例示するリソースキャパシティ予測装置およびリソース管理装置のハードウェア構成の例を示す説明図である。以下では、コンピュータを典型例とする情報処理装置として全般的な構成を説明する。ただし、専用機組み込み型装置の場合、その環境に応じて必要最小限な構成が選択される。

0186

リソースキャパシティ予測装置およびリソース管理装置は、ホスト・コントローラ51により相互に接続される、CPU52、バスライン(図示せず)、通信I/F53、メインメモリ(RAM(Random Access Memory))54、BIOS(Basic Input/Output System )55、パラレルポート56、USB(Universal Serial Bus)ポート57、グラフィック・コントローラ58、VRAM(Video RAM)59、音声プロセッサ60、I/Oコントローラ61、キーボード及びマウスアダプタ62等の入力手段を備える。I/Oコントローラ61には、例えば、フレキシブルディスクFDドライブ63、ハードディスク・ドライブ64、光ディスク・ドライブ65、半導体メモリ66等の記憶手段を接続することができる。

0187

グラフィック・コントローラ58には、表示装置71が接続されている。オプションとして、音声プロセッサ60には、増幅回路67及びスピーカ68が接続される。

0188

また、BIOS55は、リソースキャパシティ予測装置およびリソース管理装置の起動時にCPUが実行するブートプログラムや、リソースキャパシティ予測装置およびリソース管理装置のハードウェアに依存するプログラム等を格納する。FDドライブ63は、フレキシブル・ディスク69からプログラム又はデータを読み取り、I/Oコントローラ61を介してメインメモリ54又はハードディスク・ドライブ64に提供する。

0189

光ディスク・ドライブ65として、例えば、ブルーレイドライブ、DVD(Digital Versatile Disc)−ROM(Read Only Memory)ドライブ、CD(Compact Disc)−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブが使用される。この場合、各ドライブに対応した光ディスク70が使用される。光ディスク・ドライブ65は、光ディスクからプログラム又はデータを読み取り、I/Oコントローラ61を介してメインメモリ54又はハードディスク・ドライブ64に提供することもできる。

0190

リソースキャパシティ予測装置およびリソース管理装置に提供されるコンピュータプログラムは、フレキシブル・ディスク、光ディスク、又はメモリカード等の記録媒体に格納されて利用者によって提供される。このコンピュータプログラムは、I/Oコントローラを介して、記録媒体から読み出され、又は通信I/Fを介してダウンロードされることによって、リソースキャパシティ予測装置およびリソース管理装置にインストールされ実行される。コンピュータプログラムが情報処理装置に働きかけて行わせる動作は、既に説明した装置における動作と同一であるので省略する。

0191

上述するコンピュータプログラムは、外部の記憶媒体に格納されていてもよい。記憶媒体として、例えば、フレキシブル・ディスク、光ディスク、メモリカードの他に、MD(MiniDisc)等の光磁気記録媒体テープ媒体が用いられる。また、専用通信回線インターネットに接続されたサーバシステムに設けたハードディスク又は光ディスク・ライブラリ等の記憶装置を記録媒体として使用し、通信回線を介してコンピュータプログラムをリソースキャパシティ予測装置およびリソース管理装置に提供してもよい。

0192

以上の例は、リソースキャパシティ予測装置およびリソース管理装置のハードウェア構成について主に説明した。他にも、コンピュータに、情報処理装置で説明した機能を有するプログラムをインストールして、そのコンピュータを情報処理装置として動作させることにより上記で説明した情報処理装置と同様な機能を実現することができる。したがって、本発明において1つの実施形態として説明した情報処理装置は、そのコンピュータプログラムによっても実現可能である。

0193

図1に例示するリソースキャパシティ予測装置およびリソース管理装置は、ハードウェア、ソフトウェア、又はハードウェア及びソフトウェアの組み合わせとして実現可能である。ハードウェアとソフトウェアとを組み合わせて実施する方法として、例えば、所定のプログラムを有するコンピュータシステムで実施する方法が典型的な例として挙げられる。この場合、所定のプログラムがコンピュータシステムにロードされ実行されることにより、そのプログラムは、コンピュータシステムに本発明に係る処理を実行させる。

0194

このプログラムは、任意の言語、コード、又は表記によって表現可能な命令群から構成される。そのような命令群は、システムが特定の機能を直接実行すること、又は(1)他の言語、コード、もしくは表記への変換、(2)他の媒体への複製、のいずれか一方もしくは双方が行われた後に、実行することを可能にするものである。

0195

もちろん、本発明は、そのようなプログラム自体のみならず、プログラムを記録した媒体を含むプログラム製品もその範囲に含むものである。本発明の機能を実行するためのプログラムは、フレキシブル・ディスク、MO、CD−ROM、DVD、ブルーレイディスクハードディスク装置、ROM、MRAM(Magnetoresistive RAM )、RAM等の任意のコンピュータ可読媒体に格納することができる。

0196

このようなプログラムを、コンピュータ可読媒体への格納のために、通信回線で接続する他のコンピュータシステムからダウンロードしたり、他の媒体から複製したりすることができる。また、このようなプログラムを、圧縮し、又は複数に分割して、単一又は複数の記録媒体に格納することもできる。

0197

例えば、本実施形態のリソースキャパシティ予測装置の場合、ログ信頼度算出部33と、リソース使用率推移推定部35と、リソースキャパシティ予測部36とは、プログラム(リソースキャパシティ予測プログラム)に従って動作するコンピュータのCPU52によって実現される。例えば、プログラムは、リソースキャパシティ予測装置の上述する記憶手段に記憶され、CPU52は、そのプログラムを読み込み、プログラムに従って、ログ信頼度算出部33、リソース使用率推移推定部35、および、リソースキャパシティ予測部36として動作してもよい。また、ログ信頼度算出部33と、リソース使用率推移推定部35と、リソースキャパシティ予測部36とは、それぞれが専用のハードウェアで実現されていてもよい。

0198

次に、本発明の概要を説明する。図19は、本発明によるリソースキャパシティ予測装置の概要を示すブロック図である。本発明によるリソースキャパシティ予測装置(例えば、リソースキャパシティ予測装置30)は、複数のコンピュータ(例えば、処理ノード11)から構成されるコンピュータシステム(例えば、コンピュータシステム10)のリソースキャパシティを予測する。

0199

本発明によるリソースキャパシティ予測装置は、コンピュータから、リソースの監視状況に関する第一のログ(例えば、図8に例示する監視状況ログデータ)を取得し、第一のログに含まれるコンピュータの複数の時刻における監視状況の情報に基づいて、複数の時刻におけるログの信頼度を算出するログ信頼度算出手段81(例えば、ログ信頼度算出部33)と、コンピュータから、リソースの使用に関する第二のログ(例えば、図9に例示するログデータに含まれる各種リソースの使用に関するログ)およびコンピュータのサービスレベル項目の測定に関する第三のログ(例えば、図9に例示するログデータに含まれるサービスレベル項目の測定に関するログ)を取得し、第二のログに含まれるコンピュータの複数の時刻におけるリソースの使用率の情報と、第三のログに含まれるコンピュータの複数の時刻におけるサービスレベル項目の測定値の情報と、ログ信頼度算出手段81により算出された複数の時刻におけるログの信頼度とに基づいて、コンピュータのリソースの使用率(例えば、関係式)を推定するリソース使用率推移推定手段82(例えば、リソース使用率推移推定部35)とを備えている。

0200

そのような構成により、監視状況が異なるリソースの監視情報からITサービスに必要なリソースキャパシティを精度よく予測できる。

0201

また、リソースキャパシティ予測装置は、ITサービスのサービスレベル項目の目標値を含むサービス関連情報(例えば、図5に例示するサービス関連データ)を参照し、リソース使用率推移推定手段82により推定されたコンピュータのサービスレベル項目の測定値に対するコンピュータのリソースの使用率の推定結果(例えば、関係式)に基づいて、ITサービスのサービスレベル項目の目標値をすべて満たすリソースキャパシティを予測するリソースキャパシティ予測手段(例えば、リソースキャパシティ予測部36)を備えていてもよい。

0202

また、リソース使用率推移推定手段82は、ログ信頼度算出手段81により算出された複数の時刻におけるログの信頼度が一定の条件(例えば、信頼度が予め定めた信頼度より大きいという条件)を満たす場合に、コンピュータのリソースの使用率を推定してもよい。具体的には、リソース使用率推移推定手段82は、取得した第二のログの中うち、信頼度が閾値以上のログを選択してもよい。

0203

また、リソースの監視状況に関する第一のログは、ITサービスの利用状況を示すデータ、ITサービスを保守するための常駐プログラムの稼働状況を示すデータ、ネットワーク通信状況を示すデータ、コンピュータの各種リソースの使用に関するログの収集頻度と欠損頻度と遅延頻度を示すデータ、コンピュータが監視する監視データの精密さの度合いを示す監視インフラ種別カテゴリを示すデータのいずれか複数を含むデータであってもよい。

0204

また、ログ信頼度算出手段81は、第一のログに含まれる、監視状況の種類(例えば、ログ状況タイプ)に応じて測定される複数の時刻における各測定値(例えば、ログ状況測定値)のうち、測定値のばらつき具合が大きい測定値ほどログの信頼度の算出式の重み係数を重くする算出式に基づいて、ログの信頼度を算出してもよい。

0205

以上、本発明を実施形態に則して説明したが、本発明は、上述した実施形態に限られない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されない。

0206

また、本発明のリソースキャパシティ予測装置を上記実施形態を用いて説明したが、本発明のリソースキャパシティ予測装置の技術的範囲は上記実施形態に記載された範囲に限定されない。上記実施形態に、多様な変更または改良を加えることが可能であることは、当業者に明らかである。その様な変更または改良を加えた形態も、本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。

0207

本発明は、コンピュータシステムのキャパシティを管理するリソースキャパシティ装置に適用可能である。

0208

10コンピュータシステム
11処理ノード
20リソース管理装置
21フロントエンド処理部
211要求受付部
212問合せ部
213リソース確保部
22サービスデータベース(サービスDB)
23監視履歴データベース(監視履歴DB)
24キャパシティ推定データベース(キャパシティ推定DB)
25リソースデータベース(リソースDB)
26 実行管理部
27実行状態データベース(実行状態DB)
30 リソースキャパシティ予測装置
31予測処理管理部
32監視状況ログ取得部
33ログ信頼度算出部
34 ログ取得部
35リソース使用率推移推定部
36 リソースキャパシティ予測部
40ユーザ端末
99 通信ネットワーク網

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ