━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
ケーススタディ
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
vRealize Operations Manager 6.x のトラブルシューティング
今回のテーマは、vRealize Operations Manager (vROps) のトラブルシューティングです。
vROps の使用中に発生する可能性のある問題を診断および解決するために、様々な手順を使用できます。その中で、VMware のテクニカルサポートによくあるお問い合わせ内容と実際に問題を診断・解決する際に使用している手順をご紹介します。
1. ライセンス数が超過する問題
[ 問題 ] vRealize Operations Manager for Horizon (V4H) を使用した管理ソリューションは、Horizon の環境にも対応します。その際、vROps を運用するためのライセンスキーとHorizon 環境を監視するための V4H ライセンスキーが発行され、それぞれ付与する必要があります。ライセンス付与後、図 1 のように vROps ライセンス数が超過するアラートが発生する場合があります。
図1. vROps ライセンス数の超過
[ 原因 ] Horizon の仮想マシン等のオブジェクトは V4H のライセンスに関連付けされる必要がありますが、仮想マシンが Horizon のオブジェクトに属するものかどうか vROps にて判別が困難となる場合あります。その際、図 1 の例のように誤って vROps のライセンスに Horizon オブジェクトが関連付けされてしまい、vROps ライセンスの使用超過が発生します。
[ 解決方法 ] ライセンスグループの編集の「メンバーの追加」の項目にてライセンスキーに関連付けられた仮想マシンのオブジェクト (例では Horizon 仮想マシン) を除外する事で、Horizon オブジェクトと vROps ライセンスとの関連付けが解除され、ライセンス超過の問題を回避することができます。
ライセンスグループを確認できる場所
1. vROps のメインメニューから [管理] をクリックし、左側のペインで [管理] -> [ライセンス] の順にクリック
2. [ライセンスグループ] タブをクリックします。
詳細は vRealize Operations Manager ライセンスグループのドキュメントをご参照下さい。
図2. ライセンスグループの編集
2. 過去に収集した一部のデータが見えなくなる問題 (vROps 6.3, 6,4, 6.5)
[ 問題 ] 例えば、vROps を 6 ヶ月運用した際に最も古い 2 ヵ月分のデータが確認できず、最近の 4 ヵ月分のデータのみ確認できるような事象が発生します。
[ 原因 ] vROps はデフォルトで /storage/db 配下にあるディスクの空き容量が 10% 未満に至った際、ディスクの空き容量を確保するように一番古いデータから削除を実施するためとなります。
データが削除されたかどうかは、/data/log/vcops/log/datapurging-X.log ログから確認することができます。
2018-04-12 14:06:10,507 INFO [Activity Executor __DEFAULT_ACTIVITY_EXECUTOR - 5] com.integrien.alive.controller.persistence.ResourceDeletion.DataPurging.submitPurgeJobs - successfully deleted resource:19303 from 80 from shard:vRealize Ops Shard
次に、vROps のノードに ssh ログインし df コマンドで現在のディスクの使用状況を確認します。
$df -h
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/data-db 207G 186G 20G 91% /storage/db
ログからデータ削除のジョブが実施された痕跡と、df コマンドから確認できる /storage/db の空き容量が枯渇している状況から、最も古い 2ヵ月分のデータは削除された可能性が考えられます。
本事象の KB 情報はこちらです。
Historical data is lost in VMware vRealize Operations Manager 6.1 (2137020)
注意) 上記は vROps のバージョン 6.3, 6.4, 6.5 まで該当します。vROps 6.6 と上位バージョンからディスクの空き容量が 90% に達してもデータが削除されないように仕様が変更されました。ディスクが空き容量が逼迫する可能性がありますので、下記の KB 情報に記載されているアラームを活用してください。
Data Not Purged at 90% Full in vRealize Operations Manager 6.6.x (51978)
[ 解決方法 ] vROps のノードに新規仮想ディスクを追加して空き容量を確保することで、より多くのデータを保持できるようにします。
Adding additional storage to a node in vRealize Operations Manager 6.x (2016022)
3. vCenter Server のパフォーマンスデータの内容と異なる問題
[ 問題 ] vROps のチャートと vCenter Server のパフォーマンスグラフを比較した場合
例えば、図 3 のように「CPU Ready」にて表示されている値が一致しないように見えます。
vCenter Server のパフォーマンスチャートでは 7 月 17 日 07:54:40 1,925 (ミリ秒)
vROps のチャートでは 7 月 17 日 07:52:35 1,232.8 (ミリ秒)
図3. パフォーマンスチャートの比較
[原因] vROps にて確認できるメトリックの一部では、 vCenter Server からデータを取得する際リアルタイムデータの過去 5 分間のデータをサンプリングし、平均化して vROps にて表示している為となります。
図 3 の vROps のチャートにある 7 月 17 日 07:52:35 1,232.8 (ms) の値は以下のように算出しています。
vROps の 7:52:35 のデータは vCenter Server の CPU Ready の過去の 5 分間のデータを使用します。例えば 7:52:35 の過去 5 分間のデータを以下とします。
(計 15 サンプルデータ)
1. Jul 17 07:47:40 1084
2. Jul 17 07:48:00 1255
3. Jul 17 07:48:20 1193
4. Jul 17 07:48:40 1194
5. Jul 17 07:49:00 1468
6. Jul 17 07:49:20 1379
7. Jul 17 07:49:40 1378
8. Jul 17 07:50:00 1128
9. Jul 17 07:50:20 1566
10. Jul 17 07:50:40 1141
11. Jul 17 07:51:00 1112
12. Jul 17 07:51:20 1146
13. Jul 17 07:51:40 1173
14. Jul 17 07:52:00 1142
15. Jul 17 07:52:20 1093
15 サンプルのデータ総計 / 15 (サンプル)で算出できる平均値が vROps にて確認できる 1 データとなります。上記の例の場合、サンプルの平均値は 1230.13 となり vROps の 07:52:20 にて確認でき値 1,232.8 (ms) とほぼ同値となります。
このように、vROps は vCenter Server で確認できるパフォーマンスチャートとは異なる値を表示しています。
|