Managed Cloudコンテナ

Managed Cloudコンテナの監視

Version:

日本語翻訳に関する免責事項

このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。

組み込みの監視サービスを使用して、Managed Cloud Containersソリューションのパフォーマンスと可用性を監視できます。

Metrics exporters - サービスやインフラストラクチャから既存のPrometheusサーバーにメトリクスをエクスポートするのに役立つライブラリ。
Prometheus - サービスからメトリクスをスクレイピングし、データを集約して保存し、Grafanaなどの他のサービスにそのようなメトリクスの収集を許可します。
Grafana - Prometheusからメトリクスを収集し、それらを視覚化します。

Monitoring services in Managed Cloud Containers overview.

Grafanaでの認証

GrafanaはAzure Active Directoryと統合されており、基本認証は無効になっています。したがって、Sign in with Microsoft認証オプションを選択し、Microsoft職場アカウントを使用する必要があります。

ダッシュボード

ダッシュボードは、ダッシュボード名で検索したり、1つ(または複数)のタグでフィルタリングしたり、スター付きステータスでフィルタリングしたりできます。ダッシュボード検索には、ダッシュボードの上部ナビゲーション領域にあるダッシュボードピッカーからアクセスできます。ショートカットFを使用してダッシュボード検索を開くこともできます。

次のデフォルトのダッシュボードを使用できます。

ダッシュボード	形容
コンテナの概要	すべてのコンテナを、その名前空間とポッドとともに一覧表示します。各コンテナのステータスと、正常/異常または停止したコンテナの合計数を提供します。
ホストディスクの概要 (Linuxのみ)	ノード、ファイルシステム、ディスクのI/Oメトリクス (読み取り/書き込み時間、ファイルシステムの使用可能スペースなど) を公開します。
ホストディスクの概要 (Windowsのみ)	ファイル・システムの使用可能なスペースを示します。
Ingressの概要	各SitecoreロールとGrafanaのイングレスメトリクスを提供します。
Kubernetesクラスター	Kubernetesクラスターの概要について説明します。
Kubernetes Podの概要	システムを含むすべての名前空間のポッドごとのメモリとCPUの要求、制限、および使用率を公開します。ライブログを提供します。
Linuxノードの概要	各Linuxノードのメモリ/CPU/ディスク使用率に関する詳細情報を提供します。
MsSqlエラスティックプール	MsSqlエラスティックプールの使用率に関する詳細情報を提供します。
Redisサーバーの概要	一般的なRedisメトリックを公開します。ネイティブRedisの「INFO」コマンドと似ています。
Windowsノードの概要	各Windowsノードのメモリ/CPU/ディスク使用率に関する詳細情報を提供します。

アラート

アラートは、Managed Cloudソリューションで問題が見つかった場合にMCPチームに事前に通知します。これにより、システムのユーザーが問題に気付く前に問題を特定して対処できます。

次の表に、使用可能なアラートを示します。

	形容	条件	資源	時代
ノード統計量	メモリの割合は >85%	ノードのメモリ使用率が85% を超えています。	Kubernetesノード	10分間
	LinuxノードのCPU使用率は >85%	LinuxノードのCPU負荷率は85%を超えています。	Kubernetesノード	10分間
	WindowsノードのCPU使用率は>85%	WindowsノードのCPU負荷率は85%を超えています。		10分間
インフラ	ポッドは30mの準備ができていません	ポッドのステータス != 準備完了	Kubernetesポッド	30分間
	Kubeletがダウンしている	kubeletジョブは最後の15分間ダウンしています。	Kubernetesジョブ	15分間
	ポッドが頻繁に再起動する	ポッドは少なくとも5分に1回再起動されます。	Kubernetesポッド	1時間
	デプロイ世代の不一致	デプロイは失敗しましたが、ロールバックされていません。	Kubernetesのデプロイ	15分間
	デプロイメント・レプリカの不一致	デプロイが1時間を超えて、予想されるレプリカ数と一致しませんでした。	Kubernetesのデプロイ	1時間
	DaemonSetポッドの準備ができていません	必要なポッドのすべてがスケジュールされ、準備ができているわけではありません。	Kubernetesデーモンセット	15分間
	DaemonSetポッドがスケジュールされていない	必要なポッドのすべてがスケジュールされているわけではありません。	Kubernetesデーモンセット	10分間
	DaemonSetポッドのスケジュールが間違っている	DaemonSetのポッドは、実行されるべきでない場所で実行されています。	Kubernetesデーモンセット	1時間
	警告イベントが発生しました	Warning型の1つ以上のイベントが名前空間で発生しました。	Kubernetes名前空間	1時間
	ノードの準備ができていません	ノードの準備ができていません。	Kubernetesノード	1時間
	Kubernetesのバージョンの不一致	Kubernetesコンポーネントのさまざまなセマンティックバージョンが実行されています。	Kubernetes	1時間
	Kubernetes APIサーバークライアントでエラーが発生しています	Kubernetes APIサーバーで複数のエラーが発生しました。	Kubernetes	5分間
	ノードがポッドの容量を使い果たしています	ノードポッドの容量は95%以上です。	Kubernetesノード	15分間
	ディスク容量が >90% 使用されている	ノードのディスク・スペースが90% 以上使用されている。	Kubernetesノード	1時間
	Linuxノードプールの再起動が必要	Linuxノードの再起動が必要	Kubernetesノード
プロメテウス	Prometheus PersistentVolumeの空き容量	Prometheus PersistentVolumeスペースは> 90% 使用されます	プロメテウス	1時間
Sitecoreロール	HTTPリクエストは5xx >10です	5xx HTTPレスポンスが10を超えています。	nginx_ingress_controller	10分間
	平均ページ応答時間>5 – デフォルトで1秒ではなく設定	平均応答時間が1秒を超えている。	nginx_ingress_controller	30分間
	平均ページ応答時間 >30秒	平均応答時間は30秒を超えています。	nginx_ingress_controller	5分間
	可用性テストがオン /sitecore/service/keepalive.aspx	/sitecore/service/keepalive.aspxの可用性テストに失敗しました。	Sitecoreポッド	3分間
Redisキャッシュ	%で示す接続クライアントの平均数は>80%	接続されているクライアントの数は、redis_config_maxclientsと比較して80%以上です。	Redisキャッシュ	30分間
Redisキャッシュ	サーバーの負荷は >95% です	Redisのプロセッサ負荷率は、過去30分間で95%を超えています。	Redisキャッシュ	30分間
MSSQLエラスティックプール	データベーススループットユニット (仮想コア) は >95%	過去5分間で95%以上。	MSSQLエラスティックプール	5分間
	ストレージの割合は>75%	直近の5分間で75%以上	MSSQLエラスティックプール	5分間
	CPUは>90%	過去15分間のCPU使用率が90% を超えている	MSSQLエラスティックプール	15分間
	SQLデータベースのデッドロック	データベースはデッドロックされています。	MSSQLエラスティックプール
	データIOの割合は >90%	過去15分間のデータIO負荷の90% 以上	MSSQLエラスティックプール	15分間
	ログIOの割合は >90%	過去15分間のLog IO負荷の90% 以上	MSSQLエラスティックプール	15分間
	労働者の割合は>90%	過去15分間にワーカーの負荷が90% を超えている	MSSQLエラスティックプール	15分間
	DB層でサポートされる同時セッション数は >90% です	過去15分間に許可された同時セッションの数が制限の90% に達しました	MSSQLエラスティックプール	15分間
	失敗したデータベース接続の数 >5	過去5分間に5つ以上の失敗したdb接続	MSSQLエラスティックプール	5分間
	平均インメモリOLTPストレージ >95%	30分を超える平均インメモリOLTPストレージ使用量の95% 以上。	MSSQLエラスティックプール	30分間
エラスティックサーチ	ElasticSearchクラスターが黄色の状態です	ElasticSearchクラスターが黄色の状態です	エラスティックサーチ	15分間
	ElasticSearchクラスターが赤の状態です	ElasticSearchクラスターが赤の状態です	エラスティックサーチ	15分間
	ElasticSearchクラスター JVMが過負荷になっています	ElasticSearchクラスターJVMの容量が75%を超えている	エラスティックサーチ	5分間
	Elasticsearchのディスク容量が少ない	ディスク使用率が80% を超えている	エラスティックサーチ	0分間
	Elasticsearchディスクのスペースが不足しています	ディスク使用率が90% を超えている	エラスティックサーチ	0分間

この記事を改善するための提案がある場合は、お知らせください!

Managed Cloudコンテナの監視

Grafanaでの認証

ダッシュ ボード

アラート

ダッシュボード