レポートデータのサイズの管理
このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。
データ集計中、エクスペリエンス分析は、Webサイトでのすべてのインタラクションについて、各ディメンションの各グループに関する事実を収集します。これらの収集されたファクトは、追跡のためにレポート データベースのファクト テーブルに格納されます。レポートデータの量は、Webサイトへの訪問者数によっては非常に大きくなる可能性があります。データ量を減らすために、レデューサーは、毎日収集する最下位グループをotherという1つのグループに結合します。これにより、データ消費と読み取りパフォーマンスの予測が容易になります。
レデューサー構成
レデューサーは、最下位レコードを選択し、それらのレコードをotherキーの下に収集します。 Sitecore.ExperienceAnalytics.Reduce.configファイルにある次の構成可能なパラメーターを使用してレコードを選択します。
|
名前 |
形容 |
既定値 |
|---|---|---|
|
DefaultKeepCountThreshold |
保持するレコードの数 (たとえば、デフォルトの1000が使用され、レコードが3000の場合、レデューサーは2000レコードを統合し、1000レコードはそのまま残します)。 1つのディメンションのレコード数がこのしきい値より少ない場合、レデューサーは何も削減しません。 |
1000 |
|
DefaultValueThreshold |
レコードが有意であると見なされるためにValueメトリクスが満たす必要がある最小値。レデューサーは、最小値を満たさないレコードを統合します。 |
-1 (Disabled) |
|
DefaultVisitThreshold |
セグメントレコードが有意であると見なされるためにVisitsメトリクスが持つ必要がある最小値。レデューサーは、この最小値を満たさないレコードを統合します。 |
10 |
|
DefaultRetentionPeriod |
レデューサーがデータを統合する前にデータが保持される時間。 |
7.00:00:00 |
|
DefaultOrderBy |
フレキシブルディメンションにのみ影響します レデューサーがレコードをソートして相対的な重要性を判断する順序。 重要度の指標として使用する任意のメトリクス (visits、value、timeOnSiteなど) を指定できます。 |
Visits, abs(Value) |
|
Timeout |
レデューサーが動作する最大時間。この時間の後、減速機は停止します。 |
01:00:00 |
たとえば、pagesテーブルを見て、1日に10,000の一意のページがアクセスされた場合、レデューサーはデフォルトで最も重要な1,000ページ (DefaultKeepCountThreshold) に関するファクトのみを保持し、重要でない9,000ページのファクトを減らします。レデューサーは、保持期間 (デフォルトでは7日間) の後に10,000回の訪問を処理します。
レデューサーとレガシーの寸法
従来のディメンションを使用している場合、レデューサーは次のように機能します。
-
ページの訪問回数がDefaultVisitThresholdより少ない場合、そのページは重要ではないと見なされます。
-
ページの値がDefaultValueThresholdより小さい場合、そのページは重要でないと見なされます。
-
重要なページが1000ページを超える場合、レデューサーはそれらをVisits順に並べ、次にValue順に並べてから、上位1000ページを除くすべてのページのレコードを統合します。
レデューサーとフレキシブルな寸法
フレキシブル寸法を使用している場合、レデューサーは次のように機能します。
-
重要なページが1000ページを超える場合、レデューサーはそれらをDefaultOrderBy順に並べてから、上位1000ページを除くすべてのページのレコードを統合します。