データレイクエクスポートサービス
このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。
Sitecore CDP組織のデータをAmazon Simple Storage Service (Amazon S3) バケットに安全に保存します。 データへのアクセスをリクエストする には 、サポートケースを作成します。
アクセス権を取得すると、Sitecore CDP Data Lakeエクスポート サービスが毎日実行されます。毎日、組織のすべてのデータがSitecore CDP Amazon S3バケットのエクスポートフォルダにエクスポートされます。エクスポート フォルダーは、次の方法で操作できます。
-
ローカルにダウンロードします。
-
選択した別のAmazon S3バケットにコピーします。
-
GetまたはListで始まる任意のAmazon S3アクションを実行します。
データにアクセスすると、次のことが可能になります。
-
柔軟で安全な方法で組織のデータを調査します。
-
組織のダッシュボードにデータを読み込みます。
-
異なるデータセットを組み合わせ、Sitecore CDPデータと分析して、有用な洞察を生み出します。
-
解析モデルを構築してトレーニングします。
エクスポートされたデータの内容
エクスポートには、前日の深夜までにSitecore CDP APIを使用してSitecore CDPに送信されたすべてのデータを含む、組織のテナント履歴全体が含まれます。
Sitecore CDP APIを使用してSitecore CDPに送信するすべてのデータを含む、組織のテナント履歴全体が、前日の深夜までエクスポートされたデータに含まれます。たとえば、日付スタンプが2025年1月27日のエクスポート フォルダーには、2025年1月26日の深夜に取得されたデータのスナップショットが含まれています。
エクスポートされたファイルのファイル形式はApache Parquetです。Parquetは、ネストされたデータ構造をフラットな列形式で格納するオープン ソース形式です。Parquetは、データを行に格納するよりもストレージとパフォーマンスの点で効率的であり、最新のほとんどのデータベースでサポートされています。
データは次のエンティティに分割されます ( エンティティ関係図も参照してください)。
Data Lakeエクスポート サービスが実行されるたびに、guests、orders、order_items、experience_definitionsエンティティから履歴データが完全に再構築され、エクスポートに含まれます。
eventsエンティティとsessionsエンティティの場合、データ レイク エクスポート サービスは、過去3日間 (昨日、一昨日、その前日) のデータを再構築します。これより前のイベントとセッションのデータは再構築されませんが、エクスポートされたファイルには引き続き含まれます。
エクスポート頻度
データレイクのエクスポートサービスは毎日実行されます。組織のスケジュールの詳細については、サポート ケースを作成してください。
ポーリングアプローチを使用して、日次Sitecore CDPデータレイクエクスポートサービスの実行がいつ完了したかを把握します。サービスの実行が完了すると、エクスポート フォルダーに _SUCCESSファイルが作成されます。AWS LambdaとAWSステップ関数は、コードを実行し、Amazon S3バケットにアクセスして、_SUCCESSファイルが存在するかどうかを確認できます。