勤務者
このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。
ワーカーは、外部データソースから一時的なストレージにデータを投影したり、トレーニング済みのモデルに対して連絡先を評価したりするなどのタスクを実行する責任があります。ワーカーは、並列に実行できるタスクエージェントによって呼び出されます。
開発者は、次のことができます。
-
既存のワーカーが処理するタスクまたはタスクのチェーンを登録します。
-
カスタムワーカーを作成します。
労働者の種類
ワーカーには、分散ワーカーと遅延ワーカーの2つのタイプがあります。
機械学習モデルのトレーニングなどの複雑なビジネス シナリオでは、分散ワーカーと遅延ワーカーの組み合わせが、特定の順序で一連のタスクを完了します。
分散ワーカー
分散ワーカーは、外部データソースからデータをバッチで読み取り、そのデータに対して処理 (機械学習に適した形式に投影するなど) を実行します。データ・セットはカーソルに分割され、複数のエージェントによって並行して処理されます。つまり、複数のワーカーが同じタスクに取り組んでいることになります。分散ワーカーの例としては、次のようなものがあります。
-
プロジェクションワーカー (ProjectionWorker)
外部システムは、並列読み取りをサポートしている必要があります。並列読み取りがサポートされていない場合は、分散ワーカーを使用してデータを抽出しないでください。代わりに、遅延ワーカーを使用してください。
分散ワーカーのその他の用途には、次のようなものがあります。
-
多数の連絡先の更新を含むビジネス ロジックの実行。たとえば、トレーニング済みモデルに対して連絡先を評価したり、ファセットを更新したりします。
-
xDB Collectionデータベースからレポーティング データベースにデータを集約します。
処理を実行せずにxConnectにデータをインポートする場合は、処理エンジンの代わりにData Exchange Frameworkを使用してください。
繰延労働者
遅延ワーカーは1つのタスク エージェントによって1回呼び出され、既定ではデータ ソースを受け入れません。遅延ワーカーの例には、次のものがあります。
-
マージワーカー (MergeWorker)
-
研修員 (TrainingWorker)
遅延ワーカーのその他の用途には、次のものがあります。
-
トレーニング済みのモデルを他のシステムにエクスポートする。
-
既にトレーニング済みのモデルをインポートする。
-
計算の実行。
-
並列読み取りをサポートしていないシステムからデータをインポートする。
ワーカーオプション辞書
すべてのワーカーは、ワーカーのタイプに応じてDeferredWorkerOptionsDictionaryまたはDistributedWorkerOptionsDictionaryを継承するoptionsディクショナリオブジェクトを受け入れます。タスクを登録するときに、ワーカーオプションディクショナリを渡す必要があります。
オプション辞書には、主に次の2つの目的があります。
-
これには、タスクを処理するワーカーの完全修飾型名が含まれています。
-
これには、ワーカーがタスクを完了するために必要なすべての情報が含まれています。たとえば、ContactTrainingWorkerOptionsクラスには、次の情報が含まれています。
-
トレーニングに使用するモデル
-
トレーニング データを一時ストレージで見つける場所
-
トレーニングデータスキーマ
-
デフォルトのワーカーオプション辞書
すべてのデフォルトのワーカーは、1つ以上の厳密に型指定されたワーカー オプション ディクショナリによって一致します。次の表に、いくつかのデフォルトワーカーと対応するワーカーオプションディクショナリを示します。
|
勤労者 |
ワーカーオプション |
|---|---|
|
TrainingWorker |
InteractionTrainingWorkerOptionsDictionary ContactTrainingWorkerOptionsDictionary |
|
MergeWorker |
MergeWorkerOptionsDictionary |
|
ProjectionWorker |
InteractionProjectionWorkerOptionsDictionary ContactProjectionWorkerOptionsDictionary |
タスクを登録するときは、専用のオプション辞書を使用することをお勧めします。ただし、技術的には、DeferredWorkerOptionsDictionaryまたはDistributedWorkerOptionsDictionary基本クラスを使用して、任意のワーカーのタスクを登録します。
分散ワーカー データ ソース
分散ワーカーは、ワーカー オプション ディクショナリに加えて、データ ソース オプション ディクショナリを受け入れます。分散タスクを登録するときは、データソースを指定する必要があります。
データ抽出または検索によってxConnectからデータを取得する既定のデータ ソースは4つあります。
|
データソース |
データソースオプションディクショナリ |
|---|---|
|
ContactDataSource |
ContactDataSourceOptionsDictionary (データ抽出を使用) |
|
InteractionDataSource |
InteractionDataSourceOptionsDictionary (データ抽出を使用) |
|
ContactSearchDataSource |
ContactSearchDataSourceOptionsDictionary (xConnect検索を使用) |
|
InteractionSearchDataSource |
InteractionSearchDataSourceOptionsDictionary (xConnect検索を使用) |
すべてのxConnectデータ ソースは、拡張オプションとサンプリングをサポートしています。また、独自のデータソースを作成することもできます。
モデル ラッパー
一部のワーカーでは、タスクを登録するときに、ワーカーオプションディクショナリの一部として モデルラッパー を渡す必要があります。モデル ラッパーは、以下を定義します。
-
データプロジェクション ロジック
-
トレーニング ロジック (機械学習に固有)
-
評価ロジック (機械学習に特化)
サンプルワーカーとベースワーカー
次の基本ワーカーは、ビジネス シナリオに合わせて継承および調整できます。
-
評価作業員
評価の結果 (xConnectファセットへのデータの書き込みなど) は実装に依存するため、既定の評価ワーカーはありません。