インデックス作成を構成する

フィードクローラーを構成する

日本語翻訳に関する免責事項

このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。

Sitecore Searchでは、フィードクローラーを使用して、次のようなドキュメントからデータをインデックス化します。

区切り文字を含むテキストファイル。
CSVファイル。
JSON文字列ファイル。

これらのファイルからデータを体系的に抽出し、Sitecore Search内で検索可能なコンテンツに変換します。このプロセスには、フィードクローラーソースの作成、ドキュメント抽出ツールの構成、およびデータを処理するためのトランスフォーマーのセットアップが含まれます。

メモ

販売フィードクローラーコネクタタイプを選択した場合は、特定の販売フィードクローラー構成が存在する必要があります。

このチュートリアルでは、次の方法について説明します。

始める前に

ドキュメントは、Secure File Transfer Protocol(SFTP)を介してのみフィードクローラーにアップロードできます。SFTP認証情報を受け取るには、Sitecoreサポートにお問い合わせください。

これらの資格情報がサポートによって設定されたら、Administration > Domain Settings > Status > SFTPで表示できます。

フィードクローラーソースを作成する

最初のステップは、ソースを作成することです。これは、指定されたWebサイト、ドキュメント、またはリポジトリからアイテムを取得し、検索可能になるようにインデックスを作成するコネクタです。

ソースを作成するには:

メニューバーで、SOURCESをクリックします。
ソースを追加するClick Add Source 。
SOURCE NAMEフィールドに、ソースの名前を入力します。
DESCRIPTIONフィールドに、構成するソースを説明する行を数行入力します。
CONNECTORドロップダウンリストで、Feed Crawlerをクリックします。
Click Save。エラーがない場合、Searchは新しいソースを作成します。

ロケールの選択

ロケールは、データが関連する地理的および言語的地域を指定します。 Searchは、ロケール値を使用して、フィードクローラーによってインデックス付けされたデータがターゲットユーザーの言語と地域の設定に適切であることを確認し、訪問者をロケール固有のページに誘導し、すべてのタイプのウィジェットに対してロケール固有のルールを作成します。

ソースのロケールを選択するには:

メニューバーでSourcesをクリックし、フィードクローラーのソースを選択します。
Source Settingsメニューで、Available Localesをクリックします。
Localesドロップダウンリストで、ドメインに構成したロケールを選択します。
Click Save。

タグを定義する

タグは、特定のエンティティの検索エクスペリエンスを作成するために使用されます。ソースを設定すると、Tags Definitionウィンドウを使用して、そのソースによって更新されるエンティティを指定します。

タグを使用して、このソースで特定のエンティティを更新するには:

メニューバーでSourcesをクリックし、フィードクローラーのソースを選択します。
Source Settingsメニューで、Tags Definitionをクリックします。
Entityドロップダウンリストで、このソースによって更新されるエンティティを選択します。
基本タグを設定するには、FromドロップダウンリストでTagsをクリックします。
Tagsフィールドに、タグの名前を入力します。
Click Save。

ドキュメント抽出器を作成する

ドキュメント抽出ツールは、フィードクローラーにアップロードされたファイルからデータを処理および抽出し、Searchでインデックスを作成できる構造化形式に変換します。ドキュメント抽出ツールには、この変換を実行するためのデフォルトのJavaScriptロジックが付属していますが、さらに構成が必要な場合は、このロジックを必要に応じて編集できます。

ドキュメント抽出ツールを作成するには:

メニューバーでSourcesをクリックし、フィードクローラーのソースを選択します。
左側のペインでDocument Extractorsをクリックし、Document Extractorsセクションで Editをクリックします。
抽出器を作成するには、Document Extractorsページで Add Extractorをクリックし、Document Extractorsページで次の操作を行います。
- Basepathフィールドに、/upload/に追加されるファイルのベースパスを入力します。たとえば、「files」と入力します。
- File Nameフィールドにファイル名を入力します。たとえば、「filename.json」と入力します。
- File Typeドロップダウンメニューで、CSVまたはJSONを選択します。
- ファイルがGZip形式の場合は、isGzipスイッチをオンにします。
SFTPを使用してドキュメントをアップロードすると、ソースが自動的にトリガーされます。
Taggersセクションで、 Add Taggerをクリックします。次に、タグエディターのTagドロップダウンリストでタグを選択します。たとえば、contentを選択します。
手記
ドキュメント抽出ツールでは、それぞれが一意のタグにリンクされている複数のタガーを作成できます。このようにして、各タガーは次のようになります。
インデックスドキュメントのセットを生成します。

各ルールが1つの属性の抽出ロジックを定義するように、複数のルールを持つことができます。
たとえば、5つのルールを持つ1つのタガー one 、それぞれがfiveの属性を持つ一連のドキュメントを生成します。

それぞれ1つのルールを持つ3つのタガーは、それぞれがone属性を持つthreeセットのドキュメントを生成します。

Extraction Typeフィールドで、抽出ロジックのドロップダウンリストからBaseまたはJavaScriptを選択します。

アップロードされたドキュメントの既存の列ヘッダーをインデックス付き属性名として使用するには、ドロップダウンリストからBaseを選択し、ID Field フィールドに列ヘッダー ID入力し、SeparatorフィールドにCSVファイルで使用する区切り記号を入力します。
Searchのデフォルトの抽出ロジックを変更するには、ドロップダウンリストからJavascriptを選択し、JS Sourceウィンドウで関数を編集します。

// Sample extractor function. Change the function to suit your individual needs
function extract(headerSegments, lineSegments) {    
    response = {}    
    for (i = 0; i < lineSegments.length; i++) {     
        response[headerSegments[i]] = lineSegments[i]    
    }    
    return [response]
}

手記

Function NameフィールドとJS Sourceウィンドウの関数名が一致しない場合、エクストラクタの起動時にエラーが発生します。

タグエディタで、Saveをクリックします。
(オプション)別のタグの属性を抽出するには、 Add Taggerをクリックし、Tagドロップダウンリストでタグをクリックして、手順6から10を繰り返します。
(オプション)別のドキュメント抽出ツールを追加するには、手順4から6を繰り返します。
Document Extractorsページで、Saveをクリックします。

ドキュメントと列のトランスフォーマーを追加する

フィードクローラーを設定すると、Searchトランスフォーマーを使用してCSVやJSONなどの構造化ドキュメントにインデックスを付けます。インデックスを作成する前に、データをさらに変更するようにトランスフォーマーを追加および構成できます。

ドキュメントと列のトランスフォーマーを追加するには:

左側のペインでTransformersをクリックし、Transformersセクションで Editをクリックします。
Transformersページの左側のペインで、Document Transformersをクリックします。
Document Transformersウィンドウで、ドキュメントトランスフォーマーを追加します。
別のドキュメントトランスフォーマーを追加するには、手順3を繰り返します。
左側のペインで、Column Transformersの横にある Column Transformerをクリックします。
Column Transformersウィンドウで、列トランスフォーマーを追加します。
別の列トランスフォーマーを追加するには、手順6を繰り返します。
Click Save。

増分更新を設定する

SFTP経由でファイルをアップロードするとソースがトリガーされますが、PatchやPutsなどのAPI更新を使用してソースを更新することもできます。APIリクエストでソースを更新するには、増分更新を有効にします。

ソースの増分更新を有効にするには:

メニューバーでSourcesをクリックし、フィードクローラーのソースを選択します。
Source Settingsメニューで、Incremental Updatesをクリックします。
Enable Incremental UpdatesスイッチClick機能を有効にし、Saveをクリックします。

ソースを公開する

最初のスキャンとインデックスを開始するには、ソースを公開する必要があります。

ソースを公開するには:

Publish Sourceダイアログを開くには、ソースページの右上隅にあるPublishをクリックします。

この記事を改善するための提案がある場合は、お知らせください!

フィード クローラーを構成する

フィード クローラー ソースを作成する

ロケールの選択

タグを定義する

ドキュメント抽出器を作成する

ドキュメントと列のトランスフォーマーを追加する

増分更新を設定する

ソースを公開する

フィードクローラーを構成する

フィードクローラーソースを作成する