1. インデックス作成を構成する

フィード クローラーを構成する

日本語翻訳に関する免責事項

このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。

Sitecore Searchでは、フィードクローラーを使用して、次のようなドキュメントからデータをインデックス化します。

  • 区切り文字を含むテキストファイル。

  • CSVファイル。

  • JSON文字列ファイル。

これらのファイルからデータを体系的に抽出し、Sitecore Search内で検索可能なコンテンツに変換します。このプロセスには、フィード クローラー ソースの作成、ドキュメント抽出ツールの構成、およびデータを処理するためのトランスフォーマーのセットアップが含まれます。

メモ

販売フィード クローラー コネクタ タイプを選択した場合は、特定の 販売フィード クローラー構成 が存在する必要があります。

このチュートリアルでは、次の方法について説明します。

始める前に

ドキュメントは、Secure File Transfer Protocol(SFTP)を介してのみフィードクローラーにアップロードできます。SFTP認証情報を受け取るには、Sitecoreサポートにお問い合わせください。

これらの資格情報がサポートによって設定されたら、Administration > Domain Settings > Status > SFTPで表示できます。

フィード クローラー ソースを作成する

最初のステップは、ソースを作成することです。これは、指定されたWebサイト、ドキュメント、またはリポジトリからアイテムを取得し、検索可能になるようにインデックスを作成するコネクタです。

ソースを作成するには:

  1. メニューバーで、SOURCESをクリックします。

  2. ソースを追加するClick Add Source

  3. SOURCE NAMEフィールドに、ソースの名前を入力します。

  4. DESCRIPTIONフィールドに、構成するソースを説明する行を数行入力します。

  5. CONNECTORドロップダウンリストで、Feed Crawlerをクリックします。

  6. Click Save。エラーがない場合、Searchは新しいソースを作成します。

ロケールの選択

ロケール は、データが関連する地理的および言語的地域を指定します。 Searchは、ロケール値を使用して、フィード クローラーによってインデックス付けされたデータがターゲット ユーザーの言語と地域の設定に適切であることを確認し、訪問者をロケール固有のページに誘導し、すべてのタイプのウィジェットに対してロケール固有のルールを作成します。

ソースのロケールを選択するには:

  1. メニューバーでSourcesをクリックし、フィード クローラーのソースを選択します。

  2. Source Settingsメニューで、Available Localesをクリックします。

  3. Localesドロップダウンリストで、ドメインに構成したロケールを選択します。

  4. Click Save

タグを定義する

タグは 、特定のエンティティの検索エクスペリエンスを作成するために使用されます。ソースを設定すると、Tags Definitionウィンドウを使用して、そのソースによって更新されるエンティティを指定します。

タグを使用して、このソースで特定のエンティティを更新するには:

  1. メニューバーでSourcesをクリックし、フィード クローラーのソースを選択します。

  2. Source Settingsメニューで、Tags Definitionをクリックします。

  3. Entityドロップダウンリストで、このソースによって更新されるエンティティを選択します。

  4. 基本タグを設定するには、Fromドロップダウン リストでTagsをクリックします。

  5. Tagsフィールドに、タグの名前を入力します。

  6. Click Save

ドキュメント抽出器を作成する

ドキュメント抽出ツールは、フィード クローラーにアップロードされたファイルからデータを処理および抽出し、Searchでインデックスを作成できる構造化形式に変換します。ドキュメント抽出ツールには、この変換を実行するためのデフォルトのJavaScriptロジックが付属していますが、さらに構成が必要な場合は、このロジックを必要に応じて編集できます。

ドキュメント抽出ツールを作成するには:

  1. メニューバーでSourcesをクリックし、フィード クローラーのソースを選択します。

  2. 左側のペインでDocument Extractorsをクリックし、Document Extractorsセクションで Editをクリックします。

  3. 抽出器を作成するには、Document Extractorsページで Add Extractorをクリックし、Document Extractorsページで次の操作を行います。

    • Basepathフィールドに、/upload/に追加されるファイルのベースパスを入力します。たとえば、「files」と入力します。

    • File Nameフィールドにファイル名を入力します。たとえば、「filename.json」と入力します。

    • File Typeドロップダウンメニューで、CSVまたはJSONを選択します。

    • ファイルがGZip形式の場合は、isGzipスイッチをオンにします。

    SFTPを使用してドキュメントをアップロードすると、ソースが自動的にトリガーされます。

  4. Taggersセクションで、 Add Taggerをクリックします。次に、タグ エディターのTagドロップダウン リストでタグを選択します。たとえば、contentを選択します。

    手記
  5. Extraction Typeフィールドで、抽出ロジックのドロップダウン リストからBaseまたはJavaScriptを選択します。

    • アップロードされたドキュメントの既存の列ヘッダーをインデックス付き属性名として使用するには、ドロップダウン リストからBaseを選択し、ID Field フィールドに列ヘッダー ID入力し、SeparatorフィールドにCSVファイルで使用する区切り記号を入力します。

    • Searchのデフォルトの抽出ロジックを変更するには、ドロップダウンリストからJavascriptを選択し、JS Sourceウィンドウで関数を編集します。

    // Sample extractor function. Change the function to suit your individual needs
    function extract(headerSegments, lineSegments) {    
        response = {}    
        for (i = 0; i < lineSegments.length; i++) {     
            response[headerSegments[i]] = lineSegments[i]    
           
        return [response]
    }
    手記

    Function NameフィールドとJS Sourceウィンドウの関数名が一致しない場合、エクストラクタの起動時にエラーが発生します。

  6. タグエディタで、Saveをクリックします。

  7. (オプション)別のタグの属性を抽出するには、 Add Taggerをクリックし、Tagドロップダウンリストでタグをクリックして、手順6から10を繰り返します。

  8. (オプション)別のドキュメント抽出ツールを追加するには、手順4から6を繰り返します。

  9. Document Extractorsページで、Saveをクリックします。

ドキュメントと列のトランスフォーマーを追加する

フィードクローラーを設定すると、Searchトランスフォーマーを使用してCSVやJSONなどの構造化ドキュメントにインデックスを付けます。インデックスを作成する前に、データをさらに変更するようにトランス フォーマーを追加および構成できます

ドキュメントと列のトランスフォーマーを追加するには:

  1. 左側のペインでTransformersをクリックし、Transformersセクションで Editをクリックします。

  2. Transformersページの左側のペインで、Document Transformersをクリックします。

  3. Document Transformersウィンドウで、ドキュメント トランスフォーマーを追加します

  4. 別のドキュメントトランスフォーマーを追加するには、手順3を繰り返します。

  5. 左側のペインで、Column Transformersの横にある Column Transformerをクリックします。

  6. Column Transformersウィンドウで、列トランスフォーマーを追加します

  7. 別の列トランスフォーマーを追加するには、手順6を繰り返します。

  8. Click Save

増分更新を設定する

SFTP経由でファイルをアップロードするとソースがトリガーされますが、PatchPutsなどのAPI更新を使用してソースを更新することもできます。APIリクエストでソースを更新するには、増分更新を有効にします

ソースの増分更新を有効にするには:

  1. メニューバーでSourcesをクリックし、フィード クローラーのソースを選択します。

  2. Source Settingsメニューで、Incremental Updatesをクリックします。

  3. Enable Incremental UpdatesスイッチClick機能を有効にし、Saveをクリックします。

ソースを公開する

最初のスキャンとインデックスを開始するには、ソースを公開する必要があります。

ソースを公開するには:

  • Publish Sourceダイアログを開くには、ソースページの右上隅にあるPublishをクリックします。

この記事を改善するための提案がある場合は、 お知らせください!