インデックス項目
このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。
indexは、特定のソースソースに関連付けられた検索可能なアイテムを表すデータ構造です。アイテムの例としては、製品、URL、PDFドキュメント、JSONオブジェクトなどがあります。index documentは、実装内の1つの項目をJSONオブジェクトとして表します。たとえば、1,000ワードのHTMLページは1つのインデックス ドキュメントにマップされ、10ページのPDFは別のインデックス ドキュメントにマップされます。
訪問者が検索クエリを作成すると、AI/MLエンジンがインデックスを調べてクエリに一致するコンテンツを識別するため、インデックス作成はSitecore Searchにおいて重要です。同様に、recommendationsもインデックスに基づいています。
このセクションのトピックでは、インデックス ドキュメントと、インデックス作成のニーズに使用できるソースの種類について説明します。
ソースを構成する際には、エンティティと属性、および意図した 検索エクスペリエンス を考慮してください。
-
検索して結果を返すコンテンツを決定します。
-
コンテンツ タイプ、場所、アクセシビリティ、およびスコープに関する情報が含まれます。
ドキュメントのインデックス
インデックス ドキュメントには、システム属性などの結果の生成に使用される重要な情報と、アイテムのエンティティ タイプの属性に一致するプロパティを持つアイテムのJSONオブジェクトを含むrfk_source配列が含まれています。
次のコード ブロックは、会社のAbout us Webページのインデックス ドキュメントを示しています。
インデックスに登録されたすべてのアイテムは、Content Collectionページで表示できます。これらはエンティティごとに異なるコレクションにソートされ、エンティティの 属性と機能構成に準拠します。
インデックス作成が正常に実行された後、コレクションに項目が表示されるか、更新されるまでに数分かかります。
ソースの種類
sourceは、訪問者の検索可能なアイテムのインデックスを作成するためにSearchが使用するメカニズムです。一般的な実装には、HTMLページ、PDF、JSONオブジェクトなど、さまざまな場所やさまざまな形式のコンテンツにアクセスするための複数のソースがあります。
Sitecore Searchには、コンテンツのインデックス作成にpull sourcesとpush sourcesの2種類のメカニズムが用意されています。 選択するソースの種類 は、アイテムへのアクセス方法、変更頻度、および変更量によって異なります。
プルソース
pull sourceでは、Sitecore Searchはコンテンツをスキャンしてインデックスを作成するためのクローラーを提供しますが、インデックスを作成するコンテンツと属性の抽出方法を決定するルールを定義します。プル ソースを使用したコンテンツのインデックス作成は、ユーザーとSearchの間の共同作業と考えることができます。
プル ソースを使用して増分更新を行うには、開発者は インジェストAPIを使用できます。
Searchには、次のプル ソースが用意されています。
-
Webクローラー - ある地点から始めてハイパーリンクをたどるか、サイトマップを通過してコンテンツをクロールする基本的なクローラー。Webクローラーは簡単で構成が簡単で、コーディングは必要ありません。
-
高度なWebクローラー - 認証要件の処理、ローカライズされたコンテンツの処理、JavaScriptを使用した属性値の抽出などの複雑なユースケースをサポートする、強力で高度にカスタマイズ可能なクローラー。
-
APIクローラー - JSONを返すAPIエンドポイント専用に設計されたクローラー。認証要件の処理、ローカライズされたコンテンツの処理、JSONPathまたはJavaScriptを使用した属性値の抽出など、複雑なユースケースをサポートします。
プッシュソース
Searchには、インデックス ドキュメントを受信するためのインデックスを作成するAPIプッシュ ソースという1種類のプッシュ ソースが用意されています。
プッシュソースを使用して増分更新を行うには、開発者はAPIプッシュコネクタを介して インジェストAPIを使用する必要があります。