必要なソースの種類を特定する
このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。
Sitecore Searchでさまざまなタイプのソースを作成できます。ビジネス要件に応じて、1つ、一部、またはすべてを使用できます。ただし、サイト全体をクロールすると、サイトのパフォーマンスに影響を与える可能性があります。 これらのトピックで概説されているベストプラクティスのいくつかに従うことをお勧めします。
次の表は、項目の種類と更新する項目の数に基づいて、必要な ソースソース の種類を簡単に識別する方法を示しています。
|
クロール可能なコンテンツ |
インデックス作成の場合 |
頻繁な新しい更新の場合 |
大規模な変更の場合 |
|---|---|---|---|
|
はい |
スケジュールされたクローラー |
取り込みAPI |
クローラーを使用したインデックスの再作成 |
|
いいえ |
APIプッシュ |
取り込みAPI |
APIプッシュ |
Searchには、さまざまなタイプのクローラーが用意されています。それぞれが特定のビジネス要件に合わせて設計されています。次のリストは、さまざまなソースの種類に関する詳細情報を示しています。
クローラーのソース
-
1つのロケールと言語のコンテンツのみがあり、すべてのコンテンツがHTMLページで使用可能な場合は、Webクローラーを作成します。Webクローラーは通常、すべての基本的なクロール要件をカバーできます。
Webクローラーから始めて、必要に応じて高度なWebクローラーに変換することをお勧めします。
メモ1回のクロールで複数のエンティティの値を抽出するには、Webクローラーを高度なWebクローラーに変換する必要があります。Webクローラーは、1つの エンティティの値のみを抽出できます。
-
ウェブクローラーを作成したが、追加の設定が必要な場合は、高度なウェブクローラーに変換してください。たとえば、認証要件を処理したり、JavaScript式を使用して属性値を抽出したり、複数の言語でコンテンツにインデックスを付けたりする場合は、高度なWebクローラーを使用する必要があります。
-
コンテンツにはAPIエンドポイントからのみアクセスでき、エンドポイントがJSONを返す場合は、APIクローラーを使用します。
-
新しいインデックス ドキュメントを作成して既存のインデックスに追加したり、既存のインデックス ドキュメントをすばやく更新または削除したりする場合は、Ingestion APIを使用します。
たとえば、ブログのWebサイトを頻繁にクロールし、インデックスに追加する高度なWebクローラーがあるとします。訪問者が緊急に利用できるようにする必要がある新しいブログを取得し、次のスケジュールされたスキャンを待つことができません。Ingestion APIを使用してブログを追加します。
APIプッシュソース
-
コンテンツを排他的にプッシュする場合は、 APIプッシュソースを作成しますSitecore Search。これにより、空のインデックスが作成されます。その後、開発者はインジェストAPIを使用してインデックス ドキュメントを追加できます。
これらのCrawler specificationsは、テーブル内のさまざまなクローラーを比較します。