1. インデックス項目

クローラー認証

日本語翻訳に関する免責事項

このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。

メモ

このトピックでは、コンテンツがアクセスする前に認証が必要な場合に、クローラー設定で必要な認証構成のみについて説明します。Webサイトまたはアプリを統合するときにソースSitecore Search認証する方法については、「 認証と承認API」を参照してください。

元のコンテンツがクローラーがアクセスする前に認証が必要な場合は、認証設定を定義できます。キー、アクセストークン、またはパスワードをソース構成に追加できます。Searchでは、このメカニズムはSource Settings > Authenticationで使用できます。

手記

基本認証設定

元のコンテンツで、リクエストヘッダーに追加するキーまたはアクセストークンが必要な場合は、基本認証を使用します。

次の基本認証設定を構成します。

表 2.

設定

形容

Authentication Type

使用する認証の種類。 Basicを選択します。

URL

ソースコンテンツで認証が必要なURL。たとえば、「 www.acme.com/login」と入力します。

要求 トリガーを使用する場合、URLは通常、要求URLと同じです。

BODY

要求の本文。これは、POSTPUT、またはPATCH要求を送信するときに使用します。

METHOD

HTTPメソッド。 GETPOSTPUTPATCHを使用できます。

TIMEOUT

時間 (ミリ秒単位) は、クローラーがURLからの応答を取得するのを待機します。クローラーが応答を取得する前にTIMEOUTの有効期限が切れた場合、クローラーはURLをクロールしません。

HEADERS

ソースコンテンツにアクセスするときに認証に使用されるユーザーエージェントを記述する認証ヘッダー。 keyvalueに設定します。たとえば、keyauthorizationとして入力し、valueをソースコンテンツに必要なキーまたはアクセストークンとして入力します。

複数のヘッダーを追加できます。



ブラウザ認証

Webサイトがリクエストヘッダーのキーやアクセストークンではなく、GUIベースのユーザー名とパスワードを必要とする場合は、ブラウザ認証を使用します。訪問者がコンテンツにアクセスするためにユーザー名とパスワードを入力する必要がある場合は、ブラウザ認証が必要です。

次のブラウザ認証設定を構成します。

設定

形容

Authentication Type

使用する認証の種類。 Browserを選択します。

URL

Webサイトで認証が必要なURL。通常、これはloginページです。たとえば、次のように入力します。 www.acme.com/login

要求 トリガーを使用する場合、URLは通常、要求トリガー URLと同じです。

USERNAME SELECTOR

ユーザー名セレクターフィールドのCSS表記。たとえば、コンテンツログインページのUsernameUSERNAME or EMAIL、またはEnter emailフィールドにすることができます。CSS表記値を取得するには、ブラウザのusernameフィールドでinspect要素を実行します。

クローラが正しいユーザー名フィールドを確実に見つけられるように、複数のユーザー名セレクターを追加することをお勧めします。

たとえば、idセレクターとname CSSセレクターを使用してユーザー名フィールドを見つけるには、次のように入力します。

#username,[name=UserName]

USERNAME VALUE

Webサイトが期待するユーザー名をプレーンテキストで指定します。

PASSWORD SELECTOR

パスワードセレクターフィールドのCSS表記。たとえば、これはコンテンツログインページのPasswordまたはEnter passwordフィールドにすることができます。CSS表記値を取得するには、ブラウザのパスワードフィールドでinspect要素を実行します。

クローラーが正しいパスワードフィールドを確実に検出できるように、複数のpasswordセレクターを追加することをお勧めします。

たとえば、ユーザー名フィールドにidname、およびtype CSSセレクターを使用するには、次のように入力します。

#passwrd,[name=Password],[type=password]

PASSWORD VALUE

Webサイトが期待するパスワードをプレーン テキストで設定します。

SUBMIT SELECTOR

送信セレクターフィールドのCSS表記。たとえば、これは、Webサイトのログイン ページのLoginSubmit 、またはSign inボタンです。CSS表記値を取得するには、フィールドを右クリックしてinspect要素を実行します。

クローラーが適切な送信フィールドを確実に検出できるように、複数の送信セレクターを追加することをお勧めします。

たとえば、送信フィールドにidセレクターとtype CSSセレクターを使用するには、次のように入力します。

#log_in,[type=submit]

MIN WAIT

クローラーがURLからの応答を取得するのを待機する最小時間 (ミリ秒単位)。

MAX WAIT

クローラーがURLからの応答を取得するのを待機する最大時間 (ミリ秒単位)。クローラーが応答を受け取る前にMAX WAITの有効期限が切れた場合、クローラーはコンテンツをクロールしません。

この記事を改善するための提案がある場合は、 お知らせください!