関連性による検索結果の並べ替え
このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。
検索結果を整理するために、検索条件との関連性に基づいて検索結果を並べ替えることができます。つまり、検索に最も関連性の高いものが検索結果リストの一番上に表示されます。
検索結果を生成する際、Sitecore Content Hubは以下を行います。
-
定義した検索条件を適用することにより、検索結果の候補の数を減らします。
-
検索結果をスコアリングしてランク付けします。この手順では、定義された検索条件またはフィルター条件に一致するすべてのアセットが出力されます。
2番目のステップでは、Content Hubがスコアを計算し、候補セット内の各アセットに割り当てます。このスコアは、定義されたクエリに対するアセットの関連性を反映しています。関連性スコアがアセットに割り当てられると、検索結果はソートされ、ランク付けされます。
関連性スコア
Content Hubは、BM25の最適なマッチング アルゴリズムを使用して関連性を計算します。このアルゴリズムでは、次の表に示すように、3つの要素を使用して各資産スコアを決定します。
|
因子 |
形容 |
|---|---|
|
ターム頻度 (TF) |
アセットフィールドで検索語が繰り返される回数。繰り返すほど、アセットの関連性が高くなります。たとえば、Winter cookbookとClassic Cocktails recipe bookはどちらもContent Hubの資産です。アセットの説明では、cookという用語は、Classic Cocktails recipeの説明よりもWinter cookbookの説明で頻繁に使用されます。つまり、ユーザーが「cook」という用語を検索すると、頻度の点では、Winter cookbookがClassic Cocktails recipe bookよりも関連性が高いということです。 |
|
逆ドキュメント頻度 (IDF) |
検索語句を含むアセットの数。資産の数が多いほど、その用語の重要性は低くなります。たとえば、前の例のWinter cookbookとClassic Cocktails recipe book 、さらに8つのアセットが同じコンテキストにあるとします。ユーザーが「 famous chef」という用語を検索すると、10個のアセットのうち9個に、説明に「 famous 」という用語が含まれています。ただし、説明にchefという用語が含まれているアセットは3つだけです。つまり、この検索試行では、famousという用語はchefという用語よりも重要性が低く、chefという用語を持つ3つの資産は、famous chef検索用語に対する他の資産よりも関連性が高いことを意味します。 |
|
フィールドの長さ |
長さが短いフィールドに検索語句が含まれているアセットは、拡張フィールドに同じ語句が含まれているアセットよりも関連性が高いと見なされます。たとえば、Winter cookbookの説明は350文字で、Classic Cocktails recipeの本の説明は1200文字です。ユーザーが「 ingredient 」という用語を検索すると、両方のアセットの説明にこの用語が含まれています。ただし、フィールドの長さが異なるため、Winter CookbookはClassic Cocktails recipe bookよりも関連性が高くなります。 |
アセットのブースト
検索結果でのアセットのランク付け方法を変更するには 、プロパティ メンバーのBoostフィールドをオンにします。
たとえば、M.Assetエンティティ定義では、Authorフィールドはブーストしますが、Information About Authorフィールドはブーストしません。
その後、ユーザーがSara Dublerによって書かれた2冊のクックブックをアップロードし、次の操作を行います。
-
Summer Salads cookbookアセットでは、Authorフィールドに作成者の名前を追加しますが、他のフィールドは空白のままにします。
-
Mediterranean Salads cookbookでは、Authorフィールドは空白のままにしますが、Information About AuthorフィールドにSara Dublerに関する情報を追加します。
「Sara Dubler」を検索すると、Summer Salad cookbookはAuthorフィールドにSara Dublerがあり、このフィールドはブーストされますが、Information about Authorフィールドはブーストされないため、結果の先頭に表示されます。
ブースト機能は、Searchコンポーネントのワイルドカードと互換性があります。