1. インデックス作成を構成する

チュートリアル: Apache Tikaを使用してインデックス作成用のメディア コンテンツを抽出する

Version:
日本語翻訳に関する免責事項

このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。

Apache Tikaを使用して、他の方法の代わりにインデックス作成用のメディア コンテンツを抽出できます。

このチュートリアルでは、次の方法について説明します。

Apache Tikaを設定する

Solrをセットアップし、Solrが問題なく実行されていることが前提条件です。

Apache Tikaを設定するには:

  1. Apache Tikaをダウンロードし、tika-server-x.x.jarファイルをTikaを実行するフォルダに保存します。

    メモ

    Sitecoreは、Apache Tikaバージョン1.22を使用して開発およびテストされています。このバージョンを使用することをお勧めします。Apache Tikaの新しいバージョンがリリースされても、古いバージョンは引き続き アーカイブで使用できます

  2. ファイルを保存したフォルダーで、PowerShellプロンプトを開き、Apache Tikaを起動します。

    java -jar tika-server-x.x.jar --host=<Tikahostname> --port=<portnumber>
    手記

    hostportを指定しない場合、Apache Tikaはデフォルトのlocalhost9998を使用します。

  3. Apache Tikaが実行されていることを確認するには、TikaサーバのURL http://<Tikahostname>:<portnumber>を参照します。サーバーが実行中の場合は、Welcomeメッセージが表示されます。

  4. Sitecore管理ページ (https://<sitecoreinstance>/sitecore/admin/showconfig.aspx) に移動し、TikaMediaFileTextExtractor<contentExtraction> ノードに追加されたことを確認します。

    Code sample showing

Apache Tikaを主要なメディアコンテンツ抽出プロバイダーにする

Apache Tikaをプライマリメディアコンテンツ抽出プロバイダーとして構成できます。

Apache Tikaをプライマリ メディアコンテンツ抽出プロバイダーとして有効にするには:

  1. App_Config\ConnectionStrings.configファイルを開き、次の接続文字列を追加します。

    <add name="tika" connectionString=<Tika server url< />
  2. Sitecoreを再起動します。

インデックス作成が機能することを確認する

Apache Tikaを設定して有効にした後、インデックス作成が正しく機能することを確認することをお勧めします。

インデックス作成が機能することを確認するには、次のようにします。

  1. Sitecoreスタート画面で、インデックスControl Panel再構築 をクリックします。

  2. Content Editorで、Homeアイテムなどの単純な検索を実行します。

この記事を改善するための提案がある場合は、 お知らせください!