チュートリアル: Apache Tikaを使用してインデックス作成用のメディア コンテンツを抽出する
このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。
Apache Tikaを使用して、他の方法の代わりにインデックス作成用のメディア コンテンツを抽出できます。
このチュートリアルでは、次の方法について説明します。
Apache Tikaを設定する
Apache Tikaを設定する
Solrをセットアップし、Solrが問題なく実行されていることが前提条件です。
Apache Tikaを設定するには:
-
Apache Tikaをダウンロードし、tika-server-x.x.jarファイルをTikaを実行するフォルダに保存します。
メモSitecoreは、Apache Tikaバージョン1.22を使用して開発およびテストされています。このバージョンを使用することをお勧めします。Apache Tikaの新しいバージョンがリリースされても、古いバージョンは引き続き アーカイブで使用できます。
-
ファイルを保存したフォルダーで、PowerShellプロンプトを開き、Apache Tikaを起動します。
手記hostとportを指定しない場合、Apache Tikaはデフォルトのlocalhostと9998を使用します。
-
Apache Tikaが実行されていることを確認するには、TikaサーバのURL http://<Tikahostname>:<portnumber>を参照します。サーバーが実行中の場合は、Welcomeメッセージが表示されます。
-
Sitecore管理ページ (https://<sitecoreinstance>/sitecore/admin/showconfig.aspx) に移動し、TikaMediaFileTextExtractorが<contentExtraction> ノードに追加されたことを確認します。

Apache Tikaを主要なメディアコンテンツ抽出プロバイダーにする
Apache Tikaを主要なメディアコンテンツ抽出プロバイダーにする
Apache Tikaをプライマリメディアコンテンツ抽出プロバイダーとして構成できます。
Apache Tikaをプライマリ メディアコンテンツ抽出プロバイダーとして有効にするには:
-
App_Config\ConnectionStrings.configファイルを開き、次の接続文字列を追加します。
-
Sitecoreを再起動します。
インデックス作成が機能することを確認する
インデックス作成が機能することを確認する
Apache Tikaを設定して有効にした後、インデックス作成が正しく機能することを確認することをお勧めします。
インデックス作成が機能することを確認するには、次のようにします。
-
Sitecoreスタート画面で、インデックスControl Panel再構築 をクリックします。
-
Content Editorで、Homeアイテムなどの単純な検索を実行します。