マルチアームバンディットの計算を理解する
このページの翻訳はAIによって自動的に行われました。可能な限り正確な翻訳を心掛けていますが、原文と異なる表現や解釈が含まれる場合があります。正確で公式な情報については、必ず英語の原文をご参照ください。
Sitecore Personalize、最適化されたテストの実験でマルチアームバンディットアルゴリズムを実行するときに 、トンプソンサンプリング ヒューリスティック手法を適用します。
Sitecore Personalizeテスト期間中、各バリアントに最低1% のトラフィックが適用されます。Personalizeは、1% のベースラインを適用して、すべてのバリアントを継続的に提供および探索し、訪問者の行動の急速な変化に動的に対応します。マルチアーム バンディット アルゴリズムは、トラフィックの残りの割合で実行されます。
最適化されたテストの実験が開始すると、Sitecore Personalizeは各バリアントに偶数の重みを適用します。
次の手順では、マルチアーム バンディット アルゴリズムがSitecore Personalizeでどのように実行されるかについて説明します。
マルチアームバンディットアルゴリズム:
-
最初の期間のテストを実行し、各バリアントを重みによって決定されたトラフィックのランダムな割合に示します。
-
期間中の各バリエーションの表示回数(インプレッション数)と、各バリエーションのコンバージョン数を収集して保存します。
-
コンバージョン数とインプレッション数(q)の累計に、コンバージョン数とインプレッション数 (p) とインプレッション数を加算します。
-
各バリアントの事後分布を次の式に従って計算します。
Posterior = Beta(p, q+1)ここで、Betaはベータ関数です。
-
モンテカルロ計算を実行して、新しいバリアントの重みを決定します。計算では、モンテカルロ ステップの数 (N_MC) と各バリアントの最新の事後分布 (前のステップで計算) がアルゴリズムに入力されます。 N_MCは、すべてのテストで固定されたパラメーターであり、調査を通じて決定されます。モンテカルロ計算:
-
カウントを0に初期化します。
-
各バリアントの分布からランダム サンプルを取り出し、N個の乱数を与えます。
-
サンプリングされた数値のうちどれが最も大きいかを判断し、サンプリングされた数値が最も大きいバリアントの勝利カウントを1ずつ増やします。
-
手順bとcをN_MC回繰り返します。
-
新しい重みを次のように計算します。 VAR_N_WEIGHT = VAR_N_WIN_COUNT / N_MC %
-
-
モンテカルロ計算から更新された重みを適用し、手順2から5を繰り返します。