専門用語集(Glossary)
AdBanditで使用する用語の定義一覧
多腕バンディット(Multi-Armed Bandit)
複数の選択肢(アーム)の中から、報酬を最大化するためにどれを選ぶかを逐次決定する問題。各アームを引くたびに得られる報酬は確率的に変動する。探索(未知のアームを試す)と活用(既知の良いアームを選ぶ)のバランスを取ることが重要。
UCB1(Upper Confidence Bound 1)
多腕バンディット問題を解くアルゴリズムの一つ。各アームの「平均報酬」と「不確実性(試行数が少ないほど大きい)」を組み合わせたスコアで、次に選ぶアームを決定する。探索と活用を自動的にバランスさせる。
報酬関数(Reward Function)
インプレッション(α)、クリック(β)、コンバージョン(γ)を重み付きで合計し、1つのスコアに変換する関数。α + β + γ = 1.0 になるよう設定し、どの指標を重視するかを調整する。
アーム(Arm)
多腕バンディットにおける「選択肢」。AdBanditでは、訴求テーマ・トーン・フォーマットなどの組み合わせで定義される広告クリエイティブの候補。各アームは試行数と平均報酬を持ち、UCB1スコアで選択される。
枝刈り(Pruning)
パフォーマンスが低いアームを候補から除外する処理。一定試行数以上で、最良アームとの差が閾値を超えたアームをPRUNED状態にし、リソースを有望なアームに集中させる。
イベント(Event)
1回の「生成→投稿→観測」のサイクル。UCB1で選ばれたアームに基づきコンテンツを生成し、プラットフォームに投稿。一定時間後にメトリクスを取得し、報酬を計算してアームの統計を更新する。
Content Factory
アームのパラメータから広告用テキスト・画像を生成するモジュール。プロンプトテンプレートと生成AI(OpenAI/Anthropic等)を組み合わせて、プラットフォーム向けのクリエイティブを出力する。
Delivery Agent
生成したコンテンツをX(Twitter)やInstagramなどのSNSに実際に投稿するモジュール。各プラットフォームのAPIと連携し、レート制限を考慮しながら投稿を行う。
観測(Observation)
投稿したコンテンツのパフォーマンス(インプレッション、クリック、コンバージョン)を取得し、報酬を計算してアームの統計を更新する処理。observeMetrics Cloud Functionが定期実行する。
変異体アーム(Mutant Arm)
枝刈りされたアームのパラメータをベースに、わずかに変化させて生成する新しいアーム。探索の継続と多様性の確保に使われる。