01DCO(動的クリエイティブ最適化)とは
まず、この分野の中心にある考え方を正確に押さえておきます。DCO(=Dynamic Creative Optimization、動的クリエイティブ最適化)は、一つの広告枠に対して、見出し・画像・説明文・ボタンの色といった部品を、見る人や状況ごとに組み替えて出し分ける仕組みです。「これ一枚」と決めた広告を全員に見せるのではなく、部品を用意しておき、その場で組み立てて配信します。
見出しが 4 種類、画像が 3 種類、ボタンが 2 種類なら、組み合わせは 4×3×2 で 24 通り。生成 AI がこの部品を量産すれば、組み合わせは容易に数千・数万へ膨らみます。DCO が狙うのは、この膨大な組み合わせから成果の良いものへ配信を寄せていくことです。「作れる数」が増えたことと「試せる数」が増えたことが、ここで結びつきます。
ただし製薬では、この「組み替え」を素朴には使えません。効能・効果や安全性に関わる文言は、部品として自由に差し替えてよいものではないからです。DCO をそのまま持ち込めば、承認された組み合わせと承認されていない組み合わせが混ざってしまう。この危うさは後の章で正面から扱います。まずは「作って・試して・寄せる」という基本の流れを、次章の技術でたどります。
02多腕バンディットの考え方
「どの表現が効くかを試しながら、良いものへ配信を寄せる」。この仕組みの土台にあるのが、多腕バンディット(=multi-armed bandit、複数の選択肢を試しながら、当たりに賭ける割合を調整していく方法)です。名前は、レバーを何本も持つスロットマシン(=腕が何本もある盗賊、one-armed bandit のもじり)から来ています。どのレバーが当たりやすいか分からないまま、限られた回数で一番得をするにはどう引けばよいか、という問題です。
ここには相反する二つの欲求があります。まだ試していない選択肢を試す「探索」と、これまでで一番良かった選択肢を使い続ける「活用」です。探索ばかりでは、良い選択肢を見つけても取りこぼす。活用ばかりでは、たまたま最初に良く見えた選択肢に固執し、本当の当たりを見逃す。この綱引きをどう調整するかが、バンディットの核心です。Auer らは 2002 年の論文で、この綱引きを数式で扱う UCB(=Upper Confidence Bound、まだ試行回数が少ない選択肢を優先して試す仕組み)という方法を整理しました。
DCO は、この多腕バンディットを部品の組み合わせに当てはめたもの、と見ると分かりやすい。何千という組み合わせを「腕」とみなし、成果の良い腕へ配信を寄せていく。生成 AI が腕を無限に作り、バンディットがそこから当たりを選ぶ ── これが「無限生成 × 自動最適化」の正体です。
03生成 AI による量産
では、腕を作る側 ── 生成 AI による量産を見ます。かつては見出しを 1 本考えるのに時間をかけていました。いまは、切り口・語調・長さを指定すれば、数十通りの候補が数分で出てきます。画像も、患者さん向け・医師向けといった相手ごとに、複数の案を並行して作れる。試せる腕の数は、桁が変わりました。
この量産が製薬で危ういのは、AI が「正しさ」ではなく「もっともらしさ」を最適化しているからです。読みやすく、説得力があり、それらしい表現ほど、間違いが目立ちにくい。量産の三つの罠を、ここで改めて確認します。
ハルシネーション
存在しない試験結果や誇張された数値が、自然な文章に紛れ込みます(=ハルシネーション、AI の作話)。医薬では、これが誇大広告に直結します。
承認外効能
AI は「効きそうな表現」を上手に作ります。しかし医薬品は、承認された効能・効果の範囲でしか語れません。範囲を超えれば未承認広告になります。
組み合わせ爆発
部品を差し替えるほど組み合わせは膨らみます。一つひとつを審査済みにしないと、"作れる数" が "審査できる数" を追い越します。
三つ目は、量産と自動最適化が結びついたときに固有に生じる罠です。個々の部品は審査を通っていても、組み合わせた文脈で意味が変わることがあります。「効果が高い」という文言と、ある比較データの画像を並べると、単独では問題なくても、そろえた途端に誇大な優位性の示唆になりうる。腕の数が増えるほど、この文脈のズレを人が全部は追えなくなります。
04ブランド一貫性(Vibe)
量産のもう一つの壁が、ブランド一貫性(=どの表現を見ても同じブランドだと感じられるまとまり。本シリーズでは Vibe と呼びます)です。腕を無限に作り、成果の良いものへ寄せていくと、表現は「その場で最も反応が取れる形」へ引っ張られます。放っておけば、語調も色も主張の強さもばらばらになり、短期の反応は良くても、ブランドとしてのまとまりが崩れていきます。
製薬のブランドは、派手さではなく、正確さと落ち着きの上に立ちます。強い言葉で反応を稼ぐ表現は、その場の数字は良くても、医療者や患者さんの信頼という長期の財を削る。だから自動最適化には、成果の指標だけでなく、「この表現はブランドの声から外れていないか」という枠を先に与えておく必要があります。バンディットが探索してよい範囲を、ブランドの側からあらかじめ区切っておくのです。
具体的には、使ってよい語調・避ける表現・トーンの見本を、生成の指示に構造として埋め込みます。腕を作る段階でブランドの枠をかけ、枠の外の腕はそもそも生成しない。自由に作らせてから直すのではなく、初めから枠の内側だけで量産する。この順序が、Vibe を守りながら速度を使い切る鍵になります。
05規制チェック自動化の限界
ここがこの回の芯です。腕が数千に膨らむなら、規制チェックも自動化したくなる。禁止語の検知や、効能表現の範囲チェックは、機械にかなり任せられます。けれど製薬の規制チェックには、自動化しきれない部分が残ります。それを正確に見るために、動かない土台である薬機法を確かめます。
| 条文 | 何を定めるか | 自動最適化での注意 |
|---|---|---|
| 薬機法 第 66 条 | 誇大広告等の禁止。効能・安全性について、明示・暗示を問わず虚偽または誇大な記事を広告してはならない | 反応の良い腕ほど「盛った」表現に寄りやすい。断定・最上級・暗示に注意 |
| 薬機法 第 68 条 | 承認前医薬品等の広告の禁止。未承認の医薬品・効能を広告してはならない | 部品の組み替えで承認範囲を超えた効能が生じうる。適応外の示唆は本条に触れる |
| 薬機法 第 68 条の 2 | 医薬品情報の提供(適正使用のための情報提供の努力義務) | 反応最適化で安全性・リスク情報が削られやすい。欠落は本条の趣旨に反する |
条文番号の取り違えは、それだけで信頼を損ないます。誇大広告は 66 条、未承認広告は 68 条、情報提供は 68 条の 2 ── ここは丸暗記でよい土台です。その下には、厚生労働省の販売情報提供活動ガイドライン(=販提 G、医療用医薬品の販売情報提供活動に関するガイドライン。厚生労働省医薬・生活衛生局長通知、2018 年)と、医薬品等適正広告基準(=厚生労働省 医薬・生活衛生局 監視指導・麻薬対策課長の通知として示された、広告表現の物差し)があります。AI が作っても、当てる基準は同じです。
自動化の限界は、二つの点に集約されます。第一に、誇大か否かは文脈で決まること。禁止語リストは「最高」「安全」といった語を弾けますが、語を使わずに誇大な印象を作る表現までは捕まえきれません。第二に、組み合わせの意味は人にしか読めないこと。部品ごとに合格でも、並べたときに生まれる示唆は、機械には判定が難しい。だから規制チェックは、機械が一次フィルターを担い、最終の可否は人が判断する二層構造にせざるをえません。全自動で公開まで通す設計は、製薬では成り立ちません。
06クリエイターの希少性
「AI が無限に作るなら、人は要らなくなるのか」。この問いには、はっきり否と答えられます。量産で溢れるのは「もっともらしい表現」です。溢れるほど、その中から正しく・ブランドに沿い・規制を越えない一本を選び、方向を定める判断の価値が上がる。作る手間が下がった分、選ぶ目と方向づけが希少になるのです。
製薬の現場で残る仕事は、少なくとも三つあります。ブランドの声を定義し、生成の枠として言語化すること。組み合わせの文脈を読み、規制上の危うさを見抜くこと。そして、短期の反応と長期の信頼のどちらを取るかという、指標に還元できない判断を下すこと。いずれも、AI が量産できないものです。クリエイターは、部品を作る人から、枠を設計し・選び・責任を取る人へと役割を移していきます。
07効果測定
自動最適化は、効果を測ることと一体です。クリック率、閲覧時間、資料請求 ── データは細かく取れます。けれど製薬コンテンツの効果測定には、一般の Web マーケティングにない注意があります。短期の反応の良さが、長期のブランドを損なうことがあるのです。
少し「盛った」腕のほうが、その場の反応は良く出ることがあります。しかし、それが一度でも誇大と見なされれば、積み上げた信頼は一瞬で崩れる。医薬品は「信頼財(=品質を事前に確かめにくく、信頼の上に成り立つ財)」です。だから効果測定では、反応の数字だけでなく、その表現がブランドの信頼を削っていないかを必ず併せて見なければなりません。多腕バンディットに渡す「成果」の定義そのものに、規制順守とブランド一貫性を組み込む ── 反応だけを最大化させない設計が要ります。指標をどう置くかが、自動化の質を決めます。
08本サイトの他の章との接続
この回は、次の章と読み合わせると理解が深まります。
- AI Marketing 第 1 回 ── マーケティング再定義 ── 広告・CRM・コンテンツ・ブランドの全体地図。この回はその「広告 × コンテンツ」の最前線にあたる。
- AI Marketing 第 5 回 ── AI 生成コンテンツ戦略 ── 量産の速度の内側に審査を組み込む human-in-the-loop の設計。この回の量産・自動化の土台。
- 資材審査シリーズ ── 生成物と組み合わせを最後に受け止める審査の実務。自動化の "出口" にあたる。
クリエイティブの自動最適化は、DCO と多腕バンディットという二つの技術で、「無限に作り・試しながら・良いものへ寄せる」ことを可能にしました。生成 AI が腕を量産し、バンディットが当たりを選ぶ。この速度は大きな機会です。けれど製薬では、二つの壁が動きません ── ブランドの一貫性(Vibe)と、規制チェックです。
枠を先にかけること。腕を作る段階でブランドの声と承認情報を渡し、枠の外は生成しない。規制チェックは、機械が一次フィルターを担い、文脈と組み合わせの判定は人が残す。薬機法は AI が速くなっても動きません ── 66 条の誇大、68 条の未承認、68 条の 2 の情報提供。自動化できる部分を機械に任せきるほど、任せられない判断 ── 選び、方向を定め、責任を取る ── の価値は上がります。無限生成の時代に希少になるのは、作る手ではなく、選ぶ目です。次回は、サードパーティ Cookie が廃止された後の世界で、マーケティングがどう変わるかへ進みます。
- DCO(動的クリエイティブ最適化)は、部品を組み替えて出し分ける仕組み。その土台にある多腕バンディットは「探索(未試行を試す)」と「活用(良いものを使う)」の綱引きで、良い表現へ配信を寄せる。生成 AI が腕を量産し、バンディットが当たりを選ぶのが「無限生成 × 自動最適化」の正体。
- 製薬には二つの壁が動かない ── ブランド一貫性(Vibe)と規制チェック。腕を作る段階でブランドの声と承認情報を枠として渡し、枠の外は生成しない。反応最適化に任せると語調も主張の強さもばらつき、短期の数字と引き換えに長期の信頼を削る。
- 規制チェックは全自動にできない。禁止語や効能範囲は機械で弾けるが、誇大か否かは文脈で決まり、組み合わせの意味は人にしか読めない。薬機法(誇大 66 条・未承認 68 条・情報提供 68 条の 2)は AI が速くなっても変わらない。量産の時代に希少なのは、作る手より選ぶ目と責任を取る判断。
- Auer, P., Cesa-Bianchi, N., & Fischer, P. Finite-time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. Kluwer Academic Publishers, 2002. (多腕バンディットの探索と活用を UCB として定式化した基礎論文)
- 厚生労働省. 医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(薬機法)第 66 条・第 68 条・第 68 条の 2. (誇大広告の禁止=66 条、承認前医薬品の広告禁止=68 条、適正使用のための情報提供=68 条の 2 の一次条文)
- 厚生労働省医薬・生活衛生局長. 医療用医薬品の販売情報提供活動に関するガイドライン(販提 G). 厚生労働省, 2018.(医療用医薬品の情報提供活動の適正化を定めた通知)
- 厚生労働省医薬・生活衛生局監視指導・麻薬対策課長. 医薬品等適正広告基準について. 厚生労働省, 2017.(広告表現の可否を判断する物差しを示した課長通知)
- Sutton, R. S., & Barto, A. G. Reinforcement Learning: An Introduction(第 2 版). MIT Press, 2018.(探索と活用の綱引きを含む、強化学習と多腕バンディットの標準的教科書)
- World Health Organization. Ethical Criteria for Medicinal Drug Promotion. WHO, 1988.(医薬品のプロモーションが守るべき正確さ・公平さ・検証可能性の国際基準)