01創薬の工程 ── なぜ長く、高く、失敗が多いのか

創薬 AI を語る前に、まず「薬ができるまで」を一度分解します。新薬開発は、おおまかに次の順で進みます。

全工程にかかる期間と費用の目安は、よく引用される推計で 10〜15 年、1 品目あたり約 25 億ドル (2013 年時点、失敗分を含む資本コスト込み) とされます。しかも、臨床第 I 相に入った候補が最終的に承認される確率は、複数の大規模分析で およそ 13〜14%。7 つ試せば 6 つは途中で消える計算です。

この「時間・費用・失敗率」の三重苦は、どこか一箇所を速くしても解けません。標的の選び方を誤れば、その先の化合物設計も治験もまるごと無駄になる。だから創薬 AI の値打ちは「早く作る」ことだけでなく、「間違った道に長く迷い込まない」ことにあります。

02創薬 AI の全体像 ── どこに、どう効くのか

「AI で薬を作る」と一括りにされがちですが、工程ごとに使う技術も、期待できることも違います。まずは全体像を、四つの効きどころで押さえましょう。

Area 01

標的探索

"急所を絞る" を助ける

遺伝子・タンパク質・論文・臨床データの膨大なつながりを解析し、どの分子を狙うべきか仮説を出す。人が見落とす関連を拾うのが強み。

Area 02

化合物設計

"分子を描く" を助ける

標的に結合しそうな分子構造を、生成モデルが数多く提案する。合成しやすさや毒性の予測と組み合わせて候補を絞る。

Area 03

治験

"試験を設計する" を助ける

患者の層別化、適格基準の最適化、試験施設の選定、脱落予測など。設計の精度を上げ、失敗の芽を早く見つける。

Area 04

製造・品質

"作り続ける" を助ける

製造工程のパラメータ最適化や異常検知。承認後も品質を保つ、地味だが重い領域で、機械学習が使われ始めている。

四つに共通するのは、AI は 候補を出し、優先順位をつけるのは得意でも、「これで正しい」と保証はできないという点です。だからどの工程でも、AI の出力は最終結論ではなく、人と実験が確かめるべき仮説として扱われます。以下の三つの節で、標的・化合物・治験の順に中身を見ていきましょう。

03標的探索への適用 ── 病気の急所を見つける

標的探索は、創薬のいちばん上流にあたります。ここで狙いを外せば、その先の努力がすべて無駄になる。従来は、研究者が自らの専門知識と個々の実験を積み重ねて標的を選んできました。

機械学習は、この段階で 膨大なつながりの中から、人が気づきにくい関連を拾う役割を担います。たとえば、ある遺伝子の変異と特定の病気、既存薬の作用、副作用の報告 ── こうした断片的な情報を突き合わせ、「この分子を抑えれば、この病気に効くかもしれない」という仮説を数多く生み出します。既存薬を別の病気に転用する ドラッグ・リポジショニング (drug repositioning = 既承認薬の新しい使い道を探すこと) にも、この解析が役立ちます。

ただし、AI が出すのはあくまで 相関に基づく仮説 です。「関連がある」ことと「原因である」ことは違う。標的として本当に成り立つかどうかは、細胞や動物での実験、そして最終的にはヒトでの検証を経なければ確かめられません。AI は探索の入口を広げますが、正しさを証明するのは今も実験の仕事です。

04化合物設計への適用 ── 薬の分子をつくる

標的が決まったら、次はそこに結合して働きを変える分子を探します。理論上あり得る低分子化合物は 10 の 60 乗ともいわれ、そのすべてを合成して試すのは不可能です。ここで 生成モデル (generative model = 学習した規則から新しい候補を作り出す AI) の出番になります。

生成モデルは、標的の構造や既知の活性化合物を学び、「結合しそうで、合成でき、毒性が低そうな」分子構造を数多く提案します。これに活性予測・物性予測・合成経路予測を組み合わせ、実際に作って試す候補を数個〜数十個まで絞り込みます。

この分野には、実在の査読済み事例があります。深層学習で既存の抗菌薬とは構造の異なる抗生物質候補 (ハリシン) を見いだした 2020 年の研究や、生成 AI を起点に設計した線維症治療候補が臨床試験段階へ進んだ 2024〜2025 年の報告など、机上の話にとどまらない成果が出始めました (詳細は出典を参照)。とはいえ、これらは AI が単独で薬を完成させたわけではありません。各段階に人の判断と、数多くの実験による検証が入っています。AI は候補を出す速さと幅を広げますが、合成・評価・安全性確認という地道な作業は消えません。

05治験への適用 ── 試験の設計に効かせる

薬の候補が非臨床を通れば、次はヒトでの臨床試験 (治験) です。開発費用の大半はここで消え、失敗も最も多く起きます。だからこそ、治験の設計に AI を効かせる意味は大きい。

具体的には、次のような使い方があります。

従来の治験設計AI を組み込んだ設計
広い基準で患者を集める効きやすい患者層を 予測して層別化し、少人数でも差を見やすくする
過去実績で施設を選ぶ登録の速さ・質を予測して 試験施設を選定
脱落は起きてから対応脱落しやすい参加者を 早めに予測し、支援を厚くする
紙・人手での適格性確認診療記録の解析で 適格基準の該当者を効率的に抽出

これらは治験を「速く・小さく・確実に」する方向に働きます。ただし、注意点もあります。層別化を強めるほど対象は狭まり、実臨床の患者集団を代表しなくなるおそれがある。AI は過去データから学ぶため、そこに含まれない集団 (少数の人種、高齢者、併存疾患を持つ人など) は取りこぼしがちです。効率と一般化のしやすさをどう釣り合わせるかは、統計の専門家と規制当局の目が要る領域です。

06AlphaFold の意味 ── 構造予測が変えたもの

創薬 AI の話に必ず登場するのが AlphaFold です。2021 年に発表されたこの手法は、アミノ酸の並び (配列) から、タンパク質が折りたたまれた立体構造を高い精度で予測します。タンパク質の構造は、そこに薬がどう結合するかを決める土台ですから、構造が分かれば創薬の入口が大きく開けます。

それまで、タンパク質の立体構造を一つ実験で決めるには、X 線結晶構造解析などで数か月〜数年かかることも珍しくありませんでした。AlphaFold は、その多くを計算で先回りできるようにした。公開データベースには 2 億件を超える予測構造が収められ、世界中の研究者が無償で使えます。

ただし、意味は正確に押さえておく必要があります。AlphaFold が予測するのは主に 「静止した一つの構造」で、実際のタンパク質は動き、他の分子とやり取りし、状況に応じて形を変えます。予測が実験と食い違う場合もある。つまり AlphaFold は 構造を推定する出発点を大きく安くしたのであって、薬の効き目まで予測するわけではありません。構造が分かることと、そこに効く薬ができることの間には、まだ長い道のりが残っています。この違いをぼかした「AlphaFold で創薬が完成する」という語り口は、正確ではありません。

07限界の見極め ── AI が解けない部分

創薬 AI を等身大で使うには、得意なことと苦手なことを切り分けて理解しておくことが欠かせません。

AI が比較的得意AI が苦手・できない
膨大な候補の生成と絞り込み「本当に効くか」の最終的な保証
既知データからのパターン予測データにない現象・新しい生物学の発見
構造・物性の推定体内での複雑な代謝・副作用の完全予測
作業の高速化・優先順位づけ因果関係の証明 (相関と因果は別物)

根本的な限界は二つあります。第一に、AI は学習したデータの外側に弱い。創薬でいちばん価値があるのは「これまで誰も知らなかった仕組み」ですが、過去データから学ぶ AI は、そうした未知の発見をもともと苦手とします。第二に、生物は複雑で、ヒトの体内での挙動を計算だけで完全には予測できません。だからこそ臨床試験がなくならないのです。

創薬 AI は、探索を速め、失敗を早く見つける道具として現実的な価値があります。一方で「実験なしに薬ができる」という期待は、少なくとも今のところ過大です。この見極めができるかどうかが、社内で AI 投資を判断する担当者の分かれ目になります。

08規制との関係 ── PMDA・FDA、そして薬機法

AI が候補を出しても、薬として世に出すには規制当局の審査を通らなければなりません。ここで大事なのは、審査の基準が「誰が (何が) 作ったか」ではなく「何が示されたか」にある点です。AI が設計した化合物でも、求められる非臨床・臨床データの質と量は変わりません。

規制当局も AI の利用に向き合い始めました。米国 FDA は 2023 年に、医薬品開発での人工知能・機械学習の利用に関する議論用文書を公表し、透明性やデータの信頼性、モデルの妥当性確認についての考え方を示しました。日本の PMDA (医薬品医療機器総合機構) や規制の枠組みは、本シリーズ次回で正面から取り上げます。

マーケティング段階の柵: 創薬に AI を使ったこと自体は、宣伝の材料になりません。医薬品の広告・情報提供は、AI の有無にかかわらず 薬機法の規制下にあります ── 誇大広告は第 66 条未承認医薬品の広告は第 68 条承認範囲内での情報提供は第 68 条の 2。「AI が見つけた画期的な薬」といった表現も、承認された効能・効果を超えれば誇大に当たり得ます。適正広告基準 (厚生労働省 医薬・生活衛生局 監視指導・麻薬対策課長通知) や、販売情報提供活動ガイドライン (「医療用医薬品の販売情報提供活動に関するガイドライン」厚生労働省医薬・生活衛生局長通知、2018 年) の枠は、AI 創薬の時代でも一切ゆるみません。

09データの質 ── 土台が崩れれば結論も崩れる

創薬 AI の性能は、モデルの新しさよりも 学習に使うデータの質で決まります。「ゴミを入れればゴミが出る (garbage in, garbage out = 質の悪い入力からは質の悪い出力しか得られない)」という古い格言が、そのまま当てはまるのです。

創薬データには、固有の弱点があります。

だから、優れた創薬 AI を持つことと、良質で偏りの少ないデータを整えることは、別の課題です。多くの現場で本当のボトルネックは、モデルではなくデータの整備 ── 収集・標準化・品質管理にあります。ここを飛ばして「最新モデルを入れれば片づく」と考えるのは、順序を取り違えています。

10将来と、本サイトの他の章への接続

向こう 5〜10 年で、創薬 AI はどう進むでしょうか。誇張を避けて見通すと、次の方向が現実的です。

一方で、変わらないものもはっきりしています。ヒトでの臨床試験、規制当局の審査、そして安全性への責任 ── これらは AI があっても消えません。創薬 AI は「薬を自動で生む機械」ではなく、「長く・高く・失敗の多い道を、少しだけ賢く歩くための道具」です。この等身大の理解が、過剰な投資と過小な評価の両方を避けさせてくれます。

本回は、本サイトの他の章と次のようにつながります。あわせて読むと、理解に厚みが出ます。

結語

創薬 AI は、標的探索・化合物設計・治験の各段階で、確かに現実の価値を持ち始めています。膨大な候補を速く生み、失敗の芽を早く見つけ、AlphaFold のように構造推定の入口を安くする ── これらは机上の空論ではなく、査読済みの成果として積み上がってきました。けれど同時に、AI は「効く」ことを保証せず、データにない発見を苦手とし、ヒトでの検証を肩代わりできません。相関は因果ではなく、構造が分かることは薬ができることと同じではない。

だから、創薬 AI を「魔法」としても「まやかし」としても扱わないことが肝心です。長く・高く・失敗の多いこの道を、少しだけ賢く歩くための道具として、規制とデータの質に正面から向き合いながら使う。速度を上げた分だけ、検証と責任の仕組みを追いつかせる。それが、AI 時代の創薬に製薬の現場が答えるべき問いです。次回は、日本での AI 医療機器の承認と規制 ── PMDA の役割に踏み込みます。

Key Points ── 持ち帰る 3 つ
  1. 創薬は 10〜15 年・約 25 億ドル・臨床第 I 相からの承認確率およそ 13〜14% という「長く・高く・失敗の多い」構造を持つ。創薬 AI の値打ちは「早く作る」より「間違った道に長く迷い込まない」点にある。標的・化合物・治験の各工程で、AI は候補生成と優先順位づけを助けるが、正しさの保証はしない。
  2. AlphaFold は配列から立体構造を高精度に予測し、構造推定の入口を大きく安くした。ただし予測するのは主に「静止した一つの構造」であり、薬の効き目まで予測するわけではない。「AlphaFold で創薬が完成する」という語り口は正確でない。AI は相関に基づく仮説を出すが、因果の証明はヒトでの実験が担う。
  3. 審査の基準は「何が (誰が) 作ったか」でなく「何が示されたか」。AI が設計した薬でも求められるデータの質と量は変わらない。広告・情報提供の柵も緩まない ── 誇大は薬機法 66 条、未承認は 68 条、情報提供は 68 条の 2。真のボトルネックはモデルより、偏りの少ない良質なデータの整備にある。
出典・参考文献
  1. Jumper J, Evans R, Pritzel A, et al. Highly accurate protein structure prediction with AlphaFold. Nature. 2021;596:583–589. (タンパク質構造予測の中核論文)
  2. Varadi M, Anyango S, Deshpande M, et al. AlphaFold Protein Structure Database. Nucleic Acids Research. 2022;50(D1):D439–D444. (2 億件超の予測構造を無償公開するデータベース)
  3. Stokes JM, Yang K, Swanson K, et al. A Deep Learning Approach to Antibiotic Discovery. Cell. 2020;180(4):688–702. (深層学習で新規抗生物質候補ハリシンを同定した査読済み事例)
  4. Ren F, Aliper A, Chen J, et al. A small-molecule TNIK inhibitor targets fibrosis in preclinical and clinical models. Nature Biotechnology. 2025;43:63–75. (生成 AI を起点に設計した候補が臨床段階へ進んだ報告)
  5. Vamathevan J, Clark D, Czodrowski P, et al. Applications of machine learning in drug discovery and development. Nature Reviews Drug Discovery. 2019;18:463–477. (創薬各工程での機械学習応用の総説)
  6. DiMasi JA, Grabowski HG, Hansen RW. Innovation in the pharmaceutical industry: New estimates of R&D costs. Journal of Health Economics. 2016;47:20–33. (新薬開発費用 約 25 億ドルの推計)
  7. Wong CH, Siah KW, Lo AW. Estimation of clinical trial success rates and related parameters. Biostatistics. 2019;20(2):273–286. (臨床第 I 相からの承認確率の推計)
  8. U.S. Food and Drug Administration. Using Artificial Intelligence and Machine Learning in the Development of Drug and Biological Products (Discussion Paper). FDA, 2023. (医薬品開発での AI/ML 利用に関する規制側の議論用文書)
  9. 厚生労働省医薬・生活衛生局長. 医療用医薬品の販売情報提供活動に関するガイドライン. 厚生労働省, 2018. (販売情報提供活動の遵守枠組み)