使った分だけ払う。公平に聞こえるこの仕組みが、最上位AIでは「払える者ほど賢い支援を受ける」構造を生む。Fable 5 世代を題材に、機会の格差と増幅の格差、そして平準化に働く力を、製薬業界の視点で考える。

01従量制と定額制、二つの思想:「使った分」は本当に公平か

Anthropic の最上位モデル Fable 5 は、API(=プログラムからAIを呼び出す窓口)経由の利用が従量制課金(=使った分だけ支払う料金方式)を基本とする。理由は単純で、最上位クラスの推論(=AIが答えを作る計算処理)は、下位モデルより数倍から数十倍の計算資源を使うからだ。Opus 系から Fable 5 へと続く系譜を見ると、性能の伸びと同時に「一回の思考にかける計算量」も増えてきた。長く考えるほど賢くなる設計は、そのまま電気代とGPU(=AI計算専用の半導体)の占有時間に跳ね返る。

一方で、個人向けのチャットサービスは月額定額制が主流のまま残っている。定額制が売っているのは「使い放題の安心」だ。今月いくらかかるか分からない、という不安を月額固定で消してくれる。ただしその裏側では、提供側が利用上限やモデルの出し分け(=重い処理を軽いモデルに回すなどの調整)でコストを吸収している。定額の看板の下に、見えない配給制がある、と言い換えてもいい。

従量制はその逆で、計算資源の実費をほぼそのまま利用者に映す。使った分だけ払うのだから一見公平に見える。ここが本稿の出発点だ。従量制の「公平」は、支払い能力と利用量を直結させる公平である。電気や水道なら、必要量は貧富であまり変わらない。しかしAIによる知的支援は違う。払えるほど深く長く考えさせられる。つまり、財布の厚みが受け取れる思考の質に比例しはじめる。

観点定額制従量制
売っているもの使い放題の安心(上限・出し分けで裏側調整)計算資源の実費(透明だが青天井)
向く利用者利用量が読めない個人・小規模費用対効果を計算できる企業・開発者
格差との関係質の差は見えにくい(配給の中身で生じる)支払い額の差がそのまま思考量の差になる

どちらの料金思想も、それ自体は合理的だ。問題は、最上位モデルの計算コストが高止まりする世界で、従量制が「知的支援の量と質」を価格で切り分ける入口になることだ。潤沢に払える企業は Fable 5 級に何時間でも考えさせられる。払えない層は、軽いモデルの短い答えで我慢する。この線は請求書の上にしか現れないから、格差として認識されにくい。見えない線、と呼ぶ理由はここにある。

02電気・計算機・クラウドの前例: 従量制は格差と平準化の両方を生んできた

従量制が格差を生むのは、AIが初めてではない。電力がそうだった。20世紀初頭、電気の従量課金が始まった頃、電化の恩恵をまず受けたのは大口契約の工場だった。家庭への普及は後回しで、都市と農村の間にも長い時間差があった。しかし発電と送電の規模の経済(=大量に作るほど単価が下がる仕組み)が働き、単価は下がり続け、最終的に電気は「誰でも使える前提のインフラ」になった。使う量の差は残ったが、質の差はほぼ消えた。工場の電気も家庭の電気も、同じ電気である。

計算機も同じ道をたどった。1960年代のメインフレーム(=企業の基幹業務を担った大型コンピュータ)は時間貸しで、計算時間を買えるのは大企業と大学だけだった。それがパソコンで個人に降り、2000年代のクラウド(=インターネット越しに計算資源を借りるサービス)は従量制を再び持ち込んだ。クラウド初期も「使いこなせる企業」と「使えない企業」の差は大きかったが、単価の低下と道具の整備で、今では個人開発者が数百円で世界向けのサービスを動かせる。従量制は格差の入口であると同時に、単価下落を通じた平準化(=差が縮む方向の動き)の装置でもあった。歴史はこの両面を示している。

ではAIも放っておけば平準化するのか。おそらく半分はそうなるだろう。実際、一世代前の最上位モデル相当の能力は、翌年には大幅に安い中位モデルで手に入る流れが続いてきた。Sonnet 系や小型モデルの性能向上はその証拠だ。「昨年の最高知能」は確実に値下がりし、大衆化する。

ただし電気やクラウドと決定的に違う点が一つある。電気には「上位互換の電気」が存在しないが、AIには常に「その時点で最も賢いモデル」が存在する。電気は品質が一様だから、単価が下がれば格差は消えた。AIは違う。Fable 5 の次にはさらに計算量を食う次世代が来る。最先端の一枚だけは、いつの時点でも「最も高い知的支援」として頂点に残り続ける。つまり平準化するのは過去の知能であって、現在の最高知能ではない。

この構造が意味するのは、格差が「絶対的な欠乏」ではなく「相対的な遅れ」として固定される、というシナリオだ。誰もが一年前の最高知能を安く使える。しかし競争は常に現在の最高知能で行われる。研究開発でも、投資判断でも、そして後述する製薬の現場業務でも、相手が今日の Fable 5 で考えているなら、こちらが昨年のモデルで応じる不利は消えない。電力の歴史は「いずれ安くなる」という楽観の根拠になるが、頂点が動き続ける市場では、その楽観は半分しか通用しない。もっとも、推論コストの下落速度が需要の伸びを上回れば、この差は縮む。外れうる条件も、そこにある。

03機会の格差と増幅の格差: すでに強い者ほどAIで強くなる

Fable 5 のような最上位モデルが従量制で提供されるとき、生まれる格差は一種類ではない。二層に分けて考えたい。第一の層は機会の格差。最上位モデルにそもそも触れられるかどうか、というアクセスの差だ。定額制の範囲で使える標準モデルと、追加の支払いを覚悟しないと呼び出せない最上位モデル。この線引きは料金表に書いてあるから、目に見える。予算を積めば越えられる線でもある。

第二の層は増幅の格差だ。こちらは見えにくい。同じモデルを同じ料金で使っても、成果の大きさは使う側が持つ資本・データ・人材によって変わる。たとえば、自社に整理されたデータ基盤(=社内の情報をAIが読める形に整えた仕組み)を持つ企業は、モデルに渡せる材料が多い。AIの出力を評価できる専門人材がいれば、間違いを早く見抜き、良い出力だけを業務に取り込める。得られた成果を売上に変える販売網があれば、AIが生んだ一の価値を十に増やせる。機会の格差は料金と課金方式で決まり、予算で解消できる。増幅の格差はデータ・人材・販路で決まり、課金方式を変えても消えない。モデルへのアクセスが平等になるほど、差の主因はこの増幅装置の側に移るはずだ。

企業と個人の非対称(=条件のかたより)は、この二層の両方で開く。企業は利用料を経費として処理でき、失敗した試行のコストも吸収できる。個人は自分の財布から払う。月に数万円の従量課金は、企業には端数でも、個人には家計の判断になる。しかも個人は増幅装置を持たない。優れた回答を得ても、それを組織的な成果に変換する仕組みがないからだ。フリーランスの専門職が最上位モデルで生産性を上げる例は増えるだろうが、その利得は企業が同じモデルで得る利得より小さくなりやすいだろう。

先進国と新興国のあいだでは、為替と所得水準がそのまま線になる。米ドル建ての従量課金は、平均所得の低い国の利用者にとって相対的に何倍も重い。ここには反対方向の力もある。一世代前のモデルの価格は下がり続けており、新興国の開発者が安価なモデルで実務水準のシステムを組む余地は広がっている。ただし「最先端の知的支援を最初に手にするのは誰か」という問いに限れば、答えは支払い能力の高い側に偏る。これは推測ではなく、従量制という仕組みからそのまま導かれる結果だ。問題は、その先行者が増幅装置も併せ持つとき、格差が一回限りでなく累積していく点にある。

04大企業と中小の非対称: API予算が競争条件になる日

組織の規模に話を絞る。大企業では、AIの利用料は研究開発費や情報システム予算の中に吸収されやすい。年間予算の枠が先にあり、その中で試す。一方、中小企業では多くの場合、プロジェクト単位で稟議(=社内の支出承認手続き)を通す必要がある。「この検証に上限いくらまで使ってよいか」を、使う前に説明しなければならない。従量制の厄介さはここにある。使ってみないと成果が分からないのに、使う前に金額の説明を求められる。

この差は、金額の差である以前に試行回数の差だ。AIの使いこなしは、試して外して直す回数に比例して伸びる。プロンプト(=AIへの指示文)の書き方、業務への組み込み方、失敗パターンの見極め。どれも教科書ではなく試行から学ぶものだ。大企業の担当者が一日に百回試せる環境と、中小の担当者が承認済みの予算内で慎重に十回試す環境では、三か月後の習熟度が違う。習熟度が違えば同じ予算から得られる成果も違い、成果が違えば次の予算も付きやすくなる。試行回数の差は雪だるま式に開く。

観点大企業中小企業
費用の扱い研究開発費・IT予算に吸収プロジェクト単位で稟議
試行の自由度失敗込みで大量に試せる承認範囲内で慎重に試す
習熟の速度試行回数に比例して速い回数が少なく遅れやすい
追い上げの余地とくになし一世代前モデルの値下がりを使える

ただし、一方向にだけ開く話でもない。反対方向の力が二つある。一つは、前節でも触れた旧世代モデルの価格低下だ。最上位モデルの一世代前、つまり半年から一年前には最先端だったモデルが、大幅に安く使えるようになる流れは続いている。中小の実務の大半は、最新モデルでなければ解けない問題ではない。安くなった実力十分のモデルで業務を固め、どうしても差が出る局面だけ最上位モデルを従量で買う。この使い分けができる中小は、支出を抑えながら大企業との差を実務上は小さく保てるはずだ。

もう一つは、組織の小ささ自体が持つ速さだ。大企業ではAI導入に法務・情報セキュリティ・コンプライアンスの多段の確認が挟まり、承認までに数か月かかる例が珍しくない。中小は決裁の階段が短い。予算は小さいが、決めてから使い始めるまでが速い。つまり非対称は「予算の大企業、速度の中小」という形にもなりうる。それでも、最上位モデルの単価が上がり続ける場合には、試行回数の雪だるま式の差が効いてくる。API予算(=AIをプログラムから呼び出すための利用料の枠)の大きさが、人件費や設備と並ぶ競争条件として損益計算の前提に組み込まれる日は、そう遠くないと見ている。

05製薬の現場で何が起きうるか: 資材作成・審査・メディカルの三場面

抽象論を離れて、私たちの職場に引き寄せてみる。従量制の最上位モデル(=使った分だけ料金を払う、いちばん高性能なAI)に潤沢に払える会社と、定額プランや一世代前のモデルでやりくりする会社。この差が製薬の現場のどこに現れるか。三つの場面を「シナリオ」として描いてみたい。断っておくが、以下は現時点の傾向からの推測であって、確定した未来ではない。

第一の場面は資材作成だ。プロモーション資材(=MRが医療者に提示する説明資料)のドラフトづくりは、添付文書・審査報告書・ガイドラインという長い一次資料を読み込んで整合する文章に落とす作業で、まさに長文脈(=長い文書を一度にまとめて読める能力)の推論力がものを言う。最上位モデルを制限なく回せる会社では、初稿の段階から「引用箇所と原文の対応が取れているドラフト」が短時間で出てくる。一方、利用量に上限のある環境では、資料を分割して何往復もさせる運用になり、分割の切れ目で文脈が落ちる。初稿の質の差は、そのまま社内審査の手戻り回数の差になりうる。

第二の場面は審査だ。資材審査では、記載内容を適正広告基準や販売情報提供活動ガイドラインと突き合わせる照合作業が中心になる。この照合をAIに一次スクリーニングさせる場合を考える。規制文書と資材の全文を一度に読ませて矛盾を洗い出せるモデルがある。一方、要約を経由してしか扱えないモデルでは、見落とし率が高くなりうる。要約は情報を捨てる工程だからだ。ここで強調したいのは、どちらの環境でも品質責任は審査担当者という人に残るという点である。AIの指摘は網の一枚にすぎず、最終判断を委ねてよい根拠はどの規制にもない。差が出るのは「人が見落としを拾う前の、網の目の細かさ」だ。

第三の場面はメディカル・アフェアーズ(=医学的な情報活動を担う部門。販売促進とは切り分けられる)である。文献統合、つまり数十本の論文を横断して「何がどこまで言えるか」を整理する仕事は、モデルの推論の深さが直接効く領域だ。最上位モデルなら、試験デザインの違い(比較対象、追跡期間、評価項目)を踏まえた留保(=「ここまでは言える、ここからは分からない」という線引き)つきの統合ができる。廉価な環境では要約の羅列に近づき、留保が浅くなる。医療者への回答の質に差が生まれる、という筋書きはここでも成り立つ。

三つに共通するのは、差が「できる・できない」ではなく「初手の質と往復回数」に出ることだ。目に見えにくいぶん、気づいたときには積み上がっている。それがこの種の格差の厄介なところだと私は見る。

06平準化に働く力: 悲観で終わらせないための三つの根拠

ここまで差が開く方向の話を書いてきたが、逆向きに働く力も現実に存在する。悲観で締めるのはフェアではないので、平準化の根拠を三つ挙げる。

小型化と蒸留の歴史的傾向

蒸留(=大きなモデルの能力を小さなモデルに移す技術)と推論の効率化によって、「一世代前の最上位性能」は毎年のように大幅に安くなってきた。GPT-4級の性能が数年のうちに小型モデルへ降りてきたという傾向は、公開報道で繰り返し報じられてきた。今日の最上位が明日の普及帯になる、この傾きは今のところ崩れていない。

オープンモデルの存在

Llama系やDeepSeek系など、重み(=モデルの中身のデータ)が公開されたモデルは、自社サーバーで動かせば従量課金の外側に立てる。最上位には届かなくても、追い上げの速度は速い。閉じた最上位モデルの価格に対する、事実上の天井として機能している。

業務の大半は最上位を要らない

議事録の整形、定型文書の下書き、翻訳、社内Q&A。日常業務の多くは一世代前のモデルで十分にこなせる。最上位モデルが本当に差を生むのは、長文脈の照合や深い文献統合といった一部の工程に限られる。格差が効く面積は、業務全体から見れば思ったより狭い。

この三つを合わせると、私の見立てはこうなる。格差は残るが、固定はされない。今日の最上位でしかできなかった仕事が、一〜二年後には普及価格帯でできるようになる。差は「常に最先端の一歩先を使えるかどうか」という相対的なものにとどまり、絶対的な断絶にはなりにくい。中小の製薬企業やメディカル部門にとっての実務的な結論は、最上位を追い続けることではなく、「どの工程だけが最上位を本当に必要とするか」を見極めて、そこにだけ従量制の予算を集中させることだろう。

ただし、この見立てが外れる条件も正直に書いておく。それは、最上位モデルだけが質的に別次元へ抜ける場合だ。Opus 系から Fable 5 へという系譜が、単なる性能の少しずつの積み上げではなく「数週間かかる調査や設計を丸ごと任せられる」ような不連続の能力に到達したとしよう。しかもその能力が蒸留で下位モデルに移らないとしたら。そのとき格差は量の差ではなく質の断絶になり、平準化の三つの力は効かなくなる。現時点でその兆候が確定したとは言えないが、可能性としてゼロでもない。だからこそ、次の世代のモデルが出るたびに「下位モデルとの差は量か、質か」を見る。それが、この見えない線を監視するいちばん実際的な方法だと思う。

Key Points ── 持ち帰る 3 つ
  1. 従量制の「公平」は支払い能力と思考量を直結させる。最上位AIでは、財布の厚みが受け取れる知的支援の質に比例しはじめ、その線は請求書の上にしか見えない。
  2. 格差は二層ある。最上位モデルに触れられるかという「機会の格差」は予算で解消できるが、データ・人材・販路で決まる「増幅の格差」は課金方式を変えても消えない。試行回数の差は雪だるま式に開く。
  3. 平準化の力(蒸留による低価格化・オープンモデル・最上位を要らない業務の多さ)も働く。実務の焦点は最上位を追うことではなく、長文脈の照合や文献統合など「本当に最上位が要る工程」を見極めて予算を集中させること。
出典·参考文献
  1. Anthropic 公式サイト「Pricing」— モデルと API 料金(従量制課金の構造)。https://www.anthropic.com/pricing
  2. Anthropic 公式ブログ「News」— モデルリリースに関するアナウンス。https://www.anthropic.com/news
  3. AWS「Pricing」— クラウドコンピューティングの従量課金モデルの解説。https://aws.amazon.com/pricing/
  4. Stanford HAI「AI Index Report」— 推論コストと利用格差に関する年次調査。https://aiindex.stanford.edu/
  5. OECD — AI の普及と国家間デジタル格差に関するレポート。https://www.oecd.org/digital/artificial-intelligence/
  6. Hugging Face「Models」— オープンモデルの公開状況(平準化の根拠)。https://huggingface.co/models
  7. Epoch AI — 機械学習の計算コスト推移に関する公開データ。https://epoch.ai/