審査エンジンの部品表 ── 規範の階層・固定された判定語彙・二本立ての検査

AI資材審査システムは、賢い一つの頭脳ではなく、役割の決まった部品の組み合わせで出来ている。どの規範を根拠にするか(L1〜L5)、判定を何と呼ぶか(BLACK〜WHITE、ALERT)、指摘を何に分類するか(R1〜R8)、機械のどこまでをコードで確定し、どこからをLLM(＝大規模言語モデル)に任せるか。本稿はこの部品を一つずつ棚卸しする。設計の考え方そのものは前稿(philosophy)に、部品が実際に動く順序は次稿(process)に譲る。

01規範の階層 L1〜L5

システムが根拠にできる規範は、あらかじめ五つの層に整理されている。L1は薬機法66・67・68条(66条=誇大広告の禁止、67条=特定疾病用医薬品の広告制限、68条=未承認医薬品の広告禁止)。L2は医薬品等適正広告基準。L3は販売情報提供活動ガイドラインとそのQ&A。L4は製薬協コードと製品情報概要等の作成要領。L5は社会の目、つまり明文の規範ではなく世間の批判的視線である。層の順序は法的な強弱の序列ではない。L1は法律で法的拘束力を持つ。L2・L3はいずれも厚労省の通知(＝行政指導。法律そのものではない)、L4は業界の自主規範であり、並びは発出主体の公的性格(国→業界)による整理である。L5は明文規範の外に置く。すべての指摘はこのどれかの層に紐づく。「なんとなく問題」という層のない指摘は、この仕組みの中に居場所がない。

02判定の語彙は固定されている

判定の呼び方も自由記述ではない。法的な判定はBLACK(＝明確な違反)/GRAY3/GRAY2/GRAY1(＝灰色。数字が大きいほど違反の疑いが濃い)/WHITE(＝問題なし)の五段階。社会の目の判定はALERT-3/ALERT-2/ALERT-1(＝警告。数字が大きいほど重い)/CLEAR(＝懸念なし)の四段階。この語彙は型(＝プログラム上のデータの決まった形)で固定されており、この値域の外にある判定は生成そのものができない。「やや懸念」「おおむね問題なし」のような曖昧な判定文をLLMが書こうとしても、型が受け取りを拒否する。判定語彙を固定するのは、後で人間が指摘を並べ替え、比較し、集計できるようにするためだ。

03二レーン制 ── 法と社会の目を混ぜない

一つの指摘は、法的レーン(BLACK〜WHITE)か社会の目レーン(ALERT〜CLEAR)か、必ずどちらか一方だけに属する。両方を持つ指摘も、どちらも持たない指摘も、生成時点で拒否される。序列の比較も同一レーンの中でしか行わない。GRAY2とALERT-2のどちらが重いか、という比較は仕組みの上で不可能にしてある。法的違反と社会的懸念は根拠も出口も違うからだ。取り扱いも分かれる。ALERT-2以上は人間の審査担当者へ、最も重いALERT-3は経営層へ届ける。ただし社会の目レーンが資材を直接差し止めることはない。

04リスク類型 R1〜R8

指摘の中身は八つの類型に分類される。R1承認範囲逸脱、R2安全性矮小化(＝副作用などの危険を実際より軽く見せること)、R3誇大(明示)、R4誇大(暗示)、R5比較誹謗(＝他剤をおとしめる比較)、R6エビデンス不正(＝根拠データの不適切な使い方)、R7体裁欠落(＝必須の記載が無いこと)、R8社会倫理。層(L1〜L5)が「どの規範に照らしたか」を示すのに対し、類型は「何をやらかしたか」を示す。二つの軸が揃って、指摘は初めて分類として完結する。

05決定的照合とLLM意味判定の二本立て

検査の方法は二本立てである。語・数値・構造の照合はコードで行う。NG語が含まれるか。グラフの軸がゼロから始まっているか。必須記載が欠けていないか。これらは同一入力なら同一出力が100%保証される「決定的照合」だ。一方、含意・印象・暗示の判定だけをLLMに任せる。事実の羅列でも並べ方で誤った印象を与えていないか、という問いはコードでは書けないからだ。逆に、計算や数え上げはLLMに任せない。検査の最小単位である原子項目(＝一つずつ独立に検査できる最小のチェック項目)は694項目ある。その約半分が決定的照合、約半分がLLMの意味判定で処理され、残りの少数は画像検査とペルソナ検査(後述の社会の目)に回る。迷わない部分を安いコードで確定し、迷う部分にだけ高価なLLMを使う分業である。

06基準資料 ── 承認事実の三点セット

資材の主張を何と突き合わせるか。基準資料は三つある。第一に電子添文(＝医薬品の公式な説明文書)。承認範囲を判定する基準原本であり、資材はこの記載の範囲を一字も超えてはならない。第二に審査報告書。承認時に規制当局が何を評価し、何を認めなかったかの記録である。機構(＝医薬品医療機器総合機構。承認審査を行う当局)が有効性を認めなかった項目を、資材が有効であるかのように示唆していないかを見る。第三にRMP(＝市販後の安全対策計画)。市販後に注意すべきリスクの一覧であり、そのリスクが資材に反映されているかを検査する。三者は補完関係にある。電子添文が「何を言ってよいか」、審査報告書が「なぜそう承認されたか」、RMPが「売った後に何を警戒するか」を定める。

07検証可能性の型強制 ── 根拠なき指摘は存在できない

すべての指摘には、規範原文への参照と原子項目のIDが必須である。これは運用ルールではなく、データの型に組み込まれた強制だ。根拠の欠けた指摘は、生成しようとした瞬間にエラーとなって消える。第三者(当局・弁護士・記者)が「なぜその判定か」と問うたとき、必ず規範の原文まで遡って答えられる。この一点が、機械の指摘を人間の審査に使ってよい最低条件だと考えている。この強制が審査の流れのどの時点で働くかは、次稿(process)で扱う。

08社会の目 ── 8ペルソナ

明文の規範に照らす検査とは別に、資材全体を八つの視点で通読する検査がある。患者、家族、医療者、メディア、SNS、投資家、監督官庁、弁護士。それぞれの立場から見て、この資材は批判に耐えるか。明文違反の一歩手前にある倫理・品位・患者の権利の問題は、この視点でしか捕まらない。八つの視点は無理に懸念をひねり出すことはせず、見つかったものだけをALERTとして社会の目レーンに載せる。

09合議 ── 60名の仮想審査

重要な判定は、一つのLLMの一存では決めない。仮想審査(＝AIに異なる専門家の役を演じさせた模擬審査)を二段で行う。まずディベート30名。製薬会社の審査経験者、添付文書の専門家、広告規制の弁護士の三団体(各10名、計30名)が、修正すべき論拠と反論の両方を必ず出し、少数意見を明示する。次に多数決30名。規制当局を模した三団体(こちらも各10名)が争点ごとに投票し、30票中の過半で「修正要」の候補判定となる。合わせて60名。作る者(指摘を出したエンジン)と検収する者(合議)を分けているのは、自分の出した指摘を自分で承認させないためだ。全員一致に見える結論ほど疑う設計であり、割れた争点だけでなく、全員一致に見える争点も人間審査に回す。合議が下すのは修正要否の候補判定までで、最終判定と責任は人間の審査担当者に残る。合議は一次スクリーニングの精度を上げる部品であって、人間の代わりではない。

規範原典 / Primary Norms

薬機法. "第66条(虚偽・誇大広告の禁止)・第67条・第68条(承認前医薬品等の広告禁止)." (規範階層 L1)
厚生労働省. "医薬品等適正広告基準." (規範階層 L2)
厚生労働省. "医療用医薬品の販売情報提供活動に関するガイドラインおよび Q&A." 2018〜. (規範階層 L3)
日本製薬工業協会. "医療用医薬品プロモーションコード・製品情報概要等に関する作成要領." (規範階層 L4)

本セクションについて: 当サイト運営者が構築したAI資材審査システムの設計文書・実行プロセス仕様書(2026年7月版)に基づく解説です。システムは一次スクリーニングであり、最終判定と責任は人間の審査担当者にあります。

← AI審査アルゴリズムトップへ