01規範の階層 L1〜L5
システムが根拠にできる規範は、あらかじめ五つの層に整理されている。L1は薬機法66・67・68条(66条=誇大広告の禁止、67条=特定疾病用医薬品の広告制限、68条=未承認医薬品の広告禁止)。L2は医薬品等適正広告基準。L3は販売情報提供活動ガイドラインとそのQ&A。L4は製薬協コードと製品情報概要等の作成要領。L5は社会の目、つまり明文の規範ではなく世間の批判的視線である。層の順序は法的な強弱の序列ではない。L1は法律で法的拘束力を持つ。L2・L3はいずれも厚労省の通知(=行政指導。法律そのものではない)、L4は業界の自主規範であり、並びは発出主体の公的性格(国→業界)による整理である。L5は明文規範の外に置く。すべての指摘はこのどれかの層に紐づく。「なんとなく問題」という層のない指摘は、この仕組みの中に居場所がない。
02判定の語彙は固定されている
判定の呼び方も自由記述ではない。法的な判定はBLACK(=明確な違反)/GRAY3/GRAY2/GRAY1(=灰色。数字が大きいほど違反の疑いが濃い)/WHITE(=問題なし)の五段階。社会の目の判定はALERT-3/ALERT-2/ALERT-1(=警告。数字が大きいほど重い)/CLEAR(=懸念なし)の四段階。この語彙は型(=プログラム上のデータの決まった形)で固定されており、この値域の外にある判定は生成そのものができない。「やや懸念」「おおむね問題なし」のような曖昧な判定文をLLMが書こうとしても、型が受け取りを拒否する。判定語彙を固定するのは、後で人間が指摘を並べ替え、比較し、集計できるようにするためだ。
03二レーン制 ── 法と社会の目を混ぜない
一つの指摘は、法的レーン(BLACK〜WHITE)か社会の目レーン(ALERT〜CLEAR)か、必ずどちらか一方だけに属する。両方を持つ指摘も、どちらも持たない指摘も、生成時点で拒否される。序列の比較も同一レーンの中でしか行わない。GRAY2とALERT-2のどちらが重いか、という比較は仕組みの上で不可能にしてある。法的違反と社会的懸念は根拠も出口も違うからだ。取り扱いも分かれる。ALERT-2以上は人間の審査担当者へ、最も重いALERT-3は経営層へ届ける。ただし社会の目レーンが資材を直接差し止めることはない。
04リスク類型 R1〜R8
指摘の中身は八つの類型に分類される。R1承認範囲逸脱、R2安全性矮小化(=副作用などの危険を実際より軽く見せること)、R3誇大(明示)、R4誇大(暗示)、R5比較誹謗(=他剤をおとしめる比較)、R6エビデンス不正(=根拠データの不適切な使い方)、R7体裁欠落(=必須の記載が無いこと)、R8社会倫理。層(L1〜L5)が「どの規範に照らしたか」を示すのに対し、類型は「何をやらかしたか」を示す。二つの軸が揃って、指摘は初めて分類として完結する。
05決定的照合とLLM意味判定の二本立て
検査の方法は二本立てである。語・数値・構造の照合はコードで行う。NG語が含まれるか。グラフの軸がゼロから始まっているか。必須記載が欠けていないか。これらは同一入力なら同一出力が100%保証される「決定的照合」だ。一方、含意・印象・暗示の判定だけをLLMに任せる。事実の羅列でも並べ方で誤った印象を与えていないか、という問いはコードでは書けないからだ。逆に、計算や数え上げはLLMに任せない。検査の最小単位である原子項目(=一つずつ独立に検査できる最小のチェック項目)は694項目ある。その約半分が決定的照合、約半分がLLMの意味判定で処理され、残りの少数は画像検査とペルソナ検査(後述の社会の目)に回る。迷わない部分を安いコードで確定し、迷う部分にだけ高価なLLMを使う分業である。
06基準資料 ── 承認事実の三点セット
資材の主張を何と突き合わせるか。基準資料は三つある。第一に電子添文(=医薬品の公式な説明文書)。承認範囲を判定する基準原本であり、資材はこの記載の範囲を一字も超えてはならない。第二に審査報告書。承認時に規制当局が何を評価し、何を認めなかったかの記録である。機構(=医薬品医療機器総合機構。承認審査を行う当局)が有効性を認めなかった項目を、資材が有効であるかのように示唆していないかを見る。第三にRMP(=市販後の安全対策計画)。市販後に注意すべきリスクの一覧であり、そのリスクが資材に反映されているかを検査する。三者は補完関係にある。電子添文が「何を言ってよいか」、審査報告書が「なぜそう承認されたか」、RMPが「売った後に何を警戒するか」を定める。
07検証可能性の型強制 ── 根拠なき指摘は存在できない
すべての指摘には、規範原文への参照と原子項目のIDが必須である。これは運用ルールではなく、データの型に組み込まれた強制だ。根拠の欠けた指摘は、生成しようとした瞬間にエラーとなって消える。第三者(当局・弁護士・記者)が「なぜその判定か」と問うたとき、必ず規範の原文まで遡って答えられる。この一点が、機械の指摘を人間の審査に使ってよい最低条件だと考えている。この強制が審査の流れのどの時点で働くかは、次稿(process)で扱う。
08社会の目 ── 8ペルソナ
明文の規範に照らす検査とは別に、資材全体を八つの視点で通読する検査がある。患者、家族、医療者、メディア、SNS、投資家、監督官庁、弁護士。それぞれの立場から見て、この資材は批判に耐えるか。明文違反の一歩手前にある倫理・品位・患者の権利の問題は、この視点でしか捕まらない。八つの視点は無理に懸念をひねり出すことはせず、見つかったものだけをALERTとして社会の目レーンに載せる。
09合議 ── 60名の仮想審査
重要な判定は、一つのLLMの一存では決めない。仮想審査(=AIに異なる専門家の役を演じさせた模擬審査)を二段で行う。まずディベート30名。製薬会社の審査経験者、添付文書の専門家、広告規制の弁護士の三団体(各10名、計30名)が、修正すべき論拠と反論の両方を必ず出し、少数意見を明示する。次に多数決30名。規制当局を模した三団体(こちらも各10名)が争点ごとに投票し、30票中の過半で「修正要」の候補判定となる。合わせて60名。作る者(指摘を出したエンジン)と検収する者(合議)を分けているのは、自分の出した指摘を自分で承認させないためだ。全員一致に見える結論ほど疑う設計であり、割れた争点だけでなく、全員一致に見える争点も人間審査に回す。合議が下すのは修正要否の候補判定までで、最終判定と責任は人間の審査担当者に残る。合議は一次スクリーニングの精度を上げる部品であって、人間の代わりではない。