線を引く責任 ── アンカー先行・人手確認・非懲罰育成

三人の判定が確定した翌週、結衣は澪に呼ばれた。机の上には四つの封筒。樋口に不合格、南に条件付き合格、和田に当確。「結衣さん、いつかあなたが、この封筒を書く側に回る。今日はその練習」。澪はそう言って、まだ宛名のない一枚を結衣の前に置いた。「線を引くって、どういうことか分かる?」

床はどこにある ── アンカー先行

結衣は素朴な疑問をぶつけた。「樋口さんが不合格で和田さんが当確。それって澪さんの感覚ですよね? 別の人が審査したら逆になりませんか?」

澪は少し嬉しそうだった。いい問いだ、と。「もしこの判定が私の気分なら、制度じゃなくてただの好き嫌い。だから当確ラインには、運用を始める前に必ず一つやることがある」

澪が説明したのはアンカー先行だ。アンカー(=錨)とは、合否の床をどこに置くかを固定する見本のこと。「実物の資材を何件か選んで、危険なもの・安全なもの・判断が割れるものを混ぜる。それを審査者みんなで先に見て、『これは拾えて当然』『これは見逃したらアウト』と目線を合わせておく。校正(=ものさしの目盛り合わせ)を済ませた見本、それが錨」

体重計を思い出して。新品の体重計でも、まず0kgで針を合わせる。合わせないまま測った50kgは、本当に50kgか分からない。アンカー先行は、人の判断という体重計をゼロ点調整する作業。

「この校正を先にやって初めて、国籍が違っても、部門が違っても、同じ『50kg』が同じ50kgになる。錨を打たずに各自が測ったら、東京の不合格が大阪では合格になる。それは基準じゃない」

AIは下書き、判は人が押す ── 人手確認

結衣はもう一つ気になっていた。審査室には半年前から、資材の問題箇所に下線を引く支援ツールが入っている。「あれが『危険あり』と出したら、もう機械が決めてるのと同じでは?」

澪は首を振った。「ツールが出すのは見立て。お医者さんで言えば、健康診断の自動診断コメント。『要精密検査』とは出るけど、病名を確定して治療方針を決めるのは医師でしょう」

①

AIの役割

下書きの見立て。怪しい箇所に当たりをつけ、見落としを減らす。速い。疲れない。だが「なぜ危険か」の重みは測れない。

②

人の役割

最後の判断。この表現が医療者の処方をどう動かすか、害の非対称性まで含めて決める。署名する責任を負う。

「樋口さんの弱点を覚えてる? 説明はうまいのに、危険を見つける力が弱かった。もしツールの見立てを鵜呑みにする人ばかりなら、樋口さんとツールの組は『説明できて検知も出る』完璧に見えてしまう。でも検知の責任をツールに肩代わりさせた瞬間、誰も害の重みを引き受けていない」

澪の声が少し低くなった。「判を押すのは人。これは効率の話じゃない。誰が責任を負うかの話」

四つの区分は烙印じゃない ── 非懲罰育成

結衣は不合格の封筒を見て、つい眉をひそめた。「樋口さん、落ち込みますよね……」

「そこを間違えないで」。澪は四つの封筒を扇のように広げた。「不合格・条件付き合格・当確・高位当確。この四区分は、人の優劣のランクじゃない。次に何を伸ばすかの道しるべ。健康診断の結果と同じ。『要再検査』は人格の否定じゃなくて、どこをケアすべきかの地図でしょう」

区分	烙印として読むと	道しるべとして読むと
不合格	「ダメな人」	検知力を鍛え直す育成へ
条件付き合格	「半人前」	監督付きで実物の経験を積む段階
当確	「優秀」	独立して任せ、後進を見る役割へ

「罰として渡すと、人は次から欠点を隠す。隠されたら危険は見えなくなる。それが一番こわい。だから当確ラインは懲罰の道具にしない。落ちた人ほど、伸びしろの地図を丁寧に渡す」

三人の地図

澪は一枚ずつ、育成計画を結衣に読ませた。

樋口。弁が立ち、場を制する力は本物。だが危険を拾う感度が低い。再育成では説明役を一度外し、和田の隣で「実物の資材から危ない一行を探す」訓練だけを積む。「彼の説明力は、検知力が育った後に最大の武器になる。順番が逆だっただけ」

南。問題類型はすべて言える理論家。けれど目の前の実物では拾えない、いわば机上の検知だった。条件付き合格として、当確者の監督のもとで実物審査を重ねる。「知識と現場をつなぐ橋を、本人の手で架けてもらう。半年後に再判定」

和田。地味で目立たないが、実物で危険を拾える本物の検知力を持つ。当確、独立審査者として認める。「そして次は、和田さんが結衣さんに錨の見本を見せる側になる」

覚えておいて。線を引く責任は、落とすことじゃない。落ちた人が次に立ち上がる足場まで一緒に描くこと。足場を描けないなら、線を引く資格はまだない。

宛名のない封筒

結衣は、机に残ったままの空白の封筒に気づいた。「これは……?」

「いつかあなたが書く封筒。誰かに渡す日が来る」。澪は窓の外を見た。「そのとき思い出して。錨を先に打つこと。判は人が押すこと。区分は道しるべであって烙印じゃないこと。この三つを忘れた線引きは、ただの権力になる」

結衣は空白の封筒を両手で受け取った。重さはほとんどない。けれど、第三回で初めて樋口に会った日から、第九回で三人の判定が確定した日まで歩いてきた道のりが、その軽い紙の中に畳まれている気がした。

「やってみます」。結衣はそう答えた。澪は小さくうなずき、四つの封筒を引き出しにしまった。当確ラインは、こうして次の一人へ手渡される。

当確ライン（合否判定基準） ── 全 10 回の地図

第 1 回: この線が引くもの ── 「資材」ではなく「審査者」の合否線 ── 当確ライン=「この人になら資材チェックを一人で任せていい」と言える合格水準のこと。第2シリーズ第1回。合否を平均点で決めてはいけない理由を入り口として説明する。
第 2 回: 害の非対称性 ── 見逃しは過検出より桁違いに重い ── なぜ平均で線を引いてはならないかその1。見逃しと過検出の害は釣り合わない
第 3 回: 相互補償の罠 ── 雄弁がリスク検知の欠落を覆い隠す ── 説明も人付き合いも抜群にうまい審査担当者が、危険を見つける力（リスク検知力）だけ弱い。点数を平均すれば合格に届く。でも、危険に気づけないのに話がうまい人は、その説得力で危ういものを通してしまう。なぜ平均点で合否を決めてはいけないのか。会社の実例Aでやさしく解く。
第 4 回: 床と総合点を分ける ── 非代償ゲートと加重総合点 ── 合否は「最低ライン(床)」で決め、点数の合計は順位づけだけに使う。最低ラインを一つでも下回れば、合計点が満点でも不合格。これが合格ラインの動かない約束ごと。
第 5 回: 検知の床を最も高く ── リスク検知力という存在理由 ── 資材審査(製薬会社が医師向けの宣伝資料を世に出す前に点検する仕事)が存在する理由は、危ない箇所を見つけることにある。だから八つの能力のうち、危険を見抜く力(リスク検知力)に求める最低ラインだけを一番高くする。一人で審査を任せてよい合格(当確)には、上から二番目の段階L3と、実物で見抜ける広さ2以上が要る。一つ下のL2で止まる人は、いちばん危ない資料こそ素通りさせてしまう。
第 6 回: 二軸で床を定める ── 机上の検知を独立させない ── 検知の合格ラインは点数一つでは引けない。「どれだけ語れるか」と「目の前の実物で拾えるか」の二つのものさしで引く。教科書だけの目利きは、点数上はL3に見えても一人前として通さない。
第 7 回: 校正を独立の門に ── 過信は独立の失格事由 ── 「自分の見る力を、正しく見積もれているか」を問う関門(校正ゲートG2)の話。一人で審査を任せるとは、後ろで誰も確認しないということ。自分の検知力を実際より高く思い込む人(乖離Δが+2以上)は、自分の見落としに気づかないまま危ないものを通してしまう。このズレ(Δ)は腕前そのものではないが、独りで任せてよいかを分ける。
第 8 回: 四段ゲート G0–G4 ── 早期棄却の論理 ── 合否は四つの関門を順番に通して決まる。手前の関門で落ちた人を、後ろの関門でわざわざ測り直すことはしない。他の長所では埋め合わせできない最低ライン(=床)があり、最後の合計点は合否をひっくり返さない。
第 9 回: 三人のプロファイル ── 同じ線がどう振り分けるか ── 雄弁な伝道師・机上の理論家・本道のL3。同じ合格ラインが三人をどこへ送るか
第 10 回 (本回): 線を引く責任 ── アンカー先行・人手確認・非懲罰育成 ── 合格ラインを「現場で本当に使える基準」に変える最終回。お手本のそろった見本帳があって初めて、線はみんな共通のものさしになる。「合格・不合格」の4区分は落第の烙印ではなく、次に何を伸ばすかを示す道しるべ。AIはまず下書きの見立て、最後の判断は人間がする。

結語

当確ラインは、最後に三つの仕掛けで現場の基準になる。運用前に見本事案で目線を合わせるアンカー先行。機械の見立てを下書きに留め、最後は人が判を押す人手確認。そして四区分を罰ではなく次の足場として渡す非懲罰育成。この三つが揃って初めて、判定は個人の好き嫌いを超え、誰が審査しても同じ床を共有できる。

樋口・南・和田の三人は、優劣で並べられたのではない。それぞれが次にどこを伸ばすかの地図を手にして、別々の道を歩き始めた。線を引く者の責任とは、落とすことではなく、落ちた人の立ち上がる足場まで描ききることだった。

Key Points ── 持ち帰る 3 つ

アンカー先行 ── 床の実体は運用前にレビュアー間で校正した見本事案で固定する。これで初めて国籍・部門を越えた共通基準になる。校正なきものさしは個人の感覚にすぎない。
人手確認 ── AIが出すのは怪しい箇所の見立て(下書き)まで。害の重みを測り、署名して責任を負う最後の判断は人間が担う。検知の責任を機械に肩代わりさせない。
非懲罰育成 ── 不合格/条件付き/当確/高位当確の4区分は烙印ではなく、次に何を伸ばすかの道しるべ。罰にすると人は欠点を隠し、危険が見えなくなる。落ちた人ほど足場の地図を丁寧に渡す。

出典・参考文献

Angoff, W. H. Scales, Norms, and Equivalent Scores. American Council on Education, 1971.（合格基準設定（standard setting）の古典。閾値を専門家合意で接地する考え方の源流）
Messick, S. Validity. In Educational Measurement (3rd ed.). Macmillan, 1989.（判定の妥当性と帰結的妥当性。異議・透明性の理論的背景）
Cizek, G. J. & Bunch, M. B. Standard Setting: A Guide to Establishing and Evaluating Performance Standards on Tests. Sage, 2007.（アンカー・カットスコアの設定と再校正の実務）
Spencer, L. M. & Spencer, S. M. Competence at Work: Models for Superior Performance. Wiley, 1993.（コンピテンシー判定と育成接続の基盤）
Swets, J. A., Dawes, R. M. & Monahan, J. Psychological Science Can Improve Diagnostic Decisions. Psychological Science in the Public Interest, 2000.（感度・特異度と見逃し／過検出の非対称な扱い）

← 当確ライン（合否判定基準）一覧に戻る