三人の判定が確定した翌週、結衣は澪に呼ばれた。机の上には四つの封筒。樋口に不合格、南に条件付き合格、和田に当確。「結衣さん、いつかあなたが、この封筒を書く側に回る。今日はその練習」。澪はそう言って、まだ宛名のない一枚を結衣の前に置いた。「線を引くって、どういうことか分かる?」

床はどこにある ── アンカー先行

結衣は素朴な疑問をぶつけた。「樋口さんが不合格で和田さんが当確。それって澪さんの感覚ですよね? 別の人が審査したら逆になりませんか?」

澪は少し嬉しそうだった。いい問いだ、と。「もしこの判定が私の気分なら、制度じゃなくてただの好き嫌い。だから当確ラインには、運用を始める前に必ず一つやることがある」

澪が説明したのはアンカー先行だ。アンカー(=錨)とは、合否の床をどこに置くかを固定する見本のこと。「実物の資材を何件か選んで、危険なもの・安全なもの・判断が割れるものを混ぜる。それを審査者みんなで先に見て、『これは拾えて当然』『これは見逃したらアウト』と目線を合わせておく。校正(=ものさしの目盛り合わせ)を済ませた見本、それが錨」

体重計を思い出して。新品の体重計でも、まず0kgで針を合わせる。合わせないまま測った50kgは、本当に50kgか分からない。アンカー先行は、人の判断という体重計をゼロ点調整する作業。

「この校正を先にやって初めて、国籍が違っても、部門が違っても、同じ『50kg』が同じ50kgになる。錨を打たずに各自が測ったら、東京の不合格が大阪では合格になる。それは基準じゃない」

AIは下書き、判は人が押す ── 人手確認

結衣はもう一つ気になっていた。審査室には半年前から、資材の問題箇所に下線を引く支援ツールが入っている。「あれが『危険あり』と出したら、もう機械が決めてるのと同じでは?」

澪は首を振った。「ツールが出すのは見立て。お医者さんで言えば、健康診断の自動診断コメント。『要精密検査』とは出るけど、病名を確定して治療方針を決めるのは医師でしょう」

AIの役割

下書きの見立て。怪しい箇所に当たりをつけ、見落としを減らす。速い。疲れない。だが「なぜ危険か」の重みは測れない。

人の役割

最後の判断。この表現が医療者の処方をどう動かすか、害の非対称性まで含めて決める。署名する責任を負う。

「樋口さんの弱点を覚えてる? 説明はうまいのに、危険を見つける力が弱かった。もしツールの見立てを鵜呑みにする人ばかりなら、樋口さんとツールの組は『説明できて検知も出る』完璧に見えてしまう。でも検知の責任をツールに肩代わりさせた瞬間、誰も害の重みを引き受けていない」

澪の声が少し低くなった。「判を押すのは人。これは効率の話じゃない。誰が責任を負うかの話」

四つの区分は烙印じゃない ── 非懲罰育成

結衣は不合格の封筒を見て、つい眉をひそめた。「樋口さん、落ち込みますよね……」

「そこを間違えないで」。澪は四つの封筒を扇のように広げた。「不合格・条件付き合格・当確・高位当確。この四区分は、人の優劣のランクじゃない。次に何を伸ばすかの道しるべ。健康診断の結果と同じ。『要再検査』は人格の否定じゃなくて、どこをケアすべきかの地図でしょう」

区分烙印として読むと道しるべとして読むと
不合格「ダメな人」検知力を鍛え直す育成へ
条件付き合格「半人前」監督付きで実物の経験を積む段階
当確「優秀」独立して任せ、後進を見る役割へ

「罰として渡すと、人は次から欠点を隠す。隠されたら危険は見えなくなる。それが一番こわい。だから当確ラインは懲罰の道具にしない。落ちた人ほど、伸びしろの地図を丁寧に渡す」

三人の地図

澪は一枚ずつ、育成計画を結衣に読ませた。

樋口。弁が立ち、場を制する力は本物。だが危険を拾う感度が低い。再育成では説明役を一度外し、和田の隣で「実物の資材から危ない一行を探す」訓練だけを積む。「彼の説明力は、検知力が育った後に最大の武器になる。順番が逆だっただけ」

。問題類型はすべて言える理論家。けれど目の前の実物では拾えない、いわば机上の検知だった。条件付き合格として、当確者の監督のもとで実物審査を重ねる。「知識と現場をつなぐ橋を、本人の手で架けてもらう。半年後に再判定」

和田。地味で目立たないが、実物で危険を拾える本物の検知力を持つ。当確、独立審査者として認める。「そして次は、和田さんが結衣さんに錨の見本を見せる側になる」

覚えておいて。線を引く責任は、落とすことじゃない。落ちた人が次に立ち上がる足場まで一緒に描くこと。足場を描けないなら、線を引く資格はまだない。

宛名のない封筒

結衣は、机に残ったままの空白の封筒に気づいた。「これは……?」

「いつかあなたが書く封筒。誰かに渡す日が来る」。澪は窓の外を見た。「そのとき思い出して。錨を先に打つこと。判は人が押すこと。区分は道しるべであって烙印じゃないこと。この三つを忘れた線引きは、ただの権力になる」

結衣は空白の封筒を両手で受け取った。重さはほとんどない。けれど、第三回で初めて樋口に会った日から、第九回で三人の判定が確定した日まで歩いてきた道のりが、その軽い紙の中に畳まれている気がした。

「やってみます」。結衣はそう答えた。澪は小さくうなずき、四つの封筒を引き出しにしまった。当確ラインは、こうして次の一人へ手渡される。

当確ライン(合否判定基準) ── 全 10 回の地図

  1. 第 1 回: この線が引くもの ── 「資材」ではなく「審査者」の合否線 ── 当確ライン=「この人になら資材チェックを一人で任せていい」と言える合格水準のこと。第2シリーズ第1回。合否を平均点で決めてはいけない理由を入り口として説明する。
  2. 第 2 回: 害の非対称性 ── 見逃しは過検出より桁違いに重い ── なぜ平均で線を引いてはならないか その1。見逃しと過検出の害は釣り合わない
  3. 第 3 回: 相互補償の罠 ── 雄弁がリスク検知の欠落を覆い隠す ── 説明も人付き合いも抜群にうまい審査担当者が、危険を見つける力(リスク検知力)だけ弱い。点数を平均すれば合格に届く。でも、危険に気づけないのに話がうまい人は、その説得力で危ういものを通してしまう。なぜ平均点で合否を決めてはいけないのか。会社の実例Aでやさしく解く。
  4. 第 4 回: 床と総合点を分ける ── 非代償ゲートと加重総合点 ── 合否は「最低ライン(床)」で決め、点数の合計は順位づけだけに使う。最低ラインを一つでも下回れば、合計点が満点でも不合格。これが合格ラインの動かない約束ごと。
  5. 第 5 回: 検知の床を最も高く ── リスク検知力という存在理由 ── 資材審査(製薬会社が医師向けの宣伝資料を世に出す前に点検する仕事)が存在する理由は、危ない箇所を見つけることにある。だから八つの能力のうち、危険を見抜く力(リスク検知力)に求める最低ラインだけを一番高くする。一人で審査を任せてよい合格(当確)には、上から二番目の段階L3と、実物で見抜ける広さ2以上が要る。一つ下のL2で止まる人は、いちばん危ない資料こそ素通りさせてしまう。
  6. 第 6 回: 二軸で床を定める ── 机上の検知を独立させない ── 検知の合格ラインは点数一つでは引けない。「どれだけ語れるか」と「目の前の実物で拾えるか」の二つのものさしで引く。教科書だけの目利きは、点数上はL3に見えても一人前として通さない。
  7. 第 7 回: 校正を独立の門に ── 過信は独立の失格事由 ── 「自分の見る力を、正しく見積もれているか」を問う関門(校正ゲートG2)の話。一人で審査を任せるとは、後ろで誰も確認しないということ。自分の検知力を実際より高く思い込む人(乖離Δが+2以上)は、自分の見落としに気づかないまま危ないものを通してしまう。このズレ(Δ)は腕前そのものではないが、独りで任せてよいかを分ける。
  8. 第 8 回: 四段ゲート G0–G4 ── 早期棄却の論理 ── 合否は四つの関門を順番に通して決まる。手前の関門で落ちた人を、後ろの関門でわざわざ測り直すことはしない。他の長所では埋め合わせできない最低ライン(=床)があり、最後の合計点は合否をひっくり返さない。
  9. 第 9 回: 三人のプロファイル ── 同じ線がどう振り分けるか ── 雄弁な伝道師・机上の理論家・本道のL3。同じ合格ラインが三人をどこへ送るか
  10. 第 10 回 (本回): 線を引く責任 ── アンカー先行・人手確認・非懲罰育成 ── 合格ラインを「現場で本当に使える基準」に変える最終回。お手本のそろった見本帳があって初めて、線はみんな共通のものさしになる。「合格・不合格」の4区分は落第の烙印ではなく、次に何を伸ばすかを示す道しるべ。AIはまず下書きの見立て、最後の判断は人間がする。
結語

当確ラインは、最後に三つの仕掛けで現場の基準になる。運用前に見本事案で目線を合わせるアンカー先行。機械の見立てを下書きに留め、最後は人が判を押す人手確認。そして四区分を罰ではなく次の足場として渡す非懲罰育成。この三つが揃って初めて、判定は個人の好き嫌いを超え、誰が審査しても同じ床を共有できる。

樋口・南・和田の三人は、優劣で並べられたのではない。それぞれが次にどこを伸ばすかの地図を手にして、別々の道を歩き始めた。線を引く者の責任とは、落とすことではなく、落ちた人の立ち上がる足場まで描ききることだった。

Key Points ── 持ち帰る 3 つ
  1. アンカー先行 ── 床の実体は運用前にレビュアー間で校正した見本事案で固定する。これで初めて国籍・部門を越えた共通基準になる。校正なきものさしは個人の感覚にすぎない。
  2. 人手確認 ── AIが出すのは怪しい箇所の見立て(下書き)まで。害の重みを測り、署名して責任を負う最後の判断は人間が担う。検知の責任を機械に肩代わりさせない。
  3. 非懲罰育成 ── 不合格/条件付き/当確/高位当確の4区分は烙印ではなく、次に何を伸ばすかの道しるべ。罰にすると人は欠点を隠し、危険が見えなくなる。落ちた人ほど足場の地図を丁寧に渡す。
出典・参考文献
    \n
  1. Angoff, W. H. Scales, Norms, and Equivalent Scores. American Council on Education, 1971.(合格基準設定(standard setting)の古典。閾値を専門家合意で接地する考え方の源流)
  2. \n
  3. Messick, S. Validity. In Educational Measurement (3rd ed.). Macmillan, 1989.(判定の妥当性と帰結的妥当性。異議・透明性の理論的背景)
  4. \n
  5. Cizek, G. J. & Bunch, M. B. Standard Setting: A Guide to Establishing and Evaluating Performance Standards on Tests. Sage, 2007.(アンカー・カットスコアの設定と再校正の実務)
  6. \n
  7. Spencer, L. M. & Spencer, S. M. Competence at Work: Models for Superior Performance. Wiley, 1993.(コンピテンシー判定と育成接続の基盤)
  8. \n
  9. Swets, J. A., Dawes, R. M. & Monahan, J. Psychological Science Can Improve Diagnostic Decisions. Psychological Science in the Public Interest, 2000.(感度・特異度と見逃し/過検出の非対称な扱い)