結衣は審査卓に四枚の資材を積んだまま、ペンを宙で止めていた。「この人、説明はうまいんです。でも危ない箇所は素通り。逆にこっちの人は、危険は拾うけど説明がたどたどしくて。どっちを上に置けばいいのか、もう順番がぐちゃぐちゃで」。澪は手を止めずに言った。「順番から決めるから迷う。当確ラインは、足し算じゃない。落ちる順に並べた四つの門を、上から通すだけ」。

審査室に持ち込まれた「合計点」の罠

その朝、結衣は自分なりの採点表を作ってきた。説明力10点、知識10点、検知力10点、丁寧さ10点。四項目を足して合計点で並べる。樋口は説明と丁寧さが満点近く、合計は高い。和田は説明が低く、合計は中の下。表の上では、説明の名手である樋口が一番上に来ていた。

澪はその表を一目見て、ペンで樋口の名を指した。「この人、ある循環器領域の治療薬の説明資材で、効果を断定しすぎた一文を見落としたわよね。第3回のときの」。結衣はうなずく。「でも他が満点に近いので、合計では一番でした」。

「そこが罠なの。合計点は、致命傷を高得点で埋め合わせられると思い込む足し算。でも資材審査の失敗は、足し算で取り返せない。一つの見落としが、患者に届く資料を一枚通してしまう」

害の非対称——うまく説明できなかった損は、後でやり直せる。危険を見落とした損は、世に出てから取り返せない。だから当確ラインは合計点をいきなり出さない。落ちる順に門を並べ、上から順に通す。前の門で落ちた人は、次の門の採点すらしない。

空港の保安検査と同じ順番

澪はホワイトボードに、空港の保安検査場を描いた。搭乗ゲートまでの間に、いくつもの関所が一列に並んでいる。「考えてみて。保安検査でナイフが見つかった人に、『でもこの人、搭乗手続きは完璧でしたから通しましょう』とは言わないでしょう」。

結衣は笑った。「言いません。手続きが完璧でも、危険物があれば止めます」。

「当確ラインも同じ。前の関所で落ちたら、後ろの関所は評価しない。説明の上手さは搭乗手続き。検知力は保安検査。順番が違えば、意味が変わる」

四つの門には名前がある。G0からG4。Gはゲート、門のこと。番号が小さいほど手前にあり、手前で落ちれば奥は見ない。澪は番号を順に書き出した。「G0で土台を確かめ、G1で絶対に外せない床を見て、G2で自己評価のズレを測り、G3で検知が机上か実物かを分け、最後にG4でようやく総合点。でもG4は順位をつけるだけ。合否は、もっと手前で決まっている」。

四つの門を、手前から

結衣は門を一つずつ確かめた。澪はそのたびに、四人の誰かを例に挙げた。

G0 成立判定

そもそも測れているか。すべての評価軸(床次元)で、判定の信頼度Cが最低ラインC_min以上あるか。観察した資材が少なすぎて確信が持てなければ、ここで「判定保留」。落とすのでも通すのでもなく、まだ採点に入らない。

G1 絶対床

外したら一発で不合格になる座標床。一つでも欠ければ再育成へ。他の項目がどれだけ高くても代償(埋め合わせ)はきかない。保安検査のナイフと同じ。

G2 校正

自己評価と実力のズレΔ(=自分の見立てと実際の差)。検知の自信が実力より過剰、つまりΔが+2以上なら、独立審査は不可。危険を見落としたのに「大丈夫」と思い込む人を、一人にはできない。

G3 片翼

検知が机上だけか、実物で拾えるか。理屈で危険類型を語れても実物資材で拾えない「机上の検知」なら独立不可。逆に拾いすぎ(過検出)は合格、ただし要改善。

「そして最後の門」と澪。「G4 総合区分。ここまでの床を全部通った人だけを、加重総合点で並べる。でもこれが決めるのは区分と育成順位だけ。合否は決めない。合否はもう、G1からG3で済んでいるから」。

なぜ前で落ちたら後ろを見ないのか

結衣がまだ腑に落ちない顔をしていた。「でも、G1で落ちた樋口さんも、G4の総合点を出してあげれば、本人が納得しやすいんじゃ」。

澪は首を振った。「逆。総合点を見せると、本人も周りも『あと数点で届いた』と錯覚する。代償できない床を、足し算で埋められると思わせてしまう。だから前段で落ちたら、後段は計算もしない」。

何を見るか落ちたら
G0 成立各軸で信頼度C≥C_min判定保留(採点に入らない)観察量不足
G1 絶対床外せない座標床不合格・再育成(代償不可)樋口
G2 校正自己評価のズレΔΔ≥+2で独立不可過信型
G3 片翼机上か実物か机上の検知は独立不可/過検出は合格・要改善
G4 総合床通過者の加重総合点区分・育成順位のみ(合否は決めない)和田ほか

「健康診断を思い出して」と澪。「ある一項目が危険域なら、他が全部正常でも『精密検査へ』。総合スコアで割り引いたりしない。命に関わる項目は、平均に溶かさない」。結衣の採点表で一番上だった樋口は、この並べ方ではG1で止まる。総合点の出番すら来ない。

順番が、判定そのものだった

結衣は自分の合計点の表を、静かに裏返した。代わりに四つの門を縦に並べ、樋口、南、和田を上から通してみる。樋口はG1で止まった。南はG1とG2を抜け、G3の机上で止まった。和田はG3まで通り、G4の総合へ進んだ。

「分かった気がします。私はずっと、誰が一番優秀かを採点していた。でも当確ラインが聞いていたのは、誰を一人にして安全か、だった。質問が違うと、並べ方が変わる」

澪はうなずいて、ボードのG4にだけ丸をつけ、それから線で消した。「最後の総合点が一番えらく見えるけど、合否はそこじゃない。手前の床で、もう決まってる。G4は、通った人の育てる順番を決めるだけ」。
三人の判定は、次の回でそれぞれの門の前に立つ。誰がどの門で止まり、誰が抜けるか——並べ替えた表が、もう答えを指していた。

当確ライン(合否判定基準) ── 全 10 回の地図

  1. 第 1 回: この線が引くもの ── 「資材」ではなく「審査者」の合否線 ── 当確ライン=「この人になら資材チェックを一人で任せていい」と言える合格水準のこと。第2シリーズ第1回。合否を平均点で決めてはいけない理由を入り口として説明する。
  2. 第 2 回: 害の非対称性 ── 見逃しは過検出より桁違いに重い ── なぜ平均で線を引いてはならないか その1。見逃しと過検出の害は釣り合わない
  3. 第 3 回: 相互補償の罠 ── 雄弁がリスク検知の欠落を覆い隠す ── 説明も人付き合いも抜群にうまい審査担当者が、危険を見つける力(リスク検知力)だけ弱い。点数を平均すれば合格に届く。でも、危険に気づけないのに話がうまい人は、その説得力で危ういものを通してしまう。なぜ平均点で合否を決めてはいけないのか。会社の実例Aでやさしく解く。
  4. 第 4 回: 床と総合点を分ける ── 非代償ゲートと加重総合点 ── 合否は「最低ライン(床)」で決め、点数の合計は順位づけだけに使う。最低ラインを一つでも下回れば、合計点が満点でも不合格。これが合格ラインの動かない約束ごと。
  5. 第 5 回: 検知の床を最も高く ── リスク検知力という存在理由 ── 資材審査(製薬会社が医師向けの宣伝資料を世に出す前に点検する仕事)が存在する理由は、危ない箇所を見つけることにある。だから八つの能力のうち、危険を見抜く力(リスク検知力)に求める最低ラインだけを一番高くする。一人で審査を任せてよい合格(当確)には、上から二番目の段階L3と、実物で見抜ける広さ2以上が要る。一つ下のL2で止まる人は、いちばん危ない資料こそ素通りさせてしまう。
  6. 第 6 回: 二軸で床を定める ── 机上の検知を独立させない ── 検知の合格ラインは点数一つでは引けない。「どれだけ語れるか」と「目の前の実物で拾えるか」の二つのものさしで引く。教科書だけの目利きは、点数上はL3に見えても一人前として通さない。
  7. 第 7 回: 校正を独立の門に ── 過信は独立の失格事由 ── 「自分の見る力を、正しく見積もれているか」を問う関門(校正ゲートG2)の話。一人で審査を任せるとは、後ろで誰も確認しないということ。自分の検知力を実際より高く思い込む人(乖離Δが+2以上)は、自分の見落としに気づかないまま危ないものを通してしまう。このズレ(Δ)は腕前そのものではないが、独りで任せてよいかを分ける。
  8. 第 8 回 (本回): 四段ゲート G0–G4 ── 早期棄却の論理 ── 合否は四つの関門を順番に通して決まる。手前の関門で落ちた人を、後ろの関門でわざわざ測り直すことはしない。他の長所では埋め合わせできない最低ライン(=床)があり、最後の合計点は合否をひっくり返さない。
  9. 第 9 回: 三人のプロファイル ── 同じ線がどう振り分けるか ── 雄弁な伝道師・机上の理論家・本道のL3。同じ合格ラインが三人をどこへ送るか
  10. 第 10 回 (最終回): 線を引く責任 ── アンカー先行・人手確認・非懲罰育成 ── 合格ラインを「現場で本当に使える基準」に変える最終回。お手本のそろった見本帳があって初めて、線はみんな共通のものさしになる。「合格・不合格」の4区分は落第の烙印ではなく、次に何を伸ばすかを示す道しるべ。AIはまず下書きの見立て、最後の判断は人間がする。
結語

四段ゲートは、能力を足し合わせる仕組みではない。落ちる順に門を並べ、手前で止まった人の奥は測らない仕組みだ。説明の上手さも知識の深さも、絶対床を一つ欠いた瞬間に意味を失う。順番こそが、判定の中身だった。

次の回で、樋口・南・和田の三人がそれぞれの門の前に立つ。誰がどこで止まるか——四つの門を上から通せば、結論はもう見えている。

Key Points ── 持ち帰る 3 つ
  1. 要点1 判定は合計点ではなく、落ちる順に並べた四段の門(G0成立→G1絶対床→G2校正→G3片翼→G4総合)を手前から通す。前段で落ちれば後段は評価しない。
  2. 要点2 G1の絶対床は一つ欠ければ即不合格で代償不可、G2は自己評価のズレΔ≥+2で独立不可、G3は机上の検知なら独立不可(過検出は合格・要改善)。合否はG1〜G3で決まる。
  3. 要点3 最後のG4総合区分は床を全部通った人だけを加重総合点で並べるが、決めるのは区分と育成順位のみで合否は決めない。危険な見落としを高得点で埋め合わせさせないための順番設計。
出典・参考文献
  1. Angoff, W. H. Scales, Norms, and Equivalent Scores. American Council on Education, 1971. (アンカーに接地した合格点設定=当確ラインの校正思想の系譜)
  2. Cizek, G. J., & Bunch, M. B. Standard Setting: A Guide to Establishing and Evaluating Performance Standards on Tests. Sage, 2007. (非代償(conjunctive)合格基準と段階的判定の方法論)
  3. Macmillan, N. A., & Creelman, C. D. Detection Theory: A User's Guide. 2nd ed., Lawrence Erlbaum, 2005. (見逃しと過検出の非対称=感度/特異度を片翼ゲートの根拠に)
  4. Spencer, L. M., & Spencer, S. M. Competence at Work: Models for Superior Performance. Wiley, 1993. (8次元プロファイルとL水準の基盤)
  5. Messick, S. "Validity." In Educational Measurement (3rd ed.), American Council on Education/Macmillan, 1989. (閾値判定の妥当性と帰結を支える枠組み)