結衣の机に、一枚の判定資料が置かれていた。名前のない採点表。点数が並んでいるのに、合計欄も平均欄も、なぜか黒く塗りつぶされている。「これ、計算ミスですか?」と結衣が聞くと、澪は資料から目を上げずに言った。「ミスじゃない。あえて消したの。当確ラインは、平均で人を決めないから」

塗りつぶされた平均欄

入職して二年目の春、結衣は初めて「当確ライン」と書かれた青いファイルを手渡された。中身は、資材審査室が独立審査者を選ぶときの判定記録だ。資材というのは、製薬会社が医師や薬剤師に渡す宣伝資料のこと。効能の説明、グラフ、副作用の注意書き。その一枚一枚を、誰かが世に出る前に審査する。

結衣がめくった記録には、ある審査候補者の採点が項目ごとに並んでいた。説明力、知識量、検知力。点数は高い列もあれば、低い列もある。普通なら合計を出し、平均を取り、ある線を越えたら合格——そう考えるのが自然だ。だが平均欄は墨で消されていた。

「澪さん、これ平均を出せば一発で順位がつくのに、なんで消してあるんですか」。結衣の素朴な問いに、澪はようやく顔を上げた。「いい質問。そこがこの制度の入口」

運転免許に、平均点はない

澪はホワイトボードに横線を一本引いた。「想像して。自動車の運転免許。学科は満点、車庫入れも完璧。でも赤信号を一度だけ見落とす人がいる。この人に、免許を出す?」

結衣は少し考えて、首を振った。「出せないです。一回でも信号無視したら、事故が起きるから」

「そう。免許の試験は、得意科目で苦手科目を埋める足し算じゃないの。『絶対にやってはいけないこと』が一つでもあれば、他がどれだけ満点でも不合格。当確ラインも同じ。私たちが見ているのは、資材一枚の点数じゃない」。澪はファイルの表紙を指でたたいた。「この人に、一人で審査を任せていいか。判定の対象は、資料じゃなくて人なの」

当確ライン(=合否判定基準)が決めるのは、目の前の資材一枚の良し悪しではない。「この人に独立して審査を任せてよいか」という、審査者そのものの合否線。

なぜ平均で決めないのか

結衣はまだ腑に落ちない。「でも、平均が高い人って、総合力がある人ですよね。それじゃダメなんですか」

澪は採点表の一行を指でなぞった。「この候補者、説明力は満点に近い。でも検知力——危険を見つける力——が低い。平均を取ると、説明力が検知力の穴を埋めて、見かけ上は高得点になる。でも審査の現場では、説明がうまいことは、危険を見落とした穴を一ミリも埋めない」

「埋めない……」

「むしろ逆。検知できない人が雄弁だと、危ない資材を、堂々と『問題なし』と通してしまう。説明がうまいぶん、周りも納得してしまう。患者にとっては、寡黙で見落とす人より、雄弁で見落とす人のほうが危険なの」。澪の声は静かだったが、結衣はそこに芯の硬さを感じた。

決め方低い検知力の扱い患者への帰結
平均で合否得意科目が穴を埋め、隠れる危険な資材が雄弁に通る
当確ライン(必須項目方式)検知力が線を割れば不合格危険の見落としが止まる

害の非対称

「害の非対称」。澪はその言葉をボードに書いた。「空港の保安検査を思い出して。危険物を、安全だと通してしまう間違い。安全な荷物を、危険だと止めてしまう間違い。この二つは、重さが違う」

結衣は息をのんだ。「前者は……人が傷つく」

「そう。止めすぎは、やり直せば済む。でも通しすぎは、取り返しがつかないことがある。資材審査も同じ。誇張した効能を見抜けずに世に出せば、その資料を信じた医師が、患者に届ける。だから当確ラインは、検知力の不足に厳しい。そこだけは平均に溶かさない」

結衣は墨で消された平均欄を、もう一度見た。さっきまでは欠落に見えた黒い四角が、今度は意思のある線に見えた。

この線が引くもの

「結衣さん、あなたもいつか、この線の向こうに立つことになる」と澪は言った。「一人で資材を審査していい、と認められる側。そのとき測られるのは、あなたが何点取ったかじゃない。あなたに任せたら、危険を取りこぼさないか」

これから審査室では、三人の候補者が当確ラインにかけられる。弁の立つ人、博識な人、地味な人。誰が線を越え、誰が越えられないのか。結衣はファイルを閉じた。表紙の「当確ライン」という四文字が、急に重く感じられた。

対象は人

合否がつくのは資材一枚ではなく、独立審査を任せてよい人かどうか。

平均にしない

得意で苦手を埋める足し算を禁じる。必須項目が線を割れば不合格。

検知が要

危険を見つける力が核。雄弁は穴を埋めない。

当確ライン(合否判定基準) ── 全 10 回の地図

  1. 第 1 回 (本回): この線が引くもの ── 「資材」ではなく「審査者」の合否線 ── 当確ライン=「この人になら資材チェックを一人で任せていい」と言える合格水準のこと。第2シリーズ第1回。合否を平均点で決めてはいけない理由を入り口として説明する。
  2. 第 2 回: 害の非対称性 ── 見逃しは過検出より桁違いに重い ── なぜ平均で線を引いてはならないか その1。見逃しと過検出の害は釣り合わない
  3. 第 3 回: 相互補償の罠 ── 雄弁がリスク検知の欠落を覆い隠す ── 説明も人付き合いも抜群にうまい審査担当者が、危険を見つける力(リスク検知力)だけ弱い。点数を平均すれば合格に届く。でも、危険に気づけないのに話がうまい人は、その説得力で危ういものを通してしまう。なぜ平均点で合否を決めてはいけないのか。会社の実例Aでやさしく解く。
  4. 第 4 回: 床と総合点を分ける ── 非代償ゲートと加重総合点 ── 合否は「最低ライン(床)」で決め、点数の合計は順位づけだけに使う。最低ラインを一つでも下回れば、合計点が満点でも不合格。これが合格ラインの動かない約束ごと。
  5. 第 5 回: 検知の床を最も高く ── リスク検知力という存在理由 ── 資材審査(製薬会社が医師向けの宣伝資料を世に出す前に点検する仕事)が存在する理由は、危ない箇所を見つけることにある。だから八つの能力のうち、危険を見抜く力(リスク検知力)に求める最低ラインだけを一番高くする。一人で審査を任せてよい合格(当確)には、上から二番目の段階L3と、実物で見抜ける広さ2以上が要る。一つ下のL2で止まる人は、いちばん危ない資料こそ素通りさせてしまう。
  6. 第 6 回: 二軸で床を定める ── 机上の検知を独立させない ── 検知の合格ラインは点数一つでは引けない。「どれだけ語れるか」と「目の前の実物で拾えるか」の二つのものさしで引く。教科書だけの目利きは、点数上はL3に見えても一人前として通さない。
  7. 第 7 回: 校正を独立の門に ── 過信は独立の失格事由 ── 「自分の見る力を、正しく見積もれているか」を問う関門(校正ゲートG2)の話。一人で審査を任せるとは、後ろで誰も確認しないということ。自分の検知力を実際より高く思い込む人(乖離Δが+2以上)は、自分の見落としに気づかないまま危ないものを通してしまう。このズレ(Δ)は腕前そのものではないが、独りで任せてよいかを分ける。
  8. 第 8 回: 四段ゲート G0–G4 ── 早期棄却の論理 ── 合否は四つの関門を順番に通して決まる。手前の関門で落ちた人を、後ろの関門でわざわざ測り直すことはしない。他の長所では埋め合わせできない最低ライン(=床)があり、最後の合計点は合否をひっくり返さない。
  9. 第 9 回: 三人のプロファイル ── 同じ線がどう振り分けるか ── 雄弁な伝道師・机上の理論家・本道のL3。同じ合格ラインが三人をどこへ送るか
  10. 第 10 回 (最終回): 線を引く責任 ── アンカー先行・人手確認・非懲罰育成 ── 合格ラインを「現場で本当に使える基準」に変える最終回。お手本のそろった見本帳があって初めて、線はみんな共通のものさしになる。「合格・不合格」の4区分は落第の烙印ではなく、次に何を伸ばすかを示す道しるべ。AIはまず下書きの見立て、最後の判断は人間がする。
結語

結衣が最初に抱いた疑問——なぜ点数の平均で決めないのか——は、このシリーズ全体の入口だった。平均は、得意で苦手を覆い隠す。だが審査の現場で覆い隠してはいけないものが、ただ一つある。危険を見つける力だ。

当確ラインは、人に冷たい制度ではない。誰かが見落とした一枚が、患者のもとへ届く前に止まるように引かれた線である。次回からは、その線が実際にどう引かれ、どう測られるのかを、候補者たちの審査を通して見ていく。

Key Points ── 持ち帰る 3 つ
  1. 要点 当確ラインが判定するのは資材一枚の合否ではなく、「一人で審査を任せてよい人か」という審査者そのものの合否線である。
  2. 要点 合否を平均で決めない。得意項目が苦手項目の穴を埋める足し算を禁じ、検知力など必須項目が線を割れば他が満点でも不合格とする。
  3. 要点 害は非対称。安全なものを止める誤りより、危険なものを通す誤りが重い。だから検知できない者の雄弁は、患者をより危険にすると見なす。
出典・参考文献
  1. Angoff, W. H. Scales, Norms, and Equivalent Scores. Educational Measurement (2nd ed.), American Council on Education, 1971.(合格基準点を専門家判断で設定するAngoff法。床の閾値設定の古典的根拠)
  2. Hambleton, R. K. & Pitoniak, M. J. Setting Performance Standards. Educational Measurement (4th ed.), 2006.(非代償(conjunctive)対代償(compensatory)の基準設定モデルの整理)
  3. Macmillan, N. A. & Creelman, C. D. Detection Theory: A User's Guide. Lawrence Erlbaum, 2005.(信号検出理論。見逃しと過検出の非対称、sensitivity/specificityの基礎)
  4. Spencer, L. M. & Spencer, S. M. Competence at Work. Wiley, 1993.(コンピテンシーの閾値水準とパフォーマンス予測。前提シリーズの基盤)
  5. Messick, S. Validity. Educational Measurement (3rd ed.). American Council on Education, 1989.(判定の妥当性。線の正当性を支える妥当性論の枠組み)