レベルを決める前に、まず証拠を「測れる形」に直す必要がある。前の二回で、本人の意欲や人柄ではなく「実際にやった行動だけを証拠にする」聴き方を固めた。次の問いはこうだ──聴き取った具体的な行動を、何で測るのか。健康診断にたとえると分かりやすい。背・体重・血圧と、測る項目を先に決めるから比べられる。この設計も同じで、行動を測る三つのものさしを置く。判断がどれだけ深い考えに支えられているか(抽象度α)、その行動がどこまで広い場面に届いたか(視野σ)、その話がどれだけ事実で裏づけられているか(接地g)。この三つに置き換えて初めて、L1〜L4は「印象」ではなく「ものさしとの一致」の問題になる。

なぜ点数ではなく「段」で測るのか

抽象度や視野を「0.7点」のように点数にしたくなる。でも、それは中身のない正確さを装うだけだ。たとえば地震の震度を思い出してほしい。震度は1・2・3…と段で表す。「震度2.7」とは言わない。揺れの強さを細かい小数で示しても、かえって嘘くさくなるからだ。この設計も同じで、αとσは「段(帯)」として扱う。

段で測るとき、大事な性質が一つある。上下の順番は確かでも、段と段の幅は同じではない、という点だ。0から1へ上がるのと、2から3へ上がるのとでは、同じ「1段」でも中身の重みが違う。だから、足したり平均したりという計算は最後の一回(次回の射影)だけに取っておき、ここでは「この話はどの段に一番近いか」だけを問う。料理で「塩少々・中ぐらい・たっぷり」と段で言うのに近い。グラム数の小数までは測らないが、どの段かははっきり決める。なぜそうするか──評価する人が「だいたい真ん中ぐらい」と曖昧に逃げるのを防ぐためだ。証言は必ずどれか一つの段に落とす。

段で測るやり方には先例がある。BARS(行動基準評定尺度)という有名な手法は、各段を「観察できる具体的な行動の例」で固定した。本設計もそれにならい、各ものさしを「目で見て確かめられる行動の型」で定義する。

α ── 判断の深さ(どこまで深い考えに支えられているか)

α(アルファ、抽象度)は「なぜそう判断したのか」を測る。これはSTARの「+思考(なぜそうしたかの動機)」に表れる。書いてある言葉にただ従っただけか、ルールの狙いまで遡って考えたか、誰も名づけていない新しい見方を作ったか。段は0から3まで。料理にたとえると、レシピの分量どおりに作る人(浅い)と、なぜその分量なのかを理解して別の料理にも応用できる人(深い)の違いだ。

α0 ── 書いてある言葉・手順どおり

ルールの文字面をそのまま当てはめた。「『優れる』とは書いていないから問題なし」のように、書いてある言葉だけで判断が止まっている。

α1 ── 複数の条件を組み合わせた

一つの言葉だけでなく、いくつかの条件をまとめて読んだ。過去に見た似たパターンと照らし合わせている。

α2 ── ルールの狙いから考えた

条文の裏にある狙いや原理までさかのぼり、そこから目の前のケースを判断した。表面のラベルを外し、中身で見ている。

α3 ── 新しい見方を作った

これまで名前のなかった観点を、新しい判断の原則として言葉にした。「+思考」に最もはっきり現れる。

σ ── 行動の広さ(どこまで広い場面に届いたか)

σ(シグマ、視野)は「具体的に何をしたか」を測る。これはSTARの「行動A」に表れる。すでに知っている一つのケースを処理しただけか、それとも別の分野や、前例のない難しいケースにまで同じ着眼を届かせたか。段は0から3まで。スポーツにたとえると、いつも同じ相手と練習試合をするだけの選手と、別競技にも通じる動きを身につけた選手の違いだ。

σ0 ── 知っている一件だけ

すでに知っている一つの型を、その範囲だけで処理した。別の場面への持ち運びはない。

σ1 ── 複数だが同じ型

いくつものケースを扱ったが、どれも同じ型の繰り返し。経験は積んでいるが、分野は越えていない。

σ2 ── 別の分野にも応用した

構造の違う別の分野へ、同じ着眼を持ち込んだ。たとえばグラフ付きの資材で身につけた見方を、図のない患者向け小冊子でも働かせる、といった持ち運び。

σ3 ── 部門を越え、前例のない場面へ

部署や分野をまたぎ、前例のないケースにまで判断を及ぼした。最も広い射程。

σには大事な仕掛けが一つある。同じ型のケース(σ1)を何件こなしても、σ2には上がらないのだ。原典のルールは、σが段2以上に届くには「タイプの違う分野が2件以上」あることを条件にしている。なぜか──「数をこなしただけ」を「広さ」と偽るのを防ぐためだ。件数の多さは次に出てくる「事実の裏づけ(g)」の強さには効くが、それと「視野の広さ」は別物として扱う。同じ皿を100回作っても料理人の幅は広がらない、というのと同じ理屈だ。

g ── 事実の裏づけ(本当に起きたことか)

g(ジー、接地。「地に足がついている」の意)は「それは実際に起きたことか」を測る。これはSTARの「結果R」が保証する。αとσが「証言の質」を測るのに対し、gは「その証言が事実に裏打ちされているか」を測る。段は0から2まで(αやσより一段短い)。健康診断にたとえれば、本人の自己申告(g0)ではなく、実際の血液検査の数値(g1以上)があるかどうか、ということだ。

g0 ── 言っているだけ

「私はできる」「私はL4だ」のように、具体的な出来事を伴わない主張だけ。段を一切上げない。

g1 ── STARがそろう具体的な出来事

誰が・いつ・何を、が特定でき、状況→課題→行動→結果が一つの過去の出来事としてそろっている。

g2 ── 裏が取れている、または複数の出来事で繰り返し起きた

一度きりのまぐれではなく、複数の出来事で同じパターンが現れる。あるいは「本当か?」と疑ってもなお裏が取れた。BEI(面接手法)が重んじる「再現性」に対応する。

裏づけのない主張(g0)は段を上げない。これがこの判定ルールの核心だ。話のうまさではなく、事実に裏打ちされた行動だけがレベルを動かす。ここで一つだけ式が出てくるが、考え方は単純だ。「ある段を満たす出来事の裏づけが、合計で2に届けば、その段は事実に支えられたと見なす」。具体的には、g1の出来事を二つ、またはg2の出来事を一つ積めばよい。一回だけの話で高い段に置くのは危ないから、二人以上の審判が同じ判定をして初めて認める、というのに似た発想だ。(式で書けば「閾値τ_g(既定2)」だが、要は『裏づけが2たまるまで段を認めない』ということ。)

三つのものさしを一目で見る

三つのものさしを一つの表に並べると、何が共通で何が違うかが見える。αとσは0〜3、gは0〜2。αはSTARの「+思考」から、σは「行動A」から、gは「結果R」から採る。それぞれ別の場所から採るので、互いに独立している。

ものさし0123採るSTARの部分
α 判断の深さ言葉・手順どおり複数の条件を組合せルールの狙いから新しい見方を作る+思考(動機)
σ 行動の広さ知っている一件だけ複数だが同じ型別の分野にも応用部門を越え前例なき場面へ行動A
g 事実の裏づけ言っているだけSTARがそろう出来事裏取りあり/複数回再現(段なし)結果R

表の右端が示すとおり、三つは別々の場所から採る独立したものさしだ。だから「理屈は深いが場面は一つだけ(α3でσ0)」も、「着眼は広いが原理にはなっていない(α0でσ2)」もありうる。写真のピントにたとえると、被写体のどこに合っているかが人によってずれるのと同じで、二つのものさしがちぐはぐになることがある。このズレの向きは次回(片翼b = A_hat − S_hat)で扱う。本回はまず、各証言を三つのものさしに正しく落とすことだけに集中する。

実際にどう符号化するか ── 証言を三つのものさしに落とす

「符号化」とは、聴き取った話をα・σ・gの段に置き換える作業のこと。実際には、相手の話を聴きながら三つを同時に判定する。決まった手順というより、「どこを見るか」の手がかりを順に挙げる。

1. 「+思考」を聴いてαを取る

「なぜそう判断したの?」を掘る。条文を引用したらα0寄り、狙いや原理を語ったらα2以上を疑う。「適切に対応した」のような抽象語が出たら「具体的には?」と必ず行動へ戻す。

2. 「行動A」の届いた範囲でσを取る

同じ着眼が別の分野でも働いたかを、持ち運びの質問で確かめる。「他のタイプの資材でも同じことを?」。同じ型の繰り返しならσ1で頭打ち。

3. 「結果R」でgを裏づける

その行動が実際に起きたか、誰が・いつ・何を、まで特定できるかを確かめる。複数の出来事や裏取りがあればg2。主語が「私たち」のままで本人の行動が見えなければg0に近い。

こうして三つのものさしに落とした証言の束が、次回の「裏づけの上限(接地天井A_hat・S_hat)」の入力になる。逆に言えば、ここでものさしを曖昧に置けば、後ろの式がどれだけ精密でも結果は濁る。測定の精度は、最初のこの置き換えをどれだけ厳しくやるかで決まる。

測定設計(行動証拠とAI対話) ── 全 10 回の地図

  1. 第 1 回: 印象と自己申告の危うさ ── 測るのは「発揮された行動」だけ ── 第3シリーズ「測定設計」の出発点。なぜL(その人の到達した実力ランク)を本人の自己申告で決められないのか、測る対象を「実際にやった行動」だけに絞る理由と、聴き取り手順・評価のものさし・点数の付け方を一本に束ねる考え方を、やさしく解説する。
  2. 第 2 回: STARで聴く ── 状況・課題・行動・結果・思考 ── 過去に実際に起きた出来事を一つだけ取り上げ、「どんな場面で(状況)・何を任され(課題)・自分は何をして(行動)・どうなったか(結果)・なぜそう判断したか(思考)」の五つに分けて聞く。聞く時間の半分以上を「行動」に使い、やったことを動詞で書き取り、「結果」で本当に起きたかを確かめ、「思考」で判断の根っこを引き出す。
  3. 第 3 回: 二軸への符号化 ── 行動が視野を、思考が抽象度を露わにする ── 面接で聴いた一つの「やったこと」の話を、どこまで広く動けたか(視野σ)・どんな筋で考えたか(抽象度α)・本当にあった話か(接地g)の三つに翻訳する手順を、資材チェックの実例で具体化する回。
  4. 第 4 回: BEIの6原則 ── 測定値の汚染を防ぐ公理 ── 人が語った「実際にやったこと」を、考えの深さ・行動の届く範囲・実話の裏付け、という3つのものさしに置き換える。そして「裏付けのある中で一番高い実力」をその人の読みとする。この置き換えを濁らせないための、6つの聞き方の作法を身近な例で説明する。
  5. 第 5 回 (本回): 三つの帯 ── 抽象度α・視野σ・接地g の尺度 ── レベルを決める前に、聴き取った行動を測るための三つのものさし(判断の高さ・行動の広さ・事実の裏づけ)を決める回。点数ではなく「段」で測る。
  6. 第 6 回: Lの決め方 ── 接地天井と本道への射影 ── 裏づけのない話はレベルを上げない。実際の行動で確かめた到達点だけを採り、二つのものさしをならしてLを読む。
  7. 第 7 回: レベルを分ける観察行動 ── 8次元アンカーと境界 ── 「どんな行動をしたか」の見本帳(アンカー表)を使い、本人の話を一番近い見本に当てはめてレベル(L1〜L4)を決める。8つの能力すべてを同じやり方で測る回。
  8. 第 8 回: 信頼度と観測可能性 ── その読みをどれだけ確定してよいか ── 「その評価はどれくらい確かか」を数で持つ回。証拠の数・話の筋・見える立場から確からしさ(信頼度C)を出し、見えていたかと証拠を出せたかから観測可能性oを決め、両方を掛けた重みwで最後の集計に渡す。
  9. 第 9 回: 多人数AI対話 ── 裏取りで他者水準、乖離で校正 ── 一人の目では人は測れない。本人と複数の同僚が同じ聞き取り(BEI)を受け、「その場面をちゃんと見ていたか」で各人の票に重みをつけ、裏が取れた読みだけを束ねて他者から見た水準を出す。本人の自己評価とのズレは、能力ではなく「自分をどれだけ正しく見ているか」として別の欄に置く。
  10. 第 10 回 (最終回): 統合出力から当確ラインへ ── レコードと運用手順 ── 第3シリーズ「測定設計」最終回。一人ひとり・一項目ごとに作る「成績票」が、どの数値を合否判定のどの関門に渡すか。そして測定を実際に回す7つの手順を、専門用語を日常語に置き換えながら平易に解説する。
結語

三つのものさしは、それぞれ違うものを測る。αは判断の深さ、σは行動の広さ、gはその両方が本当に起きたことか。αとσは0〜3、gは0〜2の「段」で測り、足し合わせて滑らかな点数にするのは最後の射影まで待つ。符号化の段階で問うのはたった一つ──この証言はどの段に一番近いか。

次回は、こうして置き換えた証拠を「裏づけの上限(接地天井A_hat・S_hat)」にまとめ、二つのものさしを本道に重ねてレベルを読む。三つが独立しているからこそ生まれる「ズレの向き」も、そこで初めて意味を持つ。本回で固めた「どの段か」が曖昧なら、後ろの式は濁る。測定はここから始まる。

Key Points ── 持ち帰る 3 つ
  1. 三つは独立したものさし: αはSTARの+思考(判断の深さ)、σは行動A(広さ)、gは結果R(事実の裏づけ)から採る。α・σは0〜3、gは0〜2の段。
  2. 点数ではなく段で測る: 段と段の幅は同じではない。符号化では「どの段に一番近いか」だけを問い、足し算・平均は最後の射影に取っておく。
  3. 裏づけが段を支配する: g0(言っているだけ)は段を上げない。同じ型のケースはσ1で頭打ち、σ2以上はタイプの違う分野が2件以上必要。数をこなしただけを広さと偽らせない。
出典・参考文献
  1. McClelland, D. C. Testing for Competence Rather Than for Intelligence. American Psychologist, 1973. (行動証拠で能力を測る発想の起点)
  2. Boyatzis, R. E. The Competent Manager: A Model for Effective Performance. Wiley, 1982. (BEIによる行動事象の符号化)
  3. Smith, P. C., & Kendall, L. M. Retranslation of expectations: An approach to the construction of unambiguous anchors for rating scales (BARS). Journal of Applied Psychology, 1963. (観察可能な行動で各段を固定する順序帯の原型)
  4. Spencer, L. M., & Spencer, S. M. Competence at Work: Models for Superior Performance. Wiley, 1993. (コンピテンシー水準の段階的定義)