三つの帯 ── 抽象度α・視野σ・接地g の尺度

レベルを決める前に、まず証拠を「測れる形」に直す必要がある。前の二回で、本人の意欲や人柄ではなく「実際にやった行動だけを証拠にする」聴き方を固めた。次の問いはこうだ──聴き取った具体的な行動を、何で測るのか。健康診断にたとえると分かりやすい。背・体重・血圧と、測る項目を先に決めるから比べられる。この設計も同じで、行動を測る三つのものさしを置く。判断がどれだけ深い考えに支えられているか(抽象度α)、その行動がどこまで広い場面に届いたか(視野σ)、その話がどれだけ事実で裏づけられているか(接地g)。この三つに置き換えて初めて、L1〜L4は「印象」ではなく「ものさしとの一致」の問題になる。

なぜ点数ではなく「段」で測るのか

抽象度や視野を「0.7点」のように点数にしたくなる。でも、それは中身のない正確さを装うだけだ。たとえば地震の震度を思い出してほしい。震度は1・2・3…と段で表す。「震度2.7」とは言わない。揺れの強さを細かい小数で示しても、かえって嘘くさくなるからだ。この設計も同じで、αとσは「段(帯)」として扱う。

段で測るとき、大事な性質が一つある。上下の順番は確かでも、段と段の幅は同じではない、という点だ。0から1へ上がるのと、2から3へ上がるのとでは、同じ「1段」でも中身の重みが違う。だから、足したり平均したりという計算は最後の一回(次回の射影)だけに取っておき、ここでは「この話はどの段に一番近いか」だけを問う。料理で「塩少々・中ぐらい・たっぷり」と段で言うのに近い。グラム数の小数までは測らないが、どの段かははっきり決める。なぜそうするか──評価する人が「だいたい真ん中ぐらい」と曖昧に逃げるのを防ぐためだ。証言は必ずどれか一つの段に落とす。

段で測るやり方には先例がある。BARS(行動基準評定尺度)という有名な手法は、各段を「観察できる具体的な行動の例」で固定した。本設計もそれにならい、各ものさしを「目で見て確かめられる行動の型」で定義する。

α ── 判断の深さ(どこまで深い考えに支えられているか)

α(アルファ、抽象度)は「なぜそう判断したのか」を測る。これはSTARの「＋思考(なぜそうしたかの動機)」に表れる。書いてある言葉にただ従っただけか、ルールの狙いまで遡って考えたか、誰も名づけていない新しい見方を作ったか。段は0から3まで。料理にたとえると、レシピの分量どおりに作る人(浅い)と、なぜその分量なのかを理解して別の料理にも応用できる人(深い)の違いだ。

α0 ── 書いてある言葉・手順どおり

ルールの文字面をそのまま当てはめた。「『優れる』とは書いていないから問題なし」のように、書いてある言葉だけで判断が止まっている。

α1 ── 複数の条件を組み合わせた

一つの言葉だけでなく、いくつかの条件をまとめて読んだ。過去に見た似たパターンと照らし合わせている。

α2 ── ルールの狙いから考えた

条文の裏にある狙いや原理までさかのぼり、そこから目の前のケースを判断した。表面のラベルを外し、中身で見ている。

α3 ── 新しい見方を作った

これまで名前のなかった観点を、新しい判断の原則として言葉にした。「＋思考」に最もはっきり現れる。

σ ── 行動の広さ(どこまで広い場面に届いたか)

σ(シグマ、視野)は「具体的に何をしたか」を測る。これはSTARの「行動A」に表れる。すでに知っている一つのケースを処理しただけか、それとも別の分野や、前例のない難しいケースにまで同じ着眼を届かせたか。段は0から3まで。スポーツにたとえると、いつも同じ相手と練習試合をするだけの選手と、別競技にも通じる動きを身につけた選手の違いだ。

σ0 ── 知っている一件だけ

すでに知っている一つの型を、その範囲だけで処理した。別の場面への持ち運びはない。

σ1 ── 複数だが同じ型

いくつものケースを扱ったが、どれも同じ型の繰り返し。経験は積んでいるが、分野は越えていない。

σ2 ── 別の分野にも応用した

構造の違う別の分野へ、同じ着眼を持ち込んだ。たとえばグラフ付きの資材で身につけた見方を、図のない患者向け小冊子でも働かせる、といった持ち運び。

σ3 ── 部門を越え、前例のない場面へ

部署や分野をまたぎ、前例のないケースにまで判断を及ぼした。最も広い射程。

σには大事な仕掛けが一つある。同じ型のケース(σ1)を何件こなしても、σ2には上がらないのだ。原典のルールは、σが段2以上に届くには「タイプの違う分野が2件以上」あることを条件にしている。なぜか──「数をこなしただけ」を「広さ」と偽るのを防ぐためだ。件数の多さは次に出てくる「事実の裏づけ(g)」の強さには効くが、それと「視野の広さ」は別物として扱う。同じ皿を100回作っても料理人の幅は広がらない、というのと同じ理屈だ。

g ── 事実の裏づけ(本当に起きたことか)

g(ジー、接地。「地に足がついている」の意)は「それは実際に起きたことか」を測る。これはSTARの「結果R」が保証する。αとσが「証言の質」を測るのに対し、gは「その証言が事実に裏打ちされているか」を測る。段は0から2まで(αやσより一段短い)。健康診断にたとえれば、本人の自己申告(g0)ではなく、実際の血液検査の数値(g1以上)があるかどうか、ということだ。

g0 ── 言っているだけ

「私はできる」「私はL4だ」のように、具体的な出来事を伴わない主張だけ。段を一切上げない。

g1 ── STARがそろう具体的な出来事

誰が・いつ・何を、が特定でき、状況→課題→行動→結果が一つの過去の出来事としてそろっている。

g2 ── 裏が取れている、または複数の出来事で繰り返し起きた

一度きりのまぐれではなく、複数の出来事で同じパターンが現れる。あるいは「本当か?」と疑ってもなお裏が取れた。BEI(面接手法)が重んじる「再現性」に対応する。

裏づけのない主張(g0)は段を上げない。これがこの判定ルールの核心だ。話のうまさではなく、事実に裏打ちされた行動だけがレベルを動かす。ここで一つだけ式が出てくるが、考え方は単純だ。「ある段を満たす出来事の裏づけが、合計で2に届けば、その段は事実に支えられたと見なす」。具体的には、g1の出来事を二つ、またはg2の出来事を一つ積めばよい。一回だけの話で高い段に置くのは危ないから、二人以上の審判が同じ判定をして初めて認める、というのに似た発想だ。(式で書けば「閾値τ_g(既定2)」だが、要は『裏づけが2たまるまで段を認めない』ということ。)

三つのものさしを一目で見る

三つのものさしを一つの表に並べると、何が共通で何が違うかが見える。αとσは0〜3、gは0〜2。αはSTARの「＋思考」から、σは「行動A」から、gは「結果R」から採る。それぞれ別の場所から採るので、互いに独立している。

ものさし	0	1	2	3	採るSTARの部分
α 判断の深さ	言葉・手順どおり	複数の条件を組合せ	ルールの狙いから	新しい見方を作る	＋思考(動機)
σ 行動の広さ	知っている一件だけ	複数だが同じ型	別の分野にも応用	部門を越え前例なき場面へ	行動A
g 事実の裏づけ	言っているだけ	STARがそろう出来事	裏取りあり／複数回再現	(段なし)	結果R

表の右端が示すとおり、三つは別々の場所から採る独立したものさしだ。だから「理屈は深いが場面は一つだけ(α3でσ0)」も、「着眼は広いが原理にはなっていない(α0でσ2)」もありうる。写真のピントにたとえると、被写体のどこに合っているかが人によってずれるのと同じで、二つのものさしがちぐはぐになることがある。このズレの向きは次回(片翼b = A_hat − S_hat)で扱う。本回はまず、各証言を三つのものさしに正しく落とすことだけに集中する。

実際にどう符号化するか ── 証言を三つのものさしに落とす

「符号化」とは、聴き取った話をα・σ・gの段に置き換える作業のこと。実際には、相手の話を聴きながら三つを同時に判定する。決まった手順というより、「どこを見るか」の手がかりを順に挙げる。

1. 「＋思考」を聴いてαを取る

「なぜそう判断したの?」を掘る。条文を引用したらα0寄り、狙いや原理を語ったらα2以上を疑う。「適切に対応した」のような抽象語が出たら「具体的には?」と必ず行動へ戻す。

2. 「行動A」の届いた範囲でσを取る

同じ着眼が別の分野でも働いたかを、持ち運びの質問で確かめる。「他のタイプの資材でも同じことを?」。同じ型の繰り返しならσ1で頭打ち。

3. 「結果R」でgを裏づける

その行動が実際に起きたか、誰が・いつ・何を、まで特定できるかを確かめる。複数の出来事や裏取りがあればg2。主語が「私たち」のままで本人の行動が見えなければg0に近い。

こうして三つのものさしに落とした証言の束が、次回の「裏づけの上限(接地天井A_hat・S_hat)」の入力になる。逆に言えば、ここでものさしを曖昧に置けば、後ろの式がどれだけ精密でも結果は濁る。測定の精度は、最初のこの置き換えをどれだけ厳しくやるかで決まる。

測定設計（行動証拠とAI対話） ── 全 10 回の地図

第 1 回: 印象と自己申告の危うさ ── 測るのは「発揮された行動」だけ ── 第3シリーズ「測定設計」の出発点。なぜL(その人の到達した実力ランク)を本人の自己申告で決められないのか、測る対象を「実際にやった行動」だけに絞る理由と、聴き取り手順・評価のものさし・点数の付け方を一本に束ねる考え方を、やさしく解説する。
第 2 回: STARで聴く ── 状況・課題・行動・結果・思考 ── 過去に実際に起きた出来事を一つだけ取り上げ、「どんな場面で(状況)・何を任され(課題)・自分は何をして(行動)・どうなったか(結果)・なぜそう判断したか(思考)」の五つに分けて聞く。聞く時間の半分以上を「行動」に使い、やったことを動詞で書き取り、「結果」で本当に起きたかを確かめ、「思考」で判断の根っこを引き出す。
第 3 回: 二軸への符号化 ── 行動が視野を、思考が抽象度を露わにする ── 面接で聴いた一つの「やったこと」の話を、どこまで広く動けたか（視野σ）・どんな筋で考えたか（抽象度α）・本当にあった話か（接地g）の三つに翻訳する手順を、資材チェックの実例で具体化する回。
第 4 回: BEIの6原則 ── 測定値の汚染を防ぐ公理 ── 人が語った「実際にやったこと」を、考えの深さ・行動の届く範囲・実話の裏付け、という3つのものさしに置き換える。そして「裏付けのある中で一番高い実力」をその人の読みとする。この置き換えを濁らせないための、6つの聞き方の作法を身近な例で説明する。
第 5 回 (本回): 三つの帯 ── 抽象度α・視野σ・接地g の尺度 ── レベルを決める前に、聴き取った行動を測るための三つのものさし(判断の高さ・行動の広さ・事実の裏づけ)を決める回。点数ではなく「段」で測る。
第 6 回: Lの決め方 ── 接地天井と本道への射影 ── 裏づけのない話はレベルを上げない。実際の行動で確かめた到達点だけを採り、二つのものさしをならしてLを読む。
第 7 回: レベルを分ける観察行動 ── 8次元アンカーと境界 ── 「どんな行動をしたか」の見本帳(アンカー表)を使い、本人の話を一番近い見本に当てはめてレベル(L1〜L4)を決める。8つの能力すべてを同じやり方で測る回。
第 8 回: 信頼度と観測可能性 ── その読みをどれだけ確定してよいか ── 「その評価はどれくらい確かか」を数で持つ回。証拠の数・話の筋・見える立場から確からしさ(信頼度C)を出し、見えていたかと証拠を出せたかから観測可能性oを決め、両方を掛けた重みwで最後の集計に渡す。
第 9 回: 多人数AI対話 ── 裏取りで他者水準、乖離で校正 ── 一人の目では人は測れない。本人と複数の同僚が同じ聞き取り(BEI)を受け、「その場面をちゃんと見ていたか」で各人の票に重みをつけ、裏が取れた読みだけを束ねて他者から見た水準を出す。本人の自己評価とのズレは、能力ではなく「自分をどれだけ正しく見ているか」として別の欄に置く。
第 10 回 (最終回): 統合出力から当確ラインへ ── レコードと運用手順 ── 第3シリーズ「測定設計」最終回。一人ひとり・一項目ごとに作る「成績票」が、どの数値を合否判定のどの関門に渡すか。そして測定を実際に回す7つの手順を、専門用語を日常語に置き換えながら平易に解説する。

結語

三つのものさしは、それぞれ違うものを測る。αは判断の深さ、σは行動の広さ、gはその両方が本当に起きたことか。αとσは0〜3、gは0〜2の「段」で測り、足し合わせて滑らかな点数にするのは最後の射影まで待つ。符号化の段階で問うのはたった一つ──この証言はどの段に一番近いか。

次回は、こうして置き換えた証拠を「裏づけの上限(接地天井A_hat・S_hat)」にまとめ、二つのものさしを本道に重ねてレベルを読む。三つが独立しているからこそ生まれる「ズレの向き」も、そこで初めて意味を持つ。本回で固めた「どの段か」が曖昧なら、後ろの式は濁る。測定はここから始まる。

Key Points ── 持ち帰る 3 つ

三つは独立したものさし: αはSTARの＋思考(判断の深さ)、σは行動A(広さ)、gは結果R(事実の裏づけ)から採る。α・σは0〜3、gは0〜2の段。
点数ではなく段で測る: 段と段の幅は同じではない。符号化では「どの段に一番近いか」だけを問い、足し算・平均は最後の射影に取っておく。
裏づけが段を支配する: g0(言っているだけ)は段を上げない。同じ型のケースはσ1で頭打ち、σ2以上はタイプの違う分野が2件以上必要。数をこなしただけを広さと偽らせない。

出典・参考文献

McClelland, D. C. Testing for Competence Rather Than for Intelligence. American Psychologist, 1973. (行動証拠で能力を測る発想の起点)
Boyatzis, R. E. The Competent Manager: A Model for Effective Performance. Wiley, 1982. (BEIによる行動事象の符号化)
Smith, P. C., & Kendall, L. M. Retranslation of expectations: An approach to the construction of unambiguous anchors for rating scales (BARS). Journal of Applied Psychology, 1963. (観察可能な行動で各段を固定する順序帯の原型)
Spencer, L. M., & Spencer, S. M. Competence at Work: Models for Superior Performance. Wiley, 1993. (コンピテンシー水準の段階的定義)

← 測定設計（行動証拠とAI対話）一覧に戻る