Lは、一本の線の上のどこか一点ではない。「考えの深さ」と「応用の広さ」という二つのものさしの目盛りを、本人が実際にやった行動から読み取り、その二つをならして出す一つの読み値だ。前回までで、二つのものさしの意味と、合格ラインは片方が高いだけでは越えられないという決まりを置いた。今回は、その目盛りを実際にどう数字に落とすかを扱う。大事な決まりは一つだけ。裏づけのない話は、どんなに上手に語られても、レベルを一段も上げない。
接地天井 ── 「言えた最高」ではなく「裏が取れた最高」
まず言葉をそろえる。この回には三つのものさしが出てくる。「考えの深さ(専門語ではα・アルファ)」は、その人がどれだけ深い理由で動いたか。文言どおりか、それとも原理から考えたか。「応用の広さ(σ・シグマ)」は、その人の判断がどれだけ広い範囲に届いたか。同じ型の案件だけか、別分野まで届いたか。「裏づけ(g・グラウンディング、接地とも言う)」は、その話が実際に起きた出来事で支えられているか。ただの主張なら裏づけはゼロ、具体的な過去の出来事が語れたら裏づけあり、だ。
面接が終わると、一人の被評価者について、いくつもの「行動のかけら」が手元に残る。かけらの一つ一つに、考えの深さ・応用の広さ・裏づけの値が付いている。ここでつい、出てきた深さの最大値をそのまま採りたくなる。これが落とし穴だ。なぜなら、人は裏づけのない大きな話ほど、すらすら語れるからである。健康診断で「私は毎日走っています」と言うのは簡単だが、本当に効くのは体重と血圧の数字だ。言葉ではなく事実を採る。
そこで、二つのものさしをならす前に、軸ごとに「実際の出来事で支えられた一番上のレベル」を先に確定する。これを接地天井と呼ぶ。深さの接地天井(A-hat・エーハット)は、こう決める。あるレベル以上の深さを示したかけらについて、その裏づけの量を足し合わせ、合計が基準点(τ_g・タウジー、既定は2)に届く一番上のレベルを採る。考え方を言葉で言えばこうだ。「原理から考えて動いた」と主張するなら、その考えが実際に起きた具体的な出来事で、合計2点ぶん裏が取れて初めて、その深さを到達点として認める。なぜ合計2点かというと、一度きりの偶然ではなく、繰り返せる本物の力だと確かめたいからだ。式は補足にすぎない:A-hat=「深さがa以上のかけらの裏づけ量の合計が2以上になる、一番上のa」。
応用の広さの接地天井(S-hat・エスハット)も同じやり方だが、もう一枚の柵が付く。似た型の案件をいくつ積んでも、広さはレベル1で頭打ちにする。レベル2(別分野へ応用)以上を認めるには、裏づけのある分野が2つ以上いる。なぜこの柵がいるか。似た案件を百件こなしたベテランは確かに速い。だがそれは同じ型の繰り返しであって、別分野に届いた証拠にはならない。料理で言えば、同じカレーを百回作っても、それは煮込み料理全般が作れることの証明にはならない。件数は広さを広げない。分野の違いだけが広げる。
本道への射影 ── 二つの目盛りを一つの読み値に
A-hatとS-hatが決まれば、Lはほとんど自動で出る。理想の形は、考えの深さと応用の広さが同じだけ伸びた状態、つまり(深さ0・広さ0)、(1・1)、(2・2)、(3・3)とそろって進む対角線だ。これを本道と呼ぶ。実際の人はこの線の上にきれいに乗るとは限らない。深さだけ高くて広さが追いつかない、ということが起きる。そこで、その人の座標を本道の上に「ならす」。これが射影だ。やり方はいたって単純で、二つの天井の平均を取る。それを四つの帯に切り分けてLにする。平均が0.5未満ならL1、0.5〜1.5ならL2、1.5〜2.5ならL3、2.5以上ならL4。
なぜ平均なのか。ここに意味がある。深さだけ高くて広さが伴わない、あるいは広さだけ広くて深さが伴わない人は、平均を取ると真ん中に落ちる。つまり片方が突出していても、もう片方が支えなければLは上がりきらない。これは合格ラインの「片方だけでは越えられない」という考えを、L計算の内側にもう一度埋め込んだものだ。野球で複数の審判が判定をそろえないとアウトにならないのと同じで、二つの軸の両方がそろって初めてレベルが上がる。一文で言えば、裏づけのある行動が深さと広さの両方でその帯を満たす一番上のLを採り、主張だけのものは数えない。
| 段階 | やること | 防ぐ失敗 |
|---|---|---|
| 符号化(置きかえ) | かけらごとに深さ・広さ・裏づけの値を付ける | 印象や形容詞での評価 |
| 接地天井 | 裏づけの合計が基準点(2)に届く一番上の帯をA-hat/S-hatに | 裏づけなき大言を採ること |
| 広さの上限 | 同じ型の繰り返しはレベル1で頭打ち。レベル2以上は別分野2つ | 件数の水増し(経験頼み) |
| 本道へならす | 二つの天井の平均を帯に切る | 片方だけ高い人の過大評価 |
| 片翼(偏り) | 深さ−広さで、未完成の向きを記録 | 育成のやり方の取り違え |
片翼 ── 同じLでも中身は違う
射影でLを一つの数字に丸めると、二つのものさしの情報が一部こぼれてしまう。同じL2でも、原理は語れるがまだ別分野に応用できていない人と、いろいろな現場を見ているが理屈が薄い人とでは、次に伸ばすべき場所が正反対だ。このこぼれを残しておくのが片翼で、深さから広さを引いた差(専門語ではb)で表す。差がプラスなら深さが先行、つまり理屈倒れ・机上に寄っている。差がマイナスなら広さが先行、つまり経験頼み・取りすぎ(過検出)に寄っている。差がほぼゼロなら本道にきれいに乗っている。
片翼は、能力が高いか低いかではない。未完成の「向き」を指す矢印だ。写真でいえば、明るさは足りているがピントがどちら向きにずれているか、を示すようなものだ。差がプラスの人には別分野での実地応用を、差がマイナスの人には原理からの言語化を促す。Lという一つの数字が次の一手を決めるのではなく、Lと片翼の組が決める。だからLを出したあとも、A-hatとS-hatという元の座標は捨てずに、主出力として残しておく。
| 片翼(深さ−広さ) | 座標の例 | 読み | 次の一手 |
|---|---|---|---|
| プラス(理屈倒れ) | 深さ2・広さ0 | 原理は述べるが、別分野に応用した証拠がない | 別分野での実地応用を課す |
| ほぼ0(本道) | 深さ2・広さ2 | 深さと広さが釣り合っている | 次のレベルの裏づけ条件を満たしに行く |
| マイナス(経験頼み) | 深さ0・広さ2 | 広く触れているが、原理に落とすのが薄い | 判断の拠りどころを言葉にさせる |
具体例 ── リスク検知力でやってみる
題材は、主要評価項目(その試験で一番大事な比較項目)で差が出なかった試験のグラフを、矢印で交差点を強調して見せた資材だ。被評価者から次の三つの証言が、どれも実際の過去の出来事として聴けたとする。一つ目、「ゴールデン・クロス級」のような大げさな強調表現には反応した(深さ1・広さ1・裏づけあり)。二つ目、軸の取り方・矢印・配置が、本当は差のないものを優れて見せている、という見せ方の意図を見抜き、しかもグラフのない患者向け小冊子でも同じ仕掛けを捕まえた(深さ2・広さ2・裏づけあり、別分野2つ)。三つ目は「印象操作という新しい着眼点を自分が定義し、他の人も使っている」という主張だが、誰がいつ使ったのかの具体的な出来事が出てこなかった(深さ3・広さ3・裏づけゼロ)。
ここで接地天井を計算する。深さの軸では、レベル3以上の裏づけはゼロなので採れない。レベル2以上の裏づけは二つ目の証言ぶんで、これだけだと合計1で基準点2に届かない。ところがここで、かけらごとの裏取りが効く。二つ目の証言が別分野2つで確認できているなら、その2分野それぞれを裏づけ1として数えてよく、レベル2以上の裏づけ合計は2に達して基準点を満たす。だから深さの天井は2。広さの軸では、レベル2以上には別分野2つが必要で、二つ目がまさにそれを満たすので広さの天井も2。三つ目は裏づけゼロなので、深さ3も広さ3も天井を一切上げない。平均は(2+2)÷2=2、帯に切るとL3。片翼はゼロで本道に乗る。三つ目の証言は、口は達者でも裏づけがないために、一段も寄与しなかった。これが「裏づけのない話はレベルを上げない」という決まりが実際に効くところだ。
もし三つ目に、「四月のレビューで審査者の田中さんが私の着眼点を使って資材を差し戻した」という具体的な出来事が一件でも付いたら、話は変わる。深さ3の裏づけが1点立ち、さらに他の人が採用した成果まで確認できれば裏づけは2点になり、深さの天井は3へ動きうる。同じ証言でも、裏づけがあるかないかで一段が分かれる。語りの上手下手ではなく、誰が・いつ・何をしたという事実が、Lを決める。
厳しさのつまみ ── どこに置くか
この決め方には、厳しさを調整するつまみが二つある。一つは裏づけの基準点(τ_g)で、あるレベルを認めるのに必要な裏づけの量だ。既定の2は「一度きりの偶然ではなく、繰り返せる行動」を求める水準。これを1に緩めれば一回の出来事でもレベルが立ち、3に締めれば三点ぶんの裏取りを要求する。もう一つは、次回以降に扱う複数人をまとめるときの裏取りの基準(θ・シータ、既定は0.5)で、これは「何人の目が同意したか」に効く。つまり、裏づけの基準点は一人の中の証拠の厚みに、もう一つの基準は複数の目の合意に、それぞれ別々に厳しさを置ける。健康診断でいえば、一回の検査値をどこまで信じるか(厚み)と、何人の医師が同じ所見を出したか(合意)を、別々に調整するようなものだ。
| つまみ | 効く場所 | 緩める(値を下げる) | 締める(値を上げる) |
|---|---|---|---|
| 裏づけの基準点(τ_g、既定2) | 一人の中の裏づけの厚み | 一回の行動でもレベルが立つ | 繰り返しや反証まで要求 |
| 飽和件数(n*、既定3) | 読みの確からしさが頭打ちになる件数 | 少ない証拠で「確定」扱い | 多くの証拠で「確定」扱い |
| 裏取りの基準(θ、既定0.5) | 複数人の合意(次回) | 一部の高評価で引き上がる | 過半の裏取りを要求 |
つまみは現場で勝手に動かすものではない。なぜなら、人によって値が違えば、同じ証言が違うLになり、測定そのものが成り立たなくなるからだ。基準合わせ(アンカー合わせ)の場で全評価者が同じ値を共有し、規制が更新されたり基準が古びたりしたときにだけ、話し合って動かす。審判が試合の途中でストライクゾーンを各自で変えたら、判定が信用できなくなるのと同じだ。
測定設計(行動証拠とAI対話) ── 全 10 回の地図
- 第 1 回: 印象と自己申告の危うさ ── 測るのは「発揮された行動」だけ ── 第3シリーズ「測定設計」の出発点。なぜL(その人の到達した実力ランク)を本人の自己申告で決められないのか、測る対象を「実際にやった行動」だけに絞る理由と、聴き取り手順・評価のものさし・点数の付け方を一本に束ねる考え方を、やさしく解説する。
- 第 2 回: STARで聴く ── 状況・課題・行動・結果・思考 ── 過去に実際に起きた出来事を一つだけ取り上げ、「どんな場面で(状況)・何を任され(課題)・自分は何をして(行動)・どうなったか(結果)・なぜそう判断したか(思考)」の五つに分けて聞く。聞く時間の半分以上を「行動」に使い、やったことを動詞で書き取り、「結果」で本当に起きたかを確かめ、「思考」で判断の根っこを引き出す。
- 第 3 回: 二軸への符号化 ── 行動が視野を、思考が抽象度を露わにする ── 面接で聴いた一つの「やったこと」の話を、どこまで広く動けたか(視野σ)・どんな筋で考えたか(抽象度α)・本当にあった話か(接地g)の三つに翻訳する手順を、資材チェックの実例で具体化する回。
- 第 4 回: BEIの6原則 ── 測定値の汚染を防ぐ公理 ── 人が語った「実際にやったこと」を、考えの深さ・行動の届く範囲・実話の裏付け、という3つのものさしに置き換える。そして「裏付けのある中で一番高い実力」をその人の読みとする。この置き換えを濁らせないための、6つの聞き方の作法を身近な例で説明する。
- 第 5 回: 三つの帯 ── 抽象度α・視野σ・接地g の尺度 ── レベルを決める前に、聴き取った行動を測るための三つのものさし(判断の高さ・行動の広さ・事実の裏づけ)を決める回。点数ではなく「段」で測る。
- 第 6 回 (本回): Lの決め方 ── 接地天井と本道への射影 ── 裏づけのない話はレベルを上げない。実際の行動で確かめた到達点だけを採り、二つのものさしをならしてLを読む。
- 第 7 回: レベルを分ける観察行動 ── 8次元アンカーと境界 ── 「どんな行動をしたか」の見本帳(アンカー表)を使い、本人の話を一番近い見本に当てはめてレベル(L1〜L4)を決める。8つの能力すべてを同じやり方で測る回。
- 第 8 回: 信頼度と観測可能性 ── その読みをどれだけ確定してよいか ── 「その評価はどれくらい確かか」を数で持つ回。証拠の数・話の筋・見える立場から確からしさ(信頼度C)を出し、見えていたかと証拠を出せたかから観測可能性oを決め、両方を掛けた重みwで最後の集計に渡す。
- 第 9 回: 多人数AI対話 ── 裏取りで他者水準、乖離で校正 ── 一人の目では人は測れない。本人と複数の同僚が同じ聞き取り(BEI)を受け、「その場面をちゃんと見ていたか」で各人の票に重みをつけ、裏が取れた読みだけを束ねて他者から見た水準を出す。本人の自己評価とのズレは、能力ではなく「自分をどれだけ正しく見ているか」として別の欄に置く。
- 第 10 回 (最終回): 統合出力から当確ラインへ ── レコードと運用手順 ── 第3シリーズ「測定設計」最終回。一人ひとり・一項目ごとに作る「成績票」が、どの数値を合否判定のどの関門に渡すか。そして測定を実際に回す7つの手順を、専門用語を日常語に置き換えながら平易に解説する。
Lの決め方は、つまるところ二つの手順に尽きる。軸ごとに、実際の行動が裏づけた一番上のレベルを取ること。その二つをならして、一つの読み値にすること。この間ずっと、裏づけのない話は一段もレベルを上げない、という柵が効いている。だから口の達者な人が得をせず、地味でも具体的な行動を残した人が正しく上に置かれる。
射影で一つの数字に丸めても、片翼(深さ−広さ)が未完成の向きを残す。Lは合否の判断材料に、片翼は育て方の入口に渡る。次回は、この一人ぶんの読みを「どこまで確定してよいか」を測る信頼度Cと、そもそもその人にその行動が見えていたかを問う観測可能性の話に進む。
- 接地天井がレベルを縛る。軸ごとに、実際の出来事による裏づけの合計が基準点(既定2)に届いた一番上のレベルだけを採り、裏づけのない大言は数えない。
- 二つの目盛りをならしてLを読む。深さと広さの平均を帯に切ってL1〜L4にし、片方が突出しただけでは上がらない仕組みを内側に埋め込む。
- 片翼が育て方を分ける。深さ−広さの符号で理屈倒れ(プラス)か経験頼み(マイナス)かを残し、同じLでも次の一手を反対方向に向ける。
- McClelland, D. C. Testing for Competence Rather Than for "Intelligence". American Psychologist, 1973.(行動証拠で測るという基本思想)
- Boyatzis, R. E. The Competent Manager: A Model for Effective Performance. Wiley, 1982.(BEIによる行動事象面接の原型)
- Smith, P. C., & Kendall, L. M. Retranslation of Expectations: An Approach to the Construction of Unambiguous Anchors for Rating Scales. Journal of Applied Psychology, 1963.(行動アンカー型評定尺度BARS、帯定義の根拠)
- Spencer, L. M., & Spencer, S. M. Competence at Work: Models for Superior Performance. Wiley, 1993.(レベル別識別指標とコンピテンシー水準化)