前回までで、二つのものさし(考えの筋=抽象度、動ける範囲=視野)でつくる座標と、L1〜L4という四段階、そして「ここを割ったら不合格」という最低ラインを置いた。残る問いは一つ。本人の話から、どうやってその座標を読み取るのか。本稿はそこだけを扱う。鍵は、決まった聴き方で引き出した「具体的に過去やったこと」のどの部分が、どのものさしに対応するかを取り違えないこと。聴き方そのものが、測定の装置になる。
聴く話と測るものさしを取り違えない
面接は料理のレシピに似ている。材料を並べただけでは料理の腕は分からない。実際にどう手を動かし、何ができあがったかを見て初めて腕が分かる。原典がまず釘を刺すのも同じ点だ。話を四つの層で聴く ── 状況(どんな場面か)、課題(何が求められたか)、行動(具体的に何をしたか)、結果(どうなったか)、そして+思考(なぜそう判断したか)。この聴き方を頭文字でSTARと呼ぶ。だが、四つの層がそのまま評価の点数になるわけではない。場面の華やかさや課題の難しさ(状況・課題)は、話を理解する背景にすぎず、点数を動かさない。点数を動かすのは三つだけ ── 行動・結果・+思考だ。ここを混ぜると、舞台が派手なだけで中身が平凡な話を高く見積もってしまう。なぜ最初に対応を固定するのか。後でブレないための土台だからだ。
| 聴く話(STAR) | 対応するものさし | そこで何を見るか |
|---|---|---|
| 状況・課題(場面と求められたこと) | 背景(点数には直接効かない) | 誤判定を防ぐための前提。話を理解する枠を与えるだけ。 |
| 行動(具体的に何をしたか/最重要) | 視野σ=動ける範囲 | その人がどこまで届いたか。別分野や前例のない件にまで手が及んだか。 |
| 結果(どうなったか) | 接地g=話の裏づけ | その行動が本当に起きたことか。証拠の出どころ。 |
| +思考(なぜそう判断したか) | 抽象度α=考えの筋 | 判断のよりどころ。「文に書いてあるから」か「狙いから考えて」か。 |
一文にすれば ── 「やったこと」が動ける範囲を、「なぜそうしたか」が考えの筋を見せ、「どうなったか」が話の裏づけになる。決まった聴き方が、そのまま三つを採る道具になる。以下、この三つを順に解く。
「やったこと」が動ける範囲を見せる
視野σ(動ける範囲)は「その人がどこまで届いたか」を測る帯だ。健康診断の数値が帯(基準値・要注意・要精密)で示されるのと同じで、四段階の帯で読む。0は一つの見慣れた件の中だけ、1は複数だが同じ型の件、2は別分野・畑違いの件への応用、3は前例のない横断的な構造にまで届いた、という段階だ。大事なのは、この範囲はすべて「実際にやったこと」に現れる点。本人がどれだけ立派な理屈を語っても、手を動かした範囲が見慣れた件の中だけなら、範囲は0のまま。なぜか。語りは飾れても、行動の届いた先は飾れないからだ。
ここには経験頼みの罠を封じる仕掛けがある。同じ型の件を何十件こなしても、範囲は帯1で頭打ちになる。たとえば同じ料理を百回作っても「定番一品が上手」止まりで、和食からパン作りへ移れたとは言えないのと同じ。考え方を言葉にすればこうだ ── ある範囲以上の証拠が一定量(既定では証拠2件ぶん)たまって初めてその範囲を認める。ただし帯2以上は、畑違いの分野が二つ以上あるときに限る。式で書けば、視野の上限S-hatは「範囲s以上の証拠の裏づけ量が閾値τ_g(既定2)に達する最大のs。ただしs≤1か、s≥2なら別分野が2つ以上ある場合」となる。要は、経験の「量」ではなく「質」、つまり構造の違う場所へ移れたかが帯2の条件だ。
「なぜそうしたか」が考えの筋を見せる
抽象度α(考えの筋)は「何をよりどころに判断したか」を測る。0は文や手順に頼る、1は複数の条件をつなげる、2は原理や狙いから筋を引く、3は新しい原則や型を自分で作る、という四段階。これは「なぜそう判断したか」を語ってもらう層に現れる。同じ行動でも、その裏が「条文にこう書いてあるから」なのか「規制の狙いはこうだから」なのかで、考えの筋は大きく変わる。なぜ動機まで聴くのか。同じ正解でも、丸暗記で当てたのか理屈で導いたのかでは、別の場面での再現力がまるで違うからだ。
ここで陥りやすいのは、原理をすらすら語る人を「筋が高い」と誤読することだ。営業トークが滑らかな人が必ずしも商品を理解しているとは限らない。それと同じで、原典はこれを「裏づけのない主張」(接地g=0)として扱い、水準を上げない。語りの巧拙ではなく、その原理が「具体的に過去やったこと」に結びついて初めて、考えの筋は立つ。次の節がその歯止めだ。
「どうなったか」が話の裏づけになる
接地g(話の裏づけ)は、考えの筋や動ける範囲の読みが絵空事でないことを支える錘(おもり)だ。0は主張だけ(具体的な出来事なし)、1は「いつ・誰が・何を」が言える具体的な過去の出来事、2は反証つき、または複数の出来事で再現を確認した、の三段階。判定の核心は単純で、裏づけのない主張は水準を上げない。各ものさしで「裏づけがあって支持される一番上の帯」を取り、二つを合わせてLを読む。
合わせ方は、写真のピント合わせに似ている。考えの筋の上限をA-hat、動ける範囲の上限をS-hatと呼ぶ。考え方を言葉にすれば ── 二つの上限の真ん中を取り、その値が低ければL1、上がるにつれてL2、L3、L4と読む。式で書けば、平均p=(A-hat+S-hat)/2を計算し、pが0.5未満ならL1、0.5以上1.5未満ならL2、1.5以上2.5未満ならL3、2.5以上ならL4とする。さらに二つの差b=A-hat−S-hatを見れば、未完成の向きまで分かる。差がプラスなら理屈倒れ(頭でっかち)、マイナスなら経験頼み(手は動くが言葉にできない)、ほぼゼロなら両輪がそろっている。決め方を一文にすれば ── 裏づけのある行動が、考えの筋と動ける範囲の両方でその帯を満たす、一番上のLを採る。主張だけのものは数えない。なぜ両方を求めるのか。片方だけ高くても、まだ本物の実力とは言えないからだ。
一つの出来事を三つに分解する:資材チェックの実例
抽象論を具体に落とそう。判定の場面はこうだ。ある薬の試験で、主要な指標では差が出なかった。そのグラフに矢印を足し、線が交わる点を強調した資材(販促物)がある。差がないのに優れて見える、きわどい一枚だ。これを見た四人の証言を、原典のアンカー(手本となる発話例)に沿って符号化してみる。同じ患部のレントゲンを複数の医師が読むように、同じ資材への反応で力量が分かれる。
| L/座標 | 発話アンカー(面接で聴ける証言) | 符号化 |
|---|---|---|
| L1 (0,0) | 「優れると書いていないので問題なし」と判断した。文の表面だけを見ている。 | α0 σ0 g1 |
| L2 (1,1) | 「ゴールデン・クロス級の大げさな見せ方」など、見覚えのある強調パターンには反応した。 | α1 σ1 g1 |
| L3 (2,2) | 「軸・矢印・配置が、差のないものを優れて見せている」と作りの狙いを見抜き、図のない患者向け小冊子でも同じ手口を捕まえた。 | α2 σ2 g1(2分野) |
| L4 (3,3) | 「客観的な素材でも見せ方で印象を操作できる」を新しいチェック観点として定義し、今は他の審査担当もその観点を使っている。 | α3 σ3 g2(他者が採用) |
L1とL2の差は、文の表面を見ただけか、見覚えのある型に照らせたか。L2とL3の差は、狙いを言葉にしたうえで別分野(図のない小冊子)にまで応用できたか。L3とL4の差は、自分の作ったチェック観点を他人が使っているか。どの境目も、その人の人柄や印象ではなく、どの発話アンカーに一番近いかで決まる。評価者がやることは、証言を左の列に最も近いものと突き合わせ、右の符号化を与えるだけ。なぜこうするのか。評価者ごとに基準がブレるのを防ぐためだ。
符号化が踏み外しやすい四つの点
実地で符号化を誤る典型を、原典の聴き方の原則(6つの公理)に照らして並べる。いずれも「行動だけを証拠にする」という一行から出てくる。複数の審判が同じ反則を見落とさないよう、よくある誤審を先に共有しておくのと同じだ。
- 場面の難しさを、動ける範囲と混同する。難しい案件を担当したこと自体は範囲を上げない。その案件で実際に別分野まで届いたかだけが効く。なぜか。「大変な現場にいた」と「大変な現場で何かをやり遂げた」は別物だからだ。
- すらすらの原理語りを、考えの筋が高いと読む。原理を述べても、具体的な過去の行動(裏づけ1以上)に結びつかなければ筋は0扱い。語りの巧みさは測らない。
- 同じ型の件数の多さを、範囲2と誤る。同じ型を何件積んでも範囲は帯1で頭打ち。別分野2件以上が帯2の条件。
- 「私たちは」を切り分けない。チームの成果をその人個人の行動に落とさないと、誰の手柄か定まらない。主語をはっきりさせることが、範囲と筋を誰に付けるかをそのまま決める。
四つに共通するのは、証言の見かけの立派さ(難しさ・流暢さ・件数・チームの成果)を、行動の中身と取り違えている点だ。符号化は常に、「どうなったか」で裏づけられる具体的な出来事に立ち返って行う。
測定設計(行動証拠とAI対話) ── 全 10 回の地図
- 第 1 回: 印象と自己申告の危うさ ── 測るのは「発揮された行動」だけ ── 第3シリーズ「測定設計」の出発点。なぜL(その人の到達した実力ランク)を本人の自己申告で決められないのか、測る対象を「実際にやった行動」だけに絞る理由と、聴き取り手順・評価のものさし・点数の付け方を一本に束ねる考え方を、やさしく解説する。
- 第 2 回: STARで聴く ── 状況・課題・行動・結果・思考 ── 過去に実際に起きた出来事を一つだけ取り上げ、「どんな場面で(状況)・何を任され(課題)・自分は何をして(行動)・どうなったか(結果)・なぜそう判断したか(思考)」の五つに分けて聞く。聞く時間の半分以上を「行動」に使い、やったことを動詞で書き取り、「結果」で本当に起きたかを確かめ、「思考」で判断の根っこを引き出す。
- 第 3 回 (本回): 二軸への符号化 ── 行動が視野を、思考が抽象度を露わにする ── 面接で聴いた一つの「やったこと」の話を、どこまで広く動けたか(視野σ)・どんな筋で考えたか(抽象度α)・本当にあった話か(接地g)の三つに翻訳する手順を、資材チェックの実例で具体化する回。
- 第 4 回: BEIの6原則 ── 測定値の汚染を防ぐ公理 ── 人が語った「実際にやったこと」を、考えの深さ・行動の届く範囲・実話の裏付け、という3つのものさしに置き換える。そして「裏付けのある中で一番高い実力」をその人の読みとする。この置き換えを濁らせないための、6つの聞き方の作法を身近な例で説明する。
- 第 5 回: 三つの帯 ── 抽象度α・視野σ・接地g の尺度 ── レベルを決める前に、聴き取った行動を測るための三つのものさし(判断の高さ・行動の広さ・事実の裏づけ)を決める回。点数ではなく「段」で測る。
- 第 6 回: Lの決め方 ── 接地天井と本道への射影 ── 裏づけのない話はレベルを上げない。実際の行動で確かめた到達点だけを採り、二つのものさしをならしてLを読む。
- 第 7 回: レベルを分ける観察行動 ── 8次元アンカーと境界 ── 「どんな行動をしたか」の見本帳(アンカー表)を使い、本人の話を一番近い見本に当てはめてレベル(L1〜L4)を決める。8つの能力すべてを同じやり方で測る回。
- 第 8 回: 信頼度と観測可能性 ── その読みをどれだけ確定してよいか ── 「その評価はどれくらい確かか」を数で持つ回。証拠の数・話の筋・見える立場から確からしさ(信頼度C)を出し、見えていたかと証拠を出せたかから観測可能性oを決め、両方を掛けた重みwで最後の集計に渡す。
- 第 9 回: 多人数AI対話 ── 裏取りで他者水準、乖離で校正 ── 一人の目では人は測れない。本人と複数の同僚が同じ聞き取り(BEI)を受け、「その場面をちゃんと見ていたか」で各人の票に重みをつけ、裏が取れた読みだけを束ねて他者から見た水準を出す。本人の自己評価とのズレは、能力ではなく「自分をどれだけ正しく見ているか」として別の欄に置く。
- 第 10 回 (最終回): 統合出力から当確ラインへ ── レコードと運用手順 ── 第3シリーズ「測定設計」最終回。一人ひとり・一項目ごとに作る「成績票」が、どの数値を合否判定のどの関門に渡すか。そして測定を実際に回す7つの手順を、専門用語を日常語に置き換えながら平易に解説する。
第3回の要点は一つに尽きる。決まった聴き方(STAR)は、聴き方であると同時に測り方でもあり、「やったこと」から動ける範囲を、「なぜそうしたか」から考えの筋を、「どうなったか」から話の裏づけを採る道具だ、ということだ。この対応を固定すれば、評価は「あの人をどう見るか」から「証言がどの手本発話に一番近いか」へと姿を変える。人物評から型合わせへ、と言ってもいい。
次回は、こうして得た一人ぶんの読みを、どこまで「確定」と扱ってよいかに進む。証拠の量・話の整合・そもそも見えていたかから、暫定と確定を分ける段だ。一人の目を複数の目で裏取りする、多人数設計への入口である。
- 聴く話の各部分は、測るものさしに一対一で対応する。「やったこと」から動ける範囲を、「なぜそうしたか」から考えの筋を、「どうなったか」から話の裏づけを採る。場面と課題は背景で、点数には直接効かない。
- 裏づけのない主張は水準を上げない。各ものさしで裏づけのある一番上の帯を取り、二つの真ん中を見てLを読む。語りの巧みさではなく、実際にやった行動が決める。
- 符号化は、手本発話に一番近いものを選ぶだけ。評価者は証言を手本発話に当てて符号化を与えるだけで、人物の印象ではなく行動の型との近さでLが決まる。
- McClelland, D. C. Testing for Competence Rather Than for "Intelligence". American Psychologist, 1973.(過去行動を能力の予測因子とする発想の源流)
- Boyatzis, R. E. The Competent Manager: A Model for Effective Performance. Wiley, 1982.(行動事象面接BEIの体系化)
- Smith, P. C., & Kendall, L. M. Retranslation of Expectations: An Approach to the Construction of Unambiguous Anchors for Rating Scales. Journal of Applied Psychology, 1963.(行動基準評定尺度BARSとアンカーの原典)
- Spencer, L. M., & Spencer, S. M. Competence at Work: Models for Superior Performance. Wiley, 1993.(コンピテンシー水準と行動指標の対応設計)