二軸への符号化 ── 行動が視野を、思考が抽象度を露わにする

前回までで、二つのものさし（考えの筋＝抽象度、動ける範囲＝視野）でつくる座標と、L1〜L4という四段階、そして「ここを割ったら不合格」という最低ラインを置いた。残る問いは一つ。本人の話から、どうやってその座標を読み取るのか。本稿はそこだけを扱う。鍵は、決まった聴き方で引き出した「具体的に過去やったこと」のどの部分が、どのものさしに対応するかを取り違えないこと。聴き方そのものが、測定の装置になる。

聴く話と測るものさしを取り違えない

面接は料理のレシピに似ている。材料を並べただけでは料理の腕は分からない。実際にどう手を動かし、何ができあがったかを見て初めて腕が分かる。原典がまず釘を刺すのも同じ点だ。話を四つの層で聴く ── 状況（どんな場面か）、課題（何が求められたか）、行動（具体的に何をしたか）、結果（どうなったか）、そして＋思考（なぜそう判断したか）。この聴き方を頭文字でSTARと呼ぶ。だが、四つの層がそのまま評価の点数になるわけではない。場面の華やかさや課題の難しさ（状況・課題）は、話を理解する背景にすぎず、点数を動かさない。点数を動かすのは三つだけ ── 行動・結果・＋思考だ。ここを混ぜると、舞台が派手なだけで中身が平凡な話を高く見積もってしまう。なぜ最初に対応を固定するのか。後でブレないための土台だからだ。

聴く話（STAR）	対応するものさし	そこで何を見るか
状況・課題（場面と求められたこと）	背景（点数には直接効かない）	誤判定を防ぐための前提。話を理解する枠を与えるだけ。
行動（具体的に何をしたか／最重要）	視野σ＝動ける範囲	その人がどこまで届いたか。別分野や前例のない件にまで手が及んだか。
結果（どうなったか）	接地g＝話の裏づけ	その行動が本当に起きたことか。証拠の出どころ。
＋思考（なぜそう判断したか）	抽象度α＝考えの筋	判断のよりどころ。「文に書いてあるから」か「狙いから考えて」か。

一文にすれば ── 「やったこと」が動ける範囲を、「なぜそうしたか」が考えの筋を見せ、「どうなったか」が話の裏づけになる。決まった聴き方が、そのまま三つを採る道具になる。以下、この三つを順に解く。

「やったこと」が動ける範囲を見せる

視野σ（動ける範囲）は「その人がどこまで届いたか」を測る帯だ。健康診断の数値が帯（基準値・要注意・要精密）で示されるのと同じで、四段階の帯で読む。0は一つの見慣れた件の中だけ、1は複数だが同じ型の件、2は別分野・畑違いの件への応用、3は前例のない横断的な構造にまで届いた、という段階だ。大事なのは、この範囲はすべて「実際にやったこと」に現れる点。本人がどれだけ立派な理屈を語っても、手を動かした範囲が見慣れた件の中だけなら、範囲は0のまま。なぜか。語りは飾れても、行動の届いた先は飾れないからだ。

ここには経験頼みの罠を封じる仕掛けがある。同じ型の件を何十件こなしても、範囲は帯1で頭打ちになる。たとえば同じ料理を百回作っても「定番一品が上手」止まりで、和食からパン作りへ移れたとは言えないのと同じ。考え方を言葉にすればこうだ ── ある範囲以上の証拠が一定量（既定では証拠2件ぶん）たまって初めてその範囲を認める。ただし帯2以上は、畑違いの分野が二つ以上あるときに限る。式で書けば、視野の上限S-hatは「範囲s以上の証拠の裏づけ量が閾値τ_g（既定2）に達する最大のs。ただしs≤1か、s≥2なら別分野が2つ以上ある場合」となる。要は、経験の「量」ではなく「質」、つまり構造の違う場所へ移れたかが帯2の条件だ。

「なぜそうしたか」が考えの筋を見せる

抽象度α（考えの筋）は「何をよりどころに判断したか」を測る。0は文や手順に頼る、1は複数の条件をつなげる、2は原理や狙いから筋を引く、3は新しい原則や型を自分で作る、という四段階。これは「なぜそう判断したか」を語ってもらう層に現れる。同じ行動でも、その裏が「条文にこう書いてあるから」なのか「規制の狙いはこうだから」なのかで、考えの筋は大きく変わる。なぜ動機まで聴くのか。同じ正解でも、丸暗記で当てたのか理屈で導いたのかでは、別の場面での再現力がまるで違うからだ。

ここで陥りやすいのは、原理をすらすら語る人を「筋が高い」と誤読することだ。営業トークが滑らかな人が必ずしも商品を理解しているとは限らない。それと同じで、原典はこれを「裏づけのない主張」（接地g=0）として扱い、水準を上げない。語りの巧拙ではなく、その原理が「具体的に過去やったこと」に結びついて初めて、考えの筋は立つ。次の節がその歯止めだ。

「どうなったか」が話の裏づけになる

接地g（話の裏づけ）は、考えの筋や動ける範囲の読みが絵空事でないことを支える錘（おもり）だ。0は主張だけ（具体的な出来事なし）、1は「いつ・誰が・何を」が言える具体的な過去の出来事、2は反証つき、または複数の出来事で再現を確認した、の三段階。判定の核心は単純で、裏づけのない主張は水準を上げない。各ものさしで「裏づけがあって支持される一番上の帯」を取り、二つを合わせてLを読む。

合わせ方は、写真のピント合わせに似ている。考えの筋の上限をA-hat、動ける範囲の上限をS-hatと呼ぶ。考え方を言葉にすれば ── 二つの上限の真ん中を取り、その値が低ければL1、上がるにつれてL2、L3、L4と読む。式で書けば、平均p=(A-hat+S-hat)/2を計算し、pが0.5未満ならL1、0.5以上1.5未満ならL2、1.5以上2.5未満ならL3、2.5以上ならL4とする。さらに二つの差b=A-hat−S-hatを見れば、未完成の向きまで分かる。差がプラスなら理屈倒れ（頭でっかち）、マイナスなら経験頼み（手は動くが言葉にできない）、ほぼゼロなら両輪がそろっている。決め方を一文にすれば ── 裏づけのある行動が、考えの筋と動ける範囲の両方でその帯を満たす、一番上のLを採る。主張だけのものは数えない。なぜ両方を求めるのか。片方だけ高くても、まだ本物の実力とは言えないからだ。

一つの出来事を三つに分解する：資材チェックの実例

抽象論を具体に落とそう。判定の場面はこうだ。ある薬の試験で、主要な指標では差が出なかった。そのグラフに矢印を足し、線が交わる点を強調した資材（販促物）がある。差がないのに優れて見える、きわどい一枚だ。これを見た四人の証言を、原典のアンカー（手本となる発話例）に沿って符号化してみる。同じ患部のレントゲンを複数の医師が読むように、同じ資材への反応で力量が分かれる。

L／座標	発話アンカー（面接で聴ける証言）	符号化
L1 (0,0)	「優れると書いていないので問題なし」と判断した。文の表面だけを見ている。	α0 σ0 g1
L2 (1,1)	「ゴールデン・クロス級の大げさな見せ方」など、見覚えのある強調パターンには反応した。	α1 σ1 g1
L3 (2,2)	「軸・矢印・配置が、差のないものを優れて見せている」と作りの狙いを見抜き、図のない患者向け小冊子でも同じ手口を捕まえた。	α2 σ2 g1（2分野）
L4 (3,3)	「客観的な素材でも見せ方で印象を操作できる」を新しいチェック観点として定義し、今は他の審査担当もその観点を使っている。	α3 σ3 g2（他者が採用）

L1とL2の差は、文の表面を見ただけか、見覚えのある型に照らせたか。L2とL3の差は、狙いを言葉にしたうえで別分野（図のない小冊子）にまで応用できたか。L3とL4の差は、自分の作ったチェック観点を他人が使っているか。どの境目も、その人の人柄や印象ではなく、どの発話アンカーに一番近いかで決まる。評価者がやることは、証言を左の列に最も近いものと突き合わせ、右の符号化を与えるだけ。なぜこうするのか。評価者ごとに基準がブレるのを防ぐためだ。

符号化が踏み外しやすい四つの点

実地で符号化を誤る典型を、原典の聴き方の原則（6つの公理）に照らして並べる。いずれも「行動だけを証拠にする」という一行から出てくる。複数の審判が同じ反則を見落とさないよう、よくある誤審を先に共有しておくのと同じだ。

場面の難しさを、動ける範囲と混同する。難しい案件を担当したこと自体は範囲を上げない。その案件で実際に別分野まで届いたかだけが効く。なぜか。「大変な現場にいた」と「大変な現場で何かをやり遂げた」は別物だからだ。
すらすらの原理語りを、考えの筋が高いと読む。原理を述べても、具体的な過去の行動（裏づけ1以上）に結びつかなければ筋は0扱い。語りの巧みさは測らない。
同じ型の件数の多さを、範囲2と誤る。同じ型を何件積んでも範囲は帯1で頭打ち。別分野2件以上が帯2の条件。
「私たちは」を切り分けない。チームの成果をその人個人の行動に落とさないと、誰の手柄か定まらない。主語をはっきりさせることが、範囲と筋を誰に付けるかをそのまま決める。

四つに共通するのは、証言の見かけの立派さ（難しさ・流暢さ・件数・チームの成果）を、行動の中身と取り違えている点だ。符号化は常に、「どうなったか」で裏づけられる具体的な出来事に立ち返って行う。

測定設計（行動証拠とAI対話） ── 全 10 回の地図

第 1 回: 印象と自己申告の危うさ ── 測るのは「発揮された行動」だけ ── 第3シリーズ「測定設計」の出発点。なぜL(その人の到達した実力ランク)を本人の自己申告で決められないのか、測る対象を「実際にやった行動」だけに絞る理由と、聴き取り手順・評価のものさし・点数の付け方を一本に束ねる考え方を、やさしく解説する。
第 2 回: STARで聴く ── 状況・課題・行動・結果・思考 ── 過去に実際に起きた出来事を一つだけ取り上げ、「どんな場面で(状況)・何を任され(課題)・自分は何をして(行動)・どうなったか(結果)・なぜそう判断したか(思考)」の五つに分けて聞く。聞く時間の半分以上を「行動」に使い、やったことを動詞で書き取り、「結果」で本当に起きたかを確かめ、「思考」で判断の根っこを引き出す。
第 3 回 (本回): 二軸への符号化 ── 行動が視野を、思考が抽象度を露わにする ── 面接で聴いた一つの「やったこと」の話を、どこまで広く動けたか（視野σ）・どんな筋で考えたか（抽象度α）・本当にあった話か（接地g）の三つに翻訳する手順を、資材チェックの実例で具体化する回。
第 4 回: BEIの6原則 ── 測定値の汚染を防ぐ公理 ── 人が語った「実際にやったこと」を、考えの深さ・行動の届く範囲・実話の裏付け、という3つのものさしに置き換える。そして「裏付けのある中で一番高い実力」をその人の読みとする。この置き換えを濁らせないための、6つの聞き方の作法を身近な例で説明する。
第 5 回: 三つの帯 ── 抽象度α・視野σ・接地g の尺度 ── レベルを決める前に、聴き取った行動を測るための三つのものさし(判断の高さ・行動の広さ・事実の裏づけ)を決める回。点数ではなく「段」で測る。
第 6 回: Lの決め方 ── 接地天井と本道への射影 ── 裏づけのない話はレベルを上げない。実際の行動で確かめた到達点だけを採り、二つのものさしをならしてLを読む。
第 7 回: レベルを分ける観察行動 ── 8次元アンカーと境界 ── 「どんな行動をしたか」の見本帳(アンカー表)を使い、本人の話を一番近い見本に当てはめてレベル(L1〜L4)を決める。8つの能力すべてを同じやり方で測る回。
第 8 回: 信頼度と観測可能性 ── その読みをどれだけ確定してよいか ── 「その評価はどれくらい確かか」を数で持つ回。証拠の数・話の筋・見える立場から確からしさ(信頼度C)を出し、見えていたかと証拠を出せたかから観測可能性oを決め、両方を掛けた重みwで最後の集計に渡す。
第 9 回: 多人数AI対話 ── 裏取りで他者水準、乖離で校正 ── 一人の目では人は測れない。本人と複数の同僚が同じ聞き取り(BEI)を受け、「その場面をちゃんと見ていたか」で各人の票に重みをつけ、裏が取れた読みだけを束ねて他者から見た水準を出す。本人の自己評価とのズレは、能力ではなく「自分をどれだけ正しく見ているか」として別の欄に置く。
第 10 回 (最終回): 統合出力から当確ラインへ ── レコードと運用手順 ── 第3シリーズ「測定設計」最終回。一人ひとり・一項目ごとに作る「成績票」が、どの数値を合否判定のどの関門に渡すか。そして測定を実際に回す7つの手順を、専門用語を日常語に置き換えながら平易に解説する。

結語

第3回の要点は一つに尽きる。決まった聴き方（STAR）は、聴き方であると同時に測り方でもあり、「やったこと」から動ける範囲を、「なぜそうしたか」から考えの筋を、「どうなったか」から話の裏づけを採る道具だ、ということだ。この対応を固定すれば、評価は「あの人をどう見るか」から「証言がどの手本発話に一番近いか」へと姿を変える。人物評から型合わせへ、と言ってもいい。

次回は、こうして得た一人ぶんの読みを、どこまで「確定」と扱ってよいかに進む。証拠の量・話の整合・そもそも見えていたかから、暫定と確定を分ける段だ。一人の目を複数の目で裏取りする、多人数設計への入口である。

Key Points ── 持ち帰る 3 つ

聴く話の各部分は、測るものさしに一対一で対応する。「やったこと」から動ける範囲を、「なぜそうしたか」から考えの筋を、「どうなったか」から話の裏づけを採る。場面と課題は背景で、点数には直接効かない。
裏づけのない主張は水準を上げない。各ものさしで裏づけのある一番上の帯を取り、二つの真ん中を見てLを読む。語りの巧みさではなく、実際にやった行動が決める。
符号化は、手本発話に一番近いものを選ぶだけ。評価者は証言を手本発話に当てて符号化を与えるだけで、人物の印象ではなく行動の型との近さでLが決まる。

出典・参考文献

McClelland, D. C. Testing for Competence Rather Than for "Intelligence". American Psychologist, 1973.（過去行動を能力の予測因子とする発想の源流）
Boyatzis, R. E. The Competent Manager: A Model for Effective Performance. Wiley, 1982.（行動事象面接BEIの体系化）
Smith, P. C., & Kendall, L. M. Retranslation of Expectations: An Approach to the Construction of Unambiguous Anchors for Rating Scales. Journal of Applied Psychology, 1963.（行動基準評定尺度BARSとアンカーの原典）
Spencer, L. M., & Spencer, S. M. Competence at Work: Models for Superior Performance. Wiley, 1993.（コンピテンシー水準と行動指標の対応設計）

← 測定設計（行動証拠とAI対話）一覧に戻る