STARで聴く ── 状況・課題・行動・結果・思考

「あなたは優秀ですか」と訊いても、返ってくるのは自分のイメージであって、実際にやったことではない。STARは質問の向きを変える。優れているかどうかを訊くのをやめ、本当にあった一つの出来事の中で何をしたかを訊く。五つの聞きどころのうち、人の評価を本当に動かすのは「行動」と「思考」で、「場面」と「役割」はそれを読み違えないための土台にすぎない。この回は、一つの出来事をどう掘れば二つのものさしの目盛りが見えてくるかを、聞き手の手つきとして書く。

なぜ「一つの出来事」に絞るのか

測るのは人そのものでも、経歴でもない。「実際にあった一つの出来事」を測る。たとえば健康診断を思い浮かべてほしい。「あなたは健康ですか」と本人に訊いても答えは主観だ。だから血圧を測り、血液を採る。具体的な一回の検査値を見る。面接も同じで、「全体としてどうですか」と訊くと相手は自分のいいイメージを語り、聞き手はその話のうまさに引きずられる。代わりに、誰が・いつ・何をした一件かをはっきりさせ、その一件だけを五つの角度から掘る。

なぜ過去の一件にこだわるのか。原典は「過去にやった行動は、将来の行動をいちばんよく言い当てる」と置く。理由は単純で、持っている能力ややる気は外から見えないが、実際にやった行動だけは目で確かめられる事実だからだ。出来事を一つに絞ると、後で印をつける対象が定まる。「考えの高さ」「手の届く広さ」「裏づけの強さ」という印は、この一件から取り出した一つひとつの証拠につけるのであって、人物まるごとにつけるのではない。だから聞き手の最初の仕事は、霧のようにぼんやりした全体評価を、輪郭のはっきりした一つの出来事に着地させることだ。

五つの聞きどころと二つのものさしの対応

料理のレシピにたとえると分かりやすい。同じ「カレーを作った」でも、台所の様子(場面)、誰のために何人前か(役割)、どう手を動かしたか(行動)、おいしくできたか(結果)、なぜその手順にしたか(思考)では、聞いて分かることが違う。STARの五つも同じで、それぞれ別のことを教えてくれる。「場面」と「役割」は背景情報で、評価そのものは動かさない。「考えの高さ」は思考に、「手の届く広さ」は行動に現れ、「結果」が裏づけを保証する。STARはそのまま二つのものさしを採る道具になる、と原典は言う。次の表がその対応地図だ。

聞く層(STAR)	ものさし・裏づけとの対応	聞き手が取り出すもの
状況 S・課題 T	背景。読み違いを防ぐ前提。評価そのものは動かさない	行動を解釈するための枠。いつ・どこで・何が問われたか
行動 A(最重要)	手の届く広さ ── どこまで手が届いたかがここに出る	具体的に何をしたか。畑違いの場面や前例のない件まで届いたか
結果 R	裏づけ ── 本当に起きたことかの証拠	結末・影響。言い分ではなく、目で確かめられる帰結
＋思考(動機)	考えの高さ ── 判断の根っこがここに出る	なぜそう判断したか。言葉づらだけ見たか、原理から考えたか

つまり、行動が「手の届く広さ」を、思考が「考えの高さ」を見せ、結果が「裏づけ」を保証する。場面と役割はそれだけでは評価を上げも下げもしない。それでも最初に確かめるのは、背景を取り違えると、行動の意味そのものまでズレてしまうからだ。下ごしらえを飛ばすと、本番の味が決まらないのと同じだ。

掘り下げの配分 ── 行動に5〜6割

四つの聞きどころに時間を等分してはいけない。原典のやり方は、一つの出来事を掘るとき、時間の5〜6割を「行動」に使えと指示する。場面と役割は手短に枠だけ取り、結果と思考は裏づけと考えの高さを確かめるだけの分量でよい。なぜ行動が主役か。それは「手の届く広さ」が行動の中にしか現れないからだ。

「手の届く広さ」とは、同じ型の仕事を何件こなしたかではなく、構造のまるで違う畑違いの場面にまで手が届いたか、ということ。これは「何をしたか」を一段ずつ具体に下ろさないと見えてこない。だから、相手が「うまく対応しました」のような抽象的な言葉を出したら、必ず「具体的には? 次に何を?」と具体の行動に引き戻す。この引き戻しが、行動を掘るときに最も効く。望ましいのは結論ではなく、その場の手の動きだ。

掘る順番を番号で示す。

状況Sを一文で固定 ── いつ・どの資材・何が問われたか。長居しない。背景の枠だけ取る。
課題Tを一文で固定 ── その場面で本人が解くべきだった問いは何か。ここまでが土台。
行動Aを段階で掘る ── 「まず何を」「次に何を」と動詞で連ねる。ここに時間の5〜6割。畑違いの場面にも届いたかを、「似た別の場面でも同じことをしましたか」と訊いて引き出す。
結果Rで裏づけを確かめる ── 実際に何が起きたか。判断は覆ったか、定着したか。複数の出来事で同じ力が出ていれば、裏づけはさらに強い。
＋思考で根っこを露わにする ── 「なぜそう判断したか」。言葉づらだけで見たのか、原理から考えたのかを聞き分ける。

動詞で記録する ── 形容詞は証拠にならない

聞いたことは、相手の言葉のまま、しかも形容詞でなく動詞で書き残す。「優秀だった」は結論であって証拠ではない。原典の例で言えば「○○に△△と提案し、□□を実行した」と動詞で残し、印(考えの高さ・手の広さ・裏づけ)はこの記録にひもづける。BEI(行動結果面接=実際の行動とその結果を聞く面接法)の決まりごと、「結論ではなく、それを支える具体的な行動を記録する」がここで効く。

形容詞は二重に危うい。第一に、聞き手の中にある「あの人はこういう人」という先入観を呼び込む。第二に、裏づけがあるように見せかける。「いつも鋭い」は何度でも再現できそうに聞こえるが、具体的な出来事が一件もなければ裏づけはゼロで、原典の規則では評価を上げない。動詞で書けば、その場で裏づけのあるなしが一目で見える。写真に置きかえれば、形容詞はピンボケ、動詞はピントの合った一枚だ。

裏づけが評価を決める ── 行動と結果の噛み合わせ

行動でどんなに高い射程を語っても、結果でそれを裏づけられなければ評価の帯は上がらない。複数の審判がそろって手を上げて初めて判定が確定するのと同じで、語りだけでは点にならない。原典の「接地天井(裏づけの上限)」という考え方を、やさしく言うとこうだ。ある高さの帯に置くには、その帯以上にある証拠の「裏づけ点」の合計が、決められたライン(ふつうは2点)に届いていなければならない。

式では「A-hat は、裏づけ点の合計が2点以上になる、いちばん高い帯を選ぶ」と書く。難しく見えるが、要点は一つ ── 言い分だけのものは数えず、本当に起きたと裏づくものの中で、いちばん高い帯を採る。式を飛ばしても、この一文さえ分かれば足りる。

「手の届く広さ」にはもう一つ柵がある。同じ型の仕事を何件積み上げても、広さは帯1で頭打ちになる(高い帯に行くには「違う種類の場面が2つ以上」という条件が要る)。経験頼みで点を稼ぐ抜け道をふさぐためだ。だから結果を聞くときは、件数より「場面の種類が違うか」を確かめる。図のある資材と、図のない患者向け小冊子で、同じからくりを見抜いたか ── これが帯2の裏づけになる。同じ問題を2回解いても1問分、違う種類の問題を解いて初めて実力が見える、というわけだ。

L／座標	発話アンカー(STARで聴ける証言の型)	符号化
L1 (0,0)	「優れると書いていないので問題なし」と判断した。言葉づらだけを見ている	α0 σ0 g1
L2 (1,1)	「ゴールデン・クロス級の最大級表現」など、よく知られた強調パターンには気づいた	α1 σ1 g1
L3 (2,2)	「軸・矢印・配置が、差のないものを優れて見せている」と図の作りの含みを見抜き、図のない患者向け小冊子でも同じからくりを捕まえた	α2 σ2 g1 (2領域)
L4 (3,3)	「客観的な素材も、見せ方しだいで印象を操作できる」という新しい着眼点を自分で定義し、他の審査者も今その視点を使っている	α3 σ3 g2 (他者採用)

α(アルファ)は考えの高さ、σ(シグマ)は手の届く広さ、g(ジー)は裏づけの強さを表す記号で、数字が大きいほど高い・広い・強い。この表は、リスクを見抜く力という一つの観点で「迷わず決められる」ようにした例だ。評価者は相手の証言を、左の発話例(アンカー=判定の基準見本)のうち一番近いものに合わせ、右の印を与えるだけ。境界は「どの発話例に近いか」で決まり、評価者の好みには委ねない。残る7つの観点も同じ形で発話例を持つ。複数の審判が同じ判定見本を持っていれば、判定がそろうのと同じ理屈だ。

聞き手の禁じ手 ── 測った値を汚さない

STARで掘る最中、聞き手はBEIの決まりを守る。まず、仮定の質問(「もし〜だったら」)は使わない。訊くのは実際に起きた過去のことだけで、これが裏づけの源になる。次に、「私たちは」と語られたら「あなたは」に訊き直して、その人個人の貢献を切り出す。そして、望ましい答えをにおわせない ── 質問者の期待が混ざった瞬間、その一件から取れる証拠は汚れる。

とりわけ行動を掘るときは、誘導が起きやすい。相手が言葉に詰まると、聞き手はつい「それは原理から考えたということですね?」と助け舟を出してしまう。これは、本来は相手から出るべき「考えの高さ」を聞き手が代わりに引き上げてしまう行為で、ありもしない高い証拠をでっち上げているのと同じだ。正しくは、答えを足さず「そのとき具体的に何を見て、次に何をしましたか」と動詞へ戻すだけにする。

測定設計（行動証拠とAI対話） ── 全 10 回の地図

第 1 回: 印象と自己申告の危うさ ── 測るのは「発揮された行動」だけ ── 第3シリーズ「測定設計」の出発点。なぜL(その人の到達した実力ランク)を本人の自己申告で決められないのか、測る対象を「実際にやった行動」だけに絞る理由と、聴き取り手順・評価のものさし・点数の付け方を一本に束ねる考え方を、やさしく解説する。
第 2 回 (本回): STARで聴く ── 状況・課題・行動・結果・思考 ── 過去に実際に起きた出来事を一つだけ取り上げ、「どんな場面で(状況)・何を任され(課題)・自分は何をして(行動)・どうなったか(結果)・なぜそう判断したか(思考)」の五つに分けて聞く。聞く時間の半分以上を「行動」に使い、やったことを動詞で書き取り、「結果」で本当に起きたかを確かめ、「思考」で判断の根っこを引き出す。
第 3 回: 二軸への符号化 ── 行動が視野を、思考が抽象度を露わにする ── 面接で聴いた一つの「やったこと」の話を、どこまで広く動けたか（視野σ）・どんな筋で考えたか（抽象度α）・本当にあった話か（接地g）の三つに翻訳する手順を、資材チェックの実例で具体化する回。
第 4 回: BEIの6原則 ── 測定値の汚染を防ぐ公理 ── 人が語った「実際にやったこと」を、考えの深さ・行動の届く範囲・実話の裏付け、という3つのものさしに置き換える。そして「裏付けのある中で一番高い実力」をその人の読みとする。この置き換えを濁らせないための、6つの聞き方の作法を身近な例で説明する。
第 5 回: 三つの帯 ── 抽象度α・視野σ・接地g の尺度 ── レベルを決める前に、聴き取った行動を測るための三つのものさし(判断の高さ・行動の広さ・事実の裏づけ)を決める回。点数ではなく「段」で測る。
第 6 回: Lの決め方 ── 接地天井と本道への射影 ── 裏づけのない話はレベルを上げない。実際の行動で確かめた到達点だけを採り、二つのものさしをならしてLを読む。
第 7 回: レベルを分ける観察行動 ── 8次元アンカーと境界 ── 「どんな行動をしたか」の見本帳(アンカー表)を使い、本人の話を一番近い見本に当てはめてレベル(L1〜L4)を決める。8つの能力すべてを同じやり方で測る回。
第 8 回: 信頼度と観測可能性 ── その読みをどれだけ確定してよいか ── 「その評価はどれくらい確かか」を数で持つ回。証拠の数・話の筋・見える立場から確からしさ(信頼度C)を出し、見えていたかと証拠を出せたかから観測可能性oを決め、両方を掛けた重みwで最後の集計に渡す。
第 9 回: 多人数AI対話 ── 裏取りで他者水準、乖離で校正 ── 一人の目では人は測れない。本人と複数の同僚が同じ聞き取り(BEI)を受け、「その場面をちゃんと見ていたか」で各人の票に重みをつけ、裏が取れた読みだけを束ねて他者から見た水準を出す。本人の自己評価とのズレは、能力ではなく「自分をどれだけ正しく見ているか」として別の欄に置く。
第 10 回 (最終回): 統合出力から当確ラインへ ── レコードと運用手順 ── 第3シリーズ「測定設計」最終回。一人ひとり・一項目ごとに作る「成績票」が、どの数値を合否判定のどの関門に渡すか。そして測定を実際に回す7つの手順を、専門用語を日常語に置き換えながら平易に解説する。

結語

STARは五つの聞きどころを等しく扱う技法ではない。場面と役割で土台を取り、行動に掘り下げの過半を充て、結果で裏づけを、思考で考えの高さを確かめる ── この重みづけが、語りのうまさではなく実際にやった行動から評価を立ち上げる。形容詞を動詞へ、言い分を出来事へ、毎回戻すことが聞き手の規律だ。

次回は、聞き取った行動を「考えの高さ・手の広さ・裏づけ」の三つの帯にどう翻訳するか ── 段階づけとしての扱いと、裏づけのない言い分は数えないという規則 ── を、判定の手つきとして具体に下ろす。

Key Points ── 持ち帰る 3 つ

行動に5〜6割。場面・役割は背景の枠だけ取り、手の届く広さが現れる行動の掘り下げに時間の過半を充てる。
形容詞でなく動詞で記録。「優秀だった」は裏づけゼロ。実際にやった動詞だけが印をつける対象になる。
結果で裏づけを確かめる。射程を語っても裏づけがなければ評価は上がらない。同じ型の積み上げは広さ帯1で頭打ち。

出典・参考文献

McClelland, D. C. Testing for Competence Rather Than for "Intelligence." American Psychologist, 1973. (適性検査でなく行動で測るという思想の起点)
Boyatzis, R. E. The Competent Manager: A Model for Effective Performance. Wiley, 1982. (BEI=行動結果面接の体系化)
Flanagan, J. C. The Critical Incident Technique. Psychological Bulletin, 1954. (一つの重大事象を行動で掘る原型)
Smith, P. C., & Kendall, L. M. Retranslation of Expectations: An Approach to the Construction of Behaviorally Anchored Rating Scales. Journal of Applied Psychology, 1963. (発話アンカーによる尺度固定の理論)
Spencer, L. M., & Spencer, S. M. Competence at Work: Models for Superior Performance. Wiley, 1993. (BEI証拠からの符号化と水準判定の実務)

← 測定設計（行動証拠とAI対話）一覧に戻る