人的資本経営を推進するためには、自社の様々な取り組みについてどのくらい効果があるかを検証する必要があります。そのため、経験や勘ではなく、定量・定性データを使って具体的に計測・検証し、改善し続けるということが求められます。
本連載では人事データの中でも特に評価データに注目し、その分析方法を日本生産性本部の東狐貴一主任経営コンサルタントに解説してもらいます。
第1回「人的資本の情報開示に人事データをどう使う? 企業価値を向上させるデータ分析とは」
前回は、評価のバラツキについて具体的な評価項目データを元に検証していきました。今回は、評価項目間の相関について考えていきたいと思います。
評価項目間に相関があるとは、例えば、“企画力”と“積極性”といった項目があるとすると、片方が“A”評価になるともう片方も“A”評価になる、あるいは片方が“C”評価だともう片方も“C”評価になるといったように、評価結果が同じような動きをするような状態を指します。
こうした場合、この2つの項目には相関関係が見られることになります。
こうした結果となる理由は、一つには項目の定義や着眼点が非常に似ていること、もう一つはそもそも異なる観点で評価するつもりで設定しているのに、その点が評価者に伝わっていないことが考えられます。
前者は制度の問題ですし、後者は運用の問題となります。 いずれにしても、まずは項目間の動きを分析してみるところから始めなくてはなりません。
評価項目間の相関分析
相関分析とは、2つのデータの関係性の強さを表す指標(相関係数※1)を計算し、数値化する分析手法のことをいいます。
相関係数は1に近づくほど正の相関(正比例)の関係が強くなり、-1に近づくと負の相関(反比例)の関係が強くなります。また、0に近づくほど無関係となります。 それでは、具体的な評価データを使って相関を見てみましょう。
※1 一般的に相関係数という場合は、ピアソン(Pearson)の積率相関係数を指します。これは、2つの連続変数間の線形関係を評価します。一方の変数が変化したときにもう一方の変数が比例して変化する場合、関係は線形であるといいます。
図表1 評価項目間の相関係数
図表1は評価項目間の相関を算出したものです(上段の数値)。
表から分かるように、表頭と表側(※2)は同じ項目が並んでいます。当然ですが、同じ項目間では相関係数=1となります。
統率”という項目と相関係数が高いところを見ると、”統率“と”主体性“は.590、”業務管理“とは.543、”部下指導“とは.542と高くなっています。それぞれ1に近いことから、それぞれが正の相関関係にあることが分かります。 ちなみに、相関係数の判断基準は、図表2を参考として下さい。
※2 “表頭(ひょうとう)”とは、統計などの表で、いわゆる「列の見出し」、表の上部にある先頭行のことを指します。また、“表側(ひょうそく)”とは、同じく「行の見出し」、表の左側にある1列目のことを指します。
図表2 相関係数の判断基準
相関係数=r(-1≦ r ≦1)
散布図による検証
相関係数から、評価項目間に、高い正の相関関係があることが分かりました。ここでは、相関係数を先に求めていますが、実際に2種類のデータの関係性を調べるには、まず散布図を描いてみることが基本です。散布図は、Excelで簡単に作成できます。
散布図は2次元のマトリックスのため、X軸、Y軸に2変量のいずれを選択するかは、仮説をもとに設定することになります。この場合、仮説とはXとYの間に何らかの因果関係があると想定することです。
相関関係とは、AとBの2つの事柄になんらかの関連性があることを意味しますが、因果関係は原因とそれによって生ずる結果との関係のことをいいます。つまり、Aを原因としてBが変動する場合、因果関係があるといいます。
実際には、X軸、Y軸をいれかえてみたりしながら、判断していきます。 図表3は、散布図で現れた散らばりによる相関関係をイメージしたものです。この図にあるように、正の相関、負の相関あるいは無相関かどうかが、プロット散らばりからおおよそ判断がつきます。
図表3 散布図で見る相関のイメージ
高い相関係数が観察された“統率”と“主体性”について、評価結果の散布図を作ると図表4のようになります。散布図から分かるように正の相関にあることが見て取れます。
図表4 主体性と統率の評価結果分布(散布図)
近似線(回帰式)を引いてみても正の一次関数となっています。すなわち、主体性を原因(X軸)、統率を結果(Y軸)とした回帰式が表示されます。
統率(Y)=0.6834×主体性(X)+1.1194
式から分かるように、プロセス評価点が1点上がると業績評価点が1.8028点上がるという関係にあることが分かります。R-2乗とは、自由度決定係数のことで、データに対する、推定された回帰式の当てはまりの良さ(度合い)を表します。
決定係数は、0から1までの値をとります。1に近いほど、回帰式が実際のデータに当てはまっていることを表しており、説明変数が目的変数をよく説明していると言えます。
図表4の場合、R-2乗は0.3484となっており、それほど当てはまりの度合いが高くはないことが分かります。ちなみに、Rは相関係数のことで、0.5903すなわち約60%のデータがこの回帰式で説明できることを示しています。
図表5は、比較的相関係数が低い“リスク管理意識”と“部下指導”(相関係数=.258)について、評価結果をプロットしたものです。
図表5 リスク管理意識と部下指導の評価結果分布(散布図)
回帰式は下式のようになります。係数は正なので、緩やかな正の相関が見られます。
部下指導(Y)=0.3039×能力評価(X軸)+2.5566
R-2乗は0.0666なので、Rは0.2581、すなわち約26%のデータしかこの回帰式で説明できないことを示しています。実際に、散布図を見ると、図表4に比べて相関がないように見えます。
有意性の検定
実は相関係数が高いことは、必ずしも関係があることを示すわけではありません。そこで、相関係数に意味があることを確認する必要があります。それを有意性検定(※3)といいます。
相関係数の有意性検定は、「相関係数が 0 である」ということを帰無仮説としています。「相関係数が 0 」ということは2つの変数が独立している、「無相関」ということです。 このことから相関係数の有意性検定のことを「無相関の検定」と言います。
※3 統計的に有意であるとは、「仮説」と「実際に観察された結果」との差が誤差では済まされないことを意味します。例えば、部長と課長との回答の差が、誤差ではなく意味がある差である場合、統計的に有意であるといいます。
有意性の検定では有意水準を設定して判断します。有意水準とは、設定した仮説が間違っていると判断する(仮説を棄却する)確率のことで、一般的に「P値」と表現します。P値とは Probability value = P value のことで、「確率値」と訳されます。
P値が有意水準を下回れば、帰無仮説が棄却され、無相関ではないだろうということになります。有意水準0.05(5%)に設定した場合、5%以下の確率で帰無仮説が生じる現象は、非常にまれなことになります。有意水準は、一般的に10%、5%、1%が多く使われています。
図表1の下段の数値は、有意水準を示しており、その結果上段の数値に*(アスタリスク)がつけられています。
*の意味は、**=「相関係数は 1% 水準で有意 (両側)」 、*. =「相関係数は 5% 水準で有意 (両側) 」を示しています。これを見ると、ほとんどの相関関係については有意であるという結果になっています。こうした結果から推測されることは、評価項目間でハロー効果を起こしている可能性です。
ハロー効果とは、ある対象を評価する時に、それが持つ顕著な特徴に引きずられて他の特徴についての評価が歪められる(認知バイアス)現象のことをいいます。
しかし、評価者すべてが同じハロー効果を起こしているとは考えにくいでしょう。可能性として考えられるのは、項目間の違いが明確でないため、同じような評価となった場合です。
次回は、これらの評価項目間でよく似た動きをする項目を因子にまとめる分析手法を紹介いたします。