コレスポンデンス分析
コレスポンデンス(Correspondence)分析は、クロス集計表を可視化して、調査結果の解釈を容易にする分析手法である。調査データはクロス集計することが多いため、コレスポンデンス分析は非常に利用頻度の高い手法である。
<適用例>
ある企業の社員193人に対して喫煙状況調査を実施し、表側に職位、表頭に喫煙習慣を配置したクロス集計表を作成した。ここから職位と喫煙の関係などを解釈する。周辺分布の解釈であれば比較的容易で、
「約半分が契約社員であり、次は一般社員が多いものの全体の1/4程度である」
「喫煙習慣のない社員は約3割。ヘビースモーカーは1割強」
ということがすぐに分かる。しかし職位と喫煙の関係は、百分率を計算していないという理由もあるが、一目瞭然というほど容易ではない。
Greenacre(1984).Theory and Application of Correspondence Analysis.Academic Press.
コレスポンデンス分析の結果として平面マップ(知覚マップ)が得られる。
この布置を解釈してみると、喫煙習慣(表頭)について、横軸は喫煙習慣の有無になっていることが明白である。縦軸は喫煙の程度だと解釈できる。
一方、職位(表側)については、給与待遇の順序ではなさそうだ。横軸は左側に一般、右側に、管理・契約が布置されている。これは左から喫煙しない割合の多い順に配置されていると考えられる。
縦軸は喫煙習慣の程度と関係がありそうだ。管理職は喫煙者の割合が多いだけでなく、ヘビースモーカーの割合も多い。そう解釈すると、縦軸は待遇ではなく、ストレスやプレッシャーの強さを表現している可能性もある(この変数だけでは解釈というより想像である。また管理職にストレスが多いというのも先入観に基づく)。
このような解釈を平面図で表示できることから、コレスポンデンス分析を「クロス集計表の可視化」という。
ところで、このクロス集計表は小さいので、頻度表ではなく百分率表にすれば、上記のような解釈はクロス集計表を眺めても、なんとか可能であろう。
実際にコレスポンデンス分析が威力を発揮するのは、もっと大きな表の場合である。たとえば下の表は、60歳未満の成人男女717人に対して、18のブランドのイメージ20項目の回答を集計した18×20の頻度行列である。これだけの大きな表になると観察するだけでは、相対的な位置の解釈は困難なので、可視化する効果は大きい。
(この表におけるブランド名は文字数を減らす目的で部分的にカットして表示している。イメージ項目の質問文も調査票に示された質問文を簡略化してある)
コレスポンデンス分析の結果を2次元の平面に図示すると、イメージ20項目の意味を手掛かりに空間の方向性を解釈することができる。横軸は<高級←→大衆>、縦軸は<革新←→伝統>と考えることが良さそうである。この命名には厳密な規則はないので、解釈者のセンスに従って元の変数の意味を合成すればよい。
一方、ブランドのポジションは、高級な場所にシャネルやジョルジオ・アルマーニがあり、その対極に東京スタイルやサンヨーが位置する。上方の革新的な場所には、イッセイ・ミヤケやベネトンが位置し、下方にはバーバリーやセリーヌが占めている。中央の原点にハナエ・モリがあるが、このポジションは全体の中では平均的なイメージのブランドだということになる。他との著しい特徴・差異がないのだが、これはあくまでも相対的な関係における結果である。
<解釈における理論的問題>
事例では表側(行要素)と表頭(列要素)の要素を同時に布置した。この表示は便利なのだが理論的には問題がある。
行要素と列要素の布置
これを合成するのが同時布置図
ブランド・イメージの例でいえば、ブランド(行要素)間の距離は解釈できる。またイメージ(列要素)間の距離も解釈できる。しかし、あるブランドと、あるイメージ項目との、つまり列要素と行要素との距離は数理的に定義されず「近い」「似ている」のように解釈できない、という問題である。
ここで示した喫煙とブランドの2例においては、そのような解釈をしても違和感がないのだが、違和感がないにもかかわらず、実はそう見えるだけで、平面上の行要素と列要素の距離は実際には間違っている場合もある。
残念ながら、この問題は理論的には解決されておらず、解釈を間違える可能性もあるため、同時布置をすべきではないという立場もある(表示できないソフトウエアもある)。
現実には、同時布置図はマーケティング分野で頻繁に利用されている。イメージ項目で空間の方向性を解釈したうえで、ブランドに関する相対的なポジションを理解するというように分離して利用した方がよい。少なくとも「バーバリーと伝統が近い」「シャネルと自慢が近い」という直接的な表現を避けるように注意・意識して同時布置を利用することが推奨される。数理的には遠近解釈できないが、マーケティング上の結論を間違えることがないのであれば、同時布置を利用する側の責任として実践的立場で使うということである。