六一学者 - 吉澤 正氏
(第10回JUSEパッケージ活用事例シンポジウムにて)
多変量解析では,多数の変数について測定された対象の特徴を視覚的に図的に比較するためにレーダーチャートがよく使われる.
筆者が最初にレーダーチャートを使ったのは昭和40年頃.企業の特徴を財務データで客観的に評価しようと,まず財務データの主成分分析を行った.その結果を利用して,企業の成長性や安定性などの指標を作り,レーダーチャートで表現することを考えた.そのような 表現は経営分析でも定番になっている.奥野・芳賀・久米・吉澤著『多変量解析法』(日科技連1971年,改訂1981年)にも例がある.
そのとき以来次のことが気になった.
である.『多変量解析事例集第1集』(吉澤・芳賀編,日科技連,1992)で は,プロゴルファーの公式記録を使ってその問題を論じた(第2章表示13のレーダーチャートを以下に示す).
レーダーチャートでは,円の中に正多角形を想定してその頂点と中心を結ぶ軸を各変数に割りつけ,データの値に応じた中心からの線分の先を頂点とする多角形をによって多変量データを視覚化する.
軸ごとでは,中心から外に向うほど「好ましい」という印象を与える.第1主成分は,しばしば,総合的な規模やなんらかの大きさと解釈されることが多いので,その値が大きければ好ましいといえることもあるが,第2主成分以下は,第1主成分と無相関で,その値 が大きいから好ましい,小さいからよくないというような解釈は成り立たないことが普通.
例えば,入試データで,国語と数学の得点差のような成分は,学生の得手苦手の特徴を表すが,その大小が良いとか悪いとかの評価には繋がらない.そこで,生の主成分をレーダーチャートの軸に用いずに,もとの主要な変数を軸にしたほうがよいことが多い.
レーダーチャートの変数の順序問題(2)については,プロゴルファーの例では,主成分分析を行って,次のように変数順をきめている.まず,第1主成分を構成する主要な変数である“ショウキン”,“72-ストローク”,“パーセーブ”,“バーディ”を並べ,次に,第2主成分を構成する主要な変数である“パーオン”と“32-パット”,第3主成分の主要な変数“イーグル”,そして最後に試合数を軸にしている.(変数の定義は補足 を参照されたい.)
このように,主成分を構成する主要な変数を抽出して,主成分ごとにまとめて並べると,第1主成分では選手の総合的な実力を,第2や第3の主成分の変数では選手のいろいろ角度からの特徴を視覚的に見ることができる.
多変量データの視覚化の方法と顔チャートがあるが,どの変数を顔のどの部分に割り当てるかで見たときの印象が異なる.帯グラフや円グラフでもカテゴリーの順番を考える必要がある.
ショウキン | 年間賞金獲得額出場試合数でわった1試合あたりの賞金の対数 |
---|---|
72-ストローク | 1ラウンドあたり平均ストローク数を72からひいてアンダーパーの数に相当する数値に変換,大きいほうが良いようにしたもの |
パーセーブ | パーをセイブした率 |
バーディ | 1ラウンドあたりのバーディ数 |
パーオン | パーオン率,パーより2打以上少なくオンした割合 |
32-パット | 1ラウンドあたり平均パット数を32から引いたもの |
イーグル | 100ラウンドあたりのイーグル数 |
シアイ | 年間出場試合数,以上の記録は1987年のものであるが,毎年同様の解析ができる. |
2001年6月27日掲載
イベント案内や製品などの最新情報をお届けします