六一学者 - 吉澤 正氏
(第10回JUSEパッケージ活用事例シンポジウムにて)
少し進んだ回帰分析のテキストには,てこ比の定義やその性質が解説されている.例えば,
このうち1.はてこ比の定義であり,その意味を理解するには実際のデータについて目的変数のyの値を1点で1だけ増やし,yの予測値を求めてその変化量を出し,別に求めたてこ比と一致することを確認するとよい.これはすべてソフトを使って簡単にできる.
2.から5.のような性質も,数学的に証明するのは難しいが,ソフトを使って数値的に確認することは簡単である.ぜひ,やってみてほしい.
JUSE-MAのテキスト用例題5.1を使って,一例を示そう.以下の表1では,データ数nは15,まず,変数Xを説明変数,Yを目的変数とした回帰式での予測値を求める.サンプル1では2.924である.そこでてこ比も求めておく.次にサンプル1のyを2.6から1増やして3.6にしたときのサンプル1での予測値を求める.2.999となっている.これと前の予測値2.924の差は0.075でてこ比の値と一致している.1.の定義が確認できる.(ソフトの中では別の方法でてこ比を求めている.)
また,説明変数がXの1個のとき,マハラノビスの平方距離D2はXを基準化したuの2乗である.基準化は平均を引いて標準偏差でわる操作で,変数変換機能を使って実行できる.そのD2を(n-1)でわり,1/n(=1/15)を加えたものはてこ比になっているという4.の性質が表1で簡単に確認できる.1.,2.,3.についても観察してみてほしい.
サンプル | X | Y | 予測値 | Y* | 予測値* | てこ比 | u | D^2 | 1/n |
---|---|---|---|---|---|---|---|---|---|
1 | 3.2 | 2.6 | 2.924 | 3.6* | 2.999 | 0.075 | -0.346 | 0.008 | 0.067 |
2 | 5.2 | 2.5 | 4.073 | 2.5 | 以下省略 | 0.086 | 0.526 | 0.019 | 0.067 |
3 | 8.1 | 6.4 | 5.74 | 6.4 | 0.296 | 1.791 | 0.229 | 0.067 | |
4 | 4 | 5.7 | 3.383 | 5.7 | 0.067 | 0.002 | 0 | 0.067 | |
5 | 1.8 | 3.2 | 2.119 | 3.2 | 0.132 | -0.956 | 0.065 | 0.067 | |
6 | 4.3 | 3.6 | 3.556 | 3.6 | 0.068 | 0.133 | 0.001 | 0.067 | |
7 | 0.3 | 1 | 1.257 | 1 | 0.252 | -1.61 | 0.185 | 0.067 | |
8 | 2.5 | 3.6 | 2.521 | 3.6 | 0.097 | -0.651 | 0.03 | 0.067 | |
9 | 6.2 | 3.8 | 4.648 | 3.8 | 0.133 | 0.962 | 0.066 | 0.067 | |
10 | 4.5 | 4.1 | 3.671 | 4.1 | 0.07 | 0.22 | 0.003 | 0.067 | |
11 | 2 | 2.5 | 2.234 | 2.5 | 0.121 | -0.869 | 0.054 | 0.067 | |
12 | 1 | 0.5 | 1.659 | 0.5 | 0.188 | -1.305 | 0.121 | 0.067 | |
13 | 5.8 | 4.5 | 4.418 | 4.5 | 0.111 | 0.788 | 0.044 | 0.067 | |
14 | 7.5 | 5.3 | 5.395 | 5.3 | 0.234 | 1.529 | 0.167 | 0.067 | |
15 | 3.5 | 1.4 | 3.096 | 1.4 | 0.07 | -0.215 | 0.003 | 0.067 |
てこ比は観察点が説明変数についてその中心から離れるほど大きくなり,回帰式や予測に与える影響が大きくなる.そこで,支点から離れるほど小さい力でものを動かせるという“てこ”の名前がついている.英語では,leverage という.回帰分析では,てこ比の大きいサンプルについては,その影響の様子を調べることが必要である.
2001年8月16日掲載
イベント案内や製品などの最新情報をお届けします