1. ホーム
  2. 統計解析・品質管理
  3. 会員広場
  4. 六一学者の千字一話(連載)

第6話 ソフトを使った勉強−てこ比の性質−(六一学者の千字一話)

吉澤正先生御逝去に寄せて

六一学者の千字一話  六一学者 (吉澤 正氏)
六一学者 - 吉澤 正氏
(第10回JUSEパッケージ活用事例シンポジウムにて)


少し進んだ回帰分析のテキストには,てこ比の定義やその性質が解説されている.例えば,

  1. てこ比は,回帰分析の観察点(サンプル)ごとに,説明変数のデータを変えずに目的変数yの値を1だけ変えたときの予測値の変化量である.
  2. てこ比の値は,1以下である.
  3. nの観察点に対する,てこ比の合計は(p+1).ここでpは説明変数の個数.その平均は(p+1)/n.
  4. てこ比は説明変数についてのデータで計算されるマハラノビスの距離D(平均の点からの各点への統計的な距離で,その方向の標準偏差を単位として測られる)と次の関係がある.てこ比 = 1/n + D^2 / (n-1)
  5. 変数の平均点(各変数ごとの平均を値とする点)に実際のデータがあれば,その点でのてこ比は,1/n.

このうち1.はてこ比の定義であり,その意味を理解するには実際のデータについて目的変数のyの値を1点で1だけ増やし,yの予測値を求めてその変化量を出し,別に求めたてこ比と一致することを確認するとよい.これはすべてソフトを使って簡単にできる.

2.から5.のような性質も,数学的に証明するのは難しいが,ソフトを使って数値的に確認することは簡単である.ぜひ,やってみてほしい.

JUSE-MAのテキスト用例題5.1を使って,一例を示そう.以下の表1では,データ数nは15,まず,変数Xを説明変数,Yを目的変数とした回帰式での予測値を求める.サンプル1では2.924である.そこでてこ比も求めておく.次にサンプル1のyを2.6から1増やして3.6にしたときのサンプル1での予測値を求める.2.999となっている.これと前の予測値2.924の差は0.075でてこ比の値と一致している.1.の定義が確認できる.(ソフトの中では別の方法でてこ比を求めている.)

また,説明変数がXの1個のとき,マハラノビスの平方距離D2はXを基準化したuの2乗である.基準化は平均を引いて標準偏差でわる操作で,変数変換機能を使って実行できる.そのD2を(n-1)でわり,1/n(=1/15)を加えたものはてこ比になっているという4.の性質が表1で簡単に確認できる.1.,2.,3.についても観察してみてほしい.

表6-1 てこ比の観察
サンプルXY予測値Y*予測値*てこ比uD^21/n
13.22.62.9243.6*2.9990.075-0.3460.0080.067
25.22.54.0732.5以下省略0.0860.5260.0190.067
38.16.45.746.40.2961.7910.2290.067
445.73.3835.70.0670.00200.067
51.83.22.1193.20.132-0.9560.0650.067
64.33.63.5563.60.0680.1330.0010.067
70.311.25710.252-1.610.1850.067
82.53.62.5213.60.097-0.6510.030.067
96.23.84.6483.80.1330.9620.0660.067
104.54.13.6714.10.070.220.0030.067
1122.52.2342.50.121-0.8690.0540.067
1210.51.6590.50.188-1.3050.1210.067
135.84.54.4184.50.1110.7880.0440.067
147.55.35.3955.30.2341.5290.1670.067
153.51.43.0961.40.07-0.2150.0030.067

てこ比は観察点が説明変数についてその中心から離れるほど大きくなり,回帰式や予測に与える影響が大きくなる.そこで,支点から離れるほど小さい力でものを動かせるという“てこ”の名前がついている.英語では,leverage という.回帰分析では,てこ比の大きいサンプルについては,その影響の様子を調べることが必要である.


2001年8月16日掲載

イベント案内や製品などの最新情報をお届けします

メールマガジン
最新の製品アップデート情報やセミナー・イベントなどのお知らせを,eメールでお送りします