1. ホーム
  2. 統計解析・品質管理
  3. 会員広場
  4. 六一学者の千字一話(連載)

第11話  それでも山手線は丸かった(六一学者の千字一話)

吉澤正先生御逝去に寄せて

六一学者の千字一話  六一学者 (吉澤 正氏)
六一学者 - 吉澤 正氏
(第10回JUSEパッケージ活用事例シンポジウムにて)


山手線ではなかったが,電車内でJR東日本の雑誌に目を通していたら,「それでも山手線は丸かった」という見出しに気がついた.ガガーリン宇宙飛行士の「地球は青かった」ではないけれど,ヘリコプターによるナイトクルージングで上空からの東京の夜景に感激したらしい.

さて,前回と前前回は「南北線はどのくらい真っ直ぐか」をテーマにしたが,今度は,山手線はどのくらい丸いかを考えよう.前回の流儀に従えば,山手線各駅の位置データを主成分分析にかけ,その固有値の比率が1に近いほど丸いとみるのが自然であろう.

主成分分析は,ソフトを使って機械的に計算すると,相関係数行列を出発行列にして主成分を求め,その主成分得点をそれぞれの分散が1になるように基準化することが多い.いわゆるソフトのデフォルトである.山手線データのような位置のデータでは,相関係数行列でなく,分散共分散行列を基にして固有値・固有ベクトルを計算して主成分を決めないと,データに則した主成分が求まらない.

まず,分散共分散行列を計算してみると,東西の分散が6.44,南北の分散が17.62で,山手線は南北にばらつきが大きいことがわかる(表1参照).分散の合計は24.06,共分散は2.67で,ちなみに相関係数は0.25.分散の比率や相関係数を見ても丸いとはいい難い.これから,固有値を求めると,第1固有値が18.22,第2が5.84(合計は24.06).主成分得点を使って駅を散布図で表わすと,東西南北を少しだけ回転した形,北のほうに田端や駒込,南のほうに大崎や五反田が位置している(図1参照).それでも,山手線は丸い環状線なのだ.


図11-1 山手線の主成分得点散布図

表11-1. 山手線東西距離と南北距離の分散共分散行列
変数東西距離南北距離
東西距離6.442.67
南北距離2.6717.62

(固有値:第1主成分は18.225,第2主成分は5.838,主成分得点はその分散が固有値に基準化,第1主成分が南北方向とほぼ一致するので,縦軸を第1主成分とした)

ところで,図11-1では,主成分得点はその分散がそれぞれの固有値に一致するように基準化している.主成分分析には,出発行列として分散共分散行列あるいは相関係数行列の選択,主成分得点の基準化としてその分散を固有値に一致させるかあるいは分散を1にするかの選択がある.その組合せで4とおりの場合の使い分けを表2にまとめておこう.この解説は長くなるので,別の機会に取上げる.

参考までに山手線のデータを表3に,ついでに地下鉄南北線,東西線,都営新宿線のデータを含めて統一した原点を設定したときのデータを表4に掲載しておく.第9話第10話とあわせて実際に計算してほしい.

表11-2
場合出発行列主成分特典の分散説明
1分散共分散行列 固有値に一致させる
射影座標という
元のデータをその主成分の空間に射影したもの,主成分得点散布図でデータ間の相対位置が読める
2同上1基準座標という変数をプロットすると,変数と主成分の相関や変数間の相関が読める.因子負荷量による変数の散布図と重なる.
3 相関係数行列 固有値に一致させる
射影座標
基準化データをその主成分の空間に射影したもの,データ間の相対位置が読める
4同上1基準座標変数をプロットすると,変数と主成分の相関や変数間の相関が読める.因子負荷量による変数の散布図と重なる.
表11-3. 山手線データ(東西は新大久保を,南北は大崎をゼロ点した.単位はkm)
山手線山手線東西山手線南北
東京5.9946.32772
有楽町5.1845.91480
新橋4.9234.59792
浜松町4.8693.85020
田町4.3562.46636
品川3.2940.56916
大崎2.1060.00000
五反田1.8540.42408
目黒1.4400.92628
恵比寿0.5492.48868
渋谷0.0634.05108
原宿0.1265.66928
代々木0.0996.50628
新宿0.0097.67808
新大久保0.0008.39232
高田馬場0.1899.93240
目白0.32411.18232
池袋0.58511.82960
大塚2.09711.95236
巣鴨3.35712.07512
駒込4.37413.03488
田端5.11213.07952
西日暮里5.98511.97468
日暮里6.21911.66220
鴬谷6.60611.26044
上野6.5349.98820
御徒町6.4179.56412
秋葉原6.3278.22492
神田6.2107.76736

「表11-4. 地下鉄南北線・東西線・新宿線とJR山手線の位置データ」

表11-4
南北線
 東西距離南北距離
赤羽岩淵4.9818.49
志茂6.1518.1552
王子神谷6.3316.4812
王子6.4215.8116
西ヶ原6.6914.4724
駒込6.8713.1332
本駒込7.8612.2404
東大前8.1311.1244
後楽園7.7710.4548
飯田橋6.699.2272
市ヶ谷6.338.6692
四ツ谷5.347.4416
永田町6.516.9952
溜池山王6.66.5488
六本木一丁目6.425.3212
麻布十番6.424.6516
白金高輪6.243.0892
白金台5.252.7544
目黒4.621.75
表11-4
東西線
東西距離南北距離
西船橋26.15710.399
原木中山24.6189.34996
妙典23.078.54644
行徳22.5397.24072
南行徳21.2976.58228
浦安20.1995.377
葛西18.4895.23192
西葛西17.1665.28772
南砂町15.0335.57788
東陽町13.7195.63368
木場12.5315.62252
門前仲町11.3616.51532
茅場町9.8317.09564
日本橋9.5437.24072
大手町9.1567.37464
竹橋8.1488.49064
九段下7.7438.88124
飯田橋6.8889.24952
神楽坂6.2410.15348
早稲田4.91710.2874
高田馬場3.48610.75612
落合1.81210.61104
中野0.12910.2874
表11-4
新宿線
東西距離南北距離
本八幡23.2512.2404
篠崎21.3610.3432
瑞江21.098.7808
一之江19.657.4416
船堀18.037.33
東大島16.58.446
大島15.248.446
西大島14.168.446
住吉13.628.446
菊川12.548.3344
森下128.3344
浜町10.928.3344
馬喰横山10.658.6692
岩本町9.668.8924
小川町9.218.8924
神保町8.138.8924
九段下7.778.8924
市ヶ谷6.428.5576
曙橋4.988.6692
新宿三丁目3.548.5576
新宿3.098.3344
表11-4
山手線
 東西距離南北距離
東京9.1837.15144
有楽町8.3736.73852
新橋8.1125.42164
浜松町8.0584.67392
田町7.5453.29008
品川6.4831.39288
大崎5.2950.82372
五反田5.0431.2478
目黒4.6291.75
恵比寿3.7383.3124
渋谷3.2524.8748
原宿3.3156.493
代々木3.2887.33
新宿3.1988.5018
新大久保3.1899.21604
高田馬場3.37810.75612
目白3.51312.00604
池袋3.77412.65332
大塚5.28612.77608
巣鴨6.54612.89884
駒込7.56313.8586
田端8.30113.90324
西日暮里9.17412.7984
日暮里9.40812.48592
鴬谷9.79512.08416
上野9.72310.81192
御徒町9.60610.38784
秋葉原9.5169.04864
神田9.3998.59108

2001年12月7日掲載

イベント案内や製品などの最新情報をお届けします

メールマガジン
最新の製品アップデート情報やセミナー・イベントなどのお知らせを,eメールでお送りします