1. ホーム
  2. 統計解析・品質管理
  3. 会員広場
  4. 六一学者の千字一話(連載)

第17話  nはいくつ?(六一学者の千字一話)

吉澤正先生御逝去に寄せて

六一学者の千字一話  六一学者 (吉澤 正氏)
六一学者 - 吉澤 正氏
(第10回JUSEパッケージ活用事例シンポジウムにて)


統計報告には,守るべき原則がある.たとえば,統計でウソをいわないこと,統計につきものの不確かさを隠さないこと,不確かさの程度を知らせることなどが基本的な原則である.それらは,政府や自治体が企画し調査し公表する官庁統計はもとより,マスコミが実施する世論調査から研究者が行う小規模の統計調査や統計的分析の報告にも通じる.

最近の経済統計には,金融市場の拡大やグローバル化によって,新しい状況を素早く調査して状況の変化を遅れなく知らせること(迅速性)が求められている.しかし,その結果については正確であること(正確性),一部の人に早く知らせて利益を取らせることなどのないこと(公平性)などが必要であることはいつでも変わらない.そのために,官庁統計には統計法があり,統計基準も作られていて,その法律や基準を守ることが要求される.

最近のようにグローバル化した時代には,IMF(国際通貨基金,International Monetary Fund)のような国際機関がグローバルスタンダードとなるシステムを作って,各国が妥当な基準にしたがって経済統計を作成し発表するように努力している.これは,メキシコの通貨危機,タイや韓国での経済危機の未然防止ができなかった反省からの発想らしい.

最新のシステムでは,加盟各国がインタネット上で統計作成公表の基準を明らかにし,ユーザーなどからクレームがあれば,それに誠実に応えることによって,信頼性を保証しようという仕組みになっている.

専門的な難しい話はさておき,簡単な世論調査の報告や統計分析の報告でも,調査を計画したり分析したときの基本的な情報が書かれていないものがしばしば見うけられる.

筆者のデータ解析の授業では,「統計調査や分析を報告している論文を見つけ,その報告の仕方や分析の方法について,適切であるか批判せよ」という宿題を出している.そこで,よく見かけるのが,いったいいくつのデータを集めたのか,いくつのデータを使って集計したのか,例えば,簡単な平均値でもいくつのデータの平均なのかなども書かれていないことがある.

統計では,データの個数や標本の大きさをアルファベットのnで表わすことが多い.データの個数nがわかれば,統計の精度やバラツキについて,おおよその検討をつけることもできる.例えば,小泉内閣の支持率が48%になって50%をきったという報道では,大抵は2段層化抽出法で1000人を対象に62.5%の回収率(625人の回答)であったという情報は普通なら記載されている.

そのとき,支持か不支持かの分布について単純に2項分布を仮定すれば,n人の回答者による標本支持率の分散は,母集団の支持率をpとすると,p(1−p)/n,となるので,標本支持率の標準偏差は,p(1−p)/nの平方根をとればよい.それにn=625,p=0.5を代入すれば,標準偏差は 0.02 となる.支持率50%あたりでは,その標準偏差は2%ぐらい,2倍の標準偏差で幅をつければ,支持率の信頼幅は+−(プラス・マイナス)4%程度と推定できる.

ところで,『Noといえない日本』が評判になったが,国の外交には原則をもち,その原則を守ることが重要だ.統計報告にも,守るべき原則がある.それを理解して,実行することが大切.『nをいわない報告』は困り者である.


2002年6月4日掲載

イベント案内や製品などの最新情報をお届けします

メールマガジン
最新の製品アップデート情報やセミナー・イベントなどのお知らせを,eメールでお送りします