ウエイトバック集計って?
ちょっと便利帖
ちょっと豆知識
「ウエイトバック集計」って?
「全数調査」と「標本調査」
調査は、その対象全体を調査するのか、それとも一部だけを調査するのかによって、「全数調査」と「標本調査」に分けられます。
「全数調査」とは、知りたいと思っている対象のすべてを調査することで、「悉皆調査(しっかいちょうさ)」ともいいます。
「全数調査」では、調査対象のことが正確にわかるというメリットがありますが、調査対象のデータ数が多い場合には、労力や時間がかかるため、コストも高くなるというデメリットがあります。
国の基幹統計である「国勢調査」は「全数調査」の代表例です。
「標本調査」は、調査対象の全体ではなく、一部分だけを調査するので、労力・時間をかけずにできるというメリットがあります。
しかしながら、調査対象全体の本当の姿を知ることはできないというデメリットがあります。
「全数調査」とは、知りたいと思っている対象のすべてを調査することで、「悉皆調査(しっかいちょうさ)」ともいいます。
「全数調査」では、調査対象のことが正確にわかるというメリットがありますが、調査対象のデータ数が多い場合には、労力や時間がかかるため、コストも高くなるというデメリットがあります。
国の基幹統計である「国勢調査」は「全数調査」の代表例です。
「標本調査」は、調査対象の全体ではなく、一部分だけを調査するので、労力・時間をかけずにできるというメリットがあります。
しかしながら、調査対象全体の本当の姿を知ることはできないというデメリットがあります。
標本の構成比を実際の構成比に合わせるには…
回収された標本の属性構成比を、母集団(統計調査を行うとき、調査の対象となる個体全体のこと)の構成比に合わせるためには「ウエイトバック集計」を行います。
回収された標本の構成比を実際の構成比に合わせて集計したいとき、標本に重み(ウエイト)づけして集計することで、母集団の構成の数値に補正した結果を得ることができます。
例えば、男子生徒480人、女子生徒520人の学校を対象にしたアンケートを行ったとしましょう。
男子生徒の回答数が300、女子生徒の回答数が450だった場合、このまま集計してしまうと、回答数の多い女子生徒の意見がより大きく反映されます。
回収された標本の構成比を実際の構成比に合わせて集計したいとき、標本に重み(ウエイト)づけして集計することで、母集団の構成の数値に補正した結果を得ることができます。
例えば、男子生徒480人、女子生徒520人の学校を対象にしたアンケートを行ったとしましょう。
男子生徒の回答数が300、女子生徒の回答数が450だった場合、このまま集計してしまうと、回答数の多い女子生徒の意見がより大きく反映されます。
母集団 | 母集団構成比 | 回答数 | 回答数構成比 | |
---|---|---|---|---|
男子生徒 | 480 | 48.0% | 300 | 40% |
女子生徒 | 520 | 52.0% | 450 | 60% |
合計 | 1000 | 100.0% | 750 | 100% |
このために、あらかじめ「男子生徒数:女子生徒数=男子回答数:女子回答数」になるように、アンケートの回答数を調整して集計します。
ここで必要なのが、ウエイト値です。
ウエイト値は、 母集団数÷回収数×(総回収数÷総母集団数)で求めます。
ここで必要なのが、ウエイト値です。
ウエイト値は、 母集団数÷回収数×(総回収数÷総母集団数)で求めます。
ウエイト値 | 補正後 | 補正後構成比 | |
---|---|---|---|
男子生徒 | 1.20000 | 360 | 48.0% |
女子生徒 | 0.86667 | 390 | 52.0% |
合計 | 1.00000 | 750 | 100.0% |
求めたウエイト値に回答数を乗じて得た数値の構成比は母集団の構成比と等しくなり、本来の大きさに補正することができます。
標本調査では、標本を用いて母集団の状況をできるだけ正確に復元推計することが目的です。
正確な推計結果を得るためには、標本が母集団全体の特徴をよく表したものになるように、つまり、母集団のよい縮図となるように抽出することが重要になります。
標本の抽出方法についてはまたの機会に…。
標本調査では、標本を用いて母集団の状況をできるだけ正確に復元推計することが目的です。
正確な推計結果を得るためには、標本が母集団全体の特徴をよく表したものになるように、つまり、母集団のよい縮図となるように抽出することが重要になります。
標本の抽出方法についてはまたの機会に…。