アンケート調査をする前に、標本誤差のこと

ふと、思いました。
みんなはどのくらい、住んでいるまちのことが好きなんだろう。
自分と似た年代の、みなさんの意見が知りたい！！

なぜ急にアンケートのこと

たまたま仕事で専門統計調査士という調査の専門家の資格を持っていたので、個人的に自分が住んでいるまちのことを調査してみることにしました！

2022年の7月上旬現在、アンケートモニター仲介業者と契約を締結している最中で、実際の調査には進むことができません。

そこで、調査結果を見るための基礎知識として標本誤差について整理しておきます。

中野区の人口は2022年時点で35万人程度、そのうち20代・30代の若者の合計は11万人程度です。

今回僕は、自分と似たような境遇の人たち、すなわち中野区在住の20代・30代の方々の意見を聞いてみたいなと思っています。

でも、11万人全員に意見を聞くことはできません。

全員の意見を聞けたらそれが一番良いけれど、それは時間も労力も費用もめちゃくちゃかかってしまいます。

そこで僕は、モニター調査という形で、一定数の方々の意見を聞いてみることにしました。

※モニター調査とは、調査会社が抱えているアンケートモニターに対して調査を実施するものです。アンケートモニターは調査に協力する代わりに、調査会社からポイント等をもらえることがあります。

これは、全数調査ではなく、母集団（中野区在住の20代・30代の若者11万人）の中から一部（サンプル）を対象に実施する標本調査と呼ばれる形式になります。

もしも調査結果がでたあとに、

「その結果は一部の人が答えたものでしょ？本当にみんなの意見だって言えるの？信用できません！」

とか言われたらちょっと悲しい。

せっかく調査をするのだから、ある程度は信頼性のある結果がほしいなと思います。

そこで、そんな批判に晒されないようにしっかりと標本誤差について考えてサンプル数を決定したいと思います。

標本誤差ってあんまり聞きなれない言葉だと思いますが、考え方はけっこう簡単なはず。

例えば、母集団が1000人いるのに対してサンプル数が100人の調査をして、100人のうちリンゴが好きだと答えた人が50％だったとします。

そうすると、標本誤差は9.8%になるので、母集団の1000人が答えたとしても、リンゴが好きだと答える人は40.2%（50-9.8）～59.8%（50+9.8）の幅に収まるだろうというものです。

ちなみに、こんな計算式で標本誤差を求めることができます。

国の調査では、だいたいこの標本誤差が±５％以内に収まるように実施されることが多いようです。

また、信頼度というのもこのとき一緒に考える必要があって少しややこしいです。

これは、100回やったら何回標本誤差内に結果が収まるかということを意味しています。

国の調査では、大体この信頼度は95％で実施されています。

つまり、「100人のうちリンゴが好きだと50％の人が答えたとき、1000人の人がリンゴを好きだという可能性は100回のうち95回は40.2%（50-9.8）～59.8%（50+9.8）の幅に収まる」ということになります！

これは、世の中のことが大体こういう確立になることに由来しています。

はい、というわけで先程の数式を見ると分かると思いますが、比率が50％のとき、標本誤差は最大となります。

それが5％以内に収まりかつ信頼度95％にすると385人のサンプルが必要であることがわかります。

モニターは多いほど調査費用がかかるので、本当は100人くらいだと助かりますが、、、。