具体例でわかる!分散、標準偏差、偏差値の違い
具体例でわかる!分散、標準偏差、偏差値の違い
分散と標準偏差、そして偏差値の違いがわかりますか?
今回も具体例でわかりやすく説明しました!
前回の平均値などの話を理解していないとやや難しいので
よくわからん!って方はこちら↓を読むことをオススメします
statisticsworld.hatenadiary.com
平均値と中央値を理解したからどんな分布でもだいたいわかるぜ!
あまいぜ~あまいぜ~まだ重要な分散と標準偏差を理解してないぜ~
では具体的に見ていきましょう。
5人の英語のテストと数学のテストがあったとします。
それぞれの点数は
英語のテスト(40、50、60、70、80)
数学のテスト(50、55、60、65、70)
です。
どちらも平均値は60点で、中央値も60点です。
(平均、中央値わからない方は上に貼ってある記事を読んでいただければすぐに理解できると思います)
でも点数の散らばり具合は英語と数学で異なっていますよね?
これらを数字で表したい!そこで出てくるのが分散です。
分散とは、簡単に言うと「データの散らばり具合」を表す値です。
データ、つまりここでいう点数がどれくらいバラついているのか?を数値化したものが分散になります!
分散の求め方は「平均からの差の二乗」の平均 です。
平均が2つ出てきてさっそく意味不明?
大丈夫です。
具体的に見てみましょう。
英語のテストの分散を求めてみます。
英語のテスト(40、50、60、70、80)
まず、英語のテストの平均は60点です。
これを
(40-60)
(50-60)
(60-60)
(70ー60)
(80-60)
各々の点数 ー 平均 とします
平均からの差ですね。
平均からの差をそれぞれ2乗します。
(40-60)^2
(50-60)^2
(60-60)^2
(70ー60)^2
(80-60)^2
※^2は2乗しますって意味です。つまり、一番上でいえば(40-60)×(40-60)ってことです
(40-60)^2 =-20×-20=400
(50-60)^2 =-10×-10=100
(60-60)^2 =0×0=0
(70ー60)^2 =10×10=100
(80-60)^2 =20×20=400
平均からの差の2乗の結果が出ました。
分散の求め方は「平均からの差の二乗」の平均だったので
これらの平均を求めます。
つまり、(400+100+0+100+400)÷5=200
長いですけど、やっていることはめっちゃ簡単です。
(最後に簡単な計算方法教えます)
同じように数学のテストも計算してみましょう。
もちろん電卓を使ってOKですよ!
数学のテスト(50、55、60、65、70)
数学のテストの平均も60点です。
これを
平均からの差をそれぞれ2乗します。
(50-60)^2
(55-60)^2
(60-60)^2
(65ー60)^2
(70-60)^2
これが
(50-60)^2 =-10×-10=100
(55-60)^2 =-5×-5=25
(60-60)^2 =0×0=0
(65ー60)^2 =5×5=25
(70-60)^2 =10×10=100
平均からの差の2乗の結果が出ました。
これらの平均なので
つまり、(100+25+0+25+100)÷5=50
つまり、数学のテストの分散は50です!
英語のテストは分散が200
数学のテストは分散が50
英語のテストの方が点数が散らばっていることがわかりましたね。
分散を求めるときに
平均からの差の2乗を使いましたよね?
なので、より実感に近くなるように√(ルート)を取ります。
電卓使ってください。
これが標準偏差になります!
つまり、標準偏差は分散を√したもの、平方根をとったものです。
英語の分散 200点
数学の分散 50点
なのでそれぞれ平方根を求めると
英語の標準偏差が10√2なので約14点です。
数学の標準偏差は5√2なので約7点です。
テストの平均点が60点だったのでより実感に近い値になったと思います!
数学の方が散らばり具合が小さいということになりますね。
標準偏差も分散と同じくデータの散らばり度合いを表す値になります!
さて、ここで問題です!(デデドン!)
この数学と英語のテストででそれぞれ70点を取りました。
数学と英語、どちらの方がすごいでしょうか?
どちらも平均から10点多く得点しています。
これだけではどちらも平均からそこそこ上だからなぁ~くらいの感想しかでてこず
どちらがすごいか判断できませんよね?
ここで役に立つのがデータの散らばり度合いである分散と標準偏差なのです!
わかりやすく偏差値を求めたいと思います!
模試を受けたり、受験を経験されたことがある方なら必ず見たことがあるはずです。
こんなところにも統計が!!!
偏差値とは、全員の点数と自分の点数を比較して得られる値で、
点数のデータを正規分布に従うと仮定した上で、
平均が50、標準偏差が10=分散100となる様に標準化した値。
よくわからーーーん!!!
大丈夫です!
簡単に言えば
偏差値はそれぞれバラツキや平均が異なるテストの点数を同じような形に整えてうまいこと比較しよう!っていう値です。
仮にテストの点数が70点だったき
平均点が90点のテストのときと平均点が40点のときのテストではすごさが全く違いますよね?これをうまいこと標準化(同じような形に整えること)して比較しようってことです。
標準化については後日また詳しく書きますので
今はわけわからなくてOKです(後日がいつかとはいってない)
偏差値の求め方です!
(点数ー平均)÷ 標準偏差
これに10をかけて50を足したものが偏差値になります。
つまり、
{(点数ー平均)÷ 標準偏差 }×10+50
これで偏差値が求められます。
さっきの問題だと
点数は70点でしたね。
英語と数学のテストの平均は60点。
英語の標準偏差が10√2なので約14点です。
数学の標準偏差は5√2なので約7点です。
これらをあてはめていきます。
まずは英語から。
{(70点ー平均の60点)÷10√2 }×10+50
=5√2+50=だいたい57くらいですね。
つまり英語の偏差値は57程度になります。
同じように数学も計算します。
{(70点ー平均の60点)÷5√2 }×10+50
=10√2+50=だいたい64くらいですね
つまり数学の偏差値は64程度になります。
このように平均が全く同じテストで同じ得点を取ったとしても
標準偏差(点数のばらつき)が異なると偏差値が異なります。
英語が57で数学が64ということは
この人は数学の方が勉強ができる!
ということがわかります。
実は平均だけ、中央値だけではデータの特徴の一部しか表し切れていないのですね。
そこでデータのばらつきとして分散、標準偏差などを値を活用して
データの特徴をわかりやすく数値化しているのです。
前回説明した平均値、最頻値、中央値と合わせて
分散、標準偏差、偏差値を使ってよりデータの実態を明確にしてみてくださいね。
え?簡単な分散の出し方?よく覚えていましたね
~TIPS~
簡単な分散の出し方
いろんなサイトにも書いてあるのでここでは簡単に。
英語のテスト(40、50、60、70、80)を例に計算します。
それぞれの点数を2乗した平均ー平均の2乗
これで分散がでます
(40^2+50^2+60^2+70^2+80^2)÷5 - 60^2
=(1600+2500+3600+4900+6400)÷5 - 3600
=3800 - 3600 =200
大抵の場合はこのやり方で分散を出した方が圧倒的に早いです。
今日も最後まで見ていただきありがとうございました!
質問や気になる点、もしくは間違いなどありましたら
Twitter:@zack32319636
までご連絡ください。
書いてほしい記事のリクエストも随時受付中です。
気軽にリプなりメッセなりください。