昨日は偏差を扱った。

 

さて、これでデータ一つ一つが、それを含むデータセット全体の平均からどの程度ずれているのか、ということを定量的に示すことができたわけだ。

 

では、次に考えるべきことは、このデータセットそのものが、どの程度バラバラなのかということを測るのにはどうしたらよいか、だ。

 

昨日の例でいえば、ドーナツのセットがどれくらいバラバラなのかを定量的に示すにはどうしたらよいのかということを考えたいわけだ。

 

ここで、昨日扱った一つ一つの偏差を足し合わせるというアイディアが思いつく筈だ。

 

だが、それでは困ったことが起こる。ゼロになってしまうのだ。

 

そりゃ、偏差とは各データと平均値との差なのだから、足すとゼロになるのは当然だ。

 

このままではどれくらいバラバラなのかを示すことができない。
ならば、全て2条して、足し合わせればいいのではないかと考えた。

 

こうすれば、足し合わせてもゼロにはならない。
そして、どれくらいバラバラなのかを測る一つの目安になる気がする。(勿論この段階ではまだ未完成なのだが、、理由は次回説明するが、自分でも考えてみるといい)

 

この偏差を2条して足し合わせた数値を、変動と呼ぶことになった。

 

例をあげてみよう。

 

例えば、どちらも平均は100gの二つのドーナツのセットがあるとする。

 

一つは、

150g, 120g, 100g, 80g, 50g

 

もう一つは

180g, 150g, 100g, 50g, 20g

 

だ。

どちらも、平均値は100gだ。では、どちらのほうがバラバラだろうか。

 

直感的には2つ目の方がバラバラだろう。そこで、これを数字で示すために、先程の偏差を使ってみよう。

 

偏差は、一つ目のドーナツセットでは、

50g, 20g, 0g, -20g, -50g

 

2つ目では、

80g, 50g, 0g, -50g, -80g

 

となる。

 

では、これらを2条してたしあわせ、変動を出してみよう

計算は省くが、これをすると一つ目の変動が、5800、2つ目の変動が17800となる。(単位は省略)

 

なので、定量的にも二つ目の方が、明らかにバラバラであるということが言えたわけだ。

 

だが、実はこのままでは一つ困った問題がある。

 

それを解決するために必要なのが、分散という概念だ。これを次回説明したい。

ランキングポチは必ず頼むぞ。読み逃げは厳禁だ。

人気ブログランキングへ
にほんブログ村 為替ブログへ
にほんブログ村

売買ルールを手に入れたいなら、、、
動画講座はこちら
売買ルールの実践練習に、、、
チャートブックはこちら