この記事では、「二項分布」と「正規分布」の違いを分かりやすく説明していきます。
「二項分布」とは?
「二項分布」とは、確率論や統計学で用いられているもので、二択で成功の確率と失敗の確率が常に一定となることかつ、各試行を独立させて行うランダム試行の分布です。
「二項分布」では、試行回数をn、成功する確率pとすると、期待値(平均値)と分散を求められます。
二項分布の期待値は、n×pとなり、二項分布の分散はn×p(1-p)となり、標準偏差は(p(1-p)/n)となります。
(1-p)は失敗確率を表しており、例えば、全ての出る目の確率が等倍の6面サイコロで1が出ることを成功とした場合に、成功確率は6分の1となり、2~6の失敗が出る確率を求めると、1から6分の1を引いた数が失敗となります。
「二項分布」は、縦軸を確率、横軸を観測データとして試行回数を限りなく多くしていくと、「正規分布」の形に近づくという特徴があります。
「正規分布」とは?
「正規分布」とは、確率論や統計学で用いられているもので、データの分布が平均値を頂点とした左右対称の山形で表示される分布です。
「正規分布」は、縦軸を確率、横軸を観測データとすると、平均値と最頻値、中央値が一致している特徴があるので、平均値を中心とした左右対称の山形の形になります。
自然現象や社会現象の多くのものは「正規分布」に従っています。
具体的には、母集団の分布にかかわりなく、母集団から抽出された標本の数を十分に多い場合に、標本平均の分布が「正規分布」に従うという性質があります。
「二項分布」と「正規分布」の違い
「二項分布」と「正規分布」の違いを、分かりやすく解説します。
説明した通り「二項分布」と「正規分布」は違うものとなります。
「二項分布」の試行回数を限りなく多くしていくという前提条件下においては、分布の形が「正規分布」とほぼ同じになります。
確率論や統計学では、この性質を利用して、「正規分布」の性質にそった確率とデータの表を利用して、計算せずに特定の範囲にデータが含まれる確率を導いています。
まとめ
「二項分布」と「正規分布」について説明しました。
「二項分布」とは、二択で成功の確率と失敗の確率が常に一定となることかつ、各試行を独立させて行うランダム試行の分布です。
「正規分布」とは、データの分布が平均値を頂点とした左右対称の山形で表示される分布です。
「二項分布」は、試行回数を限りなく多くしていくと「正規分布」とほぼ同じ形になります。