【統計学入門】統計学で出る内容ざっくりまとめ

AIエンジニアやデータサイエンティストを目指す場合、多くはデータを扱うことになります。

その際、データを適切に扱い、データから情報を読み取るために統計学の知識が要求されることも少なくはありません。

今回はその「統計学」について、まだ触れたことがない人のためにも、どんな内容がでてくるのかざっくりまとめてみました。

※めちゃくちゃ長くなるので解説は別記事にまとめます。ここでは「こんな分野があるんだ」くらいに思ってもらえるようにまとめています。

基礎

基礎的な表

・度数分布表

・ヒストグラム

・度数折れ線・度数多角形

・累積相対度数折れ線

基礎的なデータ

・相対度数

・累積度数

・累積相対度数

・スタージェスの公式

データの指標

データの傾向を測るために指標が用いられます。

データの指標は、主に「散らばりを測る指標」と「中心・真ん中を測る指標」があります。

散らばりを測る指標

・範囲(レンジ)

・四分位範囲

・箱ひげ図

・外れ値

・平均絶対偏差(平均偏差)

・分散(抽出する集団により母分散・標本分散)

・標準偏差(抽出する集団により母標準偏差・標本標準偏差)

・チェビシェフの不等式

・変動係数(変位計数)

・標準化変量(基準値・zスコア)

・標準化(基準化)

・偏差値(標準変化量z*10+50)

・歪度(抽出する集団により母歪度・標本歪度)

中心を測る指標

・算術平均(抽出する集団により母平均・標本平均)

・メジアン・中央値・中位数

・モード・最頻値

・加重算術平均

・幾何平均(相乗平均)

・トリム平均(刈り込み平均・削除平均・調整平均)

・移動平均

並び方・順列や組み合わせ

・順列

・円順列

・数珠順列

・重複順列(おなじものを繰り返しとることを許す順列)

・組み合わせ

・重複組み合わせ(おなじものを繰り返しとることを許す組み合わせ)

確率

・試行(結果が偶然によって決まる)

・事象(試行結果)

・余事象

・全事象

・場合の数

加法定理

・積事象(同時確率)

・和事象

・排反事象(空事象)

乗法定理

・独立事象

・条件付き確立

ベイズの定理

・事前確率

・事後確率(原因の確立)

確率分布

・確率変数

・離散型確率変数

・離散型確率分布

・連続型確率変数

・連続型確率分布

・確率変数の期待値・平均値

・確率変数の分散・標準偏差

・確率密度関数

二項分布

ポアソン分布

正規分布

・正規曲線

・変曲点

標準正規分布

・ノーマライズ

区間推定

母平均の区間推定

・信頼区間

・信頼限界

・下側信頼限界

・上側信頼限界

・信頼係数

・信頼度

・大標本

・小標本

・中心極限定理

・t分布表

・自由度

・推定の誤差

母比率の区間推定

上記の母平均の区間推定ででるような内容の他に以下の要素もあります。

・母比率

・標本比率

 

仮説検定

母平均の検定

・帰無仮説

・対立仮設

・棄却

・採択・受容

・両側検定

・片側検定

・検定統計量

・優位水準(危険率)

・臨海地(境界値)

・実現値

・棄却域

・採択域

・正規検定(z検定)

・第一種の誤り

・第二種の誤り

・t検定

・t分布表

 

また他にも以下のような検定があります。

母比率の検定

母平均の差の検定

母比率の差の検定

母標準偏差の区間推定・検定

・カイ二乗分布(x分布)

・カイ二乗分布表(x分布表)

・カイ二乗分布(x分布)の確率密度関数

・ガンマ関数

・x^2分布の平均・分散・標準偏差

相関分析