「数理演算の基礎」

2019年より着手した「数理再勉強」用の倉庫。

【小まとめ】統計計算における基礎

f:id:ochimusha01:20200110140517p:plain

統計学(statistics)は実際のデータの整理と可視化を主題とする記述統計学descriptive statistics)と、様々な数理を導入しての予測を含む推計統計学(inferential statistics)の2つに大別されます。

記述統計学descriptive statistics

 一般に代表値Representative value)候補とされるのが以下。

①基本的諸元

  • 最小値Min
  • 第 1 四分位点1st Quartile
  • 中央値Median)…分布の中心にあるデータの数値。候補データが複数存在する場合にはその平均

  • 平均Mean)…データの各数値の和をデータ数で割ったもの。
  • 第 3 四分位点3rd Quartile
  • 最大値Max

範囲Range)….散布度基準の一つ。最大値(Max)-最小値(Min)。度数分布Frequency Distribution)の表現形態の一つたるヒストグラムhistogram)では「階級(Class)の最大値-階級(Class)の最小値」と計算される。
③最頻値(Mode)…やはりヒストグラムhistogram)と深い関係にある。

偏差Deviation)…データの各数値より、その平均を引いた残り標本分散Sample Dispersion)/不偏分散Unbiased Dispersion)、標準偏差Standard Deviation)/平均偏差Mean Deviation)、Z得点Value)/偏差値Deviation Value)などの算出に使われる。
*定数項を除いて分布の中心を原点に戻す効果がある。それ自体が代表数に選ばれる事はない。

 ⑤標本分散Sample Dispersion)/不偏分散Unbiased Dispersion)…散布度基準の一つ。状況によって使い分けるのが正しいが、結果として不偏分散が広まる。

  • 標本分散Sample Dispersion)…偏差^2の合計/標本数
  • 不偏分散Unbiased Dispersion)…偏差^2の合計/(標本数-1)

 標準偏差Standard Deviation)/平均偏差(Mean Deviation)…散布度基準の一つ。状況によって使い分けるのが正しいが、結果として標準偏差が広まる。

  • 標準偏差Standard Dispersion)…分散の平方根
  • 平均偏差Mean Deviation)…偏差の絶対値の平均
    知名度は今ひとつ。データの中央値が代表値となる。

⑦Z得点Z Value)/偏差値Deviation Value)…言葉としての「偏差値」が20世紀の受験戦争以降一般にも定着したが、その過程で内容についての誤解も広がった。

推計統計学(inferential statistics)…まだまだ工事中…

  それ以前の基礎たる区間(interval)設定と乱数発生に関する話題。