最頻値
最頻値(mode)は中央値や平均値と同じ「代表値」「位置の指標」のひとつである。もっとも頻度の高い値、という直観的に分かりやすい定義である。
このデータの最頻値は4である。
最頻値を求める意味があるデータは離散量の場合である。連続量の場合はすべての値が1件しか存在しない場合もある。厳密な意味では連続量(たとえば時間、重さ)は切れ目がない。連続量の場合は離散化(カテゴライズ)して階級を作ることが多い。年齢も時間という連続量だが、日数、月数、年数(年齢)と離散的に測定する習慣がある。必要な情報の精度に応じて5歳階級にカテゴライズし、階級に含まれる個数(人数)の最頻値を求めることがある。
データの分布形状にも注意が必要である。単峰分布の場合は意味があるが、頂点が複数あるようなデータ(の分布)にとって、最頻値は適切ではない。
このデータの最頻値は4と8である。頂点が2つあるデータだが、このデータにとって最頻値の意味を考えることは難しい。異質の集団が混在しているかも知れないと考えることになるだろう。