본문 바로가기
소담한 스터디

평균값(Mean) vs 중앙값(Median) vs 최빈값(Mode)

by 뻐쁠 2021. 7. 22.
반응형

 

 

 

평균(Mean) Average라고도 하며, 모든 관측값의 합을 자료의 개수로 나눈 값이다.

모든 관측값이 반영되므로 극적으로 큰 값이나 작은 값이 존재할 경우 영향을 많이 받는다.

 

중앙값(Median) : 중간값, 중위수라고도 하며, 전체 관측값을 크기 순서로 배열했을 때 가장 중앙에 위치하는 값이다.

극단적 관측값의 영향을 크게 받지 않고, 관측값의 변화에 민감하지 않다.

자료가 홀수 개이면 정중앙 값이 중앙값이 되지만, 짝수 개이면 중앙에 위치한 값이 두 개가 되므로

이 경우에는 두 값의 평균을 중앙값으로 한다.

 

최빈값(Mode) : 전체 관측값 중 가장 많이 관찰되는 값을 말한다.

 

 

예를 들어, 9 명의 삼성전자 주주의 주식보유 수량이 아래와 같다고 할 때,

 

전체 주주의 보유량의 평균값은 68.444 가 된다.

대부분의 주주가 50주 이하를 소유하고 있는데, 500주를 보유한 주주때문에 평균값이 크게 증가한 것이다.

이 경우 이 값을 대표값이라고 보기는 어렵다.

 

반면 중앙값은 보유 수량이 적은 주주부터 많은 주주까지 줄을 세웠을 때 가운데있는 5번 주주의 보유수량인 10주가 중앙값이 된다.

평균값보다는 비교적 전체 값들을 대표하는 값에 가깝다고 볼 수 있다.

 

그리고 이 경우 최빈값은 가장 빈도수가 높은 5가 된다.

 

 

 

이처럼 전체 값 중 극단적인 값이 한 개 이상 있을 때 평균은 대표값으로 부적절할 수 있다. 이런 경우에는 극단적인 값의 영향을 받지 않는 중앙값이나 최빈수가 대표값으로 더 적절할 수 있다:)

 

 

 

 

반응형

댓글