데이터 분석이나 통계 공부를 하다 보면 **사분위수(Quartile)**라는 개념을 자주 접하게 됩니다.
오늘은 그중에서도 **3사분위수(3rd Quartile)**가 무엇인지, 어떻게 계산하는지 예제를 통해 쉽고 자세하게 정리해보겠습니다.
3사분위수란?
3사분위수는 데이터를 오름차순으로 정렬했을 때, 75%의 데이터가 그 값 이하에 위치하는 점입니다.
쉽게 말해, 데이터를 네 등분했을 때 상위 25%를 제외한 값의 경계점이라고 할 수 있어요.
3사분위수 위치를 구하는 공식
데이터에서 사분위수의 위치를 계산할 때는 아래 공식을 사용합니다.
-
n : 데이터 개수
-
p : 백분위수 (3사분위수에서는 p = 0.75)
-
1을 더하는 이유 : 데이터의 위치를 1부터 세기 때문
예제로 이해해보기
다음과 같은 데이터를 오름차순으로 정렬했다고 가정해볼게요.
-
데이터 개수 (n) = 6
-
백분위수 (p) = 0.75
이때 3사분위수의 위치를 계산하면,
즉, 4.75번째 위치에 해당하는 값이 3사분위수가 됩니다.
선형 보간법으로 값 구하기
4.75번째 값은 4번째 값과 5번째 값 사이에 있으므로, 두 값 사이를 비례 계산하여 값을 구해줘야 합니다.
-
4번째 값 = 3
-
5번째 값 = 5
계산식은 아래와 같습니다.
따라서, 이 데이터의 3사분위수는 4.5가 됩니다.
핵심 요약
✔️ 데이터를 오름차순으로 정렬한다.
✔️ 위치는 (n – 1) × p + 1 공식을 사용해 계산한다.
✔️ 위치가 정수가 아닐 경우, 선형 보간법으로 값을 구한다.
생각보다 간단하죠?
이렇게 3사분위수 개념과 계산법을 이해하면, 데이터의 분포를 파악할 때 훨씬 유용하게 활용할 수 있어요.