3사분위수란? 개념부터 공식, 예제까지 쉽게 정리!

데이터 분석이나 통계 공부를 하다 보면 사분위수(Quartile)라는 개념을 자주 접하게 됩니다.

오늘은 그중에서도 3사분위수(3rd Quartile)가 무엇인지, 어떻게 계산하는지 예제를 통해 쉽고 자세하게 정리해보겠습니다.

3사분위수란?

3사분위수는 데이터를 오름차순으로 정렬했을 때, 75%의 데이터가 그 값 이하에 위치하는 점입니다.

쉽게 말해, 데이터를 네 등분했을 때 상위 25%를 제외한 값의 경계점이라고 할 수 있어요.

 

3사분위수 위치를 구하는 공식

데이터에서 사분위수의 위치를 계산할 때는 아래 공식을 사용합니다.

위치 = (n - 1) × p + 1
  • n : 데이터 개수

  • p : 백분위수 (3사분위수에서는 p = 0.75)

  • 1을 더하는 이유 : 데이터의 위치를 1부터 세기 때문

 

예제로 이해해보기

다음과 같은 데이터를 오름차순으로 정렬했다고 가정해볼게요.

2, 3, 3, 3, 5, 8
  • 데이터 개수 (n) = 6

  • 백분위수 (p) = 0.75

이때 3사분위수의 위치를 계산하면,

위치 = (6 - 1) × 0.75 + 1
= 5 × 0.75 + 1
= 3.75 + 1
= 4.75

즉, 4.75번째 위치에 해당하는 값이 3사분위수가 됩니다.

 

선형 보간법으로 값 구하기

4.75번째 값은 4번째 값과 5번째 값 사이에 있으므로, 두 값 사이를 비례 계산하여 값을 구해줘야 합니다.

  • 4번째 값 = 3

  • 5번째 값 = 5

계산식은 아래와 같습니다.

3 + (5 - 3) × 0.75
= 3 + 2 × 0.75
= 3 + 1.5
= 4.5

따라서, 이 데이터의 3사분위수는 4.5가 됩니다.

 

핵심 요약

✔️ 데이터를 오름차순으로 정렬한다.

✔️ 위치는 (n – 1) × p + 1 공식을 사용해 계산한다.

✔️ 위치가 정수가 아닐 경우, 선형 보간법으로 값을 구한다.

생각보다 간단하죠?

이렇게 3사분위수 개념과 계산법을 이해하면, 데이터의 분포를 파악할 때 훨씬 유용하게 활용할 수 있어요.

댓글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다