3사분위수란? 개념부터 공식, 예제까지 쉽게 정리!

데이터 분석이나 통계 공부를 하다 보면 **사분위수(Quartile)**라는 개념을 자주 접하게 됩니다.

오늘은 그중에서도 **3사분위수(3rd Quartile)**가 무엇인지, 어떻게 계산하는지 예제를 통해 쉽고 자세하게 정리해보겠습니다.


3사분위수란?

3사분위수는 데이터를 오름차순으로 정렬했을 때, 75%의 데이터가 그 값 이하에 위치하는 점입니다.

쉽게 말해, 데이터를 네 등분했을 때 상위 25%를 제외한 값의 경계점이라고 할 수 있어요.


3사분위수 위치를 구하는 공식

데이터에서 사분위수의 위치를 계산할 때는 아래 공식을 사용합니다.

위치 = (n - 1) × p + 1
  • n : 데이터 개수

  • p : 백분위수 (3사분위수에서는 p = 0.75)

  • 1을 더하는 이유 : 데이터의 위치를 1부터 세기 때문


예제로 이해해보기

다음과 같은 데이터를 오름차순으로 정렬했다고 가정해볼게요.

2, 3, 3, 3, 5, 8
  • 데이터 개수 (n) = 6

  • 백분위수 (p) = 0.75

이때 3사분위수의 위치를 계산하면,

위치 = (6 - 1) × 0.75 + 1
= 5 × 0.75 + 1
= 3.75 + 1
= 4.75

즉, 4.75번째 위치에 해당하는 값이 3사분위수가 됩니다.


선형 보간법으로 값 구하기

4.75번째 값은 4번째 값과 5번째 값 사이에 있으므로, 두 값 사이를 비례 계산하여 값을 구해줘야 합니다.

  • 4번째 값 = 3

  • 5번째 값 = 5

계산식은 아래와 같습니다.

3 + (5 - 3) × 0.75
= 3 + 2 × 0.75
= 3 + 1.5
= 4.5

따라서, 이 데이터의 3사분위수는 4.5가 됩니다.


핵심 요약

✔️ 데이터를 오름차순으로 정렬한다.

✔️ 위치는 (n – 1) × p + 1 공식을 사용해 계산한다.

✔️ 위치가 정수가 아닐 경우, 선형 보간법으로 값을 구한다.


생각보다 간단하죠?

이렇게 3사분위수 개념과 계산법을 이해하면, 데이터의 분포를 파악할 때 훨씬 유용하게 활용할 수 있어요.

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다