조항

2.4: 정규 분포 - 수학


정량적 데이터의 분포(모양)에는 여러 가지 유형이 있습니다. 섹션 1.5에서 우리는 다양한 히스토그램을 살펴보고 그 모양을 대칭, 왼쪽으로 치우침, 오른쪽으로 치우친 것으로 설명했습니다. 정규 분포라고 하는 특별한 대칭 모양의 분포가 있습니다. 종처럼 보이기 때문에 종곡선이라고도 합니다. 정규 분포의 한 가지 속성은 평균에 대해 대칭이라는 것입니다. 또 다른 속성은 데이터의 백분율이 평균의 특정 표준 편차 내에 속하는 것과 관련이 있습니다. 이 속성은 경험적 규칙으로 정의됩니다.

경험적 규칙: 대략적으로 정규 분포를 따르는 데이터 세트가 주어지면:

데이터의 약 68%가 평균의 1 표준 편차 내에 있습니다.

데이터의 약 95%가 평균의 2 표준 편차 내에 있습니다.

데이터의 약 99.7%가 평균의 3 표준 편차 내에 있습니다.

이러한 백분율을 시각화하려면 다음 그림을 참조하십시오.

참고: 경험적 규칙은 대략적인 정규 분포에 대해서만 참입니다.

예 (PageIndex{1}): 경험적 규칙 사용

여러분의 수업이 시험을 치렀고 평균 점수가 75%이고 표준 편차가 5%라고 가정합니다. 테스트 점수가 대략적인 정규 분포를 따르는 경우 다음 질문에 답하십시오.

  1. 65점에서 85점 사이의 점수를 받은 학생의 비율은 몇 퍼센트입니까?
  2. 학생의 몇 퍼센트가 65에서 75 사이의 점수를 가졌습니까?
  3. 학생의 몇 퍼센트가 70에서 80 사이의 점수를 받았습니까?
  4. 85점 이상의 점수를 받은 학생의 비율은 몇 퍼센트입니까?

각각의 문제를 풀기 위해서는 이 상황을 따르는 법선 곡선을 그리는 것이 도움이 될 것입니다. 평균은 75이므로 중심은 75입니다. 표준 편차는 5이므로 평균 위의 각 라인에 대해 5를 더하고 평균 아래의 각 라인에 대해 5를 뺍니다. 그래프는 다음과 같습니다.

  1. 그래프에서 95%의 학생이 65에서 85 사이의 점수를 가짐을 알 수 있습니다.
  2. 65에서 75 사이의 점수는 65에서 85 사이의 그래프 영역의 절반입니다. 대칭 때문에 65에서 85 사이의 백분율은 95%의 1/2, 즉 47.5%임을 의미합니다.
  3. 그래프에서 68%의 학생이 70에서 80 사이의 점수를 가짐을 알 수 있습니다.
  4. 이 문제에는 약간의 수학이 필요합니다. 전체 곡선을 보면 모든 시험 점수의 100%가 그 곡선에 해당한다고 말할 것입니다. 따라서 대칭성 때문에 테스트 점수의 50%는 평균 위 영역에 속하고 테스트 점수의 50%는 평균 아래 영역에 속합니다. 파트 b에서 65에서 75 사이의 백분율이 47.5%라는 것을 압니다. 대칭성 때문에 75에서 85 사이의 비율도 47.5%입니다. 따라서 85를 초과하는 비율은 50% - 47.5% = 2.5%입니다.

예제 (PageIndex{1})를 볼 때 척도의 숫자는 숫자가 평균에서 얼마나 많은 표준편차를 가졌는지만큼 중요하지 않다는 것을 알 수 있습니다. 예를 들어, 숫자 80은 평균에서 1 표준편차입니다. 숫자 65는 평균에서 2 표준 편차입니다. 그러나 80은 평균보다 높고 65는 평균보다 낮습니다. 숫자 82가 평균에서 얼마나 많은 표준편차를 가지고 있는지 알고 싶다고 가정합니다. 어떻게 할까요? 다른 숫자는 평균에서 표준 편차의 정수였기 때문에 더 쉬웠습니다. 이를 정량화할 방법이 필요합니다. 데이터 값이 평균에서 얼마나 많은 표준 편차를 가지고 있는지 측정하기 위해 z-점수(z-값 또는 표준화된 점수라고도 함)를 사용합니다. 이것은 다음과 같이 정의됩니다.

z-점수: (z = dfrac{x-mu}{sigma})

여기서 (x) = 데이터 값(원시 점수)

(z) = 표준화된 값(z-점수 또는 z-값)

(mu) = 모집단 평균

(sigma) = 모집단 표준 편차

참고: z-점수는 항상 데이터 값이 분포의 평균에서 얼마나 많은 표준 편차인지를 기억하십시오.

데이터 값의 z-점수가 2.13이라고 가정합니다. 이것은 우리에게 두 가지를 알려줍니다. 첫째, 데이터 값이 양수이므로 평균보다 높다고 말합니다. 둘째, 이 값에 도달하려면 평균에 2개 이상의 표준 편차를 추가해야 한다고 알려줍니다. 대부분의 데이터(95%)가 2개의 표준 편차 내에 있으므로 이 범위를 벗어나는 모든 데이터는 이상하거나 비정상적인 값으로 간주됩니다. 2.13의 z-점수는 이 범위 밖에 있으므로 비정상적인 값입니다. 다른 예로, 데이터 값의 z-점수가 -1.34라고 가정합니다. z-점수가 음수이기 때문에 이 데이터 값은 평균보다 작아야 하며 이 값을 얻으려면 평균에서 표준 편차를 둘 이상 빼야 합니다. 2표준편차 이내이므로 정상값입니다.

비정상적인 값 z-점수가 < 또는 z-점수 > 2

평소 가치 사이에 z-점수가 있습니다. 및 2, 즉 (-2 < z-점수 < 2)입니다.

앞서 언급한 바와 같이 표준화된 테스트 또는 행동 테스트에 대한 보고서에서 표준화된 점수를 접할 수 있습니다.

예 (PageIndex{2}): Z-점수 계산

귀하의 학급에서 평균 점수가 75%이고 표준 편차가 5%인 테스트를 치렀다고 가정합니다. 테스트 점수가 대략적인 정규 분포를 따르는 경우 다음 질문에 답하십시오.

  1. 학생이 시험에서 87점을 받았다면 그 학생의 z-점수는 무엇이며 그 의미는 무엇입니까?

(mu = 75), (sigma = 5) 및 (x = 87)

(z = dfrac{x-mu}{sigma})

( = dfrac{87-75}{5})

(=2.40)

즉, 87점은 평균보다 2 표준편차 이상 높은 점수이므로 비정상적인 점수로 간주됩니다.

  1. 학생이 시험에서 73점을 받았다면 그 학생의 z-점수는 무엇이며 그 의미는 무엇입니까?

(mu = 75), (sigma = 5) 및 (x = 73)

(z = dfrac{x-mu}{sigma})

( = dfrac{73-75}{5})

(=-0.40)

즉, 73점은 평균 아래 표준 편차의 1/2 미만입니다. 보통 또는 보통 점수로 간주됩니다.

  1. 학생이 시험에서 54점을 받았다면 해당 학생의 z-점수는 무엇이며 그 의미는 무엇입니까?

(mu = 75), (sigma = 5) 및 (x = 54)

(z = dfrac{x-mu}{sigma})

( = dfrac{54-75}{5})

(=-4.20)

54점은 평균보다 4표준편차 이상 낮은 점수를 의미하므로 비정상적인 점수로 간주됩니다.

  1. 학생의 z-점수가 1.43인 경우 시험에서 얻은 실제 점수는 얼마입니까?

(mu = 75), (sigma = 5) 및 (z = 1.43)

이 문제는 약간의 대수학을 포함합니다. 걱정하지 마십시오. 그렇게 어렵지 않습니다. 이제 z 대신 x를 찾고 있으므로 x에 대한 방정식 풀이를 다음과 같이 재정렬합니다.

(z = dfrac{x-mu}{sigma})

(z cdot sigma= dfrac{x-mu}{cancel{sigma}} cdot cancel{sigma})

(z sigma= x - mu)

(zsigma + mu = x - cancel{mu} + cancel{mu})

(x = zsigma + mu)

이제 이 공식을 사용하여 z가 주어졌을 때 x를 찾을 수 있습니다.

(x = zsigma + mu )

(x = 1.43 cdot 5 + 75 )

(x = 7.15 + 75 )

(x = 82.15 )

따라서 1.43의 z-점수는 82.15%의 실제 테스트 점수에 해당합니다.

  1. 학생의 z-점수가 -2.34인 경우 시험에서 얻은 실제 점수는 얼마입니까?

(mu = 75), (sigma = 5) 및 (z = -2.34)

이 문제의 d 부분에서 x에 대한 공식을 사용하십시오.

(x = zsigma + mu )

(x = -2.34 cdot 5 + 75 )

(x = -11.7 + 75 )

(x = 63.3 )

따라서 -2.34의 z-점수는 63.3%의 실제 테스트 점수에 해당합니다.

정규 분포에 대한 5개 숫자 요약

경험적 법칙을 보면 모든 데이터의 99.7%가 평균의 3 표준편차 이내에 있습니다. 즉, 정규 분포에서 최소값에 대한 근사값은 평균에서 표준 편차의 3배를 뺀 값이고 최대값에 대한 근사값은 평균에 표준 편차의 3배를 더한 값입니다. 정규 분포에서 평균과 중앙값은 동일합니다. 마지막으로 제1사분위수는 평균에서 표준편차의 0.67448배를 빼서 근사할 수 있고, 제3사분위수는 평균에 표준편차의 0.67448배를 더하면 근사할 수 있다. 이 모든 것이 함께 다섯 숫자 요약을 제공합니다.

수학적 표기법에서 평균이 있는 정규 분포에 대한 5자리 요약 표준편차 다음과 같다:

정규 분포에 대한 5자리 요약

(최소 = mu - 3시그마)

(Q_{1} = mu - 0.67448sigma)

(med = mu )

(Q_{3} = mu + 0.67448sigma)

(최대 = mu + 3시그마)

예 (PageIndex{3}): 정규 분포에 대한 5자리 요약 계산

당신의 수업이 시험을 치렀고 평균 점수가 75%이고 표준 편차가 5%라고 가정합니다. 테스트 점수가 대략적인 정규 분포를 따르는 경우 5자리 요약을 찾으십시오.

평균은 (mu = 75 \%)이고 표준 편차는 (sigma = 5 \%)입니다. 따라서 이 문제에 대한 다섯 개의 숫자 요약은 다음과 같습니다.

(최소 = 75 - 3(5) = 60 \%)

(Q_{1} = 75 - 0.67448(5)약 71.6 \%)

(med = 75 \% )

(Q_{3} = 75 + 0.67448(5)약 78.4 \%)

(최대 = 75 + 3(5) = 90 \%)