조항

1.6.5.4: 정규성 - 수학

1.6.5.4: 정규성 - 수학



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

모수 또는 비모수, t-검정 또는 Wilcoxon 중 사용할 검정을 결정하는 방법은 무엇입니까? 분포가 정규성을 따르거나 최소한 정규성에 접근하는지 알아야 합니다. 이것은 시각적으로 확인할 수 있습니다(그림 (PageIndex{1})):

코드 (PageIndex{1}) (R):

QQ 플롯은 어떻게 작동합니까? 먼저 데이터 포인트가 정렬되고 각 데이터 포인트가 분위수에 할당됩니다. 둘째, 이론적인 분위수 집합 - 데이터 포인트가 한 번에 차지해야 하는 위치 정규 분포- 계산됩니다. 마지막으로 이론적 분위수와 경험적 분위수가 짝을 이루고 표시됩니다.

사분위수를 통과하는 선으로 플롯을 오버레이했습니다. 점이 선을 밀접하게 따라갈 때 경험적 분포는 정규 분포입니다. 여기 꼬리에 많은 점이 있습니다. 다시, 우리는 원래 분포가 정규 분포가 아니라는 결론을 내립니다.

R은 또한 정규성을 확인하는 수치 도구를 제공합니다. 그 중 첫 번째는 Shapiro-Wilk 테스트입니다(제발 운영 이 코드는 직접):

코드 (PageIndex{2}) (R):

여기서 출력은 다소 간결합니다. P-값은 작지만 귀무 가설은 무엇이었습니까? 내장 도움말에도 명시되어 있지 않습니다. 이해하기 위해 간단한 실험을 실행할 수 있습니다.

코드 (PageIndex{3}) (R):

rnorm() 명령은 정규 분포를 따르는 난수를 생성하며, 그 중 많은 수가 인수에 언급되어 있습니다. 여기에서 우리는 1에 접근하는 p-값을 얻었습니다. 분명히 귀무가설은 "경험적 분포가 정상이다"였습니다.

Figure (PageIndex{1}) 정규성에 대한 그래픽 검사.

이 작은 실험을 통해 급여와 급여2의 분포가 모두 정상이 아니라는 결론을 내릴 수 있습니다.

Kolmogorov-Smirnov 테스트는 두 가지 분포에서 작동합니다. 귀무 가설은 두 표본이 같은 모집단에서 나왔다는 것입니다. 정규 분포에 대해 하나의 분포를 테스트하려면 두 번째 인수는 pnorm이어야 합니다.

코드 (PageIndex{4}) (R):

(결과는 Shapiro-Wilk 테스트의 결과와 비슷합니다. 기본적으로 두 번째 인수가 스케일링된 정규 분포를 사용하기 때문에 데이터를 스케일링했습니다.)

함수 ks.test()는 두 번째 인수의 모든 유형을 허용하므로 다음을 사용하여 현재 분포를 근사화하는 것이 얼마나 안정적인지 확인하는 데 사용할 수 있습니다. 어떤 이론적 분포, 반드시 정상은 아닙니다. 그러나 Kolmogorov-Smirnov 검정은 크기가 (< 50)인 표본에 대해 종종 오답을 반환하므로 Shapiro-Wilks 검정보다 덜 강력합니다.

2.2e-16 우리는 소위 지수 표기법, 이와 같이 아주 작은 숫자를 표시하는 방법((2.2 imes 10^{-16})). 이 표기법이 불편하면 제거하는 방법이 있습니다.

코드 (PageIndex{5}) (R):

(Option scipen은 0의 최대 허용 수와 같습니다.)

대부분의 경우 정규성을 결정하는 이 세 가지 방법은 일치하지만 서로 다른 결과를 반환하는 경우 놀라운 일이 아닙니다. 정규성 확인은 사형이 아니라 확률에 따른 의견일 뿐입니다.

다시 말하지만, 표본 크기가 작으면 통계적 검정과 분위수-분위수 그림도 비정규성을 감지하지 못하는 경우가 많습니다. 이러한 경우 줄기 플롯이나 히스토그램과 같은 간단한 도구가 더 나은 도움이 될 것입니다.


비디오 보기: 쎈 수학1 #960 (팔월 2022).