DATA/analysis
[데이터 분석] 상관 분석 해석
웅덩이
2022. 4. 21. 22:03
📌 상관 분석
두 변수 간의 관계의 정도를 알아보기 위한 분석 방법이다.
두 변수의 상관관계를 알아보기 위하여 상관계수를 이용한다.
상관계수 범위 | 해석 |
0.7 < r <= 1 | 강한 양(+)의 상관이 있음 |
0.3 < r <= 0.7 | 약한 양(+)의 상관이 있음 |
0 < r <= 0.3 | 거의 상관이 없음 |
r = 0 | 상관관계가 존재하지 않음 |
-0.3 <= r < 0 | 거의 상관이 없음 |
-0.7 <= r < -0.3 | 약한 음(-)의 상관이 있음 |
-1 <= r < -0.7 | 강한 음(-)의 상관이 있음 |
[ 상관분석의 가설 검정 ]
- 상관계수 r이 0이면 입력변수 x와 출력변수 y사이에는 아무런 관계가 없다.
(귀무가설 : r = 0, 대립가설 r != 0)
- t검정통계량을 통해 얻은 p-value 값이 0.05이하인 경우, 대립가설을 채택하게 되어 우리가 데이터를 통해 구한 상관계수를 활용할 수 있다.
※ p-value란?
관찰된 데이터의 검정통계량이 귀무가설을 지지하는 정도를 확률로 표현한 것이라 할 수 있다. 즉, P-Value는 귀무가설이 옳다는 가정하에 얻어진 검정통계량보다 더 극단적인 결과가 나올 확률이다. 따라서 P-Value가 작을수록 귀무가설을 지지하는 정도가 약하므로 귀무가설을 기각하게 되며, P-Value가 클수록 귀무가설을 지지하는 정도가 커짐으로 귀무가설을 채택하게 된다.
※ 대립가설, 귀무가설
귀무가설 : 일반적으로 기각될 것이 예상되어 세워진 가설
대립가설 : 검증하려는 가설
[네이버 지식백과] P-value (매일경제, 매경닷컴)
[네이버 지식백과] 귀무가설 [null hypothesis, 歸無假說] (간호학대사전, 1996. 3. 1., 대한간호학회)
참고문헌 [데이터에듀 - 2021 ADsP데이터분석준전문가]