DATA/analysis

[데이터 분석] 상관 분석 해석

웅덩이 2022. 4. 21. 22:03

📌 상관 분석

두 변수 간의 관계의 정도를 알아보기 위한 분석 방법이다.

두 변수의 상관관계를 알아보기 위하여 상관계수를 이용한다.

 

상관계수 범위 해석
0.7 < r <= 1 강한 양(+)의 상관이 있음
0.3 < r <= 0.7 약한 양(+)의 상관이 있음
0 < r <= 0.3 거의 상관이 없음
r = 0 상관관계가 존재하지 않음
-0.3 <= r < 0 거의 상관이 없음
-0.7 <= r < -0.3 약한 음(-)의 상관이 있음
-1 <= r < -0.7 강한 음(-)의 상관이 있음

 

[ 상관분석의 가설 검정 ]

- 상관계수 r이 0이면 입력변수 x와 출력변수 y사이에는 아무런 관계가 없다.

  (귀무가설 : r = 0, 대립가설 r != 0)

- t검정통계량을 통해 얻은 p-value 값이 0.05이하인 경우, 대립가설을 채택하게 되어 우리가 데이터를 통해 구한 상관계수를 활용할 수 있다.

 

 

※ p-value란?

 

관찰된 데이터의 검정통계량이 귀무가설을 지지하는 정도를 확률로 표현한 것이라 할 수 있다. 즉, P-Value는 귀무가설이 옳다는 가정하에 얻어진 검정통계량보다 더 극단적인 결과가 나올 확률이다. 따라서 P-Value가 작을수록 귀무가설을 지지하는 정도가 약하므로 귀무가설을 기각하게 되며, P-Value가 클수록 귀무가설을 지지하는 정도가 커짐으로 귀무가설을 채택하게 된다.

 

※ 대립가설, 귀무가설

 

귀무가설 : 일반적으로 기각될 것이 예상되어 세워진 가설

대립가설 : 검증하려는 가설

 

 


 

[네이버 지식백과] P-value (매일경제, 매경닷컴)

[네이버 지식백과] 귀무가설 [null hypothesis, 歸無假說] (간호학대사전, 1996. 3. 1., 대한간호학회)

참고문헌 [데이터에듀 - 2021 ADsP데이터분석준전문가]