DATA/analysis

[데이터 분석] 회귀 분석 해석

웅덩이 2022. 4. 21. 22:34

📌 회귀 분석

독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계기법

변수들 사이의 인과관계를 밝히고 모형을 적합하여 관심있는 변수를 예측 및 추론하기 위한 분석 방법

 

 

[ 회귀분석의 가설 검정 ]

1) 단순선형회귀분석 : 변수간 선형성을 점검하기 위해 산점도 확인

2) 다중선형회귀분석 : 선형성, 등분산성, 독립성, 정상성이 모두 만족하는지 확인

 

 

📝선형회귀분석의 가정

  ① 선형성 : 입력 변수와 출력변수의 관계가 선형이다.

  ② 등분산성 : 오차의 분산이 입력변수와 무관하게 일정하다.
  ③ 독립성 : 입력변수와 오차는 관련이 없다.

  ④ 비상관성 : 오차들끼리 상관이 없다.

  ⑤ 정상성(정규성) : 오차의 분포가 정규분포를 따른다.

 

 

[ 회귀분석의 검토 사항]

1) 회귀계수들이 유의미한가?

  - t 통계량의 p-value가 0.05보다 작으면 회귀계수가 통계적으로 유의

 

2) 모형(회귀식)이 얼마나 설명력을 갖는가?

  - 결정계수(R^2)가 높은 값을 가질수록 추정된회귀식의 설명력이 높음 (0<=R^2<=1)

 

 

※ 결정계수

표본관측으로 추정한 회귀선이 실제로 관측된 표본을 어느 정도 설명해 주고 있는가, 즉 회귀선이 실제관측치를 어느 정도 대표하여

그 적합성(goodness of fit)을 보여주고 있는가를 측정하는 계수로 나타낸 것

 


[네이버 지식백과] 결정계수 (사회복지학사전, 2009. 8. 15., 이철수)
참고문헌 [데이터에듀 - 2021 ADsP데이터분석준전문가]