이번 글에서는 중회귀분석에 대한 추론에 대해 알아보고자 한다.
단순회석에서 추론을 하기 위해서 가정들이 필요했는데
중회귀에서도 마찬가지로 추론을 하기 위해서 2가지의 가정이 필요하다.
중회귀분석에서의 필요한 가정
이전글에서 단순회귀에 대하여 추론을 할 때
다음의 가정을 했었는데
이러한 가정을 확장하여 중회귀에서는
다음의 가정을 통해 추론을 할 수 있다.
신뢰구간은 다음과 같이 구할 수 있다.
+) 위의 식에서
단순회귀는 n-k-1 대신에 n-2를 했었는데
단순회귀에서는 독립변수(k)가 1 임으로 n-2였다.
bⱼ의 표준편차는
다음과 같고 이전의 글에서 봤던 SAS 결과창에서
다음의 부분에서 값이 나타난다.
중회귀분석에서의 검정
종속변수 y에 대한 xⱼ의 검정은 다음과 같다.
$$H_0:\; \beta_j = \beta^*_j$$
$$H_a:\; \beta_j \neq \beta^*_j$$
(이때 βⱼ*는 특정 값)
검정통계량(test statistic)은
$$t_0=\frac{\hat{\beta_j}-\beta_j^*}{S.E.(\hat{\beta}_j)}\; \; \overset{\underset{\mathrm{H_0}}{}}{\sim }\; \; t_{n-k-1}$$
여기서 βⱼ = 0 이면
$$t_0=\frac{\hat{\beta_j}}{S.E.(\hat{\beta}_j)}\; \; \overset{\underset{\mathrm{H_0}}{}}{\sim }\; \; t_{n-k-1}$$
SAS 결과창에서
다음의 부분에서 값이 나타난다.
예제를 통해 알아보기
이전에 SAS를 이용했던 자료를 보면
<데이터 파일>
<SAS코드>
<결과창>
양측검정에 대한 예시
변수 Adv에 대한 검정으로
Sales와 Adv이 유의미한 관계가 있는지 알아보기 위해
귀무가설을 "Sales와Adv 간에 유의미한 관계가 없다."라고 하면
가설검정은 다음과 같다.
다음으로 유의 수준 5%에서 검정한다고 했을 때
먼저 t분포표에서 유의 수준 0.025에 자유도 22(25-2-1)인 부분을 찾으면
(이때 양측검정이므로 α=0.025인 부분을 찾아야 한다.)
t₀.₀₂₅(22)는 2.074 임을 구할 수 있고
Dicision rule은
$$Reject\; H_0\; if\; t_0>2.074 \; or\; t_0<-2.074 $$
t₀는 8.98 임을 알 수 있다.
따라서 8.98 > 2.074 임으로
"Sales와 Adv 간에유의미한 관계가 있다."라고 할 수 있다.
단측검정에 대한 예시
변수 Bonus에 대한 단측검정에 대해 해 보면
Bonus가 증가함에 따라 Sales가 증가하는지 알아보기 위해
귀무가설을 "Bonus가 증가함에 따라 Sales은 영향이 없다.."라고 하면
가설검정은 다음과 같다.
다음으로 유의 수준 5%에서 검정한다고 했을 때
먼저 t분포표에서 유의 수준 0.05에 자유도 22(25-2-1)인 부분을 찾으면
(이때 단측검정이므로 α=0.05인 부분을 찾아야 한다.)
t₀.₀₅(22)는 1.717 임을 구할 수 있고
Dicision rule은
$$Reject\; H_0\; if\; t_0>1.717$$
t₀는 2.59 임을 알 수 있다.
따라서 2.59 > 1.717 임으로
"Bonus가 증가함에 따라 Sales가 증가한다."라고 할 수 있다.
구간추정에 대한 예시
변수 Adv에 대한 구간추정(interval effect)을 해보면
먼저 위의 식을 이용하기 위해 SAS결과창의 다음의 값과
t분포표에서 구한 값인
t₀.₀₂₅(22)는 2.074 임을 대입하여 구하면
따라서 매출액(Sales)은 1000$, 광고비(Adv)는 100$로 측정된다고 했을 때
95% 신뢰도에서 광고비에 100$를 소비하면 1899$에서 3047$의 매출액이 나온다.
'통계 > 통계의 첫 한입 물었을 시기' 카테고리의 다른 글
중회귀분석 (0) | 2023.01.28 |
---|---|
신뢰 구간 vs 예측 구간 (0) | 2023.01.18 |
회귀적합도 (0) | 2023.01.15 |
단순회귀분석에서의 검정 (0) | 2023.01.13 |
단순회귀분석에서의 추론 (0) | 2023.01.10 |