통계/통계의 첫 한입 물었을 시기

중회귀분석에서의 추론

할거없는중 2023. 2. 2. 23:28

이번 글에서는 중회귀분석에 대한 추론에 대해 알아보고자 한다.

 

단순회석에서 추론을 하기 위해서 가정들이 필요했는데

중회귀에서도 마찬가지로 추론을 하기 위해서 2가지의 가정이 필요하다.

 

중회귀분석에서의 필요한 가정

이전글에서 단순회귀에 대하여 추론을 할 때

 

다음의 가정을 했었는데

 

이러한 가정을 확장하여 중회귀에서는

 

 

다음의 가정을 통해 추론을 할 수 있다.

 

 

신뢰구간은 다음과 같이 구할 수 있다.

 

 

+) 위의 식에서

단순회귀는 n-k-1 대신에 n-2를 했었는데

단순회귀에서는 독립변수(k)가 1 임으로 n-2였다.

 

bⱼ의 표준편차는

 

다음과 같고 이전의 글에서 봤던 SAS 결과창에서

 

 

다음의 부분에서 값이 나타난다.

 

중회귀분석에서의 검정

종속변수 y에 대한 xⱼ의 검정은 다음과 같다.

$$H_0:\; \beta_j = \beta^*_j$$

$$H_a:\; \beta_j \neq  \beta^*_j$$

(이때 βⱼ*는 특정 값)

 

검정통계량(test statistic)은

$$t_0=\frac{\hat{\beta_j}-\beta_j^*}{S.E.(\hat{\beta}_j)}\; \; \overset{\underset{\mathrm{H_0}}{}}{\sim }\; \; t_{n-k-1}$$

여기서 βⱼ = 0 이면

$$t_0=\frac{\hat{\beta_j}}{S.E.(\hat{\beta}_j)}\; \; \overset{\underset{\mathrm{H_0}}{}}{\sim }\; \; t_{n-k-1}$$

 

SAS 결과창에서

 

 

다음의 부분에서 값이 나타난다.

 

예제를 통해 알아보기

이전에 SAS를 이용했던 자료를 보면

 

<데이터 파일>

 

 

 

<SAS코드>

 

 

 

 

<결과창>

 

 

 

 

양측검정에 대한 예시

변수 Adv에 대한 검정으로

 

Sales와 Adv이 유의미한 관계가 있는지 알아보기 위해

귀무가설을 "SalesAdv 간에 유의미한 관계가 없다."라고 하면

 

가설검정은 다음과 같다.

 

 

다음으로 유의 수준 5%에서 검정한다고 했을 때

먼저 t분포표에서 유의 수준 0.025에 자유도 22(25-2-1)인 부분을 찾으면

(이때 양측검정이므로 α=0.025인 부분을 찾아야 한다.)

 

 

t₀.₀₂₅(22)는 2.074 임을 구할 수 있고

 

Dicision rule은

$$Reject\; H_0\; if\; t_0>2.074 \; or\; t_0<-2.074 $$

 

 

t₀는 8.98 임을 알 수 있다.

 

따라서 8.98 > 2.074 임으로

"SalesAdv 간에유의미한 관계가 있다."라고 할 수 있다.

 

 

단측검정에 대한 예시

변수 Bonus에 대한 단측검정에 대해 해 보면

 

Bonus가 증가함에 따라 Sales가 증가하는지 알아보기 위해

귀무가설을 "Bonus가 증가함에 따라 Sales은 영향이 없다.."라고 하면

 

가설검정은 다음과 같다.

 

 

다음으로 유의 수준 5%에서 검정한다고 했을 때

먼저 t분포표에서 유의 수준 0.05에 자유도 22(25-2-1)인 부분을 찾으면

(이때 단측검정이므로 α=0.05인 부분을 찾아야 한다.)

 

 

t₀.₀₅(22)는 1.717 임을 구할 수 있고

 

Dicision rule은

$$Reject\; H_0\; if\; t_0>1.717$$

 

 

t₀는 2.59 임을 알 수 있다.

 

따라서 2.59 > 1.717 임으로

"Bonus가 증가함에 따라 Sales가 증가한다."라고 할 수 있다.

 

 

구간추정에 대한 예시

변수 Adv에 대한 구간추정(interval effect)을 해보면

 

 

먼저 위의 식을 이용하기 위해 SAS결과창의 다음의 값과

 

 

t분포표에서 구한 값인

 

 

t₀.₀₂₅(22)는 2.074 임을 대입하여 구하면

 

 

따라서 매출액(Sales)은 1000$, 광고비(Adv)는 100$로 측정된다고 했을 때

95% 신뢰도에서 광고비에 100$를 소비하면 1899$에서 3047$의 매출액이 나온다.

 

 

 

 

'통계 > 통계의 첫 한입 물었을 시기' 카테고리의 다른 글

중회귀분석  (0) 2023.01.28
신뢰 구간 vs 예측 구간  (0) 2023.01.18
회귀적합도  (0) 2023.01.15
단순회귀분석에서의 검정  (0) 2023.01.13
단순회귀분석에서의 추론  (0) 2023.01.10