본문 바로가기

카테고리 없음

SAS 통계 - ANOVA

http://blog.naver.com/asus1984/120058086482


분산분석법(ANalysis of VAriance)는 비교하고자 하는 집단이 셋 이상일 때 많이 사용되는 분석방법이다.

이는 요인에 따라 하나일 경우 일원분산분석, 둘 일땐 이원배치 그 이상일 땐 다원분산분석이라 한다.

 

1) 일원배치 분산분석(one-way ANOVA)

우선 k개의 모집단은 독입이며 정규분포를 따른다는 가정을 한다.

귀무가설은 '각 집단의 평균이 모두 같다' 이며,

대립가설은 '각 집단의 평균 중 다른 것이 하나는 존재한다' 이다.

 

SST  =  SSt + SSE이며, 이를 이용해 분산분석표를 작성하면,

 

 

 제곱합

 자유도 

 평균제곱합 

 F값 

처리

 SSt

 k-1

SSt/(k-1) 

MSt/MSE 

오차

 SSE

 n-k

 SSE/(n-k)

 

 계

 SST

 n-1

 

 

 

예) 면역이상에 대한 연구에서 자폐아, 정상아, 지진아에 대한 혈청 항원의 농도에 대해 조사하였다. 3부류에 따라 혈청항원의 농도에 유의한 차이가 있는가를 검정하여라.

자폐아

정상아 

지진아 

755 343 820 345

170 460 325 440

380 360 400 450

415 410 225 400

435 360 365 900

300 385 215

165 390 290 435

235 345 320 330

205 375 345 305

220 270 355 360

335 305 325 245

285 370 345 345

230 370 285 315

195 270 305 375

220

380 510 315 565

715 380 390 245

155 335 295 200

105 105 245

 

귀무가설 : 자폐아, 정상아, 지진아 집단의 혈청항원의 농도의 평균이 같다.

 

<SAS>

data anova;

input group $ y @@;

cards;

1 755 1 343 1 820 1 345 1 170 1 460 1 325 1 440

1 380 1 360 1 400 1 450 1 415 1 410 1 225 1 400

1 435 1 360 1 365 1 900 1 300 1 385 1 215 2 220

2 165 2 390 2 290 2 435 2 235 2 345 2 320 2 330

2 205 2 375 2 345 2 305 2 220 2 270 2 355 2 360

2 335 2 305 2 325 2 245 2 285 2 370 2 345 2 345

2 230 2 370 2 285 2 315 2 195 2 270 2 305 2 375

3 380 3 510 3 315 3 565 3 715 3 380 3 390 3 245

3 155 3 335 3 295 3 200 3 105 3 105 3 245

;

proc anova;

      class group;

      model y=group;

      means group/ tukey duncan lines;

run;

means는 group간에 차이가 있을 시 어떤 집단간에 차이가 있는지 알아보는 다중비교를 위해 있다.

Tukey방법과 Duncan방법을 이용해 다중비교를 하였고 Lines옵션을 주어 평균차이가 없는 수준들이 그룹화되어 출력되게 한다.

 

<결과>

F값을 보면 0.0087로써 매우 작은 값이 나옴을 알 수 있다. 이는 귀무가설을 기각하게 되는데,

따라서 3집단 중 평균에 차이가 유의하게 나는 것이 있다는 것이다. 그럼 어떤 집단간에 차이가 있는지 다중비교표를 확인하자.

 

Tukey방법과 Duncan방법간에 차이가 있으나 공통적으로 1과 2집단간에 차이가 남을 알 수 있다.