1) 회귀계수(coefficient)와 오차항(error term)은 선형이어야 한다.
2) 오차항의 기대값은 0
3) 독립변수는 오차항과 선형독립(linearly independent)여야 한다.
4) 오차항은 자기상관(auto correlation)이 없어야 하고 동분산성(homoskedasticity)을 지녀야 한다.
5) 독립변수간의 다중공선성(multicollinearity)을 갖지 말아야 한다.
-> OLS는 observations이나 error term의 독립성을 가종하고 있찌만, 공간을 준거하는 데이터들은 공간의 의존성을 갖고 있어 전통적인 선형분석을 통해 얻은 추정량들은 BLUE가 될 수 없다.
* Tobler의 지리학 제 1법척
: Everyting is related everything else, but near things are more related than distant things.
= 모든 것은 다른 모든것과 관련을 맺지만, 가까운 것이 먼 것보다 더 밀접한 관련을 갖는다.
2. Spatial autocorrelation(공간자기상관)
1) 정의 : 인문사회적 또는 자연적 현상들이 지리적 공간상에서 깆는 상호의존성 및 상호작용을 말함
즉, 공간상에 분포하고 있는 실체(spatial entities)들이 위치의 유사성이 높아짐에 따라 / 이 실체들이 갖는 값의 유사
성도 또한 높아가는 현상.
2) 일반적인 상관관계(correlation coefficient)와의 차이점
- correlation coefficient : 두 변수 사이에 존재하는 관계의 성격과 정도에 대한 정보를 제공
- spatial autocorrelation : 하나의 변수가 갖는 여러 개체(observations) 또는 관측값(observation values)들 사이에 존재
하는 관계를 지칭함
a) 정적 공간자기상관(positive spatial autocorrelation) :공간실체(spatial entities)들이 서로 유사한 값을 갖으며 군집적
으로 분포하는 경우 / 1,3 사분면에 존재
b) 부적 공간자기상관(negative spatial autocorrelation) : 공간실체들이 서로 상이한 값들을 갖으며 군집적으로 분포
3. 공간자기상관이 발생하는 3가지 원인
1) 공간단위와 공간현상간의 불일치(spatial mismatch) : 인접해 있는 공간단위들은 서로 유사한 관측치를 갖게 되어 중복
적인(redundant) 정보를 제공하게 됨.
2) 공간실체들의 상호작용(spatial interection) : 공간과정(spatial progress)를 통해 공간 위의 한 장소에서 발생하는 현
상이 다른 장소에서의현상을 결정하게 된다. 따라서 공간 실체들은 공간상에서 상호 의존적인 관계를 맺게 된다.
3) 이질성(spatial heterogeneity) : 동종업체들(or 이종의 업체들)이 특정지역에 군집하기도 한다.
→ 공간속성을 담고 있는 data를 OLS선형모델로 regression하면 안된다. 그 이유는 관측개체 및 오류항의 '독립성 가정'이 위반되기 때문이다.
4. Moran's I statistic of spatial autocorrelation
1) 용도 : 공간자기상관을 파악하기 위한 측정척도, 인접해 있는 공간단위(neighboring spatial unit)들이 갖는 value 를 비
교하여 계수를 산출
Wij는 spatial weighted matrix인데 공간단위i와 j가 인접하면 1, 그렇지 않으면 0의 값을 갖는다.
2) 특징
- 인접한 공간단위들이 유사한 값을 갖는 경우 모두 값이 높거나(high-high) 모두 낮은(low-low) 경우가 상이한 값을 갖
는 경우가 더 많다면 Moran I 계수는 양수를 갖는다.
- -1<Moran I <1
5. Local Moran I (Global spatial autocorrelation)
1) moran I와 local moran I와의 차이점 : Moran I 계수는 전체 연구지역의 공간자기상관 관계를 하나의 값으로 보여주는
global index인 반면, 연구지역이 상대적으로 넓을 경우, 이 지역 안에서도 공간자기상관이 위치(location)에 따라서 상
이할 수 있다. 이 경우 공간자기상관의 국지적 변화(local variations)를 고려한 지표
2) local moran I를 이용할 경우 한 변수의 공간자기상관이 특정 지역에서 매우 높게 나타나는 hot spot지역을 찾을 수 있
다.
3) 위키디피아 인용
Global spatial autocorrelation is a measure of the overall clustering of the data. One of the statistics used to evaluate global spatial autocorrelation is Moran's I, defined by:
where
- Zi is the deviation of the variable of interest with respect to the mean;
- Wij is the matrix of weights that in some cases is equivalent to a binary matrix with ones in position i,j whenever observation i is a neighbor of observation j, and zero otherwise.
The matrix W is required because in order to address spatial autocorrelation and also model spatial interaction, we need to impose a structure to constrain the number of neighbors to be considered. This is related to Tobler’s first law of geography, which states that Everything depends on everything else, but closer things more so - in other words, the law implies a spatial distance decay function, such that even though all observations have an influence on all other observations, after some distance threshold that influence can be neglected.
4) 공간단위 i와 인접한 j만을 j에 입각해 합(summation)을 구한다.
5) 높은 값르 찾는 local moran은 유사한 값을 갖는 인접한 공간단위들의 cluster를 나타내는 반면, 낮은 local moran은 서
로 상이한 값의 cluster을 의미한다.
6. 공간회귀분석모델(Spatial Regression Models) : 공간자기상관의 통제
- 데이터가 공간자기상관을 갖고 있다면 공간자기상관을 통제해야 한다.
- 거리척도(distance measure) : 공간배열(spatial configuration)을 직접적으로 정의
- 인접성척도(adjacency measure) : 공간배열을 간접적으로 정의
-
- B는 A와 C간의 first order neighbor
- B는 D와 E간의 second order neighbor
※ 공간가중치 메트릭스를 통하여 구축된 공간정보를 회귀분석 틀 안으로 통합시킬 수 있는 공간회귀분석모델
7. SEM(Spatial Error Model , 공간오류모델)
8. SAR(Spatial Autogressive Model, 공간자기회귀모델)
- 종속변수가 공간자기상관을 갖는 경우