以2004年民進黨相對國民黨得票率當依變數,選取8各社經變數EDU456、Income92、AGRI89、INDUS89、Serveice89、NoMove89、Work89及NoWork89作為自變數,作迴歸分析,R2僅達到0.2483,檢驗其殘差圖,並計算殘差的Moran’s I =0.5155,表示殘差項並非隨機分佈,且呈現正的聚集,高數值與低數值分別群聚(下圖,Bandwidth 0 km),表示依變數有正的空間自相關,因此模式應修正為空間迴歸模型: Y=ρWY+Xβ+ε。
不過在使用空間迴歸模型時,必須考量空間權重矩陣(spatial weighting matrix)有不同的選擇型式,有離散型(Discrete)與連續型(Continuity)兩類,離散型還可分為鄰近矩陣(Contiguity Matrix)、距離矩陣(Distant Matrix)、次序矩陣(Order Matrix)等,鄰近矩陣可再細分為Rook Contiguity與Queen Contiguity,每一鄰近矩陣可再定義第幾個order的鄰近關係;距離矩陣可設Bandwidth=d,如果小於d則權重為1(wij=1 if dij,其餘為0(wij=0 otherwise);次序矩陣則可定義N個最近的鄰近單元以內權重為1,其餘為0。連續型矩陣的變化又更多了, wij=exp(-0.5(dij/b)2) 或 wij=[1-(dij/b)2] if dij,隨著定義的方程式不同,權重就會有變化。
因此究竟要如何選擇適宜的空間權重矩陣,就成為一個問題。
若以距離矩陣為例,取Bandwidth 5km、10km、20km…100km與150km製作空間權重矩陣,分別跑空間迴歸,檢驗個別的殘差圖(上圖),在Bandsidth=10km時,其殘差圖是最不規則的,因此若以10km為bandwidth跑出的迴歸模型會是最能解釋依變數的模型。
但肉眼的判斷過於主觀,若求不同bandwidth下之殘差值的Moran’s I(以Queen of first order為空間矩陣),並作圖(上圖),可以看到Bandwidth在10km~20km之間具有最小的Moran’s I,因此若選取此間距(10~20km)內的值為Bandwidth作空間迴歸,可以得到最佳(optimal)的模型。
r97228024 黃宜庭
參考書籍:Geographically Weighted Regression the analysis of spatially varying relationships
A. Stewart Fotheringham , Chris Brunsdon, Martin Charlton
John Wiley & Sons, LTD
沒有留言:
張貼留言