2010年12月15日 星期三

空間資料分析─ArcView應用:男女貧血比


第四組
B98401035劉彥伯 B98406044簡婉婷
B98902042江宗臻 B98103044 商凱茵

2010年12月14日 星期二

空間資料分析─ArcView應用:鄉鎮行業薪資

第三組 經濟
政治四 莊硯凱     經濟二 林彥竹     中文一 姜亦蘭     圖資一 林彥妤
本圖表以台灣358各鄉鎮從業人數最多的職業類別(製造業、服務業、商業)的平均薪資(千元)製作。西部以製造業人數為主,東部以商業從業人數最多,台北市則以商業為主,中央山脈地區多商業然平均薪資偏低。服務業人數在都會地區並不如想像中占多數。

2010年6月22日 星期二

無限迴圈的困境──探討農村教育程度與所得問題


  農村是我從小成長的地方,不但有許多鄰居務農,我的祖父也把一生獻給農事。然而,一直要等到我中學時,才知道種田是一件多麼辛苦、投資報酬率又不高的事──購置幼苗和肥料的成本、雇收割機的人事與機器費用、必須天天巡視、收成時又可能受商人壟斷價格......,農人一季所能穫的,其實並不高。或許也正因為這個原因,讓我對發生在農村的現象特別有興趣,也才促成這篇報告的產生。


主題: 
1.農、工、服務業與收入多寡之關聯
2.教育與收入多寡之關聯
3.農業與教育程度之關係
4.農業可能面臨的困境與困境可能帶來的影響 

台灣人被澆熄的政治熱情? 從總統大選獲/投票率探討政治參與度



  曾經遇到過這樣的情況:選舉前後,父母親一輩討論熱烈,與我同輩但有選舉權的兄姊則興趣缺缺。當我向他們提起這個話題時,常聽到「我對政治冷感」、「不想管那些政治人物」這樣的回答。


  台灣的民主歷史還不長、甚至連總統直選都只辦過四次,是否真的已經讓人們開始感到失望、無所謂了?








◆97年總統選舉投票率分層設色圖







2010年5月26日 星期三

小學生視力不良比例與家中電視、電腦數量關係

長時間看電視、打電腦,視力容易下降。家中擁有愈多電視、電腦,是否造成接觸時間更長?本文探討民國94年小學生視力不良比例,與家中電腦數量關係。

民國94年統計數據
AN16: 視力不良率-國小(%)
BF15: 家庭現代化設備(每百戶擁有數)-彩色電視機(臺/百戶)
BF25: 每千人擁有家用電腦數(臺/千人)

本文僅討論小學生,因為國中生課業較重,可能因讀書姿勢不良或過度疲勞引起視力不良,和使用電視、電腦並無絕對關係。資料庫中並無臺灣358個鄉鎮的分別資料,故以臺灣23個縣市資料進行分析。大數法則在樣本數20~30以上即開始作用,因此23個縣市仍為有效的樣本數據來源。


人口密度versus 地價指數


名詞定義
人口密度 (number of people per unit land)
每單位土地有多少人,即稱為人口密度。本作業使用平方公里為單位,所以是人/km2
地價指數 (Land Price Index)
內政部地政司根據特定的時間點,作為地價基準日,計算一定期間內地價上升或下降的百分比;換言之,地價指數是用來衡量土地價格在某一時期的平均變動趨勢,目前內政部係每半年(即1月及7月)公布1次都市地區地價指數,供各界參考。
資料來源:行政院經濟建設委員會http://www.cepd.gov.tw/m1.aspx?sNo=0001252

2010年3月16日 星期二

台北捷運地圖談


                   台北市境內捷運站分佈圖                                         現在的台北捷運

2010年1月26日 星期二

立委選舉在台灣第三勢力空間走向3

延續對於歷屆立委選舉第三勢力的觀察,第七次立委選舉由於制度的變革,更加不利於小黨派的生存。從圖中可以看出第三勢力分布最為集中的區域為中部,主要是彰化縣,並涵括部分台中縣及南投縣之鄉鎮;東部地區在花蓮和台東部分鄉鎮亦可發現第三勢力較為密集之分佈;南部地區,除屏東萬丹鄉、潮州鎮外,高雄縣市中包括左營,尤以苓雅、鼓山、三民、鹽埕區一帶有較明顯之第三勢力分佈;在台北地區之第三勢力票倉則以汐止市、永和、蘆洲、萬里、瑞芳較具規模。 雖在制度變遷下,藍綠以外的黨派或無黨參選人面對更艱困的挑戰,但由歷屆立委選舉第三勢力分佈圖中,仍可看出選民的投票行為有其脈絡可循。例如在地方派系有深刻淵源及影響力的彰化地區,第三勢力儘管有消長但仍明顯地高出其他地區。然而,在現行立委選舉制度下,是否將持續對第三勢力的打擊則有待觀察。(國發所 陳群佩R97341020)


2010年1月25日 星期一

國立大學分佈影響鄉鎮大專以上教育程度人口比?

本文為延續”所得分佈與教育程度”一文,該文章探討90年戶均所得與2000年人口普查的”大專以上教育程度人口比(%)”之關係,並進行迴歸分析,模型的R2值高達0.826,說明戶均所得與教育程度有相當大的關聯度。[左下圖]為90年戶均所得並以紅圓圈標示出與[右下圖]教育程度具相對差異的鄉鎮,亦即,戶均所得低於平均戶均所得的鄉鎮,其教育程度也應該會相對低的表現,然而標示出的鄉鎮卻有相反的現象,這也說明剩下0.174(1-0.826)無法解釋的因素。基於好奇,本文試著將90年大專以上教育程度人口比(%)與國立大學所在鄉鎮的分佈圖相互套疊(右下圖),發現有趣的現象,即戶均所得較低但大專以上教育程度人口比較高的鄉鎮,恰巧都有國立大學設立於此,似乎說明國立大學的分佈影響著大專以上教育程度人口比,也似乎湊巧地印證孟母三遷的道理?可能只是巧合、也許真具有關連性,皆須後續更加嚴謹的研究來加以分析(曾琬瑜,d96544003)。

住宅地價影響因素探討


“影響地價區域因素評價基準”依地價調查估計規則第二十一條第四項規定訂定,該影響因素主要計有土地使用管制、交通運輸、自然條件、土地改良、公共建設、特殊設施、工商活動、房屋建築現況、發展趨勢及其他影響因素等。直轄市或縣(市)地政機關於估計區段地價,對於無買賣實例及收益實例之區段,應按影響地價區域因素主要項目,分別依住宅用地、商業用地、工業用地及農業用地區域因素評價基準表,修正估計目標地價區段之區段地價(內政部地政司地政法規)。

圖1是台灣民國94年的鄉鎮住宅地價分佈圖(某些鄉鎮資料的缺漏以鄰近鄉鎮的地價代表之),高地價區可想而知的集中於都會區。本文試僅以評價基準表中的幾項代表因子來建立迴歸模式並探討影響住宅地價的因素,包括學校、便利商店、超級市場、購物中心、停車場與交通設施、政府機關,(限於資料為以設施佔鄉鎮的個數來紀錄,本文遂以之代替離設施距離),圖2為上述設施的分佈點。回歸分析的結果如下表,所考量的因素皆有顯著的表現,adjusted R-squared值為74.5。若以一般的經驗判斷,越便捷的地區會有較高的地價表現,離學校距離越近,理應住宅地價也會偏高,然而本模型的測試結果為學校個數與住宅地價卻呈現負向關係,而其它設施的個數與地價為符合期望地產生正向關係,原因應該為單位的問題,若改以距離為分析單位可能會有不同的表現(曾琬瑜,d96544003)。

台灣95年出生率空間分析(1)






此圖為民國九十五年出生率主題圖。經過空間探索分析可發現宜蘭縣、花蓮縣、屏東縣、南投縣、新竹縣市的出生率較高,其中又多半以原住民比率較高的山地鄉為主;台北市、台南市、高雄市等大都會地區相對較低。台灣整體上來看,是個低生育率的國家,生育率屢年創新低。

 造成低生育率的問題很多,根據台灣內政部的統計,其原因之一為國人越來越晚婚,台灣婦女生第一胎的年紀已延至三十一歲,女性在生完第一胎後,為避免高齡生產的風險,多不願繼續生小孩了。除了晚婚這一項「非經濟因素」外,更重要的一項原因是經濟情況不佳,在考慮日後龐大的教養支出後,國人生小孩的意願自然大幅降低。但其實根據理論來看,都市化高、生活水準高的區域,生育率反而降低,其原因是由於住在都市地區的人,較少受到傳統的生育觀念之壓力,且其心理特質和社會環境都較有利其講究個人的享受,因而對於養育子女的成本與一個人享受之衝突性也就越敏感;而隨著收入很生活水準的提高,養育子女的間接和直接成本也都提高,影響父母對生育子女也越為卻步。



經由全域空間自相關Moran’s I檢定,發現其值為0.4403,且使用蒙地卡羅999次分析,p-value值為0.0010,表示台灣出生率出現空間聚集。

進一步使用區域空間自相關LISA來分析,發現大都會區如台北、台南、高雄都是低生育率的地方(low-low),居住在這邊的人經濟能力和生活水準較高,可印證先前提過的理論,又或是住在此區的的已婚女性也有可能因為經濟獨立的關係,生活以外出工作為主,無暇養育子女,自然降低嬰兒出生率;相對圖中以台灣原住民較多的山地區,則是屬於高出生率之地。
  經濟水平對於出生率的影響甚重,不過,台灣整體性的極低生育率,相對也是對我們的社會帶來嚴重的影響:東吳大學國貿系鍾俊文副教授指出,少子化隨之而來的問題是高齡化社會,而人力即是國力。勞動人口銳減、勞動力不足,直接影響企業的生產力,同時也代表消費的萎縮,使經濟成長動力受挫,結果必然降低經濟成長率。(碩一 林佩儀R98341019)


2010年1月24日 星期日

長三角經濟圈工資率與經濟規模




長三角經濟圈的經濟規模,透過圖形可以看出主要集中在以上海為中心的樞紐地帶。而我們可以看出浙江地區的北部地帶經濟發展程度明顯受到樞紐地帶的放射狀影響。經濟發展程度明顯高於江蘇省北部區域。





而經濟學上的基本理論告訴我們經濟發展程度越高對於勞動工資會產生正面影響。因為高經濟發展程度,會帶動高資本高技術性產業移入。而高技術性產業投入會使得技術性勞動力需求更高。因此對於工資率有提升的作用。




而透過工資率分布的圖,卻發現到江蘇北部區域的工資率明顯偏低。但是整體浙江省的工資率水平卻能平均達到30000元。因此除了經濟發展的因素,針對浙江省區域可以發現到存有潛在性的變數影響著浙江省的工資率。
而經濟發展程度對於該地區的解釋能力僅僅只有11.5317%。以此傳統的經濟學理論對於該地區的工資率幅度,解釋能力不算太高。
(國發所 陳韋舜 R97341056)

2010年1月23日 星期六

台灣96年自殺率之空間分析



本圖為96年度台灣自殺率主題圖,經由空間探索分析可發現自殺率高的地區主要集中於北部及中部地區,而中南部自殺率則呈現較低的情況。自殺是一項非常複雜的事情,目前亦未有學者可以完全解釋人類的自殺行為,其中涉及的討論範圍亦非常廣範。

  佛洛依德(Sigmund Freud)從心理分析角度去解釋自殺行為。他認為自殺基於抑鬱(Depression),並視自殺為「謀殺」;涂爾幹(Emile Durkheim)則從宏觀社會學(Macrosociology)去解釋自殺行為,他認為自殺是一種社會現象。

如果採用涂爾幹的說法,人的自殺行為會和社會產生連結性,假設經社結構會影響自殺率的話,那麼自殺不意外可能會出現在台北、台中、高雄等都市化程度較高之地。但東部呢?本圖顯示出花蓮、台東一帶也是高自殺率的地方,這或許可引述涂爾幹理論中對自殺模型的分類:自負型自殺(Egoistic suicide)來解釋,這類的自殺現象是由於個人與整個社會的關係非常疏離,較少與人接觸或交往所導致,或許台灣東半部因為具有與世隔絕,獨立的特徵,導致自殺率的升高。


經由全域空間自相關Moran’s I檢定,發現其值為0.4048,且使用蒙地卡羅999次分析,p-value值為0.0010,表示出現台灣自殺現象出現空間聚集。


使用區域空間自相關LISA,發現自殺率高度集中的地區仍集中於北部與中部,分別為台北市、台北縣、台中縣等地,假定應是由於都市化程度高,居民工作壓力大,生活緊繃、受到失業率的影響等因素,造成自殺出現群聚的現象;而南投縣、台東縣、高雄縣、屏東縣等地,均呈現LOW-LOW的情形,相對於言,可能由於南部地區的生活步調較慢,且工作壓力不如北部沉重,因此自殺率呈現自己低、鄰居也低的情形。(國發碩一 林佩儀R98341019)

2010年1月22日 星期五

台灣的金融重鎮在哪裡?

「金融」顧名思義就是指融通資金、使資金能夠互相通達,其進行的方式是銀行、證券或保險業者,它們從市場募集資金,進而借貸給其他市場主體活動。一般而言,金融業包括中央銀行、國內外銀行、郵政儲金匯兌業、信用合作社業、農漁會信用部、信託投資業、典當業、證券業、融資租賃等。 從鄉鎮指標資料庫中台灣在民國90年金融業來看,以Quantile將金融營業單位的數量劃分成九等份,大體上集中在北中南三個都市精華地帶,東部則不太明顯。北部地區,以台北市中山區554家為最多,大安區480家次之,松山區及中正區則分別以396與301家緊跟在後。中部地區則以台中市西區113家為最高。

















由標準差來看,可以更明顯看出此種現象,除了幾個地方呈現紅、橘以外,其餘地區皆為淡藍色的分布情形。














從Moran’s I的數值(=0.5491)來看,可以看出其具有高度的空間自相關。

進一步利用LISA來分析金融單位在區域間的空間分布情形,是否會受到鄰近區域的影響,結果顯示在東部及南部地區,有明顯的Low-Low情況,即鄰居低,自己也低。唯台北市、高雄幾個零星地區有出現High-High的情況,即鄰居高,自己也高。

由於金融業的發展與游資是否充裕息息相關,上述此種空間自相關的現象,也許可以解釋為都會區的商業、人口密集,有助於資金聚集,助長了金融業的發展。因此,台灣的金融重鎮就集中在這些地方。(國發所梁婉玲R98341017)

2005年鄉鎮市長選舉

下圖分別為
綠營.第三黨派 . 及藍營 鄉鎮長選舉分布圖 (2005年)




















鄉鎮市長選舉為較基層之選舉,其第三勢力應較為突出.由此三圖中可看出第三黨派的勢力明顯得比立委選舉還多得多.其空間分布並沒有特別集中於某一地區.反而非常的分散.其影響之變項會在之後的研究中找出.


(國發所 R97341015 黃國虹)

立委選舉在台灣第三勢力空間走向2

各屆立委選舉投票分布平均後之地圖





























平均後可看出為六十五歲以上老人有顯著
故可將此變數視為有影響力之其中之一
而其餘變項將會繼續蒐集及分析


(國發所 黃國虹 莊宗翰 梁婉玲 陳群佩)

立委選舉在台灣第三勢力空間走向1

第三屆至第七屆立委選舉 第三勢力分布圖


























從以上各屆立委選舉圖中可看出第三勢力並沒有穩固分布在某些區域或地點,但在特定選舉中某些區域裡卻產生突然崛起之現象,因此我們推測:

@第三勢力的分布和藍營或綠營穩不穩定有其相關性。如:原屬藍營或綠營的人士脫黨參選可能造成第三勢力得票率提升。進一步研究有待篩選出第三勢力消長波動較大之地區,深入探索造成波動現象的因素為何。

@較諸地方民意代表選舉,立委選舉更為藍營綠營兵家必爭之地,在此層級上政黨的影響可能大過於地方勢力;第三黨派勢力的影響力是否更植基於較基層的選舉,有待在縣市議員層級的分析上一探究竟。

(國發所 黃國虹 莊宗翰 梁婉玲 陳群佩 )

2010年1月21日 星期四

台灣休閒農場3


依「2004年休閒農業場家全面性調查資料」,統計結果,休閒農業場家投資金額(不包括土地價值),以投入100萬至未滿500萬元者為最多,共有422個場(家)數(38.3%),其次為500萬至未滿1,000萬,共有218個場(家)(19.8%),因此投資100萬至未滿1,000萬元者共計640個場(家)(58.1%);其中投資額最少(100萬元以下)的場(家)有152個(13.8%),投資額最多(10,000萬元以上)的場(家)共有27個(2.5%)。上圖也可看出,台灣休閒農場較賺錢的場家,集中在休閒農場較密集的區域,多位於東部與中部山區。
另外,休閒農場(家)營運收入的部分,有高達八成(82.8%)的休閒農場(家)沒有門票收入,五成左右(50.8%)沒有餐飲收入,七成多(72.8%)沒有住宿收入,所有各類無營運收入類別中,無在地銷售收入者所佔比例最低,僅有三成左右(37.7%),另外,亦有七成(72.7%)的休閒農(場)沒有其他額外收入。其次,在此五項收入類別中皆以100,000~499,999元所佔比例為次之,門票收入佔有6.1%,餐飲收入佔有14.2%,住宿收入佔有9.2%,在地銷售收入佔有24%,其他收入佔有10.2%。在總產值的部分,尚未營運的場家(數)佔有3.4%,主要以1,000,000~2,999,999元所佔的場(家)數比例為最高,接近三成(28.6),其次為100,000~499,999元的二成(22.3%)左右的場(家)數,產值高達一億元以上的場家共有五家,佔所有場(家)數的0.5%。 (生傳所 d97630002 黃建嚴)

台灣休閒農場2

依「2004年休閒農業場家全面性調查資料」,統計結果,休閒農場(家)土地規模,主要以0.5公頃以上至未滿3公頃之面積規模所佔比例最多(589場家,53.4%),依據休閒農業輔導管理辦法規定,這589個場(家)皆可申請農業體驗型休閒農場。
面積3公頃以上未滿10公頃土地面積規模所佔比例次之(249場家,22.6%),若這些場家位於非山坡地或都市土地的山坡地皆可申請綜合型休閒農場;面積100公頃以上者共有9個場(家)(0.8%),其不論位於山坡地或非山坡地、都市土地或非都市土地,皆可申請綜合型休閒農場。 土地面積未滿0.5公頃者共有149個場(家)(13.5%),此類尚未達到法定休閒農場申請的基本面積規模,未來需要設法加以輔導或處理。

另外,以皮爾森(Person)相關分析法對普查資料中生產因素與休閒農場(家)營運產值進行分析,分析結果發現休閒農場(家)土地規模與營運產值的Pearson零階相關係數值為0.542(p=0.000),顯示在沒有其他生產因素被控制下,休閒農場(家)土地面積大小與營運產值有顯著的中度正相關。台灣休閒農場仍以規模取勝,面積較小的農場較難與土地面積大的大型休閒農場競爭。


(生傳所 d97630002 黃建嚴)

台灣休閒農場1

本研究主要以「2004年休閒農業場家全面性調查資料」為主要分析資料。探討台灣休閒農業經營者的經營狀況,了解休閒農場(家)生產與營運的主要因素。
台灣休閒農業的發展,農業委員會於民國八十九年將休閒農業之辭納入「農業發展條例」中的第三條第五款條文,明定「休閒農業係指利用田園景觀、自然生態及環境資源,結合農林漁牧生產、農業經營活動、農村文化及農家生活,提供國民休閒,增進國民對農業及農村之體驗為目的之農業經營。」 休閒農業經營即是將農業環境中具有獨特性、多樣性、鄉土性、優美性等之豐富資源,除了農業產銷之外,再加上農村景觀與文化等鄉土特色的「新產品」,民眾體驗自然景觀的消費行為須親自到農村才能完成交易,因它具有無形的、無法移動的、獨特的及鄉土的一種服務特性,經營範圍已超出傳統農業的生產及加工範疇,整合農業的有形資源及其所隱含的教育性質和觀光遊憩等無形資源所形成的一種新興休閒產業。在後現代多元旅遊型態下,走入自然體驗農作的方式也加速催生台灣休閒農場的數目。因此,從上圖1994、1999、2004三個年度台灣休閒農場場家的數量分布,可以看出休閒農場逐漸增加的趨勢。 (生傳所 d97630002 黃建嚴)


加入圖片

2010年1月20日 星期三

台商在長三角經濟圈的投資區位選擇

中國大陸自從1979 年,中共領導人鄧小平宣布改革開放以來,中國大陸所吸
引的外資,其投資的數量及金額日益增加。1979 年中共第五屆全國人民
代表大會第二次全體會議通過《中華人民共和國合資經濟企業法》並且頒布施行。
成為中國吸引外商直接投資的首部全國性政策法規。中國大陸據此法令建立四個
經濟特區;分別為深圳、珠海、汕頭、廈門四個經濟特區。1983 年5 月,中國國務
院召開第一次全國利用外資會議,首先整合自1979 年開放外資的經濟經驗,並且
擴展優先外資試點至14 個沿海港口城市,分別將珠江三角洲、長江三角洲、漳州、
泉州、閩南廈門等三角區域發展為經濟開放區。而透過上圖可以發現到長三角經濟圈的外資投資數額比重日益增加,甚至達到全國外資比重的二分之一強。

而不同產業類別具有不同投資屬性。將台商劃分為電子業與非電子業可探討出不同的台商分布特性。
上圖可以明顯發現到電子業台商更加集中集聚在以昆山、上海為輻射狀發散投資型態。
因此將台商的投資區位以泡泡圖可以很明顯發現下列投資型態。
值得注意的是,透過初步的探索。我們發現到一般在中國政府所定義的長三角區域是不包含浙江省溫州市區域。但此區域的台商個數也相當多,因此在研究中,我們採行廣義的長三角經濟圈定義。

國發所 陳韋舜 R97341056

2010年1月13日 星期三

分析候選人得票率差距與投票率的關係----以2009年第16屆縣(市)長選舉為例

2009年12月5日舉行了我國第16屆縣(市)長選舉,在國民黨執政近兩年之後,不少人將此次選舉視其為馬英九政府的期中考。



因應我國直轄市的改制,原本應該配合改選的台北縣市、台中縣市、台南縣市及高雄縣縣(市)長的選舉並未舉行,其首長任期因配合升格為直轄市而延任一年。因此,2009年我國第16屆縣(市)長選舉台灣省部分僅有桃園縣等15個縣分進行投票。雖然人口眾多的幾個主要縣分並未舉行投票,然而因為國內外政治經濟因素,此次選舉亦相當激烈。





此次縣(市)長選舉,投票率最高為嘉義縣75.29%,最低為基隆市53.04%,其餘縣市投票率皆介於此二縣市之間。第一高票(當選人)得票率,最高為雲林縣65.3680%,最低為新竹縣38.4872%;而第二高票(最高票落選人)得票率,最高為澎湖縣48.0701%,最低為花蓮縣25.4419%。






從資料中可看出,此次縣(市)長選舉,第一高票(當選人)與第二高票(最高票落選人)其得票率的差距,以花蓮縣30.9201%最高,雲林縣30.7338%居次,苗栗縣30.1920%第三,此三縣分當選人可謂大幅領先。而得票率差距最小的三個縣分別為澎湖縣1.2961%、台東縣5.1812%及嘉義市6.4866%,此三縣分可謂競爭激烈,當選人以些微得票率領先而當選。


在此,筆者提出如下假設。從理論來看,在影響投票率的結構因素裡,選舉競爭的激烈程度,會對投票率高低產生一定程度之影響:選情緊繃時,政治動員的程度提升,且就選民的心理層次而言,因為些微選票差異會造成懸殊結果,選民會極大化選票價值而願意投票。反觀選情不激烈時,選民容易產生「不差我一票」的心態而不去投票。第16屆縣市長選舉是否也有此一現象?我們探討關於此次縣(市)長選舉「候選人得票率差距」與「投票率」的關係,發現了一點蛛絲馬跡。




如圖,以代表選舉競爭程度的「候選人得票率差距」為自變項,以「投票率」為依變項,呈現正向的線性關係,斜率為0.6650,應為正相關。惟觀察值的分布情形,未均勻分布在直線的兩端,可以判知「候選人得票率差距」與「投票率」有相關而沒有直接的因果關係,也就是說,其他的干擾因素是存在的。事實上,許多的選舉行為研究已經指出,包括投票者的性別、年齡、教育程度、政治效能感等,都會影響投票意願與投票率之高低,選情激烈與否,只是其中一個因素而已,若要探討影響投票率高低的因素,當對各相關變項進一步做一分析探討。(國發所碩專二,p97341003,林隆瑲)





2010年1月12日 星期二

不完整空間資料之鄰近矩陣選取

前言
當我們在處理空間資料分析時,經常會遇到一種情況是,無法蒐集到所有的空間資料(如下圖),可能由於資料蒐集的難度,或是需要很多的經費支出,因此在經費不足下,只能做抽樣調查,有時候可能是資料的遺失。當我們要探討這些資料的空間延遲模型時,就必然會面臨處理空間鄰近矩陣的問題,我們熟知的空間鄰近矩陣有四種,Rook、Queen、Distance和K_nearest,在面臨空鄉鎮資料的情況下,選擇任何一種做為臨近矩陣,都可能會影響其分析結果。
資料選取
研究資料選擇2000年民進黨相對國民黨得票率當依變數,選取8各社經變數EDU456、Income89、AGRI89、INDUS89、Serveice89、NoMove89、Work89及NoWork89作為自變數,第一組為完整的358鄉鎮資料,第二組為扣除100各鄉鎮,共258各鄉鎮資料,兩組分別選擇4個空間鄰近矩陣做空間延遲模型,比較AIC與空間延遲參數的值,來探討在資料缺乏下,哪一個鄰近矩陣具有較佳的解釋能力。

鄰近矩陣討論
第一組Full_data,在Rook of order 1下的鄰居數呈現常態分佈(如下圖),眾數為5各鄰居,在Queen of order 1下亦是呈現常態分佈,眾數為5各鄰居,Distance threshold設定在15km(cite from 空間迴歸的殘差分析 http://utopia1234.blogspot.com/2009/11/blog-post_19.html),鄰居數的眾數為11,因此在Full_data這組K_nearest的K值選擇為3者相加取平均值,得K等於7。第二組Lack_data的Rook眾數有4各鄰居 ,Queen有4各鄰居,Distance_15km有6各鄰居,因此K_nearest的K為三者相加取平均為5。


結果
兩組的鄰近矩陣決定之後,開始分析空間延遲模型,我使用兩個指標來探討四個鄰近矩陣的優劣,一個是Akaike info criterion(下圖),一個是空間延遲參數(下下圖)。由下圖可以看到,Full_data的AIC都比Lack_data低,表示Full_data所跑出的結果,更接近真實的情況,這一點不難理解,本來缺少資料就比較不如完整的資料,而且其中使用Rook或是Queen並沒有太大的差別,但使用Distance及K_nearest作為鄰近矩陣時,解釋效果則較差;但是在Lack_data時,情況就有不同,Distance反而優於其他三個鄰近矩陣,其AIC值不但最低且變化的幅度也是最小的,Rook與Queen則次之,使用K_nearest最不好。第二個指標空間延遲參數(下下圖),也看到一樣的情況,Lack_data在使用Distance的鄰近矩陣下,非常接近Full_data的參數值,近似效果較佳,而其餘三者均差異過大。因此推論在分析缺少完整的空間資料下,宜使用距離做為鄰近矩陣。




R97228024 黃宜庭
資料來源:中央選舉委員會