淺議信息化測(cè)繪體系中的建立
劉念1,秦廣田2 毛臘梅3
1.長安大學(xué),2.國家測(cè)繪局第一地形測(cè)量隊(duì),3.西安地圖出版社,陜西,西安,710054
摘要:本文首先介紹了的概況,分析了要滿足測(cè)繪信息化的要求,測(cè)繪行業(yè)的地理信息數(shù)據(jù)采集、加工、交易中還存在的問題,指出數(shù)據(jù)倉庫和數(shù)據(jù)集市的癥結(jié),最后提出了“數(shù)據(jù)超市”的數(shù)據(jù)管理模式,進(jìn)一步強(qiáng)調(diào)了標(biāo)準(zhǔn)地理信息數(shù)據(jù)類型的必要性。
關(guān)鍵詞:信息化測(cè)繪 數(shù)據(jù)超市 地理空間信息
1、引言.
當(dāng)今世界已進(jìn)入信息時(shí)代,信息已經(jīng)廣泛深入應(yīng)用到政府、企事業(yè)單位、社會(huì)公眾的重大決策、日常工作以至生活之中,信息產(chǎn)業(yè)已經(jīng)成為國民經(jīng)濟(jì)的主要支柱性產(chǎn)業(yè)之一。
信息作為信息的重要組成部分,由于其基礎(chǔ)性、時(shí)空性、可視性,更是得到了政府、企業(yè)的高度重視,自上世紀(jì)90年代美國先后提出“信息高速公路”、“空間數(shù)據(jù)基礎(chǔ)設(shè)施(SDI)”、“數(shù)字地球”的概念后,大大促進(jìn)了現(xiàn)代地理信息產(chǎn)業(yè)的興起和迅猛發(fā)展,國際上傳統(tǒng)的測(cè)繪正經(jīng)歷著一場(chǎng)以地圖生產(chǎn)為主轉(zhuǎn)向以地理信息綜合服務(wù)為主的重大變革。2004年,英國《自然》雜志明確將地理空間信息技術(shù)和納米技術(shù)、生物技術(shù)一起列為21世紀(jì)最具發(fā)展前景的三大技術(shù)之一,充分體現(xiàn)了地理空間信息在未來世界發(fā)展中的重要地位及其價(jià)值。
經(jīng)過“九五”、“十五”期間的努力,我國測(cè)繪已經(jīng)基本完成了從“模擬化測(cè)繪”向“數(shù)字化測(cè)繪”的轉(zhuǎn)變。然而,從總體上說,我國的地理信息資源明顯不足,“數(shù)字鴻溝”“信息孤島”大量存在,地理信息服務(wù)水平普遍不高,難以滿足政府、企事業(yè)單位、社會(huì)公眾對(duì)地理信息的需求。因此,加快地理信息資源建設(shè)和地理空間數(shù)據(jù)整合,加強(qiáng)地理信息標(biāo)準(zhǔn)化,建立廣泛的空間信息交換網(wǎng)絡(luò),夯實(shí)“地理空間信息基礎(chǔ)設(shè)施”,實(shí)現(xiàn)全社會(huì)對(duì)地理空間信息的充分共享和利用,即走信息化測(cè)繪發(fā)展之路,不但是時(shí)代的要求,也是測(cè)繪發(fā)展的必然!1】
早在2003年,胡錦濤總書記在中央人口資源環(huán)境工作座談會(huì)上就明確指示要“推進(jìn)數(shù)字中國地理空間框架建設(shè),加快信息化測(cè)繪體系建設(shè),提高測(cè)繪保障服務(wù)能力。”溫家寶總理也提出,“要加快構(gòu)建數(shù)字中國地理空間框架,積極促進(jìn)國民經(jīng)濟(jì)和社會(huì)信息化,全面提高測(cè)繪保障能力和服務(wù)水平。”國務(wù)院前副總理曾培炎也強(qiáng)調(diào),“信息化測(cè)繪體系是當(dāng)代測(cè)繪發(fā)展進(jìn)步的標(biāo)志。測(cè)繪事業(yè)發(fā)展要走以信息化測(cè)繪體系建設(shè)為核心的道路。”
筆者認(rèn)為,要進(jìn)行信息化測(cè)繪體系的建設(shè),除了要解決“數(shù)據(jù)采集”、“數(shù)據(jù)生產(chǎn)”之外,需要解決的一個(gè)重要問題就是“數(shù)據(jù)交換”。只有解決了這個(gè)問題,數(shù)據(jù)采集和數(shù)據(jù)生產(chǎn)才會(huì)發(fā)生實(shí)際的效應(yīng)。通過數(shù)據(jù)交換,才能讓各行業(yè)充分享受信息化測(cè)繪帶來的便捷,進(jìn)而為我國的經(jīng)濟(jì)建設(shè)作出貢獻(xiàn)。那么,要解決數(shù)據(jù)交換的問題,首先就要考慮數(shù)據(jù)的存儲(chǔ)模式。
2、數(shù)據(jù)存儲(chǔ)的現(xiàn)狀
隨著航天航空、全球定位系統(tǒng)(GPS)、三維激光掃描等數(shù)據(jù)采集技術(shù)的發(fā)展,各種比例尺地形圖和專題地圖的出版發(fā)行,測(cè)繪行業(yè)的計(jì)算機(jī)系統(tǒng)每年都會(huì)產(chǎn)生海量的數(shù)據(jù)。如何有效的對(duì)這些海量的、繁雜的、各種結(jié)構(gòu)、各種類型的數(shù)據(jù)進(jìn)行有效管理,使不同需求的用戶可以方便地訪問、查詢,甚至利用這些數(shù)據(jù)進(jìn)行輔助決策,從而有效地為社會(huì)各行業(yè)提供測(cè)繪保障,目前已經(jīng)成為測(cè)繪行業(yè)面臨著的困境。
建立數(shù)據(jù)倉庫(Data Warehouse)可以把采集到的各種數(shù)據(jù)轉(zhuǎn)化為有用的、可信賴的信息,有效地支持商業(yè)決策。
目前,數(shù)據(jù)倉庫一詞尚沒有一個(gè)統(tǒng)一的定義,著名的數(shù)據(jù)倉庫專家W.H.Inmon在其著作《Building the Data Warehouse》一書中給予如下描述:數(shù)據(jù)倉庫是一個(gè)面向主題的(Subject Oriented)、集成的(Integrate)、相對(duì)穩(wěn)定的(Non-Volatile)、反映歷史變化(Time Variant)的數(shù)據(jù)集合,用于支持管理決策。對(duì)于數(shù)據(jù)倉庫的概念我們可以從兩個(gè)層次予以理解,首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫;其次,數(shù)據(jù)倉庫是對(duì)多個(gè)異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進(jìn)行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改[2]。
在信息時(shí)代,對(duì)測(cè)繪行業(yè)來講,要求對(duì)歷史數(shù)據(jù)可以進(jìn)行修改或更新,但是不能對(duì)其進(jìn)行刪除或銷毀。當(dāng)然,在修改或更新以前,需要對(duì)歷史數(shù)據(jù)進(jìn)行備份,這樣,經(jīng)過對(duì)歷史數(shù)據(jù)和更新數(shù)據(jù)進(jìn)行比較、分析,才能對(duì)有關(guān)地理信息產(chǎn)品或者對(duì)新建的項(xiàng)目進(jìn)行科學(xué)的評(píng)價(jià)。所以,測(cè)繪行業(yè)所存儲(chǔ)的數(shù)據(jù)量會(huì)越來越越大,每年甚至以TB級(jí)的速度增長。
測(cè)繪行業(yè)把地面上的人工的、天然的所有元素分為九大類,即測(cè)量控制點(diǎn)、居民地、工礦建(構(gòu))筑物、交通及附屬設(shè)施、管線及附屬設(shè)施、水系及附屬設(shè)施、境界、植被、地貌和土質(zhì)。測(cè)繪行業(yè)在建設(shè)地理信息數(shù)據(jù)庫的時(shí)候,是按照這九大類分別采集、編輯、成圖、入庫的。目前,測(cè)繪行業(yè)提供給用戶的數(shù)據(jù)是按照?qǐng)D幅進(jìn)行提供的。這就是說,這九大類數(shù)據(jù)都包含在圖幅中,如果某一個(gè)用戶只需要某一區(qū)域內(nèi)的一類或幾類數(shù)據(jù),那么,即使不需要其它類別的數(shù)據(jù),也必須支付這幾類數(shù)據(jù)的費(fèi)用。這就相當(dāng)于把不同類別的東西放在一個(gè)集裝箱內(nèi),在銷售時(shí)整箱賣,不能零售。這中交換模式對(duì)用戶來講顯然是不合適的。我們能不能建立一套系統(tǒng)就像超市一樣,用戶需要哪些數(shù)據(jù),我們就提供給用戶哪些數(shù)據(jù)呢?也就是說我們能不能面向用戶來建設(shè)地理信息的數(shù)據(jù)市場(chǎng)呢?這樣,即使用戶只需要某一類數(shù)據(jù)中的個(gè)別數(shù)據(jù),我們也能照單供應(yīng)。這就引出了測(cè)繪行業(yè)的數(shù)據(jù)是建設(shè)成按照集裝箱式交易的“數(shù)據(jù)倉庫”呢,還是建設(shè)成為可以進(jìn)行地理信息數(shù)據(jù)零售的“數(shù)據(jù)集市”?擬或是建設(shè)成為不僅可以零售,而且還可以進(jìn)行數(shù)據(jù)交換的“數(shù)據(jù)超市”?這就牽扯到測(cè)繪行業(yè)的數(shù)據(jù)存儲(chǔ)模式和管理模式的問題。
3、數(shù)據(jù)倉庫和數(shù)據(jù)集市的爭(zhēng)論
要對(duì)每年以TB級(jí)增長的數(shù)據(jù)進(jìn)行有效管理,必須建立適合測(cè)繪行業(yè)特點(diǎn)的數(shù)據(jù)存儲(chǔ)倉庫,同時(shí)也可以使用戶方便地使用倉庫中的各種數(shù)據(jù),當(dāng)然,保密數(shù)據(jù)的使用是要經(jīng)過特別允許的。
說起倉庫,大家自然而然地會(huì)想起“一所大大的房子,成排的高大貨架,合理的出入路線,是一種集中存儲(chǔ)貨物的地方,一般顧客是不來參觀訪問的。”而集市就使人聯(lián)想到空曠的場(chǎng)地,川流不息,大小商戶擺出攤子,賣各種各樣的商品,是讓顧客來消費(fèi)的地方。
如果狹義的理解這個(gè)定義,數(shù)據(jù)倉庫就是提供存儲(chǔ)的,提供一種面向數(shù)據(jù)管理的服務(wù),不面向最終用戶;而數(shù)據(jù)集市是提供數(shù)據(jù)零售的,是面向分析應(yīng)用、面向最終用戶的,但是不提供存儲(chǔ)。這樣,在測(cè)繪領(lǐng)域就出現(xiàn)了建設(shè)數(shù)據(jù)倉庫還是建設(shè)數(shù)據(jù)集市的爭(zhēng)論。
大家都知道,測(cè)繪行業(yè)的數(shù)據(jù)需要零售給其他用戶,用戶可以直接訪問,并最終使用這些測(cè)繪數(shù)據(jù)。這一點(diǎn)就有點(diǎn)像數(shù)據(jù)集市了?墒,眾所周知,測(cè)繪行業(yè)不單是給用戶提供測(cè)繪數(shù)據(jù),還承擔(dān)著測(cè)繪數(shù)據(jù)的存儲(chǔ)任務(wù)。說到數(shù)據(jù)存儲(chǔ),大家自然而然就想到了計(jì)算機(jī)上的存儲(chǔ)介質(zhì),它的存儲(chǔ)單位是“KB、MB、GB、TB”等。而測(cè)繪行業(yè)的存儲(chǔ)單位是按照“幅”來計(jì)算的,并不考慮每幅圖的數(shù)據(jù)到底能占多大的存儲(chǔ)空間,從這一點(diǎn)上看,又有點(diǎn)像只考慮存儲(chǔ)集裝箱的數(shù)量、而并不考慮集裝箱內(nèi)到底裝多少貨物的集裝箱式數(shù)據(jù)倉庫了。
一般來講,測(cè)繪行業(yè)除了進(jìn)行合法的采集地理信息數(shù)據(jù)外,還要對(duì)這些采集來的數(shù)據(jù)進(jìn)行加工、生產(chǎn),最終形成通用的地理信息數(shù)據(jù)產(chǎn)品。從這一點(diǎn)來看,測(cè)繪行業(yè)更像是一座數(shù)據(jù)加工廠了。這座“加工廠”里有“原料倉庫”——用來存儲(chǔ)采集的各種數(shù)據(jù);有“數(shù)據(jù)加工車間”——用來對(duì)采集來的數(shù)據(jù)進(jìn)行分析、處理、加工、生產(chǎn),從而生產(chǎn)出各種各樣的測(cè)繪產(chǎn)品;還有“產(chǎn)品倉庫”,用來按照比例尺、分辨率分門別類地存儲(chǔ)上工序生產(chǎn)出來的測(cè)繪產(chǎn)品;另外,這座工廠還需要一個(gè)對(duì)外銷售的“交易市場(chǎng)”,這樣才能把采集來的數(shù)據(jù)和生產(chǎn)出來的測(cè)繪產(chǎn)品銷售出去,以實(shí)現(xiàn)使用價(jià)值和價(jià)值的交換和分離。
現(xiàn)在, “數(shù)據(jù)加工廠”的生產(chǎn)模式在測(cè)繪行業(yè)已經(jīng)形成,也可以進(jìn)行各種各樣的數(shù)據(jù)處理、加工。但是,這些數(shù)據(jù)加工和處理只是建立在面向用戶的基礎(chǔ)之上的。也就是說,用戶(包括政府)要求什么,我們根據(jù)這種要求進(jìn)行數(shù)據(jù)的采集、加工和生產(chǎn)。這就相當(dāng)于工廠的“訂單式”生產(chǎn),雖然針對(duì)個(gè)別用戶來講,是一種快速的獲取有用數(shù)據(jù)的途徑。但是從大的方面來講,還不能加工成各種各樣的地理信息數(shù)據(jù)產(chǎn)品,還不能做到及時(shí)甚至超前地滿足各行各業(yè)對(duì)地理信息數(shù)據(jù)產(chǎn)品的要求。
目前,在測(cè)繪行業(yè),所有的數(shù)據(jù)都是按照標(biāo)準(zhǔn)進(jìn)行分幅存儲(chǔ)的,這在模擬測(cè)繪時(shí)代是必不可少的存儲(chǔ)手段,在計(jì)算機(jī)存儲(chǔ)空間不夠大時(shí),這個(gè)手段也還能起到條理清晰、易于查詢的作用?墒牵S著計(jì)算機(jī)技術(shù)的快速發(fā)展,電子存儲(chǔ)空間快速增大。就拿一個(gè)硬盤空間來講,在2000年前后,一個(gè)6.3GB的硬盤就已經(jīng)讓人羨慕不已了,現(xiàn)在,一個(gè)硬盤空間動(dòng)輒就500GB,甚至1TB、2TB,況且還出現(xiàn)了磁盤柜,空間更是要多大就有多大。過去,我們連把全國的1:5萬地形圖數(shù)據(jù)存儲(chǔ)到計(jì)算機(jī)里都不敢想,可是現(xiàn)在,連全國的1:5千地形圖數(shù)據(jù)都可以放到一個(gè)小小的硬盤或硬盤柜里了;如果我們?cè)敢,甚至連全國城鎮(zhèn)的1:500地形圖的數(shù)據(jù)都可以存儲(chǔ)在一個(gè)硬盤柜里。
另外,計(jì)算機(jī)的處理速度也較以前有了大幅度的提高,不管是CPU的處理速度,還是顯卡的處理速度,都是奔騰級(jí)的計(jì)算機(jī)無可比擬的。
幾乎無限量的存儲(chǔ)空間,加上越來越快的計(jì)算機(jī)處理速度,就要求我們適應(yīng)這個(gè)進(jìn)步,改變我們的工作方法,以充分利用現(xiàn)代計(jì)算機(jī)技術(shù)發(fā)展的成果。如果還是按照“幅”來存儲(chǔ)地理信息數(shù)據(jù),顯然已經(jīng)沒有必要了。這就要求我們來探索以什么樣的數(shù)據(jù)格式來存儲(chǔ)地理信息數(shù)據(jù),才能方便地進(jìn)行數(shù)據(jù)交易?
4、數(shù)據(jù)管理的新模式——數(shù)據(jù)超市
要想開發(fā)面向廣大用戶的地理信息數(shù)據(jù)應(yīng)用技術(shù),首先要解決的是如何進(jìn)行地理信息數(shù)據(jù)的存儲(chǔ)問題。在文獻(xiàn)3中,提到的空間數(shù)據(jù)倉庫技術(shù),筆者認(rèn)為值得推廣。
空間數(shù)據(jù)倉庫是在數(shù)據(jù)倉庫的基礎(chǔ)上,引入空間維數(shù)據(jù),根據(jù)主題從不同的GIS應(yīng)用系統(tǒng)中截取從瞬態(tài)到區(qū)段直到全球地球系統(tǒng)的不同規(guī)模時(shí)空尺度上的信息,從而為當(dāng)今的地學(xué)研究以及有關(guān)環(huán)境資源政策的制定提供最好的信息服務(wù)?臻g數(shù)據(jù)倉庫主要具有以下功能:(1)它可以兼容各種GIS系統(tǒng)的數(shù)據(jù);(2)可對(duì)用戶感興趣的數(shù)據(jù)進(jìn)行有效提。唬3)為了優(yōu)化空間數(shù)據(jù)倉庫的分析性能,需要將現(xiàn)有的GIS數(shù)據(jù)進(jìn)行適當(dāng)?shù)淖儞Q;(4)可以按照時(shí)間序列調(diào)用數(shù)據(jù),以便進(jìn)行變化和趨勢(shì)分析(5)可以按照空間序列調(diào)用數(shù)據(jù),以便進(jìn)行空間變化分析【3】。
根據(jù)以上特征,我們?cè)诓杉乩硇畔?shù)據(jù)時(shí),要按照測(cè)量控制點(diǎn)、居民地、工礦建(構(gòu))筑物、交通及附屬設(shè)施、管線及附屬設(shè)施、水系及附屬設(shè)施、境界、植被、地貌和土質(zhì)等的分類進(jìn)行數(shù)據(jù)采集,并進(jìn)行歸類存放。這樣,當(dāng)授權(quán)用戶需要某一地區(qū)、某一時(shí)間的某一類數(shù)據(jù)時(shí),就可以很方便進(jìn)行針對(duì)性地提取,進(jìn)而進(jìn)行歷史演變描述、現(xiàn)實(shí)情況分析,甚至可以進(jìn)行將來發(fā)展態(tài)勢(shì)預(yù)測(cè)。而未授權(quán)用戶只能瀏覽公開的、不涉密的符號(hào)化信息,或是經(jīng)過處理的影像信息,但是不能對(duì)這些信息進(jìn)行提取。
另外,在雙方自愿的前提下,測(cè)繪部門也可以和其它能夠進(jìn)行數(shù)據(jù)采集的部門合作,進(jìn)行更新數(shù)據(jù)交換,以便測(cè)繪部門對(duì)地理信息進(jìn)行快速更新。城市的地理信息更新的快捷方法可采用德國的方法,就是利用“測(cè)繪自愿者”自愿采集變化部分的地理坐標(biāo)、屬性信息,有償提供給測(cè)繪部門;或者直接提供變化所在的位置信息,測(cè)繪部門進(jìn)行快速變化數(shù)據(jù)采集,然后進(jìn)行快速更新。
這樣,數(shù)據(jù)存儲(chǔ)采用空間數(shù)據(jù)倉庫,數(shù)據(jù)交易采用交換、零售的靈活手段,數(shù)據(jù)更新采用交換或“測(cè)繪自愿者”提供信息的方法,三位一體,可以保證我們的地理信息數(shù)據(jù)保持長新。這種數(shù)據(jù)管理模式,不但是數(shù)據(jù)存儲(chǔ),也不僅是數(shù)據(jù)交易,它還有數(shù)據(jù)更新的功能,所以筆者稱之為“數(shù)據(jù)超市”。
如果要和其它數(shù)據(jù)采集部門進(jìn)行數(shù)據(jù)交換,就涉及到一個(gè)數(shù)據(jù)類型的問題。
5、數(shù)據(jù)交換的基礎(chǔ)——標(biāo)準(zhǔn)的數(shù)據(jù)類型
在解決了地理信息數(shù)據(jù)的存儲(chǔ)、更新模式以后,接著就要考慮“數(shù)據(jù)交換”的問題了。雖然,為了采集和生產(chǎn)地理信息數(shù)據(jù),在測(cè)繪行業(yè)有各種規(guī)范、圖式等強(qiáng)制性、規(guī)則性文件,可是不同比例尺的圖式及數(shù)據(jù)規(guī)定之間卻風(fēng)馬牛不相及,各有各的圖式符號(hào),各有各的數(shù)據(jù)規(guī)定,并且這些符號(hào)和數(shù)據(jù)編碼都有很大差異。這就導(dǎo)致大比例尺、中比例尺、小比例尺地形數(shù)據(jù)之間很難自動(dòng)實(shí)現(xiàn)共享和互通,對(duì)不同比例尺的地圖數(shù)據(jù)的傳遞帶來了很大的困難。
另外,不同行業(yè)的地理信息數(shù)據(jù)也有不同的圖式符號(hào)和不同的地形要素代碼,例如:鐵路行業(yè)有自己的圖式、國土部門有自己的圖式,等等。這就對(duì)不同行業(yè)之間的數(shù)據(jù)共享帶來了無法逾越的障礙。
如果我們?cè)噲D建設(shè)中國的地理信息數(shù)據(jù)市場(chǎng),滿足各行各業(yè)對(duì)地理信息數(shù)據(jù)交換的要求,那么針對(duì)每一類數(shù)據(jù)(包括自己生產(chǎn)的和不同部門之間交換的)都應(yīng)有一個(gè)統(tǒng)一的名稱、符號(hào)和要素代碼。有了標(biāo)準(zhǔn)的數(shù)據(jù)類型,不同的用戶就可以用統(tǒng)一的要素代碼(或名稱)查詢、使用自己感興趣的數(shù)據(jù)。例如:林業(yè)部門可以查詢和使用道路信息、林地覆蓋等信息;交通部門關(guān)心的是道路、橋梁、涵洞等信息;水利部門可能用到河流、湖泊、渠道、農(nóng)田等信息。這些信息只有統(tǒng)一了名稱和要素代碼,才能在不同用戶互相交流。這就相當(dāng)于不同國家的人,在交流時(shí)要使用相同的語言一樣。
6、結(jié)束語
利用“數(shù)據(jù)超市”管理模式,不但可以使測(cè)繪行業(yè)為政府部門提供快速、高效的服務(wù),也可以使測(cè)繪行業(yè)走向普通百姓,是新一代GIS的發(fā)展方向。利用空間數(shù)據(jù)倉庫功能,利用和國土、交通、水利等部門的數(shù)據(jù)交換,以及“測(cè)繪自愿者”的幫助,“數(shù)據(jù)超市”一定能提供給包括政府部門和普通百姓在內(nèi)的各類用戶滿意的服務(wù)。
參考文獻(xiàn)
1、浙江省測(cè)繪局,《浙江省信息化測(cè)繪體系建設(shè)發(fā)展戰(zhàn)略研究報(bào)告》,2009年。
2、唐世渭,裴健. 數(shù)據(jù)倉庫中的聯(lián)機(jī)分析處理技術(shù)與元數(shù)據(jù)機(jī)制. 《中國金融電腦》,1998.5。
3、“數(shù)字地球”中GIS的數(shù)據(jù)倉庫技術(shù)與應(yīng)用,2008.12,。
轉(zhuǎn)載請(qǐng)注明來自:http://www.jinnzone.com/xinxianqlw/6812.html