淺議信息化測繪體系中的建立
劉念1,秦廣田2 毛臘梅3
1.長安大學(xué),2.國家測繪局第一地形測量隊,3.西安地圖出版社,陜西,西安,710054
摘要:本文首先介紹了的概況,分析了要滿足測繪信息化的要求,測繪行業(yè)的地理信息數(shù)據(jù)采集、加工、交易中還存在的問題,指出數(shù)據(jù)倉庫和數(shù)據(jù)集市的癥結(jié),最后提出了“數(shù)據(jù)超市”的數(shù)據(jù)管理模式,進一步強調(diào)了標(biāo)準(zhǔn)地理信息數(shù)據(jù)類型的必要性。
關(guān)鍵詞:信息化測繪 數(shù)據(jù)超市 地理空間信息
1、引言.
當(dāng)今世界已進入信息時代,信息已經(jīng)廣泛深入應(yīng)用到政府、企事業(yè)單位、社會公眾的重大決策、日常工作以至生活之中,信息產(chǎn)業(yè)已經(jīng)成為國民經(jīng)濟的主要支柱性產(chǎn)業(yè)之一。
信息作為信息的重要組成部分,由于其基礎(chǔ)性、時空性、可視性,更是得到了政府、企業(yè)的高度重視,自上世紀(jì)90年代美國先后提出“信息高速公路”、“空間數(shù)據(jù)基礎(chǔ)設(shè)施(SDI)”、“數(shù)字地球”的概念后,大大促進了現(xiàn)代地理信息產(chǎn)業(yè)的興起和迅猛發(fā)展,國際上傳統(tǒng)的測繪正經(jīng)歷著一場以地圖生產(chǎn)為主轉(zhuǎn)向以地理信息綜合服務(wù)為主的重大變革。2004年,英國《自然》雜志明確將地理空間信息技術(shù)和納米技術(shù)、生物技術(shù)一起列為21世紀(jì)最具發(fā)展前景的三大技術(shù)之一,充分體現(xiàn)了地理空間信息在未來世界發(fā)展中的重要地位及其價值。
經(jīng)過“九五”、“十五”期間的努力,我國測繪已經(jīng)基本完成了從“模擬化測繪”向“數(shù)字化測繪”的轉(zhuǎn)變。然而,從總體上說,我國的地理信息資源明顯不足,“數(shù)字鴻溝”“信息孤島”大量存在,地理信息服務(wù)水平普遍不高,難以滿足政府、企事業(yè)單位、社會公眾對地理信息的需求。因此,加快地理信息資源建設(shè)和地理空間數(shù)據(jù)整合,加強地理信息標(biāo)準(zhǔn)化,建立廣泛的空間信息交換網(wǎng)絡(luò),夯實“地理空間信息基礎(chǔ)設(shè)施”,實現(xiàn)全社會對地理空間信息的充分共享和利用,即走信息化測繪發(fā)展之路,不但是時代的要求,也是測繪發(fā)展的必然。【1】
早在2003年,胡錦濤總書記在中央人口資源環(huán)境工作座談會上就明確指示要“推進數(shù)字中國地理空間框架建設(shè),加快信息化測繪體系建設(shè),提高測繪保障服務(wù)能力。”溫家寶總理也提出,“要加快構(gòu)建數(shù)字中國地理空間框架,積極促進國民經(jīng)濟和社會信息化,全面提高測繪保障能力和服務(wù)水平。”國務(wù)院前副總理曾培炎也強調(diào),“信息化測繪體系是當(dāng)代測繪發(fā)展進步的標(biāo)志。測繪事業(yè)發(fā)展要走以信息化測繪體系建設(shè)為核心的道路。”
筆者認為,要進行信息化測繪體系的建設(shè),除了要解決“數(shù)據(jù)采集”、“數(shù)據(jù)生產(chǎn)”之外,需要解決的一個重要問題就是“數(shù)據(jù)交換”。只有解決了這個問題,數(shù)據(jù)采集和數(shù)據(jù)生產(chǎn)才會發(fā)生實際的效應(yīng)。通過數(shù)據(jù)交換,才能讓各行業(yè)充分享受信息化測繪帶來的便捷,進而為我國的經(jīng)濟建設(shè)作出貢獻。那么,要解決數(shù)據(jù)交換的問題,首先就要考慮數(shù)據(jù)的存儲模式。
2、數(shù)據(jù)存儲的現(xiàn)狀
隨著航天航空、全球定位系統(tǒng)(GPS)、三維激光掃描等數(shù)據(jù)采集技術(shù)的發(fā)展,各種比例尺地形圖和專題地圖的出版發(fā)行,測繪行業(yè)的計算機系統(tǒng)每年都會產(chǎn)生海量的數(shù)據(jù)。如何有效的對這些海量的、繁雜的、各種結(jié)構(gòu)、各種類型的數(shù)據(jù)進行有效管理,使不同需求的用戶可以方便地訪問、查詢,甚至利用這些數(shù)據(jù)進行輔助決策,從而有效地為社會各行業(yè)提供測繪保障,目前已經(jīng)成為測繪行業(yè)面臨著的困境。
建立數(shù)據(jù)倉庫(Data Warehouse)可以把采集到的各種數(shù)據(jù)轉(zhuǎn)化為有用的、可信賴的信息,有效地支持商業(yè)決策。
目前,數(shù)據(jù)倉庫一詞尚沒有一個統(tǒng)一的定義,著名的數(shù)據(jù)倉庫專家W.H.Inmon在其著作《Building the Data Warehouse》一書中給予如下描述:數(shù)據(jù)倉庫是一個面向主題的(Subject Oriented)、集成的(Integrate)、相對穩(wěn)定的(Non-Volatile)、反映歷史變化(Time Variant)的數(shù)據(jù)集合,用于支持管理決策。對于數(shù)據(jù)倉庫的概念我們可以從兩個層次予以理解,首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫;其次,數(shù)據(jù)倉庫是對多個異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改[2]。
在信息時代,對測繪行業(yè)來講,要求對歷史數(shù)據(jù)可以進行修改或更新,但是不能對其進行刪除或銷毀。當(dāng)然,在修改或更新以前,需要對歷史數(shù)據(jù)進行備份,這樣,經(jīng)過對歷史數(shù)據(jù)和更新數(shù)據(jù)進行比較、分析,才能對有關(guān)地理信息產(chǎn)品或者對新建的項目進行科學(xué)的評價。所以,測繪行業(yè)所存儲的數(shù)據(jù)量會越來越越大,每年甚至以TB級的速度增長。
測繪行業(yè)把地面上的人工的、天然的所有元素分為九大類,即測量控制點、居民地、工礦建(構(gòu))筑物、交通及附屬設(shè)施、管線及附屬設(shè)施、水系及附屬設(shè)施、境界、植被、地貌和土質(zhì)。測繪行業(yè)在建設(shè)地理信息數(shù)據(jù)庫的時候,是按照這九大類分別采集、編輯、成圖、入庫的。目前,測繪行業(yè)提供給用戶的數(shù)據(jù)是按照圖幅進行提供的。這就是說,這九大類數(shù)據(jù)都包含在圖幅中,如果某一個用戶只需要某一區(qū)域內(nèi)的一類或幾類數(shù)據(jù),那么,即使不需要其它類別的數(shù)據(jù),也必須支付這幾類數(shù)據(jù)的費用。這就相當(dāng)于把不同類別的東西放在一個集裝箱內(nèi),在銷售時整箱賣,不能零售。這中交換模式對用戶來講顯然是不合適的。我們能不能建立一套系統(tǒng)就像超市一樣,用戶需要哪些數(shù)據(jù),我們就提供給用戶哪些數(shù)據(jù)呢?也就是說我們能不能面向用戶來建設(shè)地理信息的數(shù)據(jù)市場呢?這樣,即使用戶只需要某一類數(shù)據(jù)中的個別數(shù)據(jù),我們也能照單供應(yīng)。這就引出了測繪行業(yè)的數(shù)據(jù)是建設(shè)成按照集裝箱式交易的“數(shù)據(jù)倉庫”呢,還是建設(shè)成為可以進行地理信息數(shù)據(jù)零售的“數(shù)據(jù)集市”?擬或是建設(shè)成為不僅可以零售,而且還可以進行數(shù)據(jù)交換的“數(shù)據(jù)超市”?這就牽扯到測繪行業(yè)的數(shù)據(jù)存儲模式和管理模式的問題。
3、數(shù)據(jù)倉庫和數(shù)據(jù)集市的爭論
要對每年以TB級增長的數(shù)據(jù)進行有效管理,必須建立適合測繪行業(yè)特點的數(shù)據(jù)存儲倉庫,同時也可以使用戶方便地使用倉庫中的各種數(shù)據(jù),當(dāng)然,保密數(shù)據(jù)的使用是要經(jīng)過特別允許的。
說起倉庫,大家自然而然地會想起“一所大大的房子,成排的高大貨架,合理的出入路線,是一種集中存儲貨物的地方,一般顧客是不來參觀訪問的。”而集市就使人聯(lián)想到空曠的場地,川流不息,大小商戶擺出攤子,賣各種各樣的商品,是讓顧客來消費的地方。
如果狹義的理解這個定義,數(shù)據(jù)倉庫就是提供存儲的,提供一種面向數(shù)據(jù)管理的服務(wù),不面向最終用戶;而數(shù)據(jù)集市是提供數(shù)據(jù)零售的,是面向分析應(yīng)用、面向最終用戶的,但是不提供存儲。這樣,在測繪領(lǐng)域就出現(xiàn)了建設(shè)數(shù)據(jù)倉庫還是建設(shè)數(shù)據(jù)集市的爭論。
大家都知道,測繪行業(yè)的數(shù)據(jù)需要零售給其他用戶,用戶可以直接訪問,并最終使用這些測繪數(shù)據(jù)。這一點就有點像數(shù)據(jù)集市了。可是,眾所周知,測繪行業(yè)不單是給用戶提供測繪數(shù)據(jù),還承擔(dān)著測繪數(shù)據(jù)的存儲任務(wù)。說到數(shù)據(jù)存儲,大家自然而然就想到了計算機上的存儲介質(zhì),它的存儲單位是“KB、MB、GB、TB”等。而測繪行業(yè)的存儲單位是按照“幅”來計算的,并不考慮每幅圖的數(shù)據(jù)到底能占多大的存儲空間,從這一點上看,又有點像只考慮存儲集裝箱的數(shù)量、而并不考慮集裝箱內(nèi)到底裝多少貨物的集裝箱式數(shù)據(jù)倉庫了。
一般來講,測繪行業(yè)除了進行合法的采集地理信息數(shù)據(jù)外,還要對這些采集來的數(shù)據(jù)進行加工、生產(chǎn),最終形成通用的地理信息數(shù)據(jù)產(chǎn)品。從這一點來看,測繪行業(yè)更像是一座數(shù)據(jù)加工廠了。這座“加工廠”里有“原料倉庫”——用來存儲采集的各種數(shù)據(jù);有“數(shù)據(jù)加工車間”——用來對采集來的數(shù)據(jù)進行分析、處理、加工、生產(chǎn),從而生產(chǎn)出各種各樣的測繪產(chǎn)品;還有“產(chǎn)品倉庫”,用來按照比例尺、分辨率分門別類地存儲上工序生產(chǎn)出來的測繪產(chǎn)品;另外,這座工廠還需要一個對外銷售的“交易市場”,這樣才能把采集來的數(shù)據(jù)和生產(chǎn)出來的測繪產(chǎn)品銷售出去,以實現(xiàn)使用價值和價值的交換和分離。
現(xiàn)在, “數(shù)據(jù)加工廠”的生產(chǎn)模式在測繪行業(yè)已經(jīng)形成,也可以進行各種各樣的數(shù)據(jù)處理、加工。但是,這些數(shù)據(jù)加工和處理只是建立在面向用戶的基礎(chǔ)之上的。也就是說,用戶(包括政府)要求什么,我們根據(jù)這種要求進行數(shù)據(jù)的采集、加工和生產(chǎn)。這就相當(dāng)于工廠的“訂單式”生產(chǎn),雖然針對個別用戶來講,是一種快速的獲取有用數(shù)據(jù)的途徑。但是從大的方面來講,還不能加工成各種各樣的地理信息數(shù)據(jù)產(chǎn)品,還不能做到及時甚至超前地滿足各行各業(yè)對地理信息數(shù)據(jù)產(chǎn)品的要求。
目前,在測繪行業(yè),所有的數(shù)據(jù)都是按照標(biāo)準(zhǔn)進行分幅存儲的,這在模擬測繪時代是必不可少的存儲手段,在計算機存儲空間不夠大時,這個手段也還能起到條理清晰、易于查詢的作用?墒,隨著計算機技術(shù)的快速發(fā)展,電子存儲空間快速增大。就拿一個硬盤空間來講,在2000年前后,一個6.3GB的硬盤就已經(jīng)讓人羨慕不已了,現(xiàn)在,一個硬盤空間動輒就500GB,甚至1TB、2TB,況且還出現(xiàn)了磁盤柜,空間更是要多大就有多大。過去,我們連把全國的1:5萬地形圖數(shù)據(jù)存儲到計算機里都不敢想,可是現(xiàn)在,連全國的1:5千地形圖數(shù)據(jù)都可以放到一個小小的硬盤或硬盤柜里了;如果我們愿意,甚至連全國城鎮(zhèn)的1:500地形圖的數(shù)據(jù)都可以存儲在一個硬盤柜里。
另外,計算機的處理速度也較以前有了大幅度的提高,不管是CPU的處理速度,還是顯卡的處理速度,都是奔騰級的計算機無可比擬的。
幾乎無限量的存儲空間,加上越來越快的計算機處理速度,就要求我們適應(yīng)這個進步,改變我們的工作方法,以充分利用現(xiàn)代計算機技術(shù)發(fā)展的成果。如果還是按照“幅”來存儲地理信息數(shù)據(jù),顯然已經(jīng)沒有必要了。這就要求我們來探索以什么樣的數(shù)據(jù)格式來存儲地理信息數(shù)據(jù),才能方便地進行數(shù)據(jù)交易?
4、數(shù)據(jù)管理的新模式——數(shù)據(jù)超市
要想開發(fā)面向廣大用戶的地理信息數(shù)據(jù)應(yīng)用技術(shù),首先要解決的是如何進行地理信息數(shù)據(jù)的存儲問題。在文獻3中,提到的空間數(shù)據(jù)倉庫技術(shù),筆者認為值得推廣。
空間數(shù)據(jù)倉庫是在數(shù)據(jù)倉庫的基礎(chǔ)上,引入空間維數(shù)據(jù),根據(jù)主題從不同的GIS應(yīng)用系統(tǒng)中截取從瞬態(tài)到區(qū)段直到全球地球系統(tǒng)的不同規(guī)模時空尺度上的信息,從而為當(dāng)今的地學(xué)研究以及有關(guān)環(huán)境資源政策的制定提供最好的信息服務(wù)。空間數(shù)據(jù)倉庫主要具有以下功能:(1)它可以兼容各種GIS系統(tǒng)的數(shù)據(jù);(2)可對用戶感興趣的數(shù)據(jù)進行有效提;(3)為了優(yōu)化空間數(shù)據(jù)倉庫的分析性能,需要將現(xiàn)有的GIS數(shù)據(jù)進行適當(dāng)?shù)淖儞Q;(4)可以按照時間序列調(diào)用數(shù)據(jù),以便進行變化和趨勢分析(5)可以按照空間序列調(diào)用數(shù)據(jù),以便進行空間變化分析【3】。
根據(jù)以上特征,我們在采集地理信息數(shù)據(jù)時,要按照測量控制點、居民地、工礦建(構(gòu))筑物、交通及附屬設(shè)施、管線及附屬設(shè)施、水系及附屬設(shè)施、境界、植被、地貌和土質(zhì)等的分類進行數(shù)據(jù)采集,并進行歸類存放。這樣,當(dāng)授權(quán)用戶需要某一地區(qū)、某一時間的某一類數(shù)據(jù)時,就可以很方便進行針對性地提取,進而進行歷史演變描述、現(xiàn)實情況分析,甚至可以進行將來發(fā)展態(tài)勢預(yù)測。而未授權(quán)用戶只能瀏覽公開的、不涉密的符號化信息,或是經(jīng)過處理的影像信息,但是不能對這些信息進行提取。
另外,在雙方自愿的前提下,測繪部門也可以和其它能夠進行數(shù)據(jù)采集的部門合作,進行更新數(shù)據(jù)交換,以便測繪部門對地理信息進行快速更新。城市的地理信息更新的快捷方法可采用德國的方法,就是利用“測繪自愿者”自愿采集變化部分的地理坐標(biāo)、屬性信息,有償提供給測繪部門;或者直接提供變化所在的位置信息,測繪部門進行快速變化數(shù)據(jù)采集,然后進行快速更新。
這樣,數(shù)據(jù)存儲采用空間數(shù)據(jù)倉庫,數(shù)據(jù)交易采用交換、零售的靈活手段,數(shù)據(jù)更新采用交換或“測繪自愿者”提供信息的方法,三位一體,可以保證我們的地理信息數(shù)據(jù)保持長新。這種數(shù)據(jù)管理模式,不但是數(shù)據(jù)存儲,也不僅是數(shù)據(jù)交易,它還有數(shù)據(jù)更新的功能,所以筆者稱之為“數(shù)據(jù)超市”。
如果要和其它數(shù)據(jù)采集部門進行數(shù)據(jù)交換,就涉及到一個數(shù)據(jù)類型的問題。
5、數(shù)據(jù)交換的基礎(chǔ)——標(biāo)準(zhǔn)的數(shù)據(jù)類型
在解決了地理信息數(shù)據(jù)的存儲、更新模式以后,接著就要考慮“數(shù)據(jù)交換”的問題了。雖然,為了采集和生產(chǎn)地理信息數(shù)據(jù),在測繪行業(yè)有各種規(guī)范、圖式等強制性、規(guī)則性文件,可是不同比例尺的圖式及數(shù)據(jù)規(guī)定之間卻風(fēng)馬牛不相及,各有各的圖式符號,各有各的數(shù)據(jù)規(guī)定,并且這些符號和數(shù)據(jù)編碼都有很大差異。這就導(dǎo)致大比例尺、中比例尺、小比例尺地形數(shù)據(jù)之間很難自動實現(xiàn)共享和互通,對不同比例尺的地圖數(shù)據(jù)的傳遞帶來了很大的困難。
另外,不同行業(yè)的地理信息數(shù)據(jù)也有不同的圖式符號和不同的地形要素代碼,例如:鐵路行業(yè)有自己的圖式、國土部門有自己的圖式,等等。這就對不同行業(yè)之間的數(shù)據(jù)共享帶來了無法逾越的障礙。
如果我們試圖建設(shè)中國的地理信息數(shù)據(jù)市場,滿足各行各業(yè)對地理信息數(shù)據(jù)交換的要求,那么針對每一類數(shù)據(jù)(包括自己生產(chǎn)的和不同部門之間交換的)都應(yīng)有一個統(tǒng)一的名稱、符號和要素代碼。有了標(biāo)準(zhǔn)的數(shù)據(jù)類型,不同的用戶就可以用統(tǒng)一的要素代碼(或名稱)查詢、使用自己感興趣的數(shù)據(jù)。例如:林業(yè)部門可以查詢和使用道路信息、林地覆蓋等信息;交通部門關(guān)心的是道路、橋梁、涵洞等信息;水利部門可能用到河流、湖泊、渠道、農(nóng)田等信息。這些信息只有統(tǒng)一了名稱和要素代碼,才能在不同用戶互相交流。這就相當(dāng)于不同國家的人,在交流時要使用相同的語言一樣。
6、結(jié)束語
利用“數(shù)據(jù)超市”管理模式,不但可以使測繪行業(yè)為政府部門提供快速、高效的服務(wù),也可以使測繪行業(yè)走向普通百姓,是新一代GIS的發(fā)展方向。利用空間數(shù)據(jù)倉庫功能,利用和國土、交通、水利等部門的數(shù)據(jù)交換,以及“測繪自愿者”的幫助,“數(shù)據(jù)超市”一定能提供給包括政府部門和普通百姓在內(nèi)的各類用戶滿意的服務(wù)。
參考文獻
1、浙江省測繪局,《浙江省信息化測繪體系建設(shè)發(fā)展戰(zhàn)略研究報告》,2009年。
2、唐世渭,裴健. 數(shù)據(jù)倉庫中的聯(lián)機分析處理技術(shù)與元數(shù)據(jù)機制. 《中國金融電腦》,1998.5。
3、“數(shù)字地球”中GIS的數(shù)據(jù)倉庫技術(shù)與應(yīng)用,2008.12,。
轉(zhuǎn)載請注明來自:http://www.jinnzone.com/xinxianqlw/6812.html