隨著科技的發(fā)展,圖書管理系統(tǒng)也開始更新?lián)Q代了,在圖書管理中,一套合理的圖書管理系統(tǒng)能給管理工作帶來很大的便捷,而且也會精準。本文是一篇職稱論文發(fā)表范文,主要論述了基于用戶個性化的圖書管理系統(tǒng)。
摘 要:文章設計了一個基于用戶個性化的圖書管理系統(tǒng),分析了系統(tǒng)的需求,將系統(tǒng)主要劃分為用戶主頁數(shù)據(jù)存儲、用戶主頁數(shù)據(jù)管理、用戶編程模型、用戶欄目管理以及用戶主頁結構配置等幾個模塊,且設計了相應的功能結構樹,并通過系統(tǒng)運行流程圖詳細闡述了系統(tǒng)的實現(xiàn)過程。
關鍵詞:個性化服務,圖書,推薦系統(tǒng)
作者簡介:芮懷楷(1980― ),黑龍江東方學院圖書館館員。
隨著時代的進步與發(fā)展,我國進入了快速發(fā)展變化的轉型時期,其中圖書管理也發(fā)生了劇烈的變化。圖書管理系統(tǒng)作為圖書館應用現(xiàn)代信息技術更好服務于讀者的支撐平臺,隨著信息技術的發(fā)展,也經歷了多次的升級。目前傳統(tǒng)的高校圖書館圖書管理系統(tǒng)還是以圖書管理為中心,難以體現(xiàn)出以讀者為中心的服務理念。在當前圖書數(shù)據(jù)呈現(xiàn)出爆炸式增長的趨勢下,越來越多的讀者開始利用網(wǎng)絡搜索進行檢索,這就使得傳統(tǒng)圖書管理系統(tǒng)中目錄的作用越來越弱化,編目業(yè)務也正在被邊緣化。而且當前圖書管理系統(tǒng)的用戶已經不再是單純的系統(tǒng)使用者,更多的用戶越來越傾向于表達自己的意見以及個性化需求。這也使得傳統(tǒng)的統(tǒng)一用戶界面圖書管理系統(tǒng)已經無法滿足圖書數(shù)據(jù)的管理與檢索以及用戶的個性化需求。因此,本文將設計一個能夠滿足用戶個性化需求的圖書管理系統(tǒng)。
1 系統(tǒng)分析
用戶的個性化需求主要分為兩方面內容,一類是用戶自身感興趣的圖書信息,另一類則是與用戶的個性化內容相關的圖書信息。前者由用戶在圖書信息系統(tǒng)中自己配置,后者則由系統(tǒng)通過用戶的行為分析進行大數(shù)據(jù)挖掘,或者由用戶的個性化編程得到。因此圖書管理系統(tǒng)中用戶的個性化需求主要包含:用戶主頁數(shù)據(jù)存儲、用戶主頁數(shù)據(jù)管理、用戶編程模型、用戶欄目管理以及用戶主頁結構配置這幾個功能模塊。功能模塊之間的關系及用戶個性化需求圖書管理系統(tǒng)如圖1所示。
從圖中可以看出,數(shù)據(jù)存儲和欄目管理是系統(tǒng)的核心部分,這兩部分主要是對每個用戶的個性化主頁信息進行管理、分布式存儲以及欄目的定制。①主頁數(shù)據(jù)存儲模塊負責對用戶個性化主頁欄目的相關數(shù)據(jù)進行存儲,支持從后臺讀取數(shù)據(jù)在前臺進行顯示,并且能夠使得個性化主頁的內容存儲在安全方面得到保障。②主頁數(shù)據(jù)管理模塊主要負責對主頁的數(shù)據(jù)進行管理,是以用戶作為基本單位來進行管理,每個用戶會存在多種形式的文檔,包括xml文檔、html文檔、文本文檔、圖片文檔等,系統(tǒng)需要對這些文檔分別進行存儲,并對這些文檔進行維護,當需要這些文檔時可以快速地對這些文檔進行查找,以最快的速度提供給用戶。主頁數(shù)據(jù)管理模塊會針對用戶個性化主頁的每個欄目對主頁內容進行細化管理,并最終支持主頁的最后顯示。③編程模型模塊負責對主頁的數(shù)據(jù)進行檢索,因為主頁的數(shù)據(jù)是分布式地存儲,快速地實現(xiàn)主頁數(shù)據(jù)的檢索并最終呈現(xiàn)給用戶成為編程模型模塊的主要任務。編程模型模塊是在主頁數(shù)據(jù)存儲以及主頁數(shù)據(jù)管理兩個模塊的基礎上運行的,編程模型主要用來實現(xiàn)快速地在海量的圖書數(shù)據(jù)中進行檢索,最終以最快的速度呈現(xiàn)給用戶,增強用戶在使用個性化主頁時的體驗。④欄目管理模塊負責對用戶個性化主頁的欄目進行管理,每個用戶的欄目不同,其所呈現(xiàn)出的內容也會不同。一方面是為了實現(xiàn)對用戶個性化的標準欄目進行管理,以使用戶在進行文檔的上傳操作時,可以有效地對這些文檔進行分類的上傳,并可以文檔所屬欄目的類別來對欄目進行管理;另一方面允許用戶對欄目進行定制操作,并形成和用戶相關的欄目,用戶同時需要上傳和自己定義的欄目相關的文檔內容。⑤主頁結構配置模塊是建立在前四個模塊基礎上的,該模塊利用xml工具以及xml解析引擎生成用戶的整個個性化主頁結構,并以規(guī)范化的形式呈現(xiàn)給用戶,供用戶最后使用。
2 系統(tǒng)設計
在上述系統(tǒng)分析的基礎上,本文給出了如下的基于用戶個性化的圖書管理系統(tǒng)的功能結構;谟脩魝性化的圖書管理系統(tǒng)主要包括了欄目管理、主頁數(shù)據(jù)管理、主頁數(shù)據(jù)存儲、編程模型以及主頁結構配置等五個功能模塊,如圖2所示。
2.1 欄目管理模塊
欄目管理模塊中主要包含了欄目分類、欄目定制以及欄目修改模塊。欄目分類模塊主要是把欄目版塊分為標準欄目以及自定義欄目。標準欄目主要是由主頁框架中的dtd文檔來對其進行定義,dtd文檔定義的每個用戶的欄目都是相同的,包括新聞、公告、產品以及服務等欄目。自定義欄目主要是針對個性化用戶而言的,個性化用戶可以通過自定義欄目的形式編輯相應的欄目,同時,還需要上傳與欄目相關的文檔以及相應的圖片數(shù)據(jù),并且對這些數(shù)據(jù)進行維護。欄目定制模塊是由個性化用戶在自定義欄目類別下面定義具體的欄目信息。欄目修改模塊是指用戶可以對定義的欄目名稱進行修改。綜上,欄目管理模塊可以有效地對每個個性化用戶主頁的欄目版塊進行管理,也能夠從欄目層面上來對不同的個性化用戶的主頁進行區(qū)分。
2.2 主頁數(shù)據(jù)管理模塊
主頁數(shù)據(jù)管理模塊包含了數(shù)據(jù)操作模塊和數(shù)據(jù)分類模塊。數(shù)據(jù)操作模塊又可以分為數(shù)據(jù)上傳、數(shù)據(jù)下載、數(shù)據(jù)修改以及數(shù)據(jù)刪除等操作。以上的四個數(shù)據(jù)操作子模塊可以統(tǒng)稱為數(shù)據(jù)的維護。數(shù)據(jù)上傳功能的使用者可以是系統(tǒng)管理員,也可以是個性化用戶。系統(tǒng)管理員可以直接把數(shù)據(jù)上傳至相應的數(shù)據(jù)節(jié)點處。而個性化用戶在進行文檔上傳操作時,首先要具備欄目自定義的權限,才能完成相應的數(shù)據(jù)上傳操作。數(shù)據(jù)的下載同樣需要用戶充當相應的角色,而這個角色必須擁有數(shù)據(jù)下載的功能,只有這樣用戶才能夠針對特定的文檔進行下載操作。數(shù)據(jù)修改操作是在整個系統(tǒng)中用得最少的操作,因為數(shù)據(jù)的修改需要涉及的內容比較多,一般是通過上傳不同版本的文件來完成數(shù)據(jù)修改功能的。同樣,只有用戶具有相應的數(shù)據(jù)修改權限才能夠進行操作。數(shù)據(jù)刪除模塊也是一樣,只有具有相應的權限,才能夠進行數(shù)據(jù)的刪除操作。數(shù)據(jù)分類模塊是以上傳數(shù)據(jù)的不同種類為依據(jù)進行操作的,數(shù)據(jù)按照種類可以分為xml文檔、html文檔、文本文檔、圖片文檔以及音/視頻文檔。 2.3 主頁數(shù)據(jù)存儲模塊
主頁數(shù)據(jù)存儲模塊主要分為元數(shù)據(jù)存儲、結構化數(shù)據(jù)存儲以及非結構化數(shù)據(jù)存儲三個模塊。元數(shù)據(jù)存儲模塊主要指的是在HDFS中的名稱節(jié)點中的元數(shù)據(jù)的存儲。HDFS的架構為主從(master/slave)架構,一個HDFS集群通常由單個名稱節(jié)點和多個數(shù)據(jù)節(jié)點組成,名稱節(jié)點作為主服務器存在。名稱節(jié)點主要負責管理文件命名空間和控制客戶端的訪問。數(shù)據(jù)節(jié)點將文件、數(shù)據(jù)塊和數(shù)據(jù)節(jié)點等組織成相應的數(shù)據(jù)結構進行管理,這不僅簡化了操作,而且也方便了整個數(shù)據(jù)結構隨數(shù)據(jù)節(jié)點改變而更新,有利于保持數(shù)據(jù)的一致性。結構化數(shù)據(jù)管理的主要對象是數(shù)據(jù)庫數(shù)據(jù)。非結構化數(shù)據(jù)存儲主要指的是一些文本文檔、圖片文檔、xml文檔、html文檔以及音/視頻文檔,這些數(shù)據(jù)都是非結構化數(shù)據(jù),要實現(xiàn)對這些數(shù)據(jù)的存儲,需要依靠HDFS以及其他的一些文檔數(shù)據(jù)庫。HDFS中的數(shù)據(jù)節(jié)點主要用來實現(xiàn)這些數(shù)據(jù)的分布式存儲,HDFS針對的是大文件的存儲,這些大文件會被進行分塊,根據(jù)具體的配置信息這些文件會被分配成一系列的大小相同的塊,而每個數(shù)據(jù)塊又會有3塊副本數(shù)。因此,要完成HDFS對數(shù)據(jù)節(jié)點的有效管理,需要時刻監(jiān)督數(shù)據(jù)節(jié)點,并對每個數(shù)據(jù)節(jié)點的存儲狀態(tài)作相應的評估。
2.4 編程模型模塊
編程模型模塊主要包括了Map操作以及Reduce操作。Map操作主要是實現(xiàn)輸入信息的映射,其輸出是key/value中間對,需要Map/Reduce庫提供的庫函數(shù),同時,用戶編寫的Mapper函數(shù)將會用在整個過程中。Reduce是一個規(guī)約性質的操作,在文件經過Map以及與之配套的Combine操作之后,便會得到一些相應的中間key/value對,然后再經過Sort操作,對這些中間鍵值對進行排序操作,接著進行Reduce操作,最后進行輸出,并得到最終的輸出結果。在進行Reduce操作時,不僅需要Map/Reduce庫提供的庫函數(shù),而且需要用戶編寫相應的Reducer函數(shù)來實現(xiàn)Reduce操作。
2.5 主頁結構配置模塊
主頁結構配置模塊主要是由兩大子模塊組成,分別是xml工具以及xml解析引擎。通過xml工具,個性化用戶可以根據(jù)系統(tǒng)提供的服務框架的dtd文檔來進行xml文檔的填寫。xml解析引擎模塊主要是對用戶填寫的xml文檔進行解析,在解析的同時,對這些文檔進行dtd的合法性驗證,并生成個性化用戶主頁的主結構,完成用戶填寫的xml文檔的存儲操作。在個性化主頁結構生成之后,需要借助前文提到的編程模型模塊中的Map/Reduce編程模型來實現(xiàn)對主頁的構件的查找,以及對主頁欄目文檔數(shù)據(jù)的快速檢索操作,并最終生成用戶的個性化主頁。
3 系統(tǒng)實現(xiàn)
在前文系統(tǒng)分析和設計的基礎上,本節(jié)給出了基于用戶個性化的圖書館管理系統(tǒng)的實現(xiàn)方式。在此,本文將重點介紹系統(tǒng)的核心模塊數(shù)據(jù)存儲以及欄目管理兩大模塊的運行流程。
在數(shù)據(jù)存儲模塊中,針對非結構化數(shù)據(jù),系統(tǒng)采用了HDFS系統(tǒng)來實現(xiàn)。HDFS存儲的文件主要是大文件,而個性化用戶的文檔數(shù)據(jù)大多是一些小文件,因此對于HDFS來說,存儲小文件時會存在效率低下的問題,因此必須提出小文件存儲的改進措施。改進措施如圖3所示。
如圖3所示,在對這些小文件進行存儲時,需要事先實現(xiàn)預處理,當用戶在客戶端上傳文件時,首先會將文件上傳至處理層,然后判斷文件的大小,如果文件大小符合HDFS配置的要求,那么就會直接將文件交由HDFS客戶端處理;如果文件很小,則需要事先對文件進行資源整合,資源整合完畢之后再對文件進行合并,并將合并之后的文件交由HDFS客戶端處理。當處理層處理完成之后,需要交由存儲層來進行處理:先將文件進行分塊處理,并將分出的塊分別存儲在不同的數(shù)據(jù)節(jié)點上,以實現(xiàn)分布式存儲,然后在名稱節(jié)點上記錄相應的數(shù)據(jù)節(jié)點的信息(分別記錄文件和數(shù)據(jù)塊的映射信息,數(shù)據(jù)塊和數(shù)據(jù)節(jié)點的映射信息),這將有助于提高數(shù)據(jù)的檢索效率。
當用戶首次登錄該系統(tǒng)時,根據(jù)用戶庫以及功能庫查看用戶是否具有自定義欄目的功能,如果用戶具有自定義欄目的功能,那么用戶就可以對個性化主頁上的欄目進行定制,定制完成后,會生成與用戶相關的xml文件,這個xml文件會存儲在數(shù)據(jù)庫中。同時,用戶需要完成其定義的欄目內容的上傳操作,并將上傳的文件存儲到數(shù)據(jù)庫中。當用戶下次登錄時,根據(jù)用戶選擇的欄目定制信息,以用戶信息以及所選擇的欄目定制作為輸入,從HDFS中檢索出和用戶相關的xml文件,并依靠xml解析引擎生成用戶自定義之后的主頁。
4 結語
文章設計了一個基于用戶個性化需求的圖書管理系統(tǒng),此系統(tǒng)使用戶能夠主動獲取自己所需的圖書信息。在這個圖書管理系統(tǒng)中,用戶不再是單純的使用者,更是系統(tǒng)的內容生產者。在未來的設計中,文章還將探討通過數(shù)據(jù)挖掘技術實現(xiàn)對用戶所關注的圖書的主動推薦以及相關聯(lián)推薦,進而為用戶提供更智能化的圖書管理系統(tǒng)。
參考文獻:
[1] 馬文峰.論數(shù)字圖書館個性化信息推薦系統(tǒng)[J].現(xiàn)代圖書情報技術,2003(2):16-18.
[2] 趙繼海.論數(shù)字圖書館個性化定制服務[J].中國圖書館學報, 2001(3): 63-65, 84.
[3] 金潔潔.基于本體的個性化信息推薦系統(tǒng)研究[J].電子世界,2014(2):6-7.
職稱論文發(fā)表期刊推薦《圖書館》雜志1973年創(chuàng)刊,由湖南圖書館、湖南省圖書館學會、湖南省中心圖書館委員會三家主辦。1983年正式向全國公開發(fā)行。雙月刊。國際刊號ISSN: 1002-1558;國內刊號CN: 43-1031/G2。郵發(fā)代號: 42-103。