中國互聯(lián)網絡信息中心2013年7月17日發(fā)布《第32次中國互聯(lián)網絡發(fā)展狀況調查統(tǒng)計報告》顯示,截至6月底,我國Ipv4地址數量為3.31億,擁有IPv6地址數量較去年同期大幅增長16.5%。我國網民數量達到5.91億,較去年底增加2656萬人[3]。可見,在網絡,電視,報紙,書籍等各種媒介中,網絡具有其他媒介無法比擬的優(yōu)勢。醫(yī)療信息是與人們息息相關的領域,患有不同程度疾病的人群和亞健康人群不可能頻繁去醫(yī)院檢查,都希望通過網絡的快捷得到更多的指導。
【摘要】隨著互聯(lián)網在全球范圍內的普及,網絡數據正以前所未有的速度發(fā)展。從互聯(lián)網上獲取信息已經成為人們常用的方式。醫(yī)療領域是與人們生活密切相關的領域,各類人員都希望通過網絡得到相應的指導。但是目前的醫(yī)療網信息內容繁雜,結構混亂,不能給相關人員提供較好的服務。本文將本體引入到醫(yī)療信息領域,分析和比較現(xiàn)有的本體構建方法,根據它們的特點,構建藥品本體。
【關鍵詞】本體,醫(yī)療,信息檢索
一、本體在信息檢索技術方面的研究現(xiàn)狀
1.本體的概念
本體來自希臘詞匯,onto表示being,logos表示toreason,最初是哲學上的一個分支,這個術語在17世紀誕生,是古希臘哲學家亞里士多德給出的定義,將Ontology定義為研究“存在”的科學,并將其分為兩個方面,一方面研究存在的本質,另一方面研究客體對象的理論定義,即整個現(xiàn)實世界(本體)的基本特征。人工智能領域將本體的概念引入,用于知識表示和知識組織,其概念的內涵也因此發(fā)生了改變[1]。
2.國內外研究現(xiàn)狀
本體在信息檢索領域的應用研究在20世紀末至21世紀初展開,國外大量學者都在此領域進行了各種研究,如德國學者Nenad和Ljiljana提出了一種在基于本體的信息檢索系統(tǒng)中使用基于邏輯的優(yōu)化檢索方法;巴西學者Regina等研制了一個檢索代理系統(tǒng);斯洛伐克的學者Jan和Ivan在同一個文本集中將全文檢索方法、潛在語義索引方法和基于本體的方法進行對比研究等[2]。與國外相比,國內無論是在理論研究,實證研究,還是在技術手段的實用方面都相對落后,與國外高水平的研究相比存在很大差距,有關學者在本體的檢索技術方面也進行了大量的研究。但是迄今為止,大量文章仍停留在翻譯,綜述國外研究的水平上,具有獨立創(chuàng)新性的研究少之又少。
二、研究內容和意義
檢索結果往往會返回大量無關的鏈接,使得用戶將大量的時間耗費在排除無關信息上。同時,用戶和網絡文檔對同一概念的表述形式往往會有差異,導致無法接收到有用信息。目前的關于藥品的檢索,其實質仍然停留在基于關鍵字的查詢上。其查詢方式相對簡單、容易,但是不能很好地滿足用戶的真正需求,非常機械,不能夠全面準確地檢索到用戶關心的藥品信息;诒倔w的檢索可以充分利用本體對知識內容的結構化描述和概念之間的關系來實現(xiàn)智能化查詢。針對傳統(tǒng)信息檢索技術存在的上述問題,本體檢索還包括歧義信息和檢索處理,將通過歧義知識描述庫、全文索引、用戶檢索上下文分析以及用戶相關性反饋等技術結合處理,高效、準確地反饋給用戶最需要的信息。通過對比現(xiàn)有構建本體的各種方法,根據它們的特點,并結合醫(yī)療領域的特點,立足于醫(yī)療信息的一個點,即藥品,按照本方法建立藥品本體。在構建藥品本體的基礎上,改進了一種基于藥品本體的信息檢索系統(tǒng)框架。
三、基于本體的醫(yī)療信息檢索系統(tǒng)設計
1.設計目標
(1)具有傳統(tǒng)信息查詢系統(tǒng)的基本檢索功能,也就是根據用戶輸入的查詢條件,應該能夠給用戶返回相應的結果。這是最基本的查詢功能。
。2)對查詢條件的語義擴展的過程要借助于本體庫中的信息,在具有傳統(tǒng)信息查詢系統(tǒng)的基本檢索功能基礎上,輸入的查詢條件進行同義、近義和上下位關系進行擴展,也可以對用戶提出的查詢請求進行規(guī)范化等操作,目的是為了使計算機更好的理解語義信息,提高信息檢索的效率和準確性。
(3)采用傳統(tǒng)的相關度算法,盡可能地把更好的反映用戶真正意圖的檢索結果反饋給用戶。
2.體系結構
結合藥品本體,參考語義檢索機理[4],信息檢索框架包含五大模塊,分別為用戶接口、條件處理、醫(yī)療信息、信息檢索和結果顯示。如圖1所示。
。1)用戶接口:系統(tǒng)必須提供給用戶一個友好的界面,在這里主要是用戶輸入的查詢條件部分,可以采用單一的條件查詢也可以采用多組合查詢。
。2)條件處理部分:處理用戶界面的輸入查詢信息,對查詢條件進行預處理。
。3)醫(yī)療信息部分:建立醫(yī)療實例庫。
。4)信息檢索部分:對用戶輸入的查詢條件進行處理,這里面含有推理規(guī)則。同時對查詢條件進行語義擴展,實現(xiàn)進一步的查詢。
。5)顯示結果部分:經過信息檢索部分,需要對所查詢出來的結果進行匯總,并根據相關度算法對相關結果進行排序。將更貼近用戶的查詢結果靠前。
3.構建本體常見方法
目前常用的七種本體構建方法是:七步法、骨架法、IDEFS法、Methoniology法、TOVE法、SENSUS法和KACTUS法。這七種方法各有利弊,結合藥品檢索的現(xiàn)狀,領域本體的建設處于探索性研究階段,在這個過程中存在著很多問題,對不同問題的認識和解決會得出不同的方法論。主要問題分析如下[5]:
(l)需求不充分
本體構建特別是某個領域的本體構建的具體需求還很難描述清楚。沒有充分的需求,直接導致本體建設過程的無計劃性。
(2)建設過程無規(guī)范
目前,領域本體構建還沒有成熟的方法論作為指導,更談不上對構建過程的規(guī)范管理。借鑒軟件開發(fā)過程的管理,可以看出文檔的重要作用。因此,在領域本體構建過程中同樣也得關注文檔,從文檔的編寫中總結出規(guī)范。(3)成果沒有評價標準
本體的評價方法沒有統(tǒng)一的標準,也沒有標準的測試集。不能對本體的建設成果進行合理評價,使整個構建過程的正確度,科學度大打折扣。
。4)忽視本體的共享和重用
領域本體構建的目的不是為某一個系統(tǒng)提供服務,而是為不同系統(tǒng)提供進行交流的語義基礎。共享和重用是本體的本質要求,在領域本體的建設過程中,如何保證這一點就是個非常重要的問題。
在IT領域引入本體的概念,最終目的是希望計算機能夠充分理解語義信息,更加智能的為人類服務,從某種意義上說,這是一類新的軟件活動。因此,對于本體建設的過程,還需要不斷的完善和創(chuàng)新。
4.藥品本體的構建
目前互聯(lián)網上關于藥品的網站很多,但是從內容組織上看,大多都是將藥品分為不同的類別,或者是將藥品按身體各個部位進行分類。用戶點擊相關信息,了解相關治療藥物,所看到的藥品內容繁多,且不規(guī)則,主要原因是沒有對藥品形成規(guī)范的查詢體系。因此,針對藥品本體的構建,首先應對此領域建立一個比較完善的信息集,對整個領域本體的數據流有一個清晰的認識。對領域本體的建設不是一朝一夕的,而應該是先建立核心本體,在構建時先找出領域中最基本的、最重要的概念和關系作為演化的種子,在此基礎上可以不斷完善,逐步建立起領域內的函數、公理和實例。
首先,確定好藥品領域的概念分類。如“生物制品”、“解毒藥”、“延緩衰老”、“避孕藥”、“抗躁狂抑郁藥”、“維生素類”等。在“生物制品”這個概念類中,又分為子類“疫苗”、“菌苗”、“類霉素”、“抗菌素抗血清”、“人血液制品”、“體內診斷制品”等。子類“疫苗”下又分為子類“基礎免疫用疫苗”,并添加實例“乙腦疫苗”,“乙肝疫苗”、“狂犬疫苗”、“出血熱疫苗”、“流腦疫苗”、“甲肝疫苗”、“腮腺炎疫苗”、“流感疫苗”等。其中在子類“基礎免疫用疫苗”中添加了實例“卡介苗”、“脊髓灰質炎疫苗”、“百白破制劑”、“麻疹疫苗”等。其他概念類同此依次向下分類。
其次,定義類之間的關系。子類和父類之間是“is-a”的關系,脊髓灰質炎疫苗和脊灰糖丸是同義詞的關系,卡介苗和基礎免疫用疫苗是實例與概念之間的關系,在實際應用中充斥著大量的類似的關系,在此不一一列舉。
最后,定義類的屬性。例如概念類“疫苗”,它應具有的屬性有“中文名稱”、“英文名稱”、“計量單位”、“使用指南”等。
5.系統(tǒng)關鍵技術處理
。1)查詢擴展
本體可以看作是定義了類及類之間關系,同時添加了用于推理的規(guī)則集的分類體系。本體可以通過對用戶檢索進行領域內的概念及屬性關聯(lián)來擴展用戶檢索。比如用戶以“艾滋病”關鍵字進行檢索,與“獲得性免疫缺陷綜合癥(AcquiredImmuneDeficiencySyndrome)”相關的信息也能檢索出來。再如用戶如果想要檢索關于“Sars”的信息,同時本體中定義了“Sars”的關聯(lián)概念“非典”,這時候用戶的查詢就擴展為“Sars”和“非典”。如果在本體的定義中還包含概念“非典”的子概念,那么這時候就擴展為“Sars”和“非典”及其子概念。
。2)檢索推理
①謂詞和關聯(lián)的概念
這種方式通過找出與用戶提供的關鍵字相關的謂詞及概念對用戶查詢進行擴展。例如概念“疫苗專家”分別通過謂詞“屬于”及“在……工作”與概念“傳染科室”及概念“醫(yī)院”關聯(lián),則用戶輸入的查詢“疫苗”可以用來形成新的查詢條件“疫苗專家屬于傳染科室”及“疫苗專家在醫(yī)院工作”。
②謂詞特性
這種方式通過傳遞、翻轉或對稱謂詞來擴展用戶查詢。例如:實例“卡介苗”屬于概念“基礎免疫用疫苗”,概念“基礎免疫用疫苗”屬于概念“疫苗”,由此可以推斷出來實例“卡介苗”屬于概念“疫苗”。
四、總結與展望
信息檢索技術已經成為現(xiàn)在信息化時代不可或缺的重要技術,是人們獲取信息和知識的重要手段,并隨著數字化信息量的急速膨脹,人們將越發(fā)的依賴信息檢索技術給我們提供的便利。本文在信息檢索查詢技術的研究中,引入本體的概念,以特定領域知識作為研究對象,建立起一個描述藥品知識的本體。但是本體的語義化查詢仍然是不夠完善的,因此在未來的進一步研究中還有很多工作要做:如本體設計的完善和通用性問題,自然語言處理,推理功能的強化等。在未來的研究中則需要更加復雜的推理機制研究。相信未來基于本體的語義查詢系統(tǒng)將會有著廣泛的應用前景。
參考文獻
[1]王淼洋.東西方哲學比較研究[M].上海教育出版社(第一版),1994:97-104.
[2]彭鵬.基于本體的信息檢索策略優(yōu)化研究[D].吉林大學,2007.
[3]http://news.daynews.com.cn/gnxw/1835394.html(山西新聞網)[OL].
[4]http://kmi.open.ac.uk/projects/ocml(OCML)[OL].
[5]http://www.w3c.org(W3C)[OL].
相關期刊推薦:《網絡安全與技術應用》
期刊簡介:本刊成立于2003年,先由中華人民共和國公安部主管、中國人民公安大學出版社主辦。從2009年起,本刊改由中華人民教育部主管,北京大學出版社主辦,是國內網絡安全技術與應用領域行業(yè)指導性科技月刊,國內外公開發(fā)行。創(chuàng)刊以來,本刊與國內外近百家企業(yè)建立了良好的合作關系,具體合作方式包括:長期綜合合作、協(xié)辦、支持、欄目協(xié)辦和中短期合作。今后,本刊愿與國內外業(yè)界權威機構、團體、政府官員及專家學者進一步建立、開展廣泛的聯(lián)系和交流,熱忱歡迎業(yè)界同仁以多種形式加盟我們的事業(yè)。
辦刊宗旨:本刊針對網絡安全領域的“新人新潮新技術”,旨在傳達與反映政府行業(yè)機構的政策、策略、方法,探索與追蹤技術應用的最新課題、成果、趨勢,透視與掃描企業(yè)、人物及產業(yè)項目的形象、風采、焦點,推動并引領行業(yè)整體進步和發(fā)展。
轉載請注明來自:http://www.jinnzone.com/jisuanjixinxiguanlilw/31590.html
上一篇:電信網技術雜志
下一篇:淺析配網自動化通信方式