中國互聯(lián)網(wǎng)絡(luò)信息中心2013年7月17日發(fā)布《第32次中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況調(diào)查統(tǒng)計報告》顯示,截至6月底,我國Ipv4地址數(shù)量為3.31億,擁有IPv6地址數(shù)量較去年同期大幅增長16.5%。我國網(wǎng)民數(shù)量達到5.91億,較去年底增加2656萬人[3]?梢姡诰W(wǎng)絡(luò),電視,報紙,書籍等各種媒介中,網(wǎng)絡(luò)具有其他媒介無法比擬的優(yōu)勢。醫(yī)療信息是與人們息息相關(guān)的領(lǐng)域,患有不同程度疾病的人群和亞健康人群不可能頻繁去醫(yī)院檢查,都希望通過網(wǎng)絡(luò)的快捷得到更多的指導(dǎo)。
【摘要】隨著互聯(lián)網(wǎng)在全球范圍內(nèi)的普及,網(wǎng)絡(luò)數(shù)據(jù)正以前所未有的速度發(fā)展。從互聯(lián)網(wǎng)上獲取信息已經(jīng)成為人們常用的方式。醫(yī)療領(lǐng)域是與人們生活密切相關(guān)的領(lǐng)域,各類人員都希望通過網(wǎng)絡(luò)得到相應(yīng)的指導(dǎo)。但是目前的醫(yī)療網(wǎng)信息內(nèi)容繁雜,結(jié)構(gòu)混亂,不能給相關(guān)人員提供較好的服務(wù)。本文將本體引入到醫(yī)療信息領(lǐng)域,分析和比較現(xiàn)有的本體構(gòu)建方法,根據(jù)它們的特點,構(gòu)建藥品本體。
【關(guān)鍵詞】本體,醫(yī)療,信息檢索
一、本體在信息檢索技術(shù)方面的研究現(xiàn)狀
1.本體的概念
本體來自希臘詞匯,onto表示being,logos表示toreason,最初是哲學(xué)上的一個分支,這個術(shù)語在17世紀誕生,是古希臘哲學(xué)家亞里士多德給出的定義,將Ontology定義為研究“存在”的科學(xué),并將其分為兩個方面,一方面研究存在的本質(zhì),另一方面研究客體對象的理論定義,即整個現(xiàn)實世界(本體)的基本特征。人工智能領(lǐng)域?qū)⒈倔w的概念引入,用于知識表示和知識組織,其概念的內(nèi)涵也因此發(fā)生了改變[1]。
2.國內(nèi)外研究現(xiàn)狀
本體在信息檢索領(lǐng)域的應(yīng)用研究在20世紀末至21世紀初展開,國外大量學(xué)者都在此領(lǐng)域進行了各種研究,如德國學(xué)者Nenad和Ljiljana提出了一種在基于本體的信息檢索系統(tǒng)中使用基于邏輯的優(yōu)化檢索方法;巴西學(xué)者Regina等研制了一個檢索代理系統(tǒng);斯洛伐克的學(xué)者Jan和Ivan在同一個文本集中將全文檢索方法、潛在語義索引方法和基于本體的方法進行對比研究等[2]。與國外相比,國內(nèi)無論是在理論研究,實證研究,還是在技術(shù)手段的實用方面都相對落后,與國外高水平的研究相比存在很大差距,有關(guān)學(xué)者在本體的檢索技術(shù)方面也進行了大量的研究。但是迄今為止,大量文章仍停留在翻譯,綜述國外研究的水平上,具有獨立創(chuàng)新性的研究少之又少。
二、研究內(nèi)容和意義
檢索結(jié)果往往會返回大量無關(guān)的鏈接,使得用戶將大量的時間耗費在排除無關(guān)信息上。同時,用戶和網(wǎng)絡(luò)文檔對同一概念的表述形式往往會有差異,導(dǎo)致無法接收到有用信息。目前的關(guān)于藥品的檢索,其實質(zhì)仍然停留在基于關(guān)鍵字的查詢上。其查詢方式相對簡單、容易,但是不能很好地滿足用戶的真正需求,非常機械,不能夠全面準確地檢索到用戶關(guān)心的藥品信息;诒倔w的檢索可以充分利用本體對知識內(nèi)容的結(jié)構(gòu)化描述和概念之間的關(guān)系來實現(xiàn)智能化查詢。針對傳統(tǒng)信息檢索技術(shù)存在的上述問題,本體檢索還包括歧義信息和檢索處理,將通過歧義知識描述庫、全文索引、用戶檢索上下文分析以及用戶相關(guān)性反饋等技術(shù)結(jié)合處理,高效、準確地反饋給用戶最需要的信息。通過對比現(xiàn)有構(gòu)建本體的各種方法,根據(jù)它們的特點,并結(jié)合醫(yī)療領(lǐng)域的特點,立足于醫(yī)療信息的一個點,即藥品,按照本方法建立藥品本體。在構(gòu)建藥品本體的基礎(chǔ)上,改進了一種基于藥品本體的信息檢索系統(tǒng)框架。
三、基于本體的醫(yī)療信息檢索系統(tǒng)設(shè)計
1.設(shè)計目標
。1)具有傳統(tǒng)信息查詢系統(tǒng)的基本檢索功能,也就是根據(jù)用戶輸入的查詢條件,應(yīng)該能夠給用戶返回相應(yīng)的結(jié)果。這是最基本的查詢功能。
(2)對查詢條件的語義擴展的過程要借助于本體庫中的信息,在具有傳統(tǒng)信息查詢系統(tǒng)的基本檢索功能基礎(chǔ)上,輸入的查詢條件進行同義、近義和上下位關(guān)系進行擴展,也可以對用戶提出的查詢請求進行規(guī)范化等操作,目的是為了使計算機更好的理解語義信息,提高信息檢索的效率和準確性。
(3)采用傳統(tǒng)的相關(guān)度算法,盡可能地把更好的反映用戶真正意圖的檢索結(jié)果反饋給用戶。
2.體系結(jié)構(gòu)
結(jié)合藥品本體,參考語義檢索機理[4],信息檢索框架包含五大模塊,分別為用戶接口、條件處理、醫(yī)療信息、信息檢索和結(jié)果顯示。如圖1所示。
(1)用戶接口:系統(tǒng)必須提供給用戶一個友好的界面,在這里主要是用戶輸入的查詢條件部分,可以采用單一的條件查詢也可以采用多組合查詢。
。2)條件處理部分:處理用戶界面的輸入查詢信息,對查詢條件進行預(yù)處理。
。3)醫(yī)療信息部分:建立醫(yī)療實例庫。
。4)信息檢索部分:對用戶輸入的查詢條件進行處理,這里面含有推理規(guī)則。同時對查詢條件進行語義擴展,實現(xiàn)進一步的查詢。
。5)顯示結(jié)果部分:經(jīng)過信息檢索部分,需要對所查詢出來的結(jié)果進行匯總,并根據(jù)相關(guān)度算法對相關(guān)結(jié)果進行排序。將更貼近用戶的查詢結(jié)果靠前。
3.構(gòu)建本體常見方法
目前常用的七種本體構(gòu)建方法是:七步法、骨架法、IDEFS法、Methoniology法、TOVE法、SENSUS法和KACTUS法。這七種方法各有利弊,結(jié)合藥品檢索的現(xiàn)狀,領(lǐng)域本體的建設(shè)處于探索性研究階段,在這個過程中存在著很多問題,對不同問題的認識和解決會得出不同的方法論。主要問題分析如下[5]:
。╨)需求不充分
本體構(gòu)建特別是某個領(lǐng)域的本體構(gòu)建的具體需求還很難描述清楚。沒有充分的需求,直接導(dǎo)致本體建設(shè)過程的無計劃性。
。2)建設(shè)過程無規(guī)范
目前,領(lǐng)域本體構(gòu)建還沒有成熟的方法論作為指導(dǎo),更談不上對構(gòu)建過程的規(guī)范管理。借鑒軟件開發(fā)過程的管理,可以看出文檔的重要作用。因此,在領(lǐng)域本體構(gòu)建過程中同樣也得關(guān)注文檔,從文檔的編寫中總結(jié)出規(guī)范。(3)成果沒有評價標準
本體的評價方法沒有統(tǒng)一的標準,也沒有標準的測試集。不能對本體的建設(shè)成果進行合理評價,使整個構(gòu)建過程的正確度,科學(xué)度大打折扣。
。4)忽視本體的共享和重用
領(lǐng)域本體構(gòu)建的目的不是為某一個系統(tǒng)提供服務(wù),而是為不同系統(tǒng)提供進行交流的語義基礎(chǔ)。共享和重用是本體的本質(zhì)要求,在領(lǐng)域本體的建設(shè)過程中,如何保證這一點就是個非常重要的問題。
在IT領(lǐng)域引入本體的概念,最終目的是希望計算機能夠充分理解語義信息,更加智能的為人類服務(wù),從某種意義上說,這是一類新的軟件活動。因此,對于本體建設(shè)的過程,還需要不斷的完善和創(chuàng)新。
4.藥品本體的構(gòu)建
目前互聯(lián)網(wǎng)上關(guān)于藥品的網(wǎng)站很多,但是從內(nèi)容組織上看,大多都是將藥品分為不同的類別,或者是將藥品按身體各個部位進行分類。用戶點擊相關(guān)信息,了解相關(guān)治療藥物,所看到的藥品內(nèi)容繁多,且不規(guī)則,主要原因是沒有對藥品形成規(guī)范的查詢體系。因此,針對藥品本體的構(gòu)建,首先應(yīng)對此領(lǐng)域建立一個比較完善的信息集,對整個領(lǐng)域本體的數(shù)據(jù)流有一個清晰的認識。對領(lǐng)域本體的建設(shè)不是一朝一夕的,而應(yīng)該是先建立核心本體,在構(gòu)建時先找出領(lǐng)域中最基本的、最重要的概念和關(guān)系作為演化的種子,在此基礎(chǔ)上可以不斷完善,逐步建立起領(lǐng)域內(nèi)的函數(shù)、公理和實例。
首先,確定好藥品領(lǐng)域的概念分類。如“生物制品”、“解毒藥”、“延緩衰老”、“避孕藥”、“抗躁狂抑郁藥”、“維生素類”等。在“生物制品”這個概念類中,又分為子類“疫苗”、“菌苗”、“類霉素”、“抗菌素抗血清”、“人血液制品”、“體內(nèi)診斷制品”等。子類“疫苗”下又分為子類“基礎(chǔ)免疫用疫苗”,并添加實例“乙腦疫苗”,“乙肝疫苗”、“狂犬疫苗”、“出血熱疫苗”、“流腦疫苗”、“甲肝疫苗”、“腮腺炎疫苗”、“流感疫苗”等。其中在子類“基礎(chǔ)免疫用疫苗”中添加了實例“卡介苗”、“脊髓灰質(zhì)炎疫苗”、“百白破制劑”、“麻疹疫苗”等。其他概念類同此依次向下分類。
其次,定義類之間的關(guān)系。子類和父類之間是“is-a”的關(guān)系,脊髓灰質(zhì)炎疫苗和脊灰糖丸是同義詞的關(guān)系,卡介苗和基礎(chǔ)免疫用疫苗是實例與概念之間的關(guān)系,在實際應(yīng)用中充斥著大量的類似的關(guān)系,在此不一一列舉。
最后,定義類的屬性。例如概念類“疫苗”,它應(yīng)具有的屬性有“中文名稱”、“英文名稱”、“計量單位”、“使用指南”等。
5.系統(tǒng)關(guān)鍵技術(shù)處理
。1)查詢擴展
本體可以看作是定義了類及類之間關(guān)系,同時添加了用于推理的規(guī)則集的分類體系。本體可以通過對用戶檢索進行領(lǐng)域內(nèi)的概念及屬性關(guān)聯(lián)來擴展用戶檢索。比如用戶以“艾滋病”關(guān)鍵字進行檢索,與“獲得性免疫缺陷綜合癥(AcquiredImmuneDeficiencySyndrome)”相關(guān)的信息也能檢索出來。再如用戶如果想要檢索關(guān)于“Sars”的信息,同時本體中定義了“Sars”的關(guān)聯(lián)概念“非典”,這時候用戶的查詢就擴展為“Sars”和“非典”。如果在本體的定義中還包含概念“非典”的子概念,那么這時候就擴展為“Sars”和“非典”及其子概念。
(2)檢索推理
、僦^詞和關(guān)聯(lián)的概念
這種方式通過找出與用戶提供的關(guān)鍵字相關(guān)的謂詞及概念對用戶查詢進行擴展。例如概念“疫苗專家”分別通過謂詞“屬于”及“在……工作”與概念“傳染科室”及概念“醫(yī)院”關(guān)聯(lián),則用戶輸入的查詢“疫苗”可以用來形成新的查詢條件“疫苗專家屬于傳染科室”及“疫苗專家在醫(yī)院工作”。
②謂詞特性
這種方式通過傳遞、翻轉(zhuǎn)或?qū)ΨQ謂詞來擴展用戶查詢。例如:實例“卡介苗”屬于概念“基礎(chǔ)免疫用疫苗”,概念“基礎(chǔ)免疫用疫苗”屬于概念“疫苗”,由此可以推斷出來實例“卡介苗”屬于概念“疫苗”。
四、總結(jié)與展望
信息檢索技術(shù)已經(jīng)成為現(xiàn)在信息化時代不可或缺的重要技術(shù),是人們獲取信息和知識的重要手段,并隨著數(shù)字化信息量的急速膨脹,人們將越發(fā)的依賴信息檢索技術(shù)給我們提供的便利。本文在信息檢索查詢技術(shù)的研究中,引入本體的概念,以特定領(lǐng)域知識作為研究對象,建立起一個描述藥品知識的本體。但是本體的語義化查詢?nèi)匀皇遣粔蛲晟频,因此在未來的進一步研究中還有很多工作要做:如本體設(shè)計的完善和通用性問題,自然語言處理,推理功能的強化等。在未來的研究中則需要更加復(fù)雜的推理機制研究。相信未來基于本體的語義查詢系統(tǒng)將會有著廣泛的應(yīng)用前景。
參考文獻
[1]王淼洋.東西方哲學(xué)比較研究[M].上海教育出版社(第一版),1994:97-104.
[2]彭鵬.基于本體的信息檢索策略優(yōu)化研究[D].吉林大學(xué),2007.
[3]http://news.daynews.com.cn/gnxw/1835394.html(山西新聞網(wǎng))[OL].
[4]http://kmi.open.ac.uk/projects/ocml(OCML)[OL].
[5]http://www.w3c.org(W3C)[OL].
相關(guān)期刊推薦:《網(wǎng)絡(luò)安全與技術(shù)應(yīng)用》
期刊簡介:本刊成立于2003年,先由中華人民共和國公安部主管、中國人民公安大學(xué)出版社主辦。從2009年起,本刊改由中華人民教育部主管,北京大學(xué)出版社主辦,是國內(nèi)網(wǎng)絡(luò)安全技術(shù)與應(yīng)用領(lǐng)域行業(yè)指導(dǎo)性科技月刊,國內(nèi)外公開發(fā)行。創(chuàng)刊以來,本刊與國內(nèi)外近百家企業(yè)建立了良好的合作關(guān)系,具體合作方式包括:長期綜合合作、協(xié)辦、支持、欄目協(xié)辦和中短期合作。今后,本刊愿與國內(nèi)外業(yè)界權(quán)威機構(gòu)、團體、政府官員及專家學(xué)者進一步建立、開展廣泛的聯(lián)系和交流,熱忱歡迎業(yè)界同仁以多種形式加盟我們的事業(yè)。
辦刊宗旨:本刊針對網(wǎng)絡(luò)安全領(lǐng)域的“新人新潮新技術(shù)”,旨在傳達與反映政府行業(yè)機構(gòu)的政策、策略、方法,探索與追蹤技術(shù)應(yīng)用的最新課題、成果、趨勢,透視與掃描企業(yè)、人物及產(chǎn)業(yè)項目的形象、風(fēng)采、焦點,推動并引領(lǐng)行業(yè)整體進步和發(fā)展。
轉(zhuǎn)載請注明來自:http://www.jinnzone.com/jisuanjixinxiguanlilw/31590.html