精品人妻无码一区二区三区软件 ,麻豆亚洲AV成人无码久久精品,成人欧美一区二区三区视频,免费av毛片不卡无码

您現(xiàn)在的位置是:首頁計算機應用論文

多媒體論文發(fā)表基于內(nèi)容的多媒體檢索技術

發(fā)布時間: 1

  多媒體技術如今已經(jīng)被廣泛應用了,每個學校都會有多媒體教室,大學的多媒體教室更多,基本上很多課程都是在多媒體教室中上。圖書館中也會用的多媒體技術,多媒體論文發(fā)表期刊推薦《計算機科學與探索》雜志是由中華人民共和國工業(yè)和信息化部主管、華北計算技術研究所主辦的國內(nèi)外公開發(fā)行的計算機學報級高級學術期刊,中國計算機學會會刊,2010年開始由雙月刊更改為月刊,大16開。歡迎踴躍投稿(中文,英文稿件均可)。
  摘要:數(shù)字圖書館的迅猛發(fā)展使得多媒體信息資源的組織與管理成為數(shù)字圖書館發(fā)展的一個關鍵性問題,而多媒體信息檢索技術也就成為數(shù)字圖書館中的核心技術,因而在數(shù)字圖書館中引入基于內(nèi)容的多媒體檢索技術成為了必要。?

  關鍵詞:數(shù)字圖書館,信息檢索,基于內(nèi)容的多媒體檢索

  1基于內(nèi)容的多媒體檢索原理?

  傳統(tǒng)的多媒體檢索技術,主要是通過對多媒體進行人工分析,對多媒體物理特征和內(nèi)容特征進行文字著錄或標引,建立類似于文本文獻的標引著錄數(shù)據(jù)庫,并通過檢索這些數(shù)據(jù)庫以獲得多媒體編號,進而利用這些編號索取實際多媒體。這種檢索技術存在不足:①特征不具有代表性,帶有主觀性;②人工處理速度慢;③特征信息得不到充分利用;④結果信息提取慢;诖嗽蛴斜匾芯炕趦(nèi)容特征的檢索(CBR,Content-BasedRetrieval),克服傳統(tǒng)檢索方法的不足,提高多媒體檢索效率。CBR是指直接根據(jù)描述媒體對象內(nèi)容的各種特征(如圖像顏色,紋理,形狀等)進行檢索,它能從數(shù)據(jù)庫中查找到具有指定特征或含有特定內(nèi)容的圖像(包括視頻片段),區(qū)別于傳統(tǒng)的基于關鍵字的檢索手段,融合了多媒體理解、模式識別等技術。一般說來,基于內(nèi)容的圖像信息檢索主要是根據(jù)圖像的顏色、紋理、形狀開展;而對視頻信息檢索主要通過對視頻分割、視頻聚類、關鍵幀抽取、運動特性抽取、最后完成視頻檢索。數(shù)字圖書館擁有海量多媒體信息資源,只有充分利用基于內(nèi)容的多媒體檢索技術,才能挖掘海量資源庫中的信息資源,為廣大讀者服務。?

  2基于內(nèi)容的多媒體檢索分類及檢索方法?

  根據(jù)檢索對象的不同,基于內(nèi)容的多媒體檢索又可以分為基于內(nèi)容的文本檢索、基于內(nèi)容的圖像檢索、基于內(nèi)容的視頻檢索和基于內(nèi)容的音頻檢索四種檢索。?

  2.1文本檢索?

  基于內(nèi)容的文本檢索是涉及文檔內(nèi)容查詢的檢索技術。其檢索模型的構造是基于內(nèi)容文本信息檢索的核心技術,包含3個方面的內(nèi)容:文檔與用戶查詢的表示、查詢匹配策略和匹配結果的相關度表示。典型的文本檢索模型又分為布爾模型、向量空間模型和概率模型3種。?

  2.1.1布爾模型(BooleanModel)?

  該模型將文檔中的特征簡單地表示成二元變量,某特征詞出現(xiàn)則為1,否則標識為0。文檔的相似度則基于布爾量進行計算。該模型有點是簡單、速度快,缺點是不夠精確,不能反映不同“項目”對一個文檔的重要程度的差異。后來陸續(xù)有學者針對布爾模型不足,提出改進算法即擴展的布爾模型。?

  2.1.2向量空間模型(VectorSpaceModel,VSM)?

  該模型也稱為詞袋(BagofWords,BOW)表示法,該表示法有一個關鍵假設,即文章中詞條出現(xiàn)的先后次序是無關緊要的,個特征詞對應特征空間的一維,將文本表示成歐氏空間的一個向量。該模型思想是將文檔D(Document)看作是由一定代表性的特征項組成;而特征項t(Term)是指出現(xiàn)在文檔中能夠代表文檔性質(zhì)的基本語言單(如字、詞等),也就是通常所指的檢索詞。這樣一個文檔D就可以表示為?D(t-1,t-2,…,t-n),t-i(I=1,2,…n?)表示文檔的一個特征項。?

  2.1.3概率模型(ProbablisticModel)?

  該模型考慮詞項、文檔之間的內(nèi)在關聯(lián),依據(jù)關聯(lián)信息計算文檔類別歸屬大小,據(jù)此推算文檔類別。?

  布爾模型和向量空間模型都將文檔表示詞條視為相互獨立的項,忽略了表示詞條間的關聯(lián)性。概率模型則考慮到詞條、文檔間的內(nèi)在聯(lián)系,利用詞條間和詞條與文檔之間的概率依賴性進行信息檢索。其中二值獨立檢索模型(BIR)是一種實現(xiàn)簡單且效果很好的概率檢索模型。概率推理網(wǎng)絡是一種新型的檢索模型,它模擬人腦的推理思維模式,將文檔內(nèi)容與用戶查詢匹配的過程轉化為一個從文檔到查詢的推理過程。?

  2.2圖像檢索?

  基于內(nèi)容的圖像信息檢索主要根據(jù)圖像的特征進行,一般地,圖像特征包括:①圖像的畫面內(nèi)容特征(如圖像顏色分布、紋理結構、形狀等);②圖像的主題對象特征(如圖像所描述的人、車、建筑等);③圖像的著錄特征(如作者、時間、地點等);④圖像的移動和組合特征(如影象中的場景)。目前對圖像內(nèi)容檢索研究比較多的是基于圖像的顏色、紋理、形狀等特征開展的,下面重點論述此三方面的檢索。?

  2.2.1基于顏色特征的圖像檢索?

  顏色是一種重要的視覺信息屬性,在圖像索引與檢索中是一種很有用的特征。相對于其他特征,顏色特征非常穩(wěn)定,具有對旋轉、平移、尺度變化、各種形變不敏感特性,而且顏色特征計算簡單。因此,顏色特征成為現(xiàn)有檢索系統(tǒng)中應用最廣泛的特征。較早從事顏色特征進行圖像檢索的方法是直方圖,通過統(tǒng)計各不同灰度值的圖像像素數(shù)量,達到對圖像的信息描述。?

  2.2.2基于紋理特征的圖像檢索?

  紋理描述了圖像或圖像區(qū)域所對應的景物的表面性質(zhì)。包括表面結構組織及其與周圍環(huán)境關系的許多重要信息,紋理特征是一種統(tǒng)計特征,具有旋轉不變性,并具有較強的抗噪音能力。一般地,體現(xiàn)圖像紋理特征的具體指標有均勻度、對比度、方向,其中均勻度反映紋理的尺寸,對比度反映紋理清晰度,方向反映實體是否有規(guī)則的方向性。?

  2.2.3基于形狀特征的圖像檢索?

  基于形狀檢索基本上是從形狀的輪廓特征和形狀的區(qū)域特征來建立圖像的索引,主要有形狀輪廓特征和形狀區(qū)域特征兩重描述。形狀輪廓特征主要包括:直線段描述、樣條擬合曲線、傅立葉描述子、內(nèi)角直方圖、高斯參數(shù)曲線等。而形狀區(qū)域特征主要包括:形狀的無關矩、區(qū)域的面積、形狀的縱橫比等。?

  2.3視頻檢索?

  視頻檢索實際上屬于圖像的檢索。視頻除了具有一般靜態(tài)圖像的特征外,還具有動態(tài)性,如鏡頭運動的變化、運動目標的大小變化、視頻目標的運動軌跡等,所以視頻又稱動態(tài)圖像,是一組圖像按時間的有序連續(xù)表現(xiàn),它的表示與圖像序列、時間關系有關。視頻數(shù)據(jù)可用幕、場景、鏡頭、幀等描述。視頻序列主要有鏡頭組成;鏡頭由一系列連續(xù)的幀組成;幀是一幅靜態(tài)的圖像,是組成視頻的最小單位;場景含有多個鏡頭;幕是由一系列的相關場景組成,表示以完整的事件。視頻檢索的前提是需要利用可視化特征視頻數(shù)據(jù)建立有效的索引。?

  2.4音頻檢索?

  音頻就是對聲音數(shù)字化后得到的結果。音頻一般采用音量、音調(diào)、音強、帶寬、音長和音色等屬性來描述。其中音量、音調(diào)、音強、帶寬和音長等屬性易于通過技術手段進行量化建模,而對音色的處理卻相對復雜,對其進行分析和捕捉較為困難。音頻檢索同視頻檢索相類似,音頻特征隨時間而動態(tài)變化,分析時計算不同時間段的聲波信號的波形,并將波形的均值、方差和自相關系數(shù)等記錄在波形數(shù)據(jù)庫中。對音頻數(shù)據(jù)進行采樣、幀抽取后,運用方差分析等統(tǒng)計方法對音調(diào)、音量、音強等音頻特征進行量化,并在音頻數(shù)據(jù)庫中記錄這些量化值,形成索引樹,在檢索時可以利用這些特征進行示例和指定特征查詢。?

  參考文獻:?

  [1]黃如花,王梅,黃曉斌.數(shù)字圖書館原理與技術[M].武漢:武漢大學出版社,2005.

  [2]吳玉萍.基于文本的多媒體檢索與基于內(nèi)容的多媒體檢索的比較[J].信息科學.2007(5).?

  [3]管計鎖,梁勝利.數(shù)字圖書館的信息檢索技術[J].圖書館理論與實踐.2001(4).?

  [4]翟中文.基于內(nèi)容的多媒體信息檢索技術研究[J].河南圖書館學刊.2005(25).?

  [5]羅德勇,明海.數(shù)字圖書館中基于內(nèi)容的多媒體檢索研究[J].情報檢索.2003(1).?

  [6]徐建華.一種新型的多媒體檢索技術—基于內(nèi)容的檢索[J].情報學報.2000(19).?

  [7]黃蕾.多媒體數(shù)據(jù)基于內(nèi)容檢索綜述[J].情報探索.2000(4).?

  [8]李敏.論數(shù)字圖書館的信息檢索技術[J].津圖學刊.2003(3).?

  [9]徐建華.一種新型的多媒體檢索技術——基于內(nèi)容的檢索[J].情報學報.2000(19).?

  [10]楊慕蓮,張芳芳.論數(shù)字圖書館中的多媒體信息系統(tǒng)的構建[J].咸寧學院學報.2004(5).?

  [11]黃蕾.多媒體數(shù)據(jù)基于內(nèi)容檢索綜述[J].情報探索.2000(4).


轉載請注明來自:http://www.jinnzone.com/jisuanjiyingyonglw/22038.html