月期刊論文發(fā)表網(wǎng)推薦計(jì)算機(jī)雜志《電腦愛好者》雜志社創(chuàng)建于1993年6月,隸屬于中國科學(xué)院。發(fā)展至今她已經(jīng)成為擁有《電腦愛好者》半月刊、《電腦高手》、《電腦愛好者合訂本》、《互動(dòng)軟件》、《數(shù)碼》五本電腦類刊物,集采編、出版、發(fā)行、展覽、廣告、銷售于一體的集團(tuán)化企業(yè)。
摘 要:如當(dāng)今有各式各樣的水印檢測算法,水印的檢測算法是提取水印關(guān)鍵的第一步。如果無法檢測出圖像中的水印,就無法提取圖像中的水印。由于水印載體之間存在的差異和嵌入水印魯棒性的不同,各種水印檢測算法的準(zhǔn)確率也是不同的。有些水印檢測算法容易產(chǎn)生漏警與虛警的現(xiàn)象,而有些水印的檢測算法的準(zhǔn)確率較高。本文在參考了已有的基于統(tǒng)計(jì)特征的二值圖像信息隱藏檢測算法之后,再根據(jù)其算法的特征使用樸素貝葉斯的分類算法對含有水印的圖像與沒有水印的圖像進(jìn)行有效分類,最后通過對圖像分類的方法對圖像是否藏有水印進(jìn)行檢測。本文提出的算法可以作為現(xiàn)有水印檢測算法的補(bǔ)充和參考。
關(guān)鍵詞:貝葉斯,水印,二值圖像,樸素貝葉斯,信息隱藏
數(shù)字水印的載體可分為黑白和彩色的兩種載體,黑白圖像被稱為二值圖像。由于水印與水印的載體有二值圖像與非二值圖像之分,因此這兩種水印的檢測算法是有很大差別的,F(xiàn)有的水印檢測算法是多種多樣的,例如有對LSB信息隱藏的檢測,二值圖像的信息隱藏檢測和JPEG圖像的隱藏信息檢測。在本文中只對二值圖像的信息隱藏檢測算法進(jìn)行研究,該算法是不同圖像特征值之間比較算法。
如果某個(gè)載體中隱秘有水印,那么這個(gè)含有水印載體的特征值就會(huì)發(fā)生變化。當(dāng)載體嵌入隱秘圖像之后該載體的特征值有可能變大,也有可能變小,但也有不發(fā)生變化。圖像的特征值的變化是載體中是否藏有隱秘圖像的重要依據(jù)和重要根據(jù)。在二值圖像的信息隱藏檢測算法中,該檢測算法局限性在于需要將現(xiàn)有圖像特征值與原有圖像特征之進(jìn)行比較,因此,統(tǒng)計(jì)特征的二值圖像信息隱藏檢測算法是一種非盲檢的算法。在機(jī)器學(xué)習(xí)中貝葉斯算法是一種分類算法,該算法具有智能性和有效性。因此該算法已在多個(gè)科學(xué)領(lǐng)域有多次的成功有效的應(yīng)用。本文中在基于統(tǒng)計(jì)特征的二值圖像信息隱藏檢測算法的部分算法分析之后的基礎(chǔ)之上,再結(jié)合概率統(tǒng)計(jì)中的貝葉斯分類算法對不同特征圖像進(jìn)行有效的分類。
1 信息隱藏檢測原理及分類
信息隱藏檢測技術(shù)研究是一項(xiàng)具有挑戰(zhàn)性的工作。有針對性的信息隱藏檢測所采取的策略與目前反病毒軟件類似。針對性的信息隱藏檢測針對各種隱藏算法提出的檢測算法。目前針對性的信息研究非常活躍。信息隱藏方法可分為時(shí)/空域方法。
有針對性的算法一般檢測率都很高,但實(shí)用性卻不好,畢竟實(shí)際應(yīng)用中不能窮舉所有的信息隱藏方法,何況信息隱藏不同于密碼,隱藏算法完全可以做到保密,因而未知隱藏信息嵌入方法的通用性的信息隱藏檢測時(shí)信息檢測研究的重點(diǎn)。
當(dāng)今有針對性的信息隱藏檢測技術(shù)有LSB、BPCS、擴(kuò)展頻方法,統(tǒng)計(jì)嵌入方法、以及有待隱藏信息生成載體的信息隱藏方法等。
2 貝葉斯分類
在機(jī)器學(xué)習(xí)中,我們感興趣的是在給定訓(xùn)練數(shù)據(jù)D時(shí),確定假設(shè)空間H中的最佳假設(shè)。所謂最佳假設(shè),一種辦法是把它定義為在給定數(shù)據(jù)D以及H中不同假設(shè)的先驗(yàn)概率的有關(guān)知識下的最可能假設(shè)。貝葉斯理論提供了一種直接計(jì)算這種可能性的方法。
貝葉斯算法基于貝葉斯定理,分類算法的比較研究發(fā)展,一種稱為樸素貝葉斯分類法的簡單貝葉斯分類算法可以以決策樹和經(jīng)過挑選的神經(jīng)網(wǎng)絡(luò)分類算法想媲美。貝葉斯分類是統(tǒng)計(jì)學(xué)分類方法,是一種具有最小錯(cuò)誤率的概率分類方法,可以用數(shù)學(xué)公式的精確方法表示出來,并且可以用很多種概率理論來解決。用于大型數(shù)據(jù)庫時(shí),貝葉斯分類算法也已表現(xiàn)出高準(zhǔn)確率和高速度。
因此根據(jù)上述理由本文提出一種符合條件的圖像樣本的樣本集合,使用貝葉斯公式和樸素貝葉斯的分類方法對圖像集合中不同屬性的圖像進(jìn)行分類,將含有水印的圖像與未含有水印的圖像進(jìn)行分類。
2.1 貝葉斯公式
(1)X:樣本數(shù)據(jù),即所研究問題的實(shí)例,如一張圖像、一篇文章、一個(gè)句子等;
(2)H某種假設(shè),如樣本X屬于某種特定類C。
(3)P(H):H先驗(yàn)概率,,即任意樣本屬于類C的概率,此時(shí)樣本X的屬性完全未知
(4)P(H|X):在條件X下,H的后驗(yàn)概率,即已知某一樣本的各個(gè)屬性后,這一樣本屬于類C的概率。
(5)P(X):X的先驗(yàn)概率,即此樣本出現(xiàn)的概率。
(6)P(X|H):條件H下X的后驗(yàn)概率,即已知樣本屬于類C的情況下,該樣本具有屬性X的概率。
2.2 樸素貝葉斯分類法
算法[1-2]:
(1)假設(shè)數(shù)據(jù)集D,而A1,A2,A3……,An是數(shù)據(jù)集的n個(gè)屬性,對于某一具體的樣本,其屬性值為(x1,x2,x3,……,xn)其中xi就是屬性Ai的取值。
(2)假定有m個(gè)類,C={C1,C2,C3……Cn},給定樣本X,分類器將預(yù)測X的類別。對于樸素貝葉斯,當(dāng)且僅當(dāng):P(Ci|X)>P(Cj|X) 1≤j≤m,j≠1時(shí),才可判定X屬于類C。
(3)計(jì)算P(Ci)。
(4)計(jì)算P(X|Ci)。
(5)為了預(yù)測X的類標(biāo)簽,對每個(gè)類Ci,計(jì)算P(X|Ci)P(Ci),分類法預(yù)測元組X的類標(biāo)簽為Ci,當(dāng)且僅當(dāng)P(X|Ci)P(Ci)>P(X|Cj)P(Cj) 1≤j≤m+1,j≠i時(shí)。
3 二值圖像信息隱藏檢測算法與水印的概率統(tǒng)計(jì)
3.1 二值圖像信息隱藏檢測算法
假設(shè)廣義的定義圖像特征為U,信息隱藏于二值圖像后,圖像特征的值增大為U′。這樣,原始圖像的U肯定小于嵌入信息后的圖像的U′,但在實(shí)際應(yīng)用中,二值圖像千差萬別,有的原始圖像的U值甚至提嵌入信息后的U′都要大,這樣我們就很難找到一個(gè)能區(qū)分所有二值圖像是原有圖像還是嵌入了信息的圖像的閾值。
如果圖像已經(jīng)包含了隱秘信息,U和U′應(yīng)該大致相等,如果圖像不包含隱秘信息,U′一定會(huì)比U大很多?刹捎帽戎礥′/U來區(qū)分這兩類圖像。令R=U′/U,如果圖像已經(jīng)嵌入了隱秘信息,R大致等于或者略微大于1;而如果圖像中沒有隱秘信息,R一定比1大得多。 3.2 圖像特征的分析與討論
根據(jù)對圖像特征值的計(jì)算R=U′/U,可以R將分為三種情況:①大致等于1;②略微大于1;③一定比1大的多。R的值大致等于1,可以解釋為略微小于1或略微大于1。
(1)當(dāng)R的值大致等于1或略微大于1時(shí),則圖像中藏有水印。
(2)當(dāng)R的值一定比1大的多時(shí),則圖像沒有水印。
根據(jù)R的值的大小可將:R劃分為大于1的值域和略微小于1的值域。
(1)當(dāng)R略微小于1時(shí),則圖像中藏有水印。
(2)當(dāng)R大于1時(shí),
分兩種情況討論:
、佼(dāng)R略微大于1時(shí),則圖像中藏有水印。
、诋(dāng)R遠(yuǎn)大于1時(shí),則圖像沒有水印。
結(jié)論:
因此當(dāng)R的值略微小1時(shí),則圖像中藏有水印。
當(dāng)R的值大于1時(shí),則圖像中可能藏有水印也可能沒有水印。
討論:
當(dāng)圖像中藏有水印時(shí),此時(shí)圖像的屬性值的取值范圍是R略微大于1。
當(dāng)圖像中沒有水印時(shí),此時(shí)圖像的屬性值的取值范圍是R遠(yuǎn)大于1。
存在一個(gè)值域R,當(dāng)R>1時(shí),這里用集合B代表圖像的集合,用0表示圖像中沒有藏有水印,則1就表示圖像中有水印。存在集合B,并且有b∈{0,1}存在集合B,在這里可以統(tǒng)計(jì)概率的方法來計(jì)算b∈{0,1}時(shí),b分別取得屬性值0或1的概率多少。通過某個(gè)圖像集合中元素屬性值的概率計(jì)算,從而可以計(jì)算可以得出圖像中沒有藏有水印的概率是多少,同時(shí)通過計(jì)算也能得出圖像中有水印的概率為多少。最后通過使用貝葉斯算法的圖像特征概率計(jì)算,來對不同特征的圖像進(jìn)行分類。
3.3 水印的概率統(tǒng)計(jì)
以下對集合B,計(jì)算元素b分別取得0與1的概率:
若隨機(jī)變量b只取0與1,它們的概率分布為:
P(b=1)=p,P(b=0)=1-p
注釋:p表示的是0與1的概率。
概率p計(jì)算公式:
P(X=k)=Cknpkqn-k,k=0、1、2,……,n。
0 4 貝葉斯的概率分類方法
貝葉斯公式:
(1)X:{x1,x2,x3,……,xn} {圖像不含有水印,圖像藏有水印}。
(2)H假設(shè)元素X屬于圖像中藏有水印。
(3)P(H):概率為P(X=k)=Cknpkqn-k。
(4)P(H|X):在X條件下,H的概率理想狀態(tài)下,其為50%。
(5)P(X):概率為P(X=k)=Cknpkqn-k。
(6)P(X|H):理想狀態(tài)下,圖像藏有水印樣本出現(xiàn)的先驗(yàn)概率為50%。
5 含有水印的圖像與沒有水印圖像的分類算法
(1)在數(shù)據(jù)集中D中,圖像中藏有水印,圖像中沒有水印是數(shù)據(jù)集的2個(gè)屬性。對于某一具體的樣本屬性值就是R值。1)圖像藏有水印時(shí),其屬性值略微大于1。2)圖像沒有水印時(shí),其屬性值遠(yuǎn)大于1。
(2)這里有兩個(gè)類別,有水印的圖像與沒有水印的圖像為兩個(gè)不同的類別。如果樣本X屬于有水印圖像的概率大于樣本X屬于沒有水印圖像的概率,則這時(shí)可以判斷樣本X屬于有水印的圖像。如果樣本X屬于沒有水印圖像的概率大于樣本X屬于有水印圖像的概率,則這時(shí)可以判斷樣本X屬于沒有水印的圖像。
當(dāng)且僅當(dāng):P(Ci|X)>P(Cj|X) 1≤j≤m,j≠1時(shí),才可判定X屬于類C。
(3)計(jì)算Ci的先驗(yàn)概率P(Ci)。
(4)計(jì)算Ci條件下X的概率P(X|Ci)。
(5)為了預(yù)測X的類標(biāo)簽,對每個(gè)類Ci,計(jì)算P(X|Ci)P(Ci),分類法預(yù)測元組X的類標(biāo)簽為Ci,當(dāng)且僅當(dāng)P(X|Ci)P(Ci)>P(X|Cj)P(Cj) 1≤j≤m+1,j≠i時(shí)。
說明:當(dāng)且僅當(dāng)Ci的先驗(yàn)概率P(Ci)與Ci條件下X的概率P(X|Ci)的乘積大于Cj的先驗(yàn)概率P(Cj)與Cj條件下X的概率P(X|Cj)的乘積時(shí),才能夠預(yù)測X的類標(biāo)簽。
6 結(jié)束語
圖像提取算法固然重要,但要提取水印必須檢測出載體中的水印,因此水印的檢測算法更為重要。但是目前的某些水印的檢測算法容易產(chǎn)生漏警和誤警現(xiàn)象,解決水印檢測算法的漏警和誤警是水印研究人員主要研究的問題之一。因此一個(gè)好的水印檢測算法能夠盡量減少漏警與虛警的概率。本文查閱和參考了已有的水印圖像檢測算法,提出了一種基于該算是否切實(shí)有效,還需要在實(shí)際應(yīng)用的到檢測和驗(yàn)證。在這里十分希望廣大的水印研究者提出新的信息隱藏檢測算法,來完善現(xiàn)有的信息隱藏檢測算法。
參考文獻(xiàn):
[1]TomM.Mitchell(美)著.機(jī)器學(xué)習(xí)[M].北京:機(jī)械工業(yè)出版社,2013.
[2]羅森林,馬俊,潘敏麗編著.數(shù)據(jù)挖據(jù)理論與技[M].北京:術(shù)電子工業(yè)出版社,2013.
[3]金聰.數(shù)字水印理論與技術(shù)[M].北京:清華大學(xué)出版社,2008.
作者簡介:朱俚治(1980-),男,江蘇宜興人,計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)畢業(yè),本科,工學(xué)學(xué)士,工程師,研究方向:網(wǎng)絡(luò)安全。
作者單位:南京航空航天大學(xué)信息中心,南京 210016
基金項(xiàng)目:本文是北京航空航天大學(xué)軟件開發(fā)環(huán)境國家重點(diǎn)實(shí)驗(yàn)室開放基金資助項(xiàng)(項(xiàng)目編號:SKLSDE-2013KF)。
轉(zhuǎn)載請注明來自:http://www.jinnzone.com/jisuanjiyingyonglw/51139.html