摘要:介紹了馬爾可夫隨機場模型及其進行圖像處理的方法,該方法主要包括三個階段:學習階段、計算階段和處理階段,并對這類方法的應用進行了展望。
關鍵字:馬爾可夫隨機場模型,吉布斯分布,OCR,模擬退火
AnApplicationofMRFModelforImagePreprocessing
YELing-weiZhangXin
(QingDaoBranchofNavalAeronauticalEngineeringInstitute,QingDao266041,China)
Abstract:ThispaperintroducesaMRFbasedalgorithmforpreprocessingimages.Thisapproachconsiststhreestages:trainingstage,computatingstageandprocessingstage.Atlastthefutureresearchworkislisted.
Keywords:MRF,Gibbsdistribution,OCR,Simulateannealing
1 馬爾可夫隨機場
馬爾可夫隨機場(MarkovRandomField,MRF)模型已經被廣泛應用于圖像處理并取得了很好的處理效果。在圖像處理領域,馬爾可夫隨機場模型主要通過鄰域和基團來建立圖像象素之間的相關關系,再由Hammersley-Clifford定理與吉布斯分布相對應,因此若定義了吉布斯分布的能量函數(shù),那么就可以確定一個馬爾可夫隨機場。
下面是一些馬爾可夫隨機場的相關概念[1]:
定義2.1(隨機場)設(,F,P)為一概率空間,={1,2,…,l}為一指標集,B={0,1,…,m}為狀態(tài)空間,隨即變量(i,j∈Λ):(Ω,F(xiàn),P)→B,稱其全體X={;i,j∈Λ}為B上的隨機場。
定義2.2(鄰域)對于給定的指標集Λ,設N={;Λ×Λ,i,j∈Λ}為一集族,如果N滿足(i,j)且當(i,)∈時有(,)∈,則稱N為Λ×Λ上的鄰域系,稱為(i,j)的鄰域。
最常用的鄰域系有兩種:
N={(i-1,j),(i+1,j),(i,j-1),(i,j+1)}
N={(i-1,j-1),(i-1,j),(i+1,j+1),(i+1,j-1),(i+1,j),(i,j+1),(i-1,j+1),(i-1,j)}
它們即為通常的4鄰域和8鄰域,這里分別稱為一階和二階鄰域系統(tǒng)。當(i,j)位于圖的邊緣或頂角處時,鄰域的定義要作相應的改動。
定義2.3(基團)設N={N;i,j∈Λ}為一鄰域系,A為某指標集,稱集族C={;a∈A}是關于N的基團集,其滿足:
。1)
。2)對于一切(,),(,)∈,則有。
點集位置的集合稱為相對該鄰域系的基團(clique)。
定義2.4(馬爾可夫隨機場)設X={;i,j∈Λ}是隨機場,N={;i,j∈Λ}是一鄰域,如果對一切(i,j)∈Λ×Λ,都有
則稱X是關于鄰域系N的馬爾可夫隨機場(MRF)。
關于馬爾可夫隨機場有下面重要的基本定理,即Hammersley-Clifford定理。
定理1設X={;i,j∈Λ}使關于鄰域系N的馬爾可夫隨機場,C={;a∈A}是關于N的一個基團集,若對任何一個實現(xiàn)x={x;i,j∈Λ,x∈B},X的聯(lián)合概率(密度)P(X=x)=具有下列形式:
式中,T為正常數(shù);Z為歸一化常數(shù);U(x)稱為能量函數(shù),其具有如下表示:
U(x)=
函數(shù)只依賴于中那些點(,)的值,這種形式的分布稱為C上的吉布斯(Gibbs)分布。反之,如果隨機場X的聯(lián)合分布具有上述的吉布斯分布形式,則X式關于N的馬爾可夫隨機場。
對于一階鄰域系={;i,j∈Λ},此時,
U(x)==
按定理及有關定義,只與及鄰域象素有關,因此式(2.3)可進一步簡化為
U(x)=++
只要規(guī)定三個函數(shù)V、V和V,就可以定義一個馬爾可夫場。
2 基于馬爾可夫隨機場模型的圖像處理
基于馬爾可夫隨機場的圖像處理主要包括三個階段:
1) 學習階段:通過大量的訓練樣本建立觀測模型并對先驗概率進行學習;
2) 計算階段:定義適當?shù)哪芰抗讲捎媚M退火算法對模型參數(shù)進行優(yōu)化計算;
3) 處理階段:應用前兩個階段得到的模型對未知的圖像進行處理。
在實驗中,學習階段是通過選擇一定大小的鄰域,統(tǒng)計大量質量較好的二值化圖像的可能模式及其概率分布來完成的;計算階段選用模擬退火算法對模型參數(shù)進行優(yōu)化計算,得到一個優(yōu)化模型;最后應用所得的優(yōu)化模型對一些降質圖像進行處理,修復殘缺的文字。
2.1能量函數(shù)的定義
正如前一小節(jié)所述,馬爾可夫隨機場模型都符合吉布斯分布,不同模型之間的主要差別在于能量函數(shù)的定義,在這里我們應用了
文獻[2]中基于概率的定義,其中B與所取的鄰域大小有關,為所取鄰域中包含的象素數(shù)目。
。1)
2.2未知模式的概率統(tǒng)計
對于在學習階段未出現(xiàn)的模式,通過與已知模式的比較來求得[2],計算公式如下:
。2)
式中,p為平滑因子,d(i,j)和u(i,j)分別為與之間不同和相同的象素數(shù)目,未知模式的能量計算公式為
。3)
式中,,為歸一化因子。
2.3模擬退火算法
模擬退火算法[3](simulatedannealing,簡稱SA)是一種通用的優(yōu)化算法。的思想最早是由Metropolis等(1953)提出的,1983年Kirkpatrick等將其組合優(yōu)化。SA算法是基于MenteCarlo迭代求解策略的一種隨機尋優(yōu)算法,其出發(fā)點是基于
物理中固體物體的退火過程與一般組合優(yōu)化問題之間的相似性。模擬退火算法在某一初溫下,伴隨溫度參數(shù)的不斷下降,結合概率突跳特性在解空間中隨機尋找目標函數(shù)的全局最優(yōu)解,即在局部優(yōu)解能概率性地跳出并最終趨于全局最優(yōu)。
歸納言之,SA算法是基于MonteCarlo迭代求解策略的一種隨機尋優(yōu)算法,其出發(fā)點是基于物理退火過程與組合優(yōu)化之間的相似性,SA由某一較高溫度開始,利用具有概率突跳性的Metropolis抽樣策略在解空間中進行隨機搜索,伴隨溫度的不斷下降重復抽樣過程,最終得到問題的全局最優(yōu)解。
模擬退火算法步驟描述如下:
1) 給定初溫t=t,隨機產生初始狀態(tài)s=s,令k=0;
2) T(k)=t0×;
3) 產生新狀態(tài)s=Genete(s);
4) Ifmin{1,exp[-(C(s)-C(s))/l]}random[0,1]s=s;
5) Until抽樣穩(wěn)定準則滿足;
6) 退溫=update()并令k=k+1;
7) Until算法終止準則滿足;
8) 輸出算法搜索結果。
其中,c是一個控制冷卻速度的常量,在實驗中,。
在模擬退火過程中,每一種模式的潛在的能量值在其修改前后都計算一次,是否接受修正值根據(jù)下式判斷:,其中就是修正前后的能量差。如果,q>T,那么改變中心象素值是合理的,可以接受;但是如果q<1,那么這種改變就以一定概率接受。
3 結束語
本文對應用Markov隨機場模型的方法進行了描述。進一步研究的工作:一是可以改進該方法在處理比較復雜的鄰域關系,增大鄰域大小無疑是一種解決方法,但是計算復雜度也會大大增加;二是應用該方法對文字圖像、指紋圖像等統(tǒng)計規(guī)律比較強的圖像進行預處理,以減小后續(xù)的特征提取工作的難度。
參考文獻
[1]. 孫即祥等.《模式識別中的特征提取與計算機視覺不變量》[M].國防出版社,2001年9月.
[2]. ChristianWolf,DavidDoermann.BinarizationofLowQualityTextusingaMarkovRandomFieldModel[J].IEEETrans,onPam2,2002,1051-1056.
[3]. 姚新,陳國良.模擬退火算法及其應用[J].
計算機研究與發(fā)展,1990,7,1-6.
轉載請注明來自:http://www.jinnzone.com/boyinyuzhuchilw/3246.html