- 相關(guān)推薦
圖像塊平坦測度與系數(shù)掃描方式選擇
圖像塊平坦測度與系數(shù)掃描方式選擇 山東大學(xué)電子工程系 陳默 李維釗摘要:本文介紹了圖像塊平坦測度的概念,提出圖像的水平測度和垂直測度,并在此基礎(chǔ)上提出了簡單有效的掃描方式選擇策略。
關(guān)鍵詞:圖像塊 平坦測度 掃描模式 H.263
1. 問題的提出
在眾多的圖像編碼建議中,如H.261/H.263幀內(nèi)圖像編碼都需要通過DCT變換,將圖象從空間的表達式/空間域轉(zhuǎn)化為頻譜表達式/頻率域。這樣變換后,只需要少量的數(shù)據(jù)點就可以表示圖象。并且DCT產(chǎn)生的系數(shù)很容易被量化,可獲得好的塊壓縮。在量化后,圖像矩陣中的大多數(shù)DCT系數(shù)都被截取為零值。在這些圖像塊的DCT系數(shù)的游程編碼前,一般都要按一定并且可選的方式對系數(shù)進行重新排列,排列的目的是增加游程編碼的效率,使得盡可能多的零相連。在H.263建議中,在高級幀內(nèi)編碼模式中給出了一些指導(dǎo)性的建議和掃描的順序,但是建議本身并不提供如何實際地選擇系數(shù)掃描模式。而且是不是只有在高級幀內(nèi)編碼模式中才能應(yīng)用多種掃描模式,建議并未指明。
本人在實際的視頻壓縮編碼研究和應(yīng)用中發(fā)現(xiàn),掃描方式的選擇與圖像的平坦測度有直接的關(guān)系,并且通過平坦測度測定和圖像塊方差可以簡單地確定系數(shù)掃描方式。并且正確選擇率較高。同時把這一掃描模式選擇推廣到任何幀內(nèi)編碼宏塊。
2. 塊的平坦測度
塊的平坦測度(Flatness measurement)指塊的像素在水平和垂直兩個方向上的綜合分布特點。假定塊的大小為 大小。塊的平坦測度定義如下:
其中和分別是塊的垂直和水平平坦測度,a、b是比例因子,它們的作用是調(diào)節(jié)水平和垂直平坦測度以獲得子塊的綜合平坦測度。一般,和分別定義如下:
其中:和定義如下:
其中FM()為相鄰像素平坦測度函數(shù),定義如下:
T是控制閾值,控制閾值的確定由人類視覺系統(tǒng)對于像素亮度變化的敏感度決定。一般而言,閾值可以由實驗的出。對于控制閾值的選擇是獲得優(yōu)良編碼性能的關(guān)鍵,控制閾值的選擇依賴于圖像塊本身的起伏特性,圖像的起伏特性可以由圖像像素的方差表征。如果圖像的像素的方差較大,則閾值也要較大,否則,方差較小,閾值也小。方差的計算可以由下式完成:
其中:
在實際計算時可以簡化為:
得到方差后就可以用實驗的方法獲得控制閾值T,本人在實驗中得到的經(jīng)驗公式為:
另外控制閾值與量化參數(shù)也有一定的關(guān)系,直觀的分析表明,控制閾值大,子塊的平坦度小,控制閾值小,子塊的平坦度大,,因為控制閾值與圖像的方差為線性關(guān)系。通過對HVS(Human Visual System)的分析,HVS對平坦區(qū)域比對非平坦區(qū)域更加敏感,因此如果一個塊的平坦測度較大,就要采用精細(xì)量化,反之則采用粗糙量化。通過平坦度和控制閾值的關(guān)系我們可以調(diào)整量化參數(shù),從而有效地分配碼位,達到較好的圖像質(zhì)量。
3. 系數(shù)掃描方式的選擇策略
可以通過測度圖像塊的平坦測度來決定對于子塊的掃描方式。在H.263標(biāo)準(zhǔn)的高級幀內(nèi)編碼方式中有三種掃描方式:ZigZag Scan(暫且稱之為Z形掃描)、Alternate-Horizontal Scan(稱之為輪流水平掃描) 和Alternate-Vertical Scan(稱之為輪流垂直掃描)。但是我們可以把這種做法推廣到一般的編碼塊中。一般而言,對于原始圖像塊采用這種掃描選擇策略獲得的較好的編碼性能,而幀差信號的分布隨機性較大,一般適合Z形掃描。當(dāng)然,如果采用也可以在一定程度上提高編碼效率。
Z形掃描 子塊中所有頻率分量都比較均勻,這種情況適合Z形掃描。掃描路徑見圖1。
輪流水平掃描 如果塊中包含較強的水平頻率分布,也就是非零DCT系數(shù)主要集中垂直方向的低頻部分。表現(xiàn)在像素亮度上則是塊在垂直方向上較為平坦。掃描路徑見圖2。
輪流垂直掃描 如果子塊中包含較強的垂直頻率分布,也就是非零DCT系數(shù)主要集中水平方向的低頻部分。表現(xiàn)在像素亮度上則是塊在水平方向上較為平坦。掃描路徑見圖3。
具體確定掃描方式的策略如下:
1) 如果水平平坦測度和垂直平坦測度之差小于DIST,采用ZigZag掃描。否則轉(zhuǎn)2。之所以采取這種方案是因為幾乎一半以上的圖像塊適合ZigZag掃描。
2) 如果水平平坦測度和垂直平坦測度之差大于等于DIST,則選擇較小的平坦測度作為掃描的方式。例如,水平測度小于垂直測度,就選擇水平掃描方式。
DIST稱為測度失真,它表征在平坦度測定過程中可能出現(xiàn)的誤差。這里有個問題就是如何確定DIST,DIST一般在通過實驗得到,量化參數(shù)和圖像方差
決定它的取值,其值一般在[5,9]中間取值。通過DIST的選取能明顯提高掃描模式的選擇的正確率。DIST值取得大,有利于ZigZag掃描的正確選擇,而DIST取值小,有利于另外兩種掃描的正確選擇。
以上對于DIST的選擇是靜態(tài)的。另外,可以設(shè)計一個函數(shù),,其中是圖像的垂直和水平平坦測度,是圖像的方差,Q是圖像的量化參數(shù)。
由于平坦程度的測定比較粗糙,控制閾值的確定也只是從統(tǒng)計意義上得出,因此通過上述方法得到的掃描模式不可能保證總是效率最好的編碼,有時候會出現(xiàn)相反的情況,但是將上述方法應(yīng)用于幀內(nèi)編碼宏塊時命中率一般大于65%。
方差的計算量較大,難以在實時應(yīng)用中使用。但是考慮到原始圖像的連續(xù)性可以計算宏塊的方差,在實際操作時只抽取部分像素作為樣本,從而減少算量。例如可以采用下圖的方法在計算圖像的方差是可以采取隔行列,這樣獲得方差計算量可以減少到1/4,計算出的方差用于四個子塊的平坦度測定。通過對方差以及平坦測度的計算可以明顯看出其算法規(guī)律性強,適合于利用MMX技術(shù)指令實現(xiàn),從而大大提高速度。
一般將平坦度測定用于幀內(nèi)編碼的圖像宏塊中,而在幀間編碼的宏塊中統(tǒng)一采用ZigZag掃描,因為,幀間編碼圖像宏塊像素分布隨機性大,采用其他兩種類型的掃描策略編碼效果不明顯,并且采用上述掃描方式選擇方法命中率較低,而復(fù)雜的選擇策略顯著影響編碼速度。
通過對6000幀圖像中所有的I宏塊進行統(tǒng)計,得到下表
方法平均位數(shù)(Bit) 單純Z形掃描 18.97 平坦測度選擇掃描 16.63 掃描方式對編碼性能的影響4. 總結(jié)
通過平坦測度來選擇掃描模式具有簡單、有效和可操作性強的特點,便于在實際應(yīng)用中采用。
參考文獻:
1. 賈志科,崔慧娟,唐昆,馮重熙。"H.26
【圖像塊平坦測度與系數(shù)掃描方式選擇】相關(guān)文章:
醫(yī)學(xué)圖像領(lǐng)域中數(shù)字圖像處理的應(yīng)用論文04-19
談地理圖像投影導(dǎo)學(xué)法08-21
《左傳》修辭方式淺探05-03
探析Little。拢颍椋簦幔椋畹臄⑹路绞05-31
論人生的選擇05-29
采礦塌陷災(zāi)害特征與治理方式04-21
美國沃爾瑪公司的治理方式及啟示05-26
分析基于三維掃描的特種設(shè)備管理系統(tǒng)設(shè)計論文05-26
文本方式下圖形提示界面制作05-10
知識型員工激勵方式初探05-03