亚洲国产日韩欧美在线a乱码,国产精品路线1路线2路线,亚洲视频一区,精品国产自,www狠狠,国产情侣激情在线视频免费看,亚洲成年网站在线观看

Video Object編碼技術(shù)

時(shí)間:2023-01-07 01:25:33 計(jì)算機(jī)畢業(yè)論文 我要投稿
  • 相關(guān)推薦

Video Object編碼技術(shù)

Video Object編碼技術(shù)

《西部廣播電視》2001.10發(fā)表
2001中南地區(qū)廣播電視技術(shù)討論會(huì)技術(shù)論文二等獎(jiǎng)

多媒體信息是未來(lái)人類獲取信息最主要的載體,因此它已成為目前世界上技術(shù)開(kāi)發(fā)和研究的熱點(diǎn)。視頻信息作為多媒體信息中最被關(guān)注、數(shù)據(jù)量最大的一員,現(xiàn)在也正面臨著一場(chǎng)其意義不亞于從模擬到數(shù)字的技術(shù)進(jìn)步革新:從傳統(tǒng)的矩形DCT變換編碼到根據(jù)視頻內(nèi)容、劃分對(duì)象、分別變換編碼的新的編碼方法。

一、傳統(tǒng)的編碼方式

傳統(tǒng)的視頻編碼是以視頻信號(hào)的數(shù)字量為編碼對(duì)象的,與視頻信息的內(nèi)容無(wú)關(guān),無(wú)論是M-JPEG、MPEG-1還是MPEG-2,都是以DCT矩形變換塊為變換編碼單元,對(duì)DCT塊內(nèi)圖像的亮度和色度進(jìn)行特征取樣,提取像素;采用幀間編碼、運(yùn)動(dòng)估測(cè)技術(shù),在參考幀幀內(nèi)DCT編碼的基礎(chǔ)上,對(duì)DCT塊內(nèi)圖像的像素特征進(jìn)行差值預(yù)測(cè)編碼;诰匦蜠CT編碼的視頻編碼在設(shè)計(jì)思想上只考慮到對(duì)信號(hào)數(shù)據(jù)進(jìn)行處理的需要(比如小的比特率以利于傳輸、高的比特率以保證質(zhì)量),但未考慮視頻信息--圖像內(nèi)容本身的含義和重要性,以及視頻信息應(yīng)用者的主觀需求(比如部分內(nèi)容的提取功能)。另外,這種基?quot;塊"的壓縮算法在低碼率時(shí)容易產(chǎn)生"方塊效應(yīng)"和"抽幀",大大縮小了視頻信息的應(yīng)用領(lǐng)域。

小波變換是一種新的變換編碼方法,它與DCT變換相比,考慮到了視頻信號(hào)對(duì)不同應(yīng)用環(huán)境的自適應(yīng)性(不同的清晰度與比特率),可以將基礎(chǔ)圖像層與增強(qiáng)圖像層分離編碼傳輸,用戶可根據(jù)實(shí)際情況選擇是否打開(kāi)增強(qiáng)圖像層。但無(wú)論用戶選擇是或否,被傳送的視頻信息卻都是一樣的。

二、 基于內(nèi)容對(duì)象的編碼

1、 VO與VOP概念的引入

傳統(tǒng)的視頻編碼方式是將整個(gè)視頻信號(hào)作為一個(gè)內(nèi)容單體來(lái)處理,其本身不可再分割,而這與人類對(duì)視覺(jué)信息的判別法則,也就是大腦對(duì)視神經(jīng)導(dǎo)入的視覺(jué)信號(hào)的處理方法是完全不同的。這就決定了我們不可能將一個(gè)視頻信息完整的從視頻信號(hào)中提取出來(lái),比如:將加有臺(tái)標(biāo)和字幕的視頻恢復(fù)成無(wú)臺(tái)標(biāo)、字幕的視頻。解決問(wèn)題的惟一途徑就是在編碼時(shí)就將不同的視頻信息載體--視頻對(duì)象VO(Video Objects)區(qū)分開(kāi),獨(dú)立編碼傳送,將圖像序列中的每一幀,看成是由不同的VO加上活動(dòng)的背景所組成。VO可以是人或物,也可以是計(jì)算機(jī)生成的2D或3D圖形。VO具有音頻屬性,其屬性賦值可能?quot;有"或者是"無(wú)"。但音頻的具體內(nèi)容數(shù)據(jù)是獨(dú)立于視頻編碼、傳輸?shù)。VO概念的引入,更加符合人腦對(duì)視覺(jué)信息的處理方式,并使視頻信號(hào)的處理方式從數(shù)字化進(jìn)展到智能化。提高了視頻信號(hào)的交互性和靈活性,使得更廣泛的視頻應(yīng)用和更多的內(nèi)容交互功能成為可能。

現(xiàn)代圖像編碼理論指出,人眼捕獲圖像信息的本質(zhì)是"輪廓-紋理",即人眼感興趣的是VO的一些表面特性,如形狀、運(yùn)動(dòng)、紋理等。VO的表面往往是不規(guī)則的、千變?nèi)f化的,但可將其視為一定視角下,n個(gè)形狀規(guī)則的、具有一定紋理的剖面的組合的連續(xù)運(yùn)動(dòng),這些剖面的組合稱為視頻對(duì)象面VOP(Video Object Profile)。VOP描述了VO在一定視角條件下的表面特性。VOP的編碼主要由兩部分組成:一個(gè)是形狀編碼,另一個(gè)是紋理和運(yùn)動(dòng)信息編碼。VOP紋理編碼和運(yùn)動(dòng)的預(yù)測(cè)、補(bǔ)償在原理上同MPEG-2基本一致,而形狀編碼技術(shù)則是首次應(yīng)用在圖像編碼領(lǐng)域。

2、新的編碼技術(shù)

合成VO的獨(dú)立編碼 在以前,2D或3D動(dòng)畫(huà)被看作是視頻的一部分,并一概以視頻的方法來(lái)處理。實(shí)際上,根據(jù)合成VO的合成機(jī)理和特性,大部分合成VO都可以用通用的有關(guān)圖形文本的多種表達(dá)方式來(lái)描述。非復(fù)雜性合成VO將被視為一種獨(dú)立于視頻的數(shù)據(jù)類型來(lái)編碼,并定義了其描述框架、通用的數(shù)據(jù)流結(jié)構(gòu)和靈活的接口。而復(fù)雜性合成VO和自然VO的編碼方法,將采用以下的編碼方法。

基于矩形窗口的VOP分割 考慮到與現(xiàn)有標(biāo)準(zhǔn)的兼容,目前已得到應(yīng)用的VO編碼技術(shù),比如MPEG4,仍采用了基于矩形窗口的內(nèi)容分割法。編碼時(shí),首先利用像素特征統(tǒng)計(jì),將每一個(gè)VOP都限定在一個(gè)矩形窗口內(nèi),稱之為VOP窗口(VOP Window),取窗的原則為:長(zhǎng)、寬均為16像素的整數(shù)倍(便于對(duì)現(xiàn)有標(biāo)準(zhǔn)的兼容和將來(lái)的擴(kuò)展),同時(shí)保證VOP窗口中非VOP的宏塊數(shù)目最少。目前標(biāo)準(zhǔn)中的視頻幀可認(rèn)為是一個(gè)無(wú)VOP的特例,在編碼過(guò)程中將形狀編碼模塊屏蔽掉就可以了。在一個(gè)VOP窗口內(nèi),VOP剖面的形狀也是采用8×8像素的矩形形狀。針對(duì)不同的VOP,可以根據(jù)不同的應(yīng)用場(chǎng)合和運(yùn)動(dòng)、變化的特點(diǎn),采用固定的或可變的VOP幀頻(即VOP刷新頻率)。

矩形窗口分割法并不能體現(xiàn)VOP的具體形狀信息。為了確認(rèn)采用矩形窗口分割法的VOP的形狀信息,就引入了形狀編碼技術(shù)。形狀編碼其實(shí)并不是什么新技術(shù),它在計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)領(lǐng)域早有應(yīng)用。而目前的視頻編碼標(biāo)準(zhǔn)中的位圖技術(shù)其實(shí)就是形狀編碼的簡(jiǎn)單特例。位圖采用矩陣的形式來(lái)表示二值(0或1)的形狀信息,具有較高的編碼效率和較低的運(yùn)算復(fù)雜度。VOP的形狀信息有兩類:邊緣信息和灰度信息。邊緣信息用0、1來(lái)表示VOP的形狀,0表示非VOP區(qū)域,1表示VOP區(qū)域。對(duì)于包含一定透明度的VOP區(qū)域,可以用灰度信息(取值0~255之間)來(lái)表示透明程度,其中0表示完全透明,255表示完全不透明。對(duì)于模糊邊緣部分,可將其視為灰度信息從周圍已知VOP區(qū)域的灰度值向0值的過(guò)渡區(qū)域,采用內(nèi)插法確定其形狀信息。

基于小波變換的VOP分割 基于矩形窗口的VOP分割依舊存在"塊效應(yīng)"問(wèn)題,而基于小波變換的VOP分割則可以很好的解決這個(gè)問(wèn)題,而且由于這種分割方法的本身就包含了VOP的形狀信息,所以無(wú)需另對(duì)形狀信息進(jìn)行判別與編碼;谛〔ㄗ儞Q的VOP分割方法是目前最為活躍的視頻編碼課題研究領(lǐng)域,各種算法不斷的被發(fā)表,但基本上可以劃分為兩類方法:

1、利用圖像灰度特征分割:不同的圖像具有不同的灰度分布,利用小波變換,將圖像變換到小波域,產(chǎn)生各層、各子帶圖像。小波變換后,大部分的能量是集中在低頻子帶圖像上,即大面積的平均灰度區(qū)域信息主要在低頻子帶圖像中體現(xiàn)。根據(jù)信息論的原理,確定多個(gè)灰度值,可以將具有不同灰度的VOP從低頻子帶圖像中分離。同時(shí)再利用高頻子帶圖像以及模糊數(shù)學(xué)模型,確定每一個(gè)VOP的邊緣信息。利用圖像灰度特征分割的小波變換,是沿掃描方向的單方向變換。

2、利用圖像紋理特征分割:紋理是一種局部特征反復(fù)出現(xiàn)的結(jié)果,它體現(xiàn)了圖像的局部頻域信息。對(duì)

【Video Object編碼技術(shù)】相關(guān)文章:

小議3D 視頻編碼傳輸技術(shù)05-07

網(wǎng)絡(luò)直播技術(shù)前沿技術(shù)探析05-08

籃球投籃技術(shù)11-30

通信技術(shù)論文11-21

電子技術(shù)論文11-03

計(jì)算機(jī)技術(shù)和聯(lián)用信息技術(shù)論文09-23

探討西瓜嫁接育苗技術(shù)05-29

油茶豐產(chǎn)栽培技術(shù)05-27

談數(shù)字IC設(shè)計(jì)技術(shù)08-25