跳到主要內容

科技大觀園商標

分類項目
Menu

通訊科技:數位視訊壓縮標準的價值

91/09/16 瀏覽次數 13997
數位視訊壓縮主要是在同時解決「不降低數位視訊的影像品質下,減少數位視訊的資料量」和「以很便宜的成本在很短的時間內完成上述動作」兩件「不可能的任務」。

即使是湯姆克魯斯一次也只能執行一件「不可能的任務」,那到底是誰有能耐一次完成兩個「不可能的任務」?

視訊壓縮標準的產生

近年來,音訊與視訊的應用領域有了巨大的變化,如影音光碟、數位化多功能光碟、高解析度數位電視、影像電話和視訊會議等等,都迅速地走進我們的生活。跟以往的技術相比,這些新系統架構的特點在於採用全數位化的方式來處理語音與影像的資訊。而隨著不同領域的應用需求,一些相關的標準也不斷地制訂與修訂得更加完善。

為什麼需要這些技術和標準呢?對於數位視訊而言,存取數位資料需要相當大的儲存空間。一段數位視訊可以看成是一連串的靜止數位影像畫面(標準規定為每秒30張畫面)的合成。在連續播放的情形下,由於人類視覺暫留效應而可被視為連續的視訊。但在不壓縮的情形下,儲存數位視訊所需的空間與傳輸數位視訊所需的頻寬都是非常地高。

若以畫面大小為720 × 480畫素,每秒30張畫面,90分鐘的一段全彩數位視訊為例,其需要的儲存空間為:167.96百萬位元組(Gbytes)。很明顯地,這個數目遠大於目前個人電腦裡的硬碟容量。視訊壓縮的工作就是要節省儲存數位視訊所需空間,但同時又能在視覺上儘量維持數位視訊未壓縮前的品質。

要「馬兒好又要馬兒不吃草」是不可能的任務。同樣地,要減少數位視訊的資料量又不能降低數位視訊的影像品質原本也是件不可能的任務。但現在這不可能的任務依賴視訊壓縮專家的智慧已變為可能了。

視訊壓縮的主要觀念就是設法把視訊資料中重複或眾所皆知的資料找出來並去除掉。這就好像重播的電視節目看起來很無聊(因為資訊一直重複)或者用「電機系」代表「電機工程學系」(眾所皆知)一樣。

視訊壓縮還有另一件「不可能的任務」,就是必須要以很便宜的成本,在很短的時間內把重複或眾所皆知的資料找出來,並且還要在很短的時間內把被壓縮過後的資料重組出來。否則,如果每次要看「不可能的任務」影音光碟就必須先等上好幾天,那這種技術也絕對不會被一般大眾所接受了。還好,有視訊壓縮專家,幫我們同時完成兩件「不可能的任務」。

為減少數位視訊的儲存空間需求,就產生了很多的壓縮演算法。然而,為了使不同人所壓縮出來的數位視訊能夠互相流通,就需要集合世界各地的技術來制定一個放諸四海都通用的標準。對視訊壓縮標準而言,最為大家耳熟能詳的莫過於MPEG。MPEG 不僅代表動畫專家群組(Moving Picture Experts Group),也代表這個專家群組所建立的標準格式。

MPEG是國際標準組織(ISO)的一個工作小組,他們那具有影響力的壓縮格式已廣泛地應用在全球數位化產品上。自一九八八年成立以來,MPEG已經公布了數項重要的標準。由於MPEG在一開始就是作為一個國際化的標準來研究制定,所以,它具有很好的相容性,MPEG也比其他算法提供更好的壓縮比,最高可達200:1。最重要的是,MPEG在提供高壓縮比的同時,對數位視訊品質的損失很小,同時整個壓縮方法也簡單到可以在很短的時間內來做壓縮與解壓縮。

接下來,我們就來回顧一下動態圖像專家群組的成員們在這十幾年來為數位視訊領域所制訂的一些壓縮標準。

MPEG-1標準

MPEG-1這個工業標準制定於一九九二年,其目的是希望能在不同頻寬的設備下儲存多媒體資訊,如唯讀光碟記憶體、影音光碟及互動式光碟等。MPEG-1的編碼位元率最高可達1.5 Mbits/sec。隨著編碼位元率的提高,其壓縮影像品質也會相對提升。MPEG-1的品質約與家用錄影系統VHS相當。目前較為大家熟悉的影音光碟視訊格式(VCD)就是採用MPEG-1視訊壓縮標準。至於音訊方面,如大家耳熟能詳的 MP3就是MPEG-1音訊壓縮中名為MPEG-1 Audio Layer-3的壓縮技術。

MPEG-1的視訊壓縮主要有兩個技術:數位離弦轉換編碼與區塊移動補償。數位離弦轉換是一種時域到頻域的轉換。藉此,我們可以使用另一種座標來表示二維的影像訊號。其好處是影像訊號的表示方式更為簡潔。更通俗的講法就是,「湯姆克魯斯」與「阿湯哥」都代表同一個人,但阿湯哥的表示方式既簡潔又親切。而數位離弦轉換的動作就像是告訴大家,我們要用一個既簡潔又親切的阿湯哥來取代湯姆克魯斯的原名一樣。

數位離弦轉換編碼是將一幅畫面分割成很多個8 × 8無重疊的小畫面,並對各個小畫面做數位離弦轉換。再將高頻部分,即人眼比較看不到的部分去掉,並只保留低頻部分訊號。這種原理是依照視覺心理學所決定出來的,就好比MP3在壓縮時也是將人耳聽不到的東西給去掉是一樣的。換言之,就是讓被保留的訊號跟原來的訊號「差不多」就好了。另一個好處就是將8 × 8的影像畫素的資料,集中在幾個重要的頻帶上,因而得以減少資料量。

區塊移動補償影像壓縮處理過程:以相鄰兩張影像畫面而言,區塊移動補償就是在上一張影像畫面中找出與目前這一張影像畫面最接近、最相似的部分(即綠色方框部分),並記錄他們之間的位置關係,而這個位置關係就是所謂的移動向量。系統壓縮所要處理的資料就是這兩者的差異處(即藍色方框部分),在所有的視訊壓縮標準中,區塊移動補償的基本單位均為16 × 16的影像畫面。

簡單地說,區塊移動補償就是減去時域上多餘的訊息。例如,如果兩幅相鄰影像畫面有很相似的內容,且第一幅影像畫面已經完整地被儲存或傳送,那麼只要儲存或傳送第一與第二幅影像畫面不同之處,就可以重建第二幅影像畫面的訊號。

MPEG-2標準

與MPEG-1相較之下,MPEG-2要複雜許多,而且也受到更多的關注,這主要是拜MPEG-1的成功所賜。MPEG-2在一九九四年首次獲得認可,它的應用範圍為高解析度數位電視及數位化多功能光碟的動態影像編碼標準。MPEG-1只能處理連續掃描格式的視訊信號,而MPEG-2則可處理連續掃描及交錯掃描格式的視訊信號。同時,MPEG-2還可提供廣播級的視訊和光碟級的音訊品質。

對用戶來說,由於傳統電視機解析度的限制,MPEG-2的高清晰度畫面在傳統電視上的效果並不很明顯。不過,在音訊特性如重低音、多伴音聲道等上,則比MPEG-1有更大的進步。因此,目前無論是數位化多功能光碟或是數位電視系統,不論是經由電纜或衛星播放,其所採用音、視訊壓縮核心技術都是MPEG-2。而許多的半導體業者也相繼推出單晶片的MPEG-2解碼器,甚至國際聯盟電信部(Internat-ional Telecommunications Union-Telecommuni-cation Sector, ITU-T)在雙向數位影音通訊H.310系列標準中,也採用MPEG-2作為動態影音壓縮的框架。由此即可知MPEG-2的魅力。

MPEG-4標準

MPEG國際標準組織繼成功地推出MPEG-1、MPEG-2標準後,於一九九八年十月又正式制定了MPEG-4標準,正式國際名稱是ISO/IEC 14496。主要目的是為了加速多媒體通信的發展,並促成電信、電腦、廣播電視三大網路的融合。MPEG-4標準是將多個的多媒體應用集中於一個完整的系統內,主要目的在為多媒體通信及應用環境提供標準的演算法及工具,並使音訊、視訊資料能有效地編碼以及存取更靈活。

在傳統的MPEG-1、MPEG-2等視訊壓縮中,壓縮方式是以一張張影像畫面為主體來進行壓縮。因此,整張影像畫面上的所有圖形與文字都採用相同的壓縮方式,產生出來的資料量也就比較大。MPEG-4則採用新一代的壓縮理念,將影像畫面上的文字、背景及圖形視為不同物件,並制定以物件為基礎的方式來壓縮影像畫面,以達到最有效率的壓縮方式。

MPEG-1與MPEG-2的壓縮演算法只是將視訊間的多餘資料予以刪除,然而MPEG-4則提出不一樣的壓縮技術,此技術稱為以內容為基礎之視訊壓縮。MPEG-4的壓縮技術可依照需求,將視訊內容分割成數個視訊物件平面,再將這些視訊物件平面分別編碼、儲存和傳送,而於解碼端再依不同的應用來重組、刪減或是替換所需的視訊物件平面。

在此一概念中,我們將動態影像序列中的每一個場景,看成是由不同的視訊物件平面所組成。而同一物件的連續視訊物件平面稱為視訊物件。視訊物件可以是動態影像序列中的人物或景物,如電視新聞中的主播,也可以是電視劇中的一輛賓士的汽車。對於輸入的動態影像序列,通過分析後可將其分割成數個視訊物件,而每個視訊物件再對其中所組成的視訊物件平面進行編碼。視訊物件平面的編碼包括對運動(採用移動預測與補償)及紋理(採用數位離弦轉換編碼)的編碼,其基本原理與MPEG-1、MPEG-2極為相似。

由於視訊物件平面具有任意形狀,因此,MPEG-4要求編碼時必須處理視訊物件平面的形狀和其透明度等資訊。這跟只能處理矩形影像序列的視訊編碼標準(MPEG-1與MPEG-2)形成了鮮明的對照。

在MPEG-4中,矩形區塊可被認為是視訊物件平面的一個特例,這時編碼系統不用處理視訊物件平面形狀資訊,而以類似MPEG-1、MPEG-2的傳統編碼方法 來對矩形區塊的視訊物件平面進行編碼,因此,MPEG-4能與現有標準(MPEG-1和MPEG-2)相容。

MPEG-4原先的目的是要訂定一個低位元率之視訊壓縮標準,因此,目前網路上的電影或多媒體大多以MPEG-4的方式來壓縮。同時,未來第三代行動通訊中的視訊服務也是以MPEG-4來做壓縮。

但MPEG的專家們並不以此為滿足,他們還把MPEG-4擴展到能夠支援內容交談式編碼。相較於傳統標準,MPEG-4除了採用物件式編碼外,還增加了自然與人工合成視訊的編碼以及許多原屬於電腦圖學範疇的工具技術,如動態人臉模型壓縮、立體幾何壓縮、動態網狀展示等,因此其應用範圍也變得非常廣泛。

MPEG-7標準

MPEG-1、MPEG-2和MPEG-4 提供的都是與音訊和視訊相關的解壓縮標準。而MPEG-7 則被稱為「多媒體內容描述界面」,目的則是為了處理數位音訊、視訊產品的查詢問題。

隨著網際網路的發展,大量的數位視聽產品,使得網路上音訊、視訊資料的查詢變得越來越困難。譬如說,一個使用者想要尋找阿湯哥的照片,可是他又不知道他所要找的人叫做阿湯哥,怎麼辦?透過MPEG-7的幫助,只要使用者知道阿湯哥身高不高、笑口常開、棕色頭髮、類似一字眉、雙眼皮、鼻樑挺、鼻子高及耳垂無肉,那電腦就有可能把阿湯哥在資料庫中的影像全部找出來。

為了分類和搜索視訊資料的方便,MPEG提出的解決方案就是MPEG-7的標準。MPEG-1、MPEG-2與MPEG-4是訂定如何對影像或聲音的資料進行有效的壓縮,而MPEG-7則是對這些信息做有效的描述。即前三者使得信息的內容可以更有效地獲取,而MPEG-7則使我們在需要的時候可以立刻找到所要的信息。

MPEG-7的主要目的是希望使用者能夠快速且有效地搜索出所需的各種不同類型的音訊、視訊資料。此項目標最先在一九九八年十月提出,並於二○○一年完成與公布。MPEG-7對各種不同類型的音訊、視訊信息進行標準化的描述,並將該描述與所描述的內容相聯繫,以實現快速有效的搜索。簡單地說,MPEG-7的技術就是在探討如何利用文字及數據來描述一段音訊或視訊資料。但必須注意的是,MPEG-7標準並不包括對描述特徵的自動提取,也沒有規定利用描述進行搜索的工具或任何程序。

MPEG-7定義了一個標準描述器集合來描述各種類型的音訊、視訊資料,與之對應的描述方法則用來定義音訊、視訊描述的生成和不同描述之間的關係,這些描述器與所指定的音訊、視訊內容緊密關連。在此基礎上,MPEG-7定義了一套描述語言,用於指定和生成描述計畫。

由於MPEG-7描述的多媒體內容相當廣泛,其核心的描述語言也包含現有的各種描述語言的特點,以便擴大其應用性。 MPEG-7可以不用跟其他MPEG標準搭配使用,但MPEG-4中對音訊、視訊的描述可供MPEG-7作分類的基礎。另外,我們也可以利用MPEG-7的描述來增強其他MPEG標準的功能。

MPEG-7的應用範圍相當廣泛,既可應用於儲存,也可用在廣播或網際網路上。如:數字圖書館(圖像目錄,音樂字典),多媒體名錄服務(黃頁),廣播媒體選擇(無線電信頻道,電視信息頻道),多媒體編輯(個人電子新聞業務,媒體寫作)等。另外,MPEG-7在教育、新聞、導遊信息、娛樂、研究業務、地理信息系統、醫學、購物、建築等,均有相當的應用潛力。

展望

目前利用MPEG技術所開發出來的產品,已經是我們生活中不可或缺的東西了。例如,利用MPEG-1,使得影音光碟取代了傳統的錄影帶,而MPEG-2將使數位電視完全取代現有的類比電視,且具備高畫質與音質的數位化多功能光碟也將取代現有的影音光碟。

由於MPEG-4比起傳統的MPEG-1與MPEG-2具有更高的壓縮率,因此,MPEG-4標準也已應用到網路上流行的DivX公司視頻編碼技術、微軟公司的串流視訊,以及MPEG-4壓縮攝錄影機。同時,下一代的數位化多功能光碟標準也都有意採用MPEG-4壓縮標準。

隨著MPEG-7標準的推出及未來MPEG-21的產生,相信將會加速許多東西的商品化,並使數位音訊、視訊壓縮和傳輸技術的應用更趨向多元化。
OPEN
回頂部