Selasa

Perbandingan Standar Image, Audio dan Video

A. Standar Image
bagaimana cara-cara format standar image dengan menggunakan BMP, PNG, JPEG, GIF, dan TIFF. Kompresi standar image itu adalah aplikasi kompresi data yang dilakukan terhadap image digital dengan tujuan untuk mengurangi redudansi dari data-data yang terdapat dalam image  sehingga dapat disimpan atau ditransmisikan secara efisien.Dalam pengolahan citra digital dapat didefinisikan sebagai fungsi dua variabel,
f(x,y), dimana x dan  y  adalahkoordinat spasial dan nilai f(x,y)
adalah intensitas citra pada koordinat tersebut,  Teknologi dasar untuk menciptakan dan menampilkan warna pada image  digital berdasarkan  pada  kombinasi dari tiga warna dasar, yaitu merah, hijau, dan biru ( Red, Green, Blue - RGB).Sebuah image  diubah ke bentuk digital agar dapat disimpan dalam memori komputer atau media lain. Proses mengubah image  ke bentuk digital bisa dilakukan dengan beberapa perangkat,misalnya  scanner , kamera digital, dan handycam
Ketika sebuah image  sudah diubah ke dalam bentuk digital (selanjutnya disebut image  digital), 
Ada dua tipe pada kompresi yaitu
I. Kompresi tipe lossless
Adalah kompresi yang tidak menghilangkan informasi setelah kompresi terjadi, akibatnyakualitas citra hasil kompresi tidak menurun.Beberapa ciri dari kompresi lossless :
  • Teknik kompresi citra dimana tidak ada satupun informasi citra yang dihilangkan. 
  • Biasa digunakan pada citra medis. 
  • Metode loseless: Run Length Encoding, Entropy Encoding (Huffman, Aritmatik), danAdaptive Dictionary Based (LZW) 
 II. Kompresi tipe lossy
Adalah kompresi dimana terdapat data yang hilang selama proses kompresi, akibatnya kualitas data yang dihasilkan jauh lebih rendah daripada kualitas data asli.Beberapa ciri dari kompresi lossy :
  • Ukuran file citra menjadi lebih kecil dengan menghilangkan beberapa informasi dalam citraasli. 
  • Teknik ini mengubah detail dan warna pada file citra menjadi lebih sederhana tanpa terlihatperbedaan yang mencolok dalam pandangan manusia, sehingga ukurannya menjadi lebih kecil. 
  • Biasanya digunakan pada citra foto atau image lain yang tidak terlalu memerlukan detail citra,dimana kehilangan bit rate foto tidak berpengaruh pada citra.
 ALGORITMA KOMPRESI/DEKOMPRESI IMAGE
Algoritma umum untuk kompresi image adalah:
  • Menentukan bitrate dan toleransi distorsi image dari inputan user. 
  • Pembagian data image ke dalam bagian-bagian tertentu sesuai dengan tingkatkepentingan yang ada (classifying). 
  • Pembagian bit-bit di dalam masing-masing bagian yang ada (bit allocation).
  •  Lakukan kuantisasi (quantization).
           Kuantisasi Scalar : data-data dikuantisasi sendiri-sendiri
           Kuantisasi Vector : data-data dikuantisasi sebagai suatu himpunan nilai-nilai vektor yang
                                         diperlakukan sebagai suatu kesatuan. 
  • Lakukan pengenkodingan untuk masing-masing bagian yang sudah di kuantisasi tadi dengan menggunakan teknik entropy coding (Huffman dan aritmatik) dan menuliskannyake dalam file hasil.
Sedangkan algoritma umum dekompresi image adalah:
  • Baca data hasil kompresi menggunakan entropy dekoder. 
  • Dekuantisasi data. 
  • Rebuild image
1.TEKNIK KOMPRESI GIF(GRAPHICS INTERCHANGE FORMAT)
  •  GIF (Graphic Interchange Format) dibuat oleh Compuserve pada tahun 1987 untuk menyimpan berbagai file bitmap manjadi file lain yang mudah diubah dan ditransmisikanpada jaringan komputer. Format gif mendukung image  bergerak. Namun format gif hanyamendukung 255 warna tiap frame dan juga pada image  transparan. Format gif jugamerupakan kompresi tipe lossy. 
  • GIF merupakan format citra web yang tertua yang mendukung kedalaman warna sampai 8 bit (256 warna), menggunakan 4 langkah interlacing, mendukung transparency, dan mampu menyimpan banyak image dalam 1 file. 
  • Byte ordering: LSB ± MSB 
  • Struktur file GIF:
    • Header: menyimpan informasi identitas file GIF (3 bytes, harus string “GIF”)dan versinya (3 bytes, harus string “87a” or “89b”).
    • Global Screen Descriptor: mendefinisikan logical screen area dimana masing-masing file GIF ditampilkan. 
    • Global Color Table: masing-masing image dalam GIF dapat menggunakanglobal color table atau tabel warnanya sendirisendiri. Penggunaan GCT akanmemperkecil ukuran file GIF.
    • Image1, Image2, Image3,… Image-n: dimana masing-masing image memiliki struktur blok sendiri-sendiri dan terminator antar file. 
    • Trailer: Akhir dari sebuah file GIF 
    Kompresi GIF menggunakan teknik LZW: gambar GIF yang berpola horizontal danmemiliki perubahan warna yang sedikit, serta tidak bernoise akan menghasilkan hasilkompresan yang baik. 
  • LZW kurang baik digunakan dalam bilevel (hitam-putih) dan true color. 
  • Format file GIF:
    • GIF87a: mendukung interlacing dan mampu manyimpan beberapa image dalam1 file, ditemukan tahun 1987 dan menjadi standar. 
    • GIF89a: kelanjutan dari 87a dan ditambahkan dengan dukungan transparency,mendukung text, dan animasi. 
    Animated GIF: tidak ada standar bagaimana harus ditampilkan sehingga umumnyaimage viewer hanya akan menampilkan image pertama dari file GIF. Animated GIFmemiliki informasi berapa kali harus diloop. 
  • Tidak semua bagian dalam animated GIF ditampilkan kembali, hanya bagian yang berubah saja yang ditampilkan kembali.
 
2.TEKNIK KOMPRESI PNG(PORTABLE NETWORK GRAPHICS)
  • PNG adalah format citra dengan kompresi tipe lossless dengan kedalaman bit berkisar antara 1 sampai dengan 32. PNG didesain untuk menggantikan format citra GIFuntuk diimplementasikan di website. Algoritma kompresi PNG tidak memerlukanpaten karena sudah menjadi public domain sejak tahun 2003. 
  • Menggunakan teknik  loselessdan mendukung :
    a) Kedalaman warna 48 bit.
    b) Tingkat ketelitian sampling : 1, 2, 4, 8, dan 16 bit.
    c) Memiliki alpha channel untuk mengkontrol transparency.
    d) Teknik pencocokan warna yang lebih canggih dan akurat. 
  • Diprakarsai oleh Thomas Boutell dari PNG Development Groups, dan versi finaldirelease pada 1 Oktober 1996, 1,5 sejak project berjalan. 
  • Byte ordering : MSB-LSB 
  • Format penamaan file PNG diatur ke dalam suatu urutan blok biner yang disebutsebagai “chunk” (gumpalan), yang terdiri dari :
    a. Length (4 byte), berupa informasi ukuran PNG.
    b. Type (4 byte), berupa informasi nama chunk.
    c.Data (ukuran dinamis), berupa data PNG.
    d.CRC (cyclic redundancy check), berupa CRC-32 untuk pendeteksian error checking pada saat
       transmisi data. 
  • Sedangkan struktur file PNG adalah :
    a. PNG signature : tanda file PNG.
    b. IHDR chunk : menyimpan dimension.
    c. PLTE chunk : untuk PNG yang menggunakan color palette type.
    d. IDAT chunk 1, IDAT chunk 2, IDAT chunk 3, …IDAT chunk-n.
    e. IEND chunk : end of PNG image
3.TEKNIK KOMPRESI JPEG(JOINT PHOTOGRAPIC EXPER TS GROUP)

JPEG biasanya digunakan untuk foto atau citra di website. JPEG menggunakan kompresitipe lossy. Kualitas
JPEG 2000 bisa bervariasi tergantung setting kompresi yangdigunakan. Kompresi JPEG berbasis DCT(Discreete Cosine Transform).
  • Tingkat kompresi yang baik untuk JPEG adalah 10:1-20:1 untuk citra foto, 30:1-50:1untuk citra web, dan 60:1-100:1 untuk kualitas rendah seperti citra untuk ponsel. 
  • Byte order : MSB-LSB. 
  • Tahapan kompresi JPEG :
    a. Sampling adalah proses pengkonversian data pixel dari RGB ke YUV/YIQ dandilakukan down
        sampling.
    b. DCT (Discreete Cosine Transform) adalah hasil dari proses sampling akandigunakan sebagai
        inputan proses DCT, dimana blok 8*8 pixels akan diubah menjadi fungsi matriks cosines.
    c. Quantization adalah proses membersihkan koefisien DCT yang tidak penting untuk pembentukan
        image baru.
4.TEKNIK KOMPRESI BMP(WINDOWS BITMAP)

Biasanya digunakan oleh aplikasi dan system operasi Microsoft Windows. Merupakan kompresilossless. Ukuran sebenarnya untuk n-bit (2n warna) bitmap dalam byte dapat dihitung ukuran file BMP, dimana tinggi dan lebar dalam pixel.Kerapatan titik-titik tersebut dinamakan resolusi, yang menunjukkan seberapa tajam gambar ini di tampilkan, di tunjukkan dengan jumlah baris dan kolom, contohnya 1024×768.Untuk menampilkan citra bitmap pada monitor atau mencetaknya pada printer , komputer  menterjemahkan bitmap
ini menjadi pixel(pada layar) atau titik tinta(pada printer). Beberapa format file bitmap yang populer adalah BMP,PCX danTIFF. 

 5. TEKNIK KOMPRESI TIFF(Tagged Image File Format)TIFF
adalah format gambar yang fleksibel biasanya hanya menyimpan 16-bit per warna merah ,hijau, dan biru untuk total 48-bit atau 8-bit per warna dengan menggunakan nama file atauperpanjangan TIFF TIF. TIFF yang kedua adalah fleksibilitas fitur, dan kutukan, dengan tidak ada satu pembaca semua mampu menangani berbagai jenis file TIFF. TIFF dapat lossy ataulossless. Beberapa jenis TIFF menawarkan kompresi lossless relatif baik untuk tingkat dua(hitam dan putih, tidak abu-abu) gambar. Beberapa tinggi-akhir kamera digital memiliki pilihanuntuk menyimpan gambar dalam format TIFF, menggunakan algoritma kompresi LZW untuk lossless penyimpanan. TIFF format gambar yang tidak didukung penuh oleh web browser, dan tidak boleh digunakan di World Wide Web. TIFF masih secara luas diterima sebagai file foto standar dalam industri percetakan. TIFF adalah mampu menangani perangkat-warna ruangkhusus, seperti yang ditetapkan oleh CMYK tertentu menetapkan pencetakan tekan inks.

B. Standar  Audio
  • Metode Transformasi
    • Menggunakan algoritma seperti MDCT (Modified DiscreateCosine Transform) untuk mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat didengar oleh manusia (20Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz dan 96 dB. 
    Metode Waktu
    • Menggunakan LPC (Linier Predictive Coding) yaitu digunakan untuk speech (pidato), dimana LPC akan menyesuaikan sinyal data pada suara manusia, kemudian mengirimkannya ke pendengar. Jadi seperti layaknya komputer yang berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps
1. Teknik kompresi audio dengan format MPEG (Moving Picture Expert Group)
  • MPEG-1 menggunakan bandwidth 1,5 Mbits/sec untuk audio dan video, dimana 1,2 Mbits/sec digunakan untuk video sedangkan 0,3 Mbits/sec digunakan untuk audio. Nilai 0,3 Mbits/sec ini lebih kecil dibandingkan dengan bandwidth yang dibutuhkan oleh CD Audio yang tidak terkompres sebesar 44100 samples/sec x 16 bits/sample * 2 channel > 1,4 Mbits/sec yang hanya terdiri dari suara saja. 
  • Untuk ratio kompresi 6:1 untuk 16 bit stereo dengan frekuensi 48kHz dan bitrate 256 kbps CBR akan menghasilkan ukuran file terkompresi kira-kira 12.763 KB, sedangkan ukuran file tidak terkompresinya adalah 75.576 KB 
  • MPEG-1 audio mendukung frekuensi dari 8kHz, 11kHz, 12kHz, 16kHz, 22kHz, 24 kHz, 32 kHz, 44kHz, dan 48 kHz. Juga mampu bekerja pada mode mono (single audio channel), dual audio channel, stereo, dan joint-stereo
2. Algoritma MPEG Audio
  • Menggunakan filter untuk membagi sinyal audio: misalnya pada 48 kHz, suara dibagi menjadi 32 subband frekuensi. 
  • Memberikan pembatas pada masing-masing frekuensi yang telah dibagi-bagi, jika tidak akan terjadi intermodulasi (tabrakan frekuensi) 
  • Jika sinyal suara terlalu rendah, maka tidak dilakukan encode pada sinyal suara tersebut 
  • Diberikan bit parity yang digunakan untuk mengecek apakah data tersebut rusak atau tidak (yang mungkin disebabkan oleh gangguan /noise), apabila rusak, maka bit tersebut akan digantikan bit yang jenisnya sama dengan bit terdekatnya.
3. Kompresi Audio MP3
  • Asal-usul MP3 dimulai dari penelitian IIS-FHG (Institut Integriette Schaltungen-Fraunhofer
  • Gesellschaft), sebuah lembaga penelitian terapan di Munich, Jerman dalam penelitian coding audio perceptual. 
  • Penelitian tersebut menghasilkan suatu algoritma yang menjadi standard sebagai ISO-MPEG Audio Layer-3 (MP3)  
 Format Header MP3 File MP3 terdiri atas 2 bagian data:
  • Header : berfungsi sebagai tanda pengenal bagi file MP3 agar dapat dibaca oleh MP3 player yang berukuran 4 byte Beberapa karakteristik yang dibaca komputer adalah bit ID, bit layer, bit sampling frequency dan bit mode. 
  • Data audio : berisi data file mp3 
Teknik kompresi MP3 Beberapa karakteristik dari MP3 memanfaatkan kelemahan pendengaran manusia.
1. Model psikoakustik
  • Model psikoakustik adalah model yang menggambarkan karakteristik pendengaran manusia.
  • Salah satu karakteristik pendengaran manusia adalah memiliki batas frekuensi 20 Hz s/d 20 kHz, dimana suara yang memiliki frekuensi yang berada di bawah ambang batas ini tidak dapat didengar oleh manusia, sehingga suara seperti itu tidak perlu dikodekan.
2. Auditory masking
Manusia tidak mampu mendengarkan suara pada frekuensi tertentu dengan amplitudo tertentu jika pada frekuensi di dekatnya terdapat suara dengan amplitudo yang jauh lebih tinggi.
3. Critical band
Critical band merupakan daerah frekuensi tertentu dimana pendengaran manusia lebih peka pada frekuensi-frekuensi rendah, sehingga alokasi bit dan alokasi sub-band pada filter critical band lebih banyak dibandingkan frekuensi lebih tinggi.
4. Joint stereo
Terkadang dual channel stereo mengirimkan informasi yang sama. Dengan menggunakan joint stereo, informasi yang sama ini cukup ditempatkan dalam salah satu channel saja dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil. Beberapa persyaratan dari suatu encoder/decoder MP3:
  • Ukuran file terkompresi harus sekecil mungkin 
  • Kualitas suara file yang telah terkompresi haruslah sedekat mungkin dengan file asli yang belum dikompresi 
  • Tingkat kesulitan rendah, sehingga dapat direalisasikan dengan aplikasi yang mudah dibuat dan perangkat keras yang ‘sederhana’ dengan konsumsi daya yang rendah
C. Standar  Video 


Standardisasi terhadap kompresi informasi audio-visual diperlukan untuk memfasilitasi pertukaran data berupa video digital secara global. Sebuah standardisasi pengkodean dikatakan efisien bila mendukung algoritma kompresi yang baik dan mengimplementasikan disain enkoder dan dekoder yang efisien. Untuk komunikasi multimedia, terdapat dua organisasi standard yang utama yaitu ITU-T dan International Organization for Standardization (ISO). Selama beberapa dekade belakangan ini, sejumlah standard dari ITU-T dan ISO, seperti MPEG-1, MPEG-2, MPEG-4, H.261, H.263 dan H.264 telah dikembangkan untuk banyak domain aplikasi. Standard-standard tersebut mendefinisikan bitstream dari data audio-visual dan menentukan sekumpulan aturan yang harus dipatuhi dalam pengembangan hardware maupun software untuk solusi kompresi.

1. Standarisasi kompresi video H.261.
Standar H.261 adalah standar yang diterbitkan oleh ITU-T pada tahun 1990. Standar H.261 didesain untuk kompresi video yang akan ditransmisikan melalui jaringan ISDN dengan bandwidth yang diizinkan sebesar px64 kbit/s, di mana p berkisar antara 1 sampai 30. Standar H.261 ini diimplementasikan untuk aplikasi video conferencing dan videophone.
Algoritma pengkodean yang digunakan pada standar H.261 antara lain hybrid of inter-picture prediction, transform coding, dan motion vector. Interpicture prediction menghapus temporal redundancy. Transform coding digunakan untuk menghapus spatial-redundancy. Motion vector digunakan untuk membantu codec dalam mengimbangi gerakan (motion). Untuk menghapus redundansi akibat dari bitstream pengiriman data digunakan variable length coding.
H.261 mendukung dua resolusi yakni QCIF (Quarter Common Interchange Format) dan CIF (Commn Interchange Format).

2.Standarisasi kompresi video H.263
Pada Februari 1995 ITU-T SG15 mengeluarkan standar H.263 yang dirancang untuk penggunaan komunikasi bit-rate namun tidak pernah berjalan dengan baik ketika melalui jaringan POTS (Plain Old Telephone Service). Standar H.263 telah menggantikan standar H.261 untuk video conferencing di beberapa aplikasi dan mendominasi standarisasi untuk beberapa aplikasi internet video streaming sekarang ini. 
Algoritma pengkodean H.263 hampir sama dengan H.261 namun dengan beberapa perbaikan dan perubahan untuk meningkatkan kinerja dan pemulihan kesalahan dalam pengcodingan. Selain QCIF dan CIF yang didukung oleh H.261, standar H.263 mendukung resolusi SQCIF, 4CIF, dan 16CIF. SQCIF memiliki sekitar setengah resolusi dari QCIF. 4CIF dan 16CIF masing-masing adalah 4 dan 16 kali dari resolusi CIF. 

3.Standarisasi kompresi video H.264/AVC
Berdasarkan ISO/IEC 14496-10, Standar H.264/AVC pertama kali diterbitkan pada Mei tahun 2003 dan dibangun berdasarkan pada konsep awal standar seperti MPEG-2 dan MPEG-4 Visual. H.264 menawarkan efisiensi kompresi yang lebih baik yakni kompresi video yang lebih berkualitas dan fleksibilitas yang lebih besar dalam melakukan kompresi, transmisi dan penyimpanan video. Video encoder pada H.264 dapat melakukan prediksi, transform dan proses encoding untuk menghasilkan kompresi bitstream H.264. Sedangkan video decoder H.264 dapat melakukan proses decoding secara lengkap, inverse transform dan rekonstruksi untuk memnghasilkan sebuah urutan video yang telah diencode. Dibandingkan dengan standar seperti MPEG-2 dan MPEG-4 Visual, H.264 memiliki kelebihan antara lain:
a.Kualitas gambar yang lebih baik pada bitrate kompresi yang sama
b.Kecepatan bit kompresi yang lebih rendah untuk kualitas gambar yang sama.
Standar H.264 menawarkan fleksibilitas yang lebih besar dari segi kompresi dan transmisi. Sebuah encoder H.264 dapat memilih dari berbagai jenis alat kompresi, sehingga cocok untuk aplikasi mulai dari bitrate rendah hingga transmisi HDTV ke konsumen televisi.

4. Standarisasi kompresi video Moving Pictures for Digital Storage Media (MPEG-1)
MPEG-1 merupakan generasi pertama video codec yang diusulkan oleh Motion Pictures Expert Group sebagai sebuah standar video coding untuk Digital Media Storage (DSM) seperti CD, DAT, Winchester Disc, Optical Drive. Pengembangan standar ini mendapat respons positif dari dunia industri, yang membutuhkan cara efisien dalam penyimpanan informasi visual pada sebuah media penyimpanan (storage media). Hal ini berbeda dengan cara konvensional sebelumnya yang menggunakan Video Cassette Recorder (VCR). Sistem coding MPEG-1 didasarkan pada pemindaian image (gambar) secara progresif sehingga interlaced video dikonversi terlebih dahulu ke dalam format non-interlaced sebelum proses coding. Setelah proses coding, image yang telah didecode akan dikonversi balik menjadi format interlaced untuk ditampilkan. 

5. Standarisasi kompresi video Moving Pictures for Digital Storage Media (MPEG-2)
Standar MPEG-2 diperuntukkan bagi berbagai macam aplikasi pengkodean audio-visual. Aplikasi tersebut antara lain broadcast TV, satellite/cable TV, video on demand serta HDTV. Target bit rate untuk kompresi MPEG-2 berkisar antara 4 Mbps hingga 10 Mbps serta tahan terhadap error untuk broadcasting dan jaringan ATM.
Sistem coding MPEG-2 didasarkan atas pemindaian gambar/image secara progresif dan interlaced frame coding sehingga format interlaced video tidak perlu lagi diubah ke format non-interlaced.
Bit stream video dan audio yang telah terkompresi dapat digabung ke dalam single stream atau multiple stream yang cocok untuk media penyimpanan interaktif atau untuk ditransmisikan melalui kanal komunikasi.
Standar MPEG-2 mendefinisikan dua tipe stream, yaitu program stream dan transport stream. Program stream sama dengan sistem stream pada MPEG-1 tetapi memiliki tambahan fungsi-fungsi baru yang tidak dimiliki oleh MPEG-1, seperti scrambing data. Sedangkan transport stream untuk transmisi melalui kanal komunikasi. Selain itu, struktur dasar sebuah paket untuk program stream dan transport stream
diorganisasikan dengan sebutan Packetised Elementary Stream (PES) packet.
Di sisi penerima, transport stream dan program stream di-decode kembali oleh transport/program demultiplexer, unpacketised oleh sebuah depacketiser dan kemudian video dan audio akan diproses oeh sebuah decoder. Sinyal informasi yang telah di-decode akan dikirim ke buffer dan siap untuk ditampilkan melalui video output atau audio output.

6. Standarisasi kompresi video Moving Pictures for Digital Storage Media (MPEG-4)
MPEG-4 merupakan standar untuk kompresi video, transport, dan object oriented framework yang didesain untuk mendukung aplikasi video digital konvensional maupun interaktif yang mempunyai bit rate berkisar dari 5 Kbps hingga 4 Mbps. MPEG-4 menyediakan fungsi-fungsi baru untuk content authoring dan peningkatan fleksibilitas. MPEG-4 menggabungkan gambar alami dengan gambar sintetis, mendukung interaksi tingkat tinggi dengan user, dan mengakomodasi semua tipe dan teknologi jaringan. MPEG-4 menggabungkan dua set algoritma inti, yaitu VLBV core (Very Low Bit rate Video) yang didesain untuk bit rate 4,8 hingga 64 Kbps hingga 4 Mbps. Standar MPEG-4 memungkinkan jangkauan aplikasi yang sangat luas seperti interactive mobile multimedia communications, videophone, mobile audiovisual communications, multimedia electronic mail, remote sensing, electronic newspaper, interactive multimedia databases, multimedia videotext, games, interactive computer imagery, sign language captioning. Setiap objek dalam layer disegmentasi ke dalam sejumlah bentuk citra yang dinamakan VOP (Video Object Plane). VOP berurutan yang dimiliki oleh objek fisik yang sama dinamakan Video Object (VO). Pengkodean VOP untuk masing-masing VO diperlakukan sama dengan teknik pengkodean MPEG-2.




 

 

0 komentar:

Blog Archive

About Me

Diberdayakan oleh Blogger.