Videobase

Standards de compression vidéo

CD et DVD

Sur les CD et les DVD l’information vidéo est ’écrite’ en bit. Un fichier (file) vidéo occupe beaucoup d’espace, c’est à dire de MegaByte (1Mb = 1.048.576 bit), il a donc fallu créer des systèmes de compression (codec) vidéo lossy (= c’est à dire qu’on perd des données par rapport à l’original) afin d’insérer toujours plus de temps en image avec une meilleure qualité, dans des formats comme le CD et le DVD.

Il est né ainsi le MPEG-1, qui permettait de transférer sur un CD (650 MB) une heure de vidéo avec une qualité comparable à celle d’une VHS.

Ensuite, il est né le MPEG-2, projet destiné aux émissions TV (broadcast) et utilisé pour l’archivage des films sur DVD (DVD Video), qui offre une qualité supérieure par rapport au précédent format et en même temps permet de créer des fichiers (files) plus lourds.

Pour les ordinateurs, il a été plus cohérent d’utiliser un système progressif : chaque séquence (frame) est lue entièrement et de façon séquentielle en une seule fois ; il est possible de gérer ce système de lecture progressive avec MPEG-2 et avec son successeur MPEG-4 aussi.

La séquence (frame) du DVD Video a une résolution ( = nombre de pixel par unité) de 720X576. L’image vidéo, à elle seule, peut se classer selon différentes proportions (ratio*) entre largeur et hauteur d’image, le plus souvent : 1,85:1 / 1,33:1 et surtout 2,35:1.

Il ne faut pas confondre l’aspect ratio (*) de l’écran (4:3, 16:9) avec celui des images (1,85:1, 1,33:1, 2,35:1).

Chaque DVD Video est optimisé pour être vu sur un écran TV (4:3) ou sur un écran panoramique (16:9), les modes de disposition des pixels dans l’image (720X756) varient donc beaucoup.

L’aspect ratio (*) 1,33 est optimisé par l’écran TV 4:3 (4/3 = 1,33).
Les pixels, disposés dans l’image (frame), correspondent à la vision qui en résulte.

Les formats 1,85:1 (Flat) et 2,35:1 (CinemaScope ou Panavision) sont les plus utilisés pour les DVD Video (cinéma) et sont optimisés pour les écrans 16:9. Ceux-ci, avec peu d’exceptions, ont - dans l’image - une disposition des pixels particulière, grâce à une technique dite d’anamorphose. On appelle film anamorphique les vidéos optimisées pour le ratio 16:9.
A part le widescreen (écran panoramique) anamorphique (on voit l’image selon le format qui correspond au ratio de sa production), il existe le "widescreen letterbox", utilisé pour voir correctement sur un écran TV 4:3 les images d’une vidéo optimisée pour les écrans 16:9, c’est à dire que l’image originelle anamorphique n’est pas ’dilatée’ à l’horizontale lors du visionnage, mais elle est comprimée en vertical et des bandes noirs sont ajoutées en haut et en bas.

LA COMPRESSION VIDEO

La compression vidéo est une technique spécifique à la sauvegarde des données sur un fichier, selon cette technique un signal qui peut être interprété comme une série de nombres (soit en tant que flux de paroles, de musique ou d’images) est ’comprimé’ dans un ensemble numérique plus petit.

Cette deuxième série de nombres, qui est plus petite, pèse moins donc elle occupe moins d’espace sur le disque dur/mémoire et demande moins de temps pour son transfert en réseau Net.

Cette deuxième série de nombres, avant d’être lue à nouveau, est ’décomprimée’ par un signal similaire à celui d’origine.
Il s’agit d’un processus de réduction de la bande passante ou de la vitesse du flux de données vidéo.

La compression est considérée comme une opération qui met à l’écart ou perd certaines parties contenues dans l’information originelle : les séries numériques reconstituées ne correspondent pas exactement aux série originelles. Cette perte de définition peut être acceptable s’il s’agit d’une restitution imparfaite des définitions des détails de l’image comprimée ; la mesure d’efficacité d’une compression est donnée par le niveau de qualité atteint avec le minimum de perte et de distorsion des images.

Il y a différents motifs pour choisir de comprimer une vidéo, mais le plus évident c’est le poids/temps/coût d’un transfert de données.

Il faut constater que la plateforme de transfert la plus éfficace, donc plus véloce
-  pour l’instant - reste le réseau Net, il est donc évident que pour travailler en réseau sur une échelle mondiale les supports analogiques (VHS, films, Beta, etc.) seront substitués par des supports digitaux qui, à la base, utilisent les technologies du Net.
La vitesse de transfert des données dépends de plusieurs facteurs (un grand nombre) et - surtout - de l’évolution technologique de la trasmission numérique.

Un modem "vieux style" ou un téléphone portable peut transférer jusqu’à 9600 bit/sec, tandis que la fibre optique a une vitesse de quelques Gb (milliards de bit/sec).

COMMENT çA MARCHE :

1 byte = 8 bits 1 kilobyte = 1,024 bytes 1 megabyte = 1,024 kilobytes 1Mb (megabyte) = 8 millions di bit

Un signal vidéo broadcast digital non comprimé utilise, approximativement, 160 millions de bits (= 20 Mb) par séconde.
En le comprimant, le même signal broadcast peut avoir jusqu’à 1 megabit (0,12 Gb) par seconde. Dans un format de basse qualité, en VHS par exemple, on peut mesurer (en datarate*) encore plus bas.

Afin de réduire le poids d’informations à mémoriser il faut, avant tout, en éliminer certaines :
-  les données qui se reproduisent dans la même image (frame)
dans une image, les pixels ’voisins’ ont les mêmes caractéristiques de luminosité et de couleur. Le compresseur fait la synthèse et élimine les "rédondances" spatiales (persistance spatiale)*

-  les données qui se reproduisent dans la séquence des images
dans les séquences d’images il y a une forte probabilité (sauf s’il s’agit de séquences différentes ou de séquences où le mouvement est rapide) de répérer des zones avec les mêmes couleurs et la même luminosité, le compresseur vidéo intégrera ces données et éliminera la rédondance temporelle (persistence temporelle)*

-  les données vidéo qui ne sont pas lisibles par l’oeil humain
les valeurs de couleur et de luminosité de l’image (qui sont élaborés en la décomposant en petits blocs carrés de pixel, normalement en 16X16 ou bien 8X8)sont converties selon les valeurs des fréquences vidéo correspondantes par le biais de la fonction appelée DTC.
En général, les hautes fréquences, ’non visibles’ dans les séquences animées (ex : déplacement rapide de la fumée, mouvements dus au vent, très petits objets), peuvent être éliminées avec la "quantisation" ; une grande "quantisation" a pour effet la perte d’informations, donc une moins bonne qualité de la restitution.

Suite à la compression des données, les autres informations peuvent être comprimées en utilisant des techniques dites "lossless" (sans pertes).
Ces techniques sont en général dénommées "codification de l’entropie".
L’entropie est une mesure mathématique de la quantité d’information contenue dans une série de nombres ou d’autres symboles : la mesure du contenu intrinsèque de l’information peut donc être utilisée pour calculer la quantité de compression théorique applicable à la série numérique, mais la mesure de l’entropie ne dit rien sur comment obtenir cette compression possible.
Beaucoup de techniques (arithmétiques) ont été dévélopées à partir de cette mesure, elles travaillent toutes pour substituer des séries de symboles avec un seul symbole, ou sur la substitution des symboles qui nécessitent une grande quantité de bits (nombres binaires) avec des symboles qui démandent moins de bit pour être représentés. Ces substitutions de symboles sont pilotées par le calcul de l’entropie pour chaque symbole dans le flux des données.

Typologie des images (frame)

Les images vidéo comprimées peuvent être de type ’I’ (Key Frame), ‘P’ (Predicted Frame) et ‘B’ (Frame ‘Bidirectional’) :

-  Le key frame est une image mémorisée intégralement et comprimée de laquelle dérivent (sont crées) les successifs p-frame et b-frame. Les nouveaux codecs en insèrent un à chaque changement de séquence.

-  Le predicted frame mémorise seulement les differences par rapport à l’image (frame) qui le précède, donc il utilisera trés peu d’information.

-  Le b-frame archive les différences par rapport à l’image (frame) précedente et à celle qui suit (il sera donc utilisé moins d’informations par rapport au p-frame).

Plus de key-frame dans une vidéo augmente la qualité (et la dimension), plus de b-frame vont réduire l’espace occupé mais aussi la qualité.







(CC)
Syndication
  • Vidéos (rss0.91)
  • Documentation (rss0.91)
  • Vidéos (rss2.0)
  • Torrents (rss2.0)

  • -->