Videocoderingstechnologie geeft prioriteit aan het elimineren van ruimtelijke en temporele redundantie. Laat me je nu voorstellen welke methode er wordt gebruikt: de video wordt gevormd door continue weergave van verschillende frames.
Deze frames worden hoofdzakelijk verdeeld in drie categorieën: I-frames, B-frames en P-frames. I-frame is een onafhankelijk frame met al zijn eigen informatie, wat het meest complete beeld is (dat de grootste ruimte inneemt) en onafhankelijk kan worden gedecodeerd zonder te verwijzen naar andere afbeeldingen. Het eerste frame in de videosequentie is altijd het I-frame. P-frame, "inter frame prediction encoding frame", vereist verwijzing naar verschillende delen van het vorige I-frame en/of P-frame om te coderen. Het P-frame is afhankelijk van de vorige P- en I-referentieframes. De compressiesnelheid van het P-frame is echter relatief hoog en neemt minder ruimte in beslag.
B-frame, "Bidirectional Predictive Encoding Frame", waarbij frames voor en na worden gebruikt als referentieframes. Niet alleen verwijzend naar de voorkant, maar ook naar de frames erachter, dus de compressieverhouding is het hoogst, met een bereik van 200:1. Het is echter niet geschikt voor realtime transmissie (zoals videoconferenties) omdat het afhankelijk is van volgende frames.
Door frames te classificeren kan de grootte van de video aanzienlijk worden gecomprimeerd. Het aantal te verwerken objecten is immers aanzienlijk afgenomen (van de hele afbeelding naar een regio binnen de afbeelding).
Als je een pakket uit de videostream pakt, kun je ook de informatie van het I-frame zien
Als we altijd op basis van pixels rekenen, zal de hoeveelheid data relatief groot zijn. Daarom verdelen we de afbeelding meestal in verschillende "blokken" of "MacroBlocks" en berekenen deze. Een macroblok is over het algemeen 16 pixels bij 16 pixels.
De verwerking van I-frames gebruikt de intra-frame-coderingsmethode, waarbij alleen de ruimtelijke correlatie binnen de afbeelding van dit frame wordt gebruikt. De verwerking van P-frames gebruikt inter-frame-codering (schatting van voorwaartse beweging) terwijl ruimtelijke en temporele correlaties worden gebruikt. Simpel gezegd, met behulp van bewegingscompensatiealgoritmen om overbodige informatie te verwijderen











