INDUSTRY OPINION: Produktionsmetoder, HDR & bildfrekvens
”Ett accepterat regelverk skulle hjälpa branschen”
Text: Mats Jungner
Foto: Ellenhill Teknik, Edward M. Noll, Sony & NHK
Vi lever i en mediavärld som ställer helt andra krav på planering av produktion nu och i framtiden än för inte så väldigt länge sedan. Bildfrekvens är en parameter men det finns mycket mer att beakta. I den här artikeln kommer Mats Jungner reda ut just denna parameter och andra kritiska punkter.
För 20 år sedan var det lätt att bestämma sig för hur man tekniskt skulle gå tillväga för att göra en viss typ av produktion för tv. Det analoga PAL-systemet var standard och bildfrekvensen var 50 Hz, det vill säga en bildhastighet på 25 fps uppdelat i 50 fields interlaced scanning. tv-apparaterna var mellan åtta och 28 tum och alla hade de samma grundläggande typ av bildrör. Det var bara att välja kameratyp och bandmaskinstandard och sedan körde man på.
I dag finns ett otal standarder av bildfrekvenser och man kan välja mellan progressive eller interlaced scanning. Vidare finns olika samplingsstandarder. Ska man filma RGB 4:4:4 eller YCrCb 4:2:2, eller rent av YCrCb 4:2:0? Vilken typ av codec är bäst lämpad? Eller ska man välja RAW-format och sedan efterbearbetning av colorist? Ska man välja en modern storsensorkamera med till exempel S-log så att man kan fånga 14 bländarsteg och sedan krympa det till sex bländarsteg med efterbearbetning? Hur ska materialet publiceras? Ska ett distributionsföretag komprimera ner materialet till några få megabit per sekund? Sist, men inte minst, vilken sorts display ska det visas på – mobilen, hemma-tv:n eller en 9x16-meters skärm på en sportarena? Vilka hänsyn till displayteknik måste jag ta vid produktion? LCD-, LED- och OLED-skärm har alla helt olika egenskaper.
Jag efterlyser någon form av riktlinjer som hjälp för både produktionsbolag och beställare. Hur ska man som beställare av till exempel reklamfilm kunna avgöra vilken metod som är lämplig och också ekonomiskt rimlig med all teknisk mumbo jumbo? Jag tror att hela branschen skulle dra en lättnadens suck om man med erfaren produktionspersonal och teknisk personal gjorde en genomgång av vad de senaste årens utveckling verkligen innebär i praktiken. Sedan kunde man ta fram riktlinjer. Kanske en form av produktionsmanual? Jag bollar frågan vidare!
Bildfrekvens
Bildfrekvens är en av alla parametrar att ta hänsyn till. Vi står dessutom inför en stor omvälvning i tv-världen i och med att vi redan nu har dubblerat upplösningen både horisontellt och vertikalt (UHD*). Och snart kommer att ha olika varianter på implementering av High Dynamic Range (HDR) och Wide Color Gamut (WCG) i våra tv-system. Det finns också många olika bildfrekvenser i tv-media. Bildfrekvensen är en viktig parameter som kommer att få större betydelse i nya tekniker.
De bildfrekvenser vi använder i dag
Det är viktigt att skilja på flimmerfrekvens och bildfrekvens. Flimmerfrekvens betyder hur många bildrutor som visas varje sekund. Bildfrekvens betyder ursprungligen hur många gånger bilden förändras varje sekund. Anledningen till den här åtskillnaden är att kemisk film en gång i tiden fick standarden 24 bilder per sekund.
Biografprojektorn, däremot, visade 48 bilder per sekund. Projektorn ryckte nämligen fram en bild och visade den två gånger med hjälp av en roterande slutare. Kemisk film är dyr eftersom den innehåller silver och man strävade därför bland annat efter att hålla förbrukningen av råfilm nere. Det beslutades efter tester på 1920- och 1930-talen att standardisera bildfrekvensen till 24 Hz. Det var den lägsta bildfrekvens som var acceptabel ur flera perspektiv. Människan har till exempel en lägsta flimmertröskel att ta hänsyn till som ligger på ungefär 48 Hz vid ett ljus från skärmen på ungefär 50–80 cd/m² (NIT**). Det var också den lägsta hastighet på filmmatningen som kunde accepteras av dåtidens optiska ljudsystem. Man uppnådde cirka 8 kHz bandbredd på ljudet vilket var ungefär det bästa som också AM-radio förmådde att återge på den tiden.
Med den här begränsningen ställdes stora krav på filmfotograferna. De tvingades lära sig panorera långsamt så att man inte skulle se ryckigheten som ofelbart infinner sig vid så låg bildfrekvens. Man tog också hjälp av kort skärpedjup – man följde personen som rörde sig i fokus medan oskärpan på bakgrunden effektivt maskerade ryckigheten. Ljuset på filmduken begränsades till max 50 cd/m² och ljuset i salongen släcktes helt. Det gäller än i dag. Allt för att maskera den låga temporala upplösningen (bildfrekvensen).
Bildfrekvensen i tv
50 Hz i Europa och 60 Hz i USA kom till på 1940-talet. De gamla kamerarören Iconoscope och Image Orthicon hade egenskapen att de stördes av nätspänningen från glödtråden i kameraröret som matades via nätspänning. Man låste då bildfrekvensen till nätspänningen, så var det fixat och standarden satt. I dag är förutsättningarna annorlunda och det hade varit bättre att ha en världsstandard på till exempel 60 Hz.
Videostandarden 24p, det vill säga 24 enskilda bilder i sekunden, kom enbart till för att kunna överföra video till kemisk biofilm där den skulle visas på projektorer som hade 48 Hz flimmerfrekvens. För cirka 25 år sedan började videotekniken kunna matcha filmens då överlägsna upplösning och överlägsna dynamik med nya moderna CCD-kameror och senare CMOS-kameror. Det blev plötsligt möjligt att göra elektroniska manipulationer och dataanimeringar för att sedan överföra dem till film. Det sparade tid och pengar i produktionen av filmer som till exempel Stjärnornas krig, som var en av de första att dra nytta av elektroniska bildeffekter. 24p har alltså ingenting med videoproduktion och videosändningar att göra, utan var ett sätt att anpassa video till kemisk biofilm.
25/30p
Att 25/30p blivit de facto-standard beror på två saker: Dels blir kamerorna ljuskänsligare (exponeringstiden blir dubbelt så lång som vid 50 Hz), dels spar man bandbredd. Man tar helt enkelt bort halva informationsmängden (halverar bitrate). Det finns också konstnärliga synpunkter. Till exempel kan rörelseoskärpan påverkas negativt, vilket gör resultatet mera ”filmlikt”.
Nästan alla videokameror, både konsument- och pro-varianter, har nu för tiden 25p som menyval. Men det betyder inte alltid 25 bilder per sekund progressiv upptagning, utan 25 bilder Progressive Segmented Frame (PsF), alltså interlaced video i 1080i där delbild 1 och 2 har samma information: 50 rutor flimmerfrekvens och 25 rutor bildfrekvens. Som på bio fast med interlace-teknik. De allra flesta videokameror förutom de som är avsedda för att spela in Digital Cinema Film är konstruerade på det här sättet.
Interlace
Interlace var en briljant lösning för att spara bandbredd (kompression 1:2) och för att kompensera för bildrörens efterlysning i fosforskiktet på bildskärmen på 1950-talet. I dag ter sig den standarden något förlegad och ger inte lika bra bildresultat som progressiv scanning.
PsF
PsF var en briljant lösning för att överföra biofilm till video på 1900-talet. Man ökade hastigheten från 24 till 25 bilder per sekund på filmen och överförde den på så vis till interlaced video med samma information i delbild 1 och 2. Filmen blev dock lite kortare och rösterna lät aningen pipigare på grund av det optiska ljudets högre läshastighet. Senare fick man processorer med audio synthesis-funktion, som kunde återställa ljudfrekvenserna trots den lite högre hastigheten på filmen.
23,976/29,97/59,94 Hz
För att göra historien om bildfrekvenser komplett tar jag även med de amerikanska ”avarterna” 23,976/29,97/59,94 Hz.
När färg-tv-systemet NTSC introducerades i USA 1953 visade det sig att färginformationen i videosignalen störde ljudmoduleringen i sändarna. Man kunde inte bara se färgen, man kunde också höra den som ett interferensbrus i ljudet.
För att avhjälpa det och slippa modifiera alla gamla svartvita tv-apparater och även sändarutrustningar i USA kom man på att man kunde dela bildfrekvensen (60 Hz) med en faktor 1,001. Det kunde både tv-apparaterna och sändarna hantera utan modifiering och det resulterade i att de så kallade bärvågorna för färginformation och ljud inte störde varandra. En elegant teknisk lösning 1953 och en fullkomlig pest i dag då man måste fortsätta med bildfrekvenserna för att vara bakåtkompatibel.
Tidkoden i NTSC blev också synnerligen intressant med så kallad Drop Frame. Förklaringen till det får dock anstå till en annan artikel av utrymmesskäl.
Hur människor reagerar på olika bildfrekvens
Nu börjar vi närma oss pudelns kärna! Människans synförmåga har egenskaper som man måste ta i beaktande vid filmproduktion. Våra ögon förmedlar bildinformationen till hjärnan på mellan 0,15 och 0,30 sekunder. Vårt färgseende skiljer sig från vårt svartvita seende, därav spannet. Färgseendet (fotopiskt seende) är något snabbare än det svartvita (skotopiska), eftersom det skotopiska seendet processas under längre tid på näthinnan. Bilden har en varaktighet i hjärnan på cirka 0,1 sekunder innan den så att säga ersätts av en ny bild. Efterlysning kan man kalla det (som inte ska förväxlas med efterlysningen på näthinnan).
Det här fenomenet är beroende av hur ljus bilden är och hur ljust det är i omgivningen runt bildskärmen. Man kan beskriva det i en graf över människans uppfattning av temporal bildfrekvens kontra kontrastkänslighet. Figuren intill visar att ökat ljus på skärmen bidrar till ökad uppfattning av flimmer.
High Dynamic Range (HDR)
High Dynamic Range (HDR) kommer med sitt högre ljusutbud att kräva betydligt högre bildfrekvens. 100 och 120 Hz är föreslagna i ITU-BT Rec. 2020. Även Wide Color Gamut-tekniken (WCG) påverkar intrycket. Dagens tv-apparater med standarden Rec. 709 klarar ungefär 100 till uppåt 250 cd/m². Den nya standarden ger möjlighet till 10 000 cd/m²!
En brasklapp dock: På grund av människans olinjära ljusuppfattning är det faktiskt inte så mycket som det ser ut på pappret. Vår ljusuppfattning följer ungefär en logaritmisk kurva. Vi är alltså mycket känsligare för ljusförändringar i mörkare miljö och mörkare bilder än i ljusare. Dessutom finns det ännu ingen tv-apparat eller monitor som kommer så värst mycket högre än 500–1 000 cd/m² med dagens LCD-teknik. OLED-tekniken har för närvarande en begränsning vid 600–700 cd/m². Men OLED-skärmar har å andra sidan betydligt bättre egenskaper än LCD-skärmar i svagt ljus och skillnaden i dynamik blir därför inte så stor som det ser ut på pappret.
Sedan har vi LED-skärmar. Med LED-skärmar menar jag inte de tv-apparater som radiohandeln kallar LED-TV, som är en LCD-skärm med LED-ljus bakom, utan de stora LED-skärmar som ofta används utomhus. De klarar betydligt högre ljus, men jag har tyvärr inte några detaljerade data.
En annan faktor att ta hänsyn till är att ju ljusare omgivningen är där skärmen står, desto känsligare är vi för flimmer från skärmen. Det är därför dataindustrin tidigt använde minst 60 Hz men även 72 Hz (3 x 24 Hz), 85 Hz och 100 Hz. Datorskärmarna skulle ju stå i ljusa kontorslandskap och visa till exempel Worddokument, och man var därför tvungen att ta till högre bildfrekvens för att användarna inte skulle störas av flimmer.
Progressive scanning var naturligtvis standard redan från början på datorskärmar och grafikkort för att undvika flimmer från interlace-tekniken.
Hur de nya standarderna påverkar produktionssättet
UHD-tv, med sin upplösning på 3840 x 2160 pixlar jämfört med 1920 x 1080p, är faktiskt inte så revolutionerande för vanligt hemmabruk som man skulle kunna tro. Anledningen är att man måste sitta väldigt nära skärmen för att verkligen kunna se den högre upplösningen. Figuren intill visar på förhållandet.
UHD kommer att vara viktig i produktionsledet då man kan fotografera stora utsnitt i UHD och zooma elektroniskt och därmed välja bildutsnitt i efterbearbetning. I sportproduktion kan man zooma live i den högre upplösningen UHD och sedan sända i HD vilket ger nya intressanta produktionsmöjligheter.
HDR-teknik (High Dynamic Range) är också en stor fördel i sportproduktion. Där har man sällan kontroll över ljusförhållanden i utomhustagningar. Och där är det till exempel värdefullt att kunna fotografera en fotbollsmatch när ena halvan av planen ligger i skugga och den andra i solsken. I sådana sammanhang kommer det att vara viktigt att producera med hög bildfrekvens och inte bara för slow motion-upptagningarna.
HDR och WCG kommer också att innebära en förändring för våra hemmamottagare så småningom eftersom skillnaden i bildkvalitet är mycket stor jämfört med dagens signal-standard ITU-BT Rec.709.
Skillnader i monitorteknik
LCD-baserade tv-apparater och monitorer har relativt lång reaktionstid för ljusförändringar. Ljuset ska ju polariseras om för att kunna passera de två polarisationsfiltren och det innebär att LCD-teknik är väldigt förlåtande mot låg bildfrekvens – tv:n själv skapar viss rörelseoskärpa. LCD maskerar därför ryckigheten i 24/25p i till exempel en relativt snabb panorering. Nu finns det olika LCD-tekniker och somliga är betydligt bättre än andra, men problemet är generellt.
OLED är raka motsatsen. Tv-apparater med OLED-teknik är blixtsnabba tack vare att de har individuella lysdioder direkt på skärmen. Sony har till och med infört en anti-flicker-funktion på sina monitorer som slöar ner monitorns reaktionstid för att man inte ska störas av interlace-flimmer vid 50 Hz. Men OLED skiljer sig ändå från LCD och kan obarmhärtigt avslöja en låg bildfrekvens. 25p är ofta svårt att visa på en OLED-skärm utan viss ryckighet och strobe-effekt om det är snabba rörelser i bild. Det är verkligen något att ta i beaktande när man planerar en produktion. Att fotografera en nyhetsuppläsare som sitter still går fint, men att fotografera eller sända till exempel en ishockeymatch i 25p är inte lika roligt. I synnerhet inte om man ser det på en tv med OLED-skärm.
Slutsats
Vi lever i en mediavärld som ställer helt andra krav på planering av produktion nu än för inte så väldigt länge sedan, och kommer att ställa helt nya krav i framtiden vartefter tekniken implementeras. Bildfrekvens är bara en parameter, men det finns mycket mer att beakta. Det gör det svårt att ta beslut både för produktionsbolag och beställare. Det handlar naturligtvis i slutändan om tid och ekonomi, såväl som kvalitet. Ett enkelt och genomtänkt regelverk skulle hjälpa till att förenkla för branschen som helhet.
* Ofta kallar vi UHD för 4K, men jag skiljer på dem eftersom UHD är 16:9 och 4K är 17:9 och därmed ett cinema-format och inte avsett för television.
** Beteckningen NIT kommer av det latinska uttrycket Nitere, som betyder blänka/glänsa. Det användes tidigt i videosammanhang innan SI-standarden var satt.
Källor
Watkinson: Compression in Video and Audio
Scientific report: Evaluation of Critical Flicker-Fusion Frequency Measurement: Methods for investigation of Visual Temporal Resolution.