INDUSTRY OPINION: Nya webbdirektiv 2019
Information för alla
Text: Johan Skaneby
Foto: Johan Skaneby & Andrea Piacquadio
Att kommunicera är hårdvaluta idag. Det spelar inte så stor roll hur bra din tjänst eller produkt är, eller hur viktig och intressant din information är, om du misslyckas med att kommunicera ditt budskap. Det kan tänkas vara en enkel utmaning? Vem som helst kan ju skriva vad som helst och nå ut till vem som helst på jordklotet. Jo visst är det så, men det är ju samtidigt en del av utmaningen här. I dagens mediebrus där alla kan kommunicera med alla så ökar kraven på själva kvaliteten i kommunikationen för att just ditt budskap ska nå ut. Ur ett samhällsperspektiv behöver kommunikation vara tillgänglig för alla som lever i samhället och som behöver informationen. Då räcker det inte med kvantitet – vi behöver även definiera vår kommunikation kvalitativt så att viktig information ska bli tillgänglig för alla.
Den 2:a december 2016 beslutade EU om ett tillgänglighetsdirektiv för offentliga webbplatser. “Myndigheter, landsting, kommuner och andra aktörer som klassas som offentligrättsliga organ, det vill säga aktörer som anses vara en upphandlande myndighet, med några undantag, ska uppfylla kraven, och även vissa privata aktörer som utför tjänster med offentlig finansiering.” kopierat från webbriktlinjer.se.
Vi ska skall titta lite närmare på direktivet och DOS-lagen (Lag (2018:1937) om tillgänglighet till digital offentlig service) ur ett mediaproduktionsperspektiv – här finns nämligen mycket nytt att lära sig och att använda sig av.
Webben i vardagen
Alla har vi haft problem med en webbsida vid något tillfälle. Det kan vara rena gränssnittsfel där det inte framgår tydligt vad för information som efterfrågas. Kanske hittar du inte det du söker för att du inte stavat exakt rätt, inputfält som inte svarar med mera. Dessa problem har blivit en del av vardagen som de flesta av oss i bästa fall kan arbeta oss runt – men inte alla. Det finns grupper av människor i vårt samhälle som på grund av olika anledningar har extra svårt att tillgodogöra sig av den information som finns på skärmen på det viset som vi övriga är vana vid. Förutom att äldre människor kan ha både nedsatt syn och hörsel så lever grupper av människor i vårt samhälle med olika typer av funktionsnedsättningar – och det handlar i många fall inte bara om syn och hörselnedsättning, utan även fysiska och psykiska.
I definitionen av det nya direktivet finner vi en lång lista med funktionalitet som en sida skall uppfylla för att AA-kraven för webb-direktivet ska uppfyllas. Allt ifrån att beskriva bilder med text till att erbjuda alternativ för komplexa fingerrörelser.
Hela listan återfinns på webbriktlinjers hemsida. Spelare och plattform skall uppfylla nivån enligt modellen WCAG 2.1 AA. Screen9:s spelare, som vi ska läsa om senare i artikeln, uppfyller nivån WCAG 2.1 AA och då ingår alltså all funktionalitet.
Det vi ska titta lite närmare på är hur våra offentliga myndigheter och organisationer måste förhålla sig till video på webben från och med 23/9 2020. Ur ett användarperspektiv behöver video på webben göras tillgängligt på flera vis.
I direktivet framgår att all media som publiceras på webbplatser inklusive webbspelare från och med 23/9 2020 skall undertextas på svenska. Detta gäller våra myndigheter och offentliga organisationer, inklusive de privata aktörer som verkar inom dessa områden. En privat skola måste alltså också anpassa sin verksamhet efter webbdirektivet. Att notera är att detta gäller inspelad video. Inte direktsänd video som av förklarliga skäl är betydligt mer komplicerat. Den 23 september 2021 gäller samma sak även för mobila applikationer.
Undertextning är en tidskrävande process, där människor med kunskaper om tekniken och verktygen kommer att efterfrågas i allt högre grad. På myndigheters och andra offentliga organs platser finner vi idag inte bara korta informationsfilmer, utan även betydligt längre information i seminarieform. Särskilt i universitetsvärlden. Andra exempel är internkommunikation och e-learning.
Var och en förstår ju att det kommer att krävas betydande resurser bara för att uppfylla delen i direktivet som begär textning av video. Så hur ska vill hinna? Var ska vi få resurser i från? Det står ju helt klart att den klassiska metoden att anlita undertextningsföretag för att hinna i kapp kommer att bli alltför resurskrävande. En uppgift gör gällande att man får räkna med åtta timmars arbetsdag för att undertexta en timme. Räkna på det en stund och återkom.
Tal till text och maskininlärning
Ingen har väl undgått nyheter om utvecklingen och den påföljande debatten inom AI, eller maskininlärning som är ett bättre ord här. Just det problemområde vi har beskrivit kan bli ett av de många områden där maskininlärning i närtid faktiskt kan vara till stor nytta.
Det handlar alltså om att automatiskt översätta svenskt tal till svensk text – en teknik som funnits länge, men som kanske inte imponerat så mycket alla gånger.
Maskinerna är ju världsmästare på att räkna på given data – det vet vi, men när det handlar om att förstå människor, vårt tal, våra gester, vår humor med mera – då ställs maskinerna inför något oerhört mycket svårare. Forskare har sedan länge förstått att det inte går att ”programmera” en sådan kapacitet som vi är vana vid. Istället måste vi hämta inspiration från naturen och låta maskinerna lära sig själva och utvecklas genom sina misstag.
Väldigt förenklat går det till så, i detta fall, att en maskin tolkar en talad text, resultatet jämförs med facit och får ett värde. Men inte bara värdet rätt eller fel – utan även ett värde på en skala. Maskinen kan ha, låt säga 23 procent rätt på sitt första försök – kanske eftersom den klarade några ord, men inte alla.
Om vi nu tänker oss att vi skickar in miljontals liknande uppgifter och låter maskinen lära sig genom att behålla de resurser i koden som gav de 100 bästa tolkningarna och sen skickar in en miljon uppgifter till för en ny övning så får vi via kontinuerliga justeringar av koden ett resultat som blir träffsäkrare. Enkelt beskrivet så låter vi en självlärande algoritm utvecklas och förbättras.
En datorexpert inom området AI skulle inte vara helt nöjd med detaljerna i min förklaring, men det viktiga är att förstå den bakomliggande principen för den här typen av maskinförståelse som återkommer i en mängd områden idag.
Varför är det viktigt att förstå denna bakomliggande teknik då? Jo, det är viktigt eftersom vi då förstår att resultatet och träffsäkerheten hela tiden utvecklas – precis som vi blir bättre när vi tränar på en uppgift. Vi måste alltså närma oss tekniken strategiskt – välja att redan nu anpassa oss till den, så att vi kan utnyttja tekniken mer och mer vartefter den förbättras. Istället för att bli överraskade i morgon.
Marknadens aktörer
För att kunna utföra dessa enorma beräkningar och lagra så stora bibliotek krävs naturligtvis obegränsade resurser. Eller rättare sagt, ju mer resurser som kan avsättas desto bättre resultat. Det är därför inte överraskande att jättar som AWS, Google, Microsoft, IBM och Apple är några av de leverantörer som studerar och kontinuerligt utvecklar tekniken inom en rad områden.
I dagsläget erbjudet Google och Microsoft, tillsammans med specialiserade aktörer som Zoom Media och Speech Media ”fungerande” tal till text på svenska som kan integreras med befintliga system och applikationer. Övriga aktörer stödjer än så länge bara de i sammanhangen större språken, men det kommer ju att ändras så småningom. Apple erbjuder svenskt tal till text, men endast via Siri i sin egen tekniska infrastruktur.
Hur svårt kan det vara?
Pröva nån gång att lyssna på inspelat talspråk. Det är påfallande sällan vi talar till punkt, vi talar med bisatser, på bisatser i långa trappsteg för att understryka den ursprungliga meningen. En maskin måste inte bara hålla redan på detta, den behöver även ta egna beslut precis som en översättare för att förenkla det sagda till en sammanfattande mening. Det kan vara flera personer som talar också. En ny person i ett samtal som svarar på en fråga skall ha ett talstreck framför sin mening. Det blir mycket att hålla redan på för en självlärd algoritm så klart – oavsett hur flitig i skolan den har varit.
I det perspektivet tycker jag ändå att resultaten idag är mycket imponerande. Pröva att tala in ett sms i telefonen nästa gång du tänkt skriva till en kompis. Det går troligtvis mycket snabbare, och med bättre träffsäkerhet. Till skillnad från för ett år sedan.
Tjänster på marknaden
Så här långt har vi förstått att våra offentliga myndigheter och organ har en utmaning när det kommer till att texta video på webben till svenska. Googles tal till text-analys är mycket imponerande, men långt ifrån perfekt. Vi kan inte släppa en maskin helt fri att texta utan överseende av en människa såklart. Men mina tester indikerar ändå på, under gynnsamma omständigheter, en träffsäkerhet på cirka 80 procent. Det betyder med andra ord att människa och maskin ändå har goda förutsättningar att samverka om maskinen får göra grovjobbet.
De tjänster vi finner på marknaden idag för just svenskt tal till text är alla ett slags portaler som använder Googles tal till text-API. Ett API är ett sätt för en maskin att prata med en annan maskin på ett språk som maskiner gillar.
Med det sagt är det alltså möjligt att bygga sin egen lösning som talar med Googles tal till text-API – och det tror jag långsiktigt är vägen att gå. För visst vore det fantastisk att bara kunna trycka på knappen Autotext i sitt eget gränssnitt, rätta felen och sen bara publicera via sitt eget CRM?
Ett företag som tar detta nya webbdirektiv på stort allvar är svenska Screen9, en Online Video Platform (OVP) lik Vimeo, Youtube, RedBee, BitMovin med flera, men som i högre grad inriktar sig på kunder som offentliga myndigheter, publicister och företag. Jag träffar Joakim Rosenqvist, säljchef på Screen9 för att höra lite om hans spaningar.
Screen9 – en liten kort bakgrund för alla som inte känner till ert företag?
– Vi är sprungna ur ett annat bolag som heter Pixsearch som startade år 2000 och erbjöd en framgångsrik bildsöktjänst på nätet. Men sen kom ett annat bolag, Google, och gjorde samma sak. Då förstod Pixsearch att man måste gå vidare och beslöt bygga en OVP-tjänst som lanserades 2007. Vi fick ganska omgående stora kunder som DN, SAAB och deLaval. Pixsearchs OVP-tjänst gick så pass bra så att vi beslöt att starta ett dotterbolag 2011 – Screen9, berättar Joakim Rosenqvist
Hur tycker du marknad och kunder har utvecklats genom åren?
– Vad vi kan se är att det är en explosion av behovet av video på nätet, men sen behöver man video i olika applikationsområden idag. HR-sidan behöver video för on-boarding. Vi ser behov av e-learning. Marknadskommunikation var ju rätt tidigt ute, men vi ser ett snabbt ett växande behov av internkommunikation. DeLaval till exempel, som arbetar inom mjölkindustrin, använder sig framgångsrikt av internkommunikation. Varje gång en tekniker är ute någonstans i världen och löser ett problem så filmar han eller hon momenten som sedan används för internutbildning på företaget.
Det nya webbdirektivet – vad betyder det och för vem gäller det?
– För Screen9:s del handlar det i första hand om spelare och administrationsgränssnitt. Som anställd på en myndighet så ska dina funktionsbegränsningar inte hindra dig från att utföra dina sysslor. Själva spelaren uppfyller funktioner enligt WCAG 2.1 AA vilket innebär att den innehåller stöd för 25 direktiv som ingår i denna specifikation. Undertextstöd, reglage, skalning av text och zoom, kontrastjustering, möjlighet att styra via tangentbord och mycket mer. Allt det som webbdirektivet begär av myndigheter och offentliga plattformar från och med i år och nästa.
Som jag har förstått det så löser Screen9 undertextning med hjälp av maskininlärning i kombination med ett gränssnitt som en person använder för att justera texten?
– Ja, vad vi gör är ju att vi erbjuder automatisk översättning via en tredjepartstjänst. Det finns ju ett antal, men i dagsläget använder vi Google. Men jag vill vara tydlig med att det kan vi enkelt ändra när och om en annan leverantör visar sig vara bättre. Sånt är viktigt. Efter att automatisk textning har skett, så går användaren in vårt gränssnitt och justerar texten som behöver justeras. Nästa steg som kommer snart är ju även att enkelt kunna begära automatisk översättning till valfritt språk inifrån gränssnittet med påföljande justering.
Ja, även om översättning till övriga språk inte är ett krav så är det ju en av många positiva sidoeffekter av en anpassning till det pågående webbdirektivet. Det är ju naturligtvis av högsta vikt att våra myndigheter kan nå ut med viktig information till de medborgare som inte talar flytande svenska. Försäkringskassan, Arbetsförmedlingen med flera är exempel på sådana myndigheter.
Hur ställer sig myndigheter och offentliga organisationer i dagsläget till dessa nya direktiv?
– Ja, man har nu börjat förstå att detta är en utmaning och vill därför börja lära sig mer och mer. Insikten att ansvaret faktiskt ligger på publicerande myndighet börjar också klarna. Mitt intryck är att man också inser att just ta in traditionella översättningsbyråer för den här typen av översättningar till svenska blir för kostsamt.
En annan positiv konsekvens är väl att med textat videoinnehåll så får vi ju en så kallad temporal metadata över vår video, vilket innebär att det blir mycket enklare och effektivare att göra sökningar på ämnen som avhandlas i långa videosekvenser tack vare just den befintliga undertextningen?
– Precis, och här kommer vi faktiskt in på ett område där GDPR och det nya webbdirektivet samverkar. Det är ju så att sökbarhet över tid, som du beskriver, kan vara ett viktigt hjälpmedel för att finna referenser till personer vars namn och uppgifter kan råka hamna i videoarkivet för att deras namn och uppgifter har nämnts på till exempel ett videoinspelat seminarium.
Inte helt tydligt hur GDPR skulle appliceras i ett sådant fall, men möjligheten till effektivare sökning tack vara den temporala metadatan som undertextning faktiskt innebär är ju bra för både den offentliga och kommersiella delen av branschen.
Summering
Det har varit ett mycket intressant samtal med Joakim Rosenqvist på Screen9, och jag kan lova att det finns väldigt mycket fler intressanta aspekter på ämnet. Personligen är jag intresserad av teknik, men särskilt intresserad, på gränsen till passionerad till teknik som faktiskt möter människan och underlättar vardagen och livet. Det nya webbdirektivet kommer att bli en utmaning för många offentliga organisationer men det är ett viktig demokratiskt initiativ som kommer att förbättra vardagen på internet för alla.
Mer om webbdirektivet går att läsa på https://webbriktlinjer.se/lagkrav/webbdirektivet/