Auteur: Fred van Lierop
Je bent doof of slechthorend en je bent op je werk. Voor vergaderingen regel je altijd een schrijftolk, maar nu heb je onverwacht een teamoverleg. Zo snel kun je echter geen schrijftolk regelen. Wat nu? Herken je die situatie? Wat zou jij dan doen? Ga je proberen het met liplezen te redden, wat in groepsverband soms onbegonnen werk is en bovendien nogal vermoeiend? Of schakel je in de vorm van een app een digitale oplossing in?
Apps en software voor de omzetting van spraak naar tekst zijn volop in ontwikkeling. En er komen er steeds meer. Onlangs nog lanceerde Google de app Google Live Transcribe voor Android-toestellen. En na de zomer kunnen we eindelijk SpeakSee verwachten. Hoe dan ook, op dit moment zijn er al heel wat apps die spraak 'ondertitelen'. De ene doet dat beter dan de andere, maar in het algemeen zijn ze nooit zo goed als een echte schrijftolk. Het is dus zinnig om eens te kijken welke apps voor het ondertitelen van spraak er zijn.
Overeenkomsten
De meeste ondertitelingsapps maken voor het opnemen van spraak gebruik van de interne microfoon van je smartphone. Die spraak wordt via internet doorgestuurd naar de servers (computers) van de ontwikkelaar. Je hebt dus sowieso een internetverbinding nodig. Op die servers draait een programma dat de spraak analyseert en omzet in tekst. De tekst wordt vervolgens op het scherm van je smartphone weergegeven. Dat gebeurt allemaal in real-time, oftewel vrijwel direct. Als gebruiker ervaar je dat alsof de spraak live wordt ondertiteld.
Met enkel de interne microfoon is de kwaliteit van de spraakopname, en daarmee ook die van de spraakomzetting, vaak onvoldoende. Je moet de microfoon dicht bij de mond van de spreker houden, die persoon moet rustig en duidelijk spreken en er mogen geen storende achtergrondgeluiden aanwezig zijn, zoals het rumoer in openbare ruimtes. Alleen dan wil het ondertitelen van spraak mogelijk nog wel lukken. In de praktijk zul je vaker meemaken dat het resultaat op deze manier nogal onsamenhangende teksten oplevert.
Alle apps zoeken dus naar mogelijkheden om de opnamekwaliteit te verbeteren. Bijvoorbeeld met een externe microfoon, zoals het microfoontje aan het snoertje van de oordopjes, of met4 een draadloze bluetooth microfoon. Hoe beter de opgenomen spraak, hoe beter de uiteindelijke tekst. Sommige apps bieden een leerfunctie: je kunt fouten in de tekst typend corrigeren, zodat die woorden de volgende keer correct worden weergegeven. Het blijft echter moeilijk, omdat je met veel verschillende soorten stemmen te maken hebt.
Ava (iOS & Android)
Ava is momenteel een van de populairste apps voor het live ondertitelen van spraak. De app gebruikt standaard de interne microfoon. Voor betere spraakopname en daarmee betere ondertiteling, kun je dus een externe microfoon of bijvoorbeeld een Roger Pen aansluiten.
Een andere mogelijkheid is je gesprekspartners uit te nodigen de app Ava ook op hun eigen smartphone te installeren. Je kunt dan een groepsgesprek starten. Daarbij spreekt elke persoon in de microfoon van zijn eigen toestel en wordt de ondertiteltekst op jouw smartphone weergegeven. Deze werkwijze levert ongetwijfeld een betere kwaliteit aan ondertitelteksten op. Bovendien krijgt elke spreker zijn eigen ondertitelkleur, zodat je altijd weet wie er praat.
Behalve voor persoonlijke of groepsgesprekken kun je Ava ook gebruiken voor het ondertitelen van radio- of tv-programma’s, of bijvoorbeeld webinars op je computer. Volg je een opleiding? Geef dan je docent een externe (bluetooth-)microfoon of een Roger Pen, zodat je via de app enigszins kunt meelezen wat hij vertelt. Ava is natuurlijk geen vervanging voor een schrijftolk, maar in voorkomende gevallen kun je de lessen zo hopelijk een stuk beter volgen dan zonder schrijftolk.
Tenslotte streeft Ava voor de ondertiteling naar een accuratesse van 95 tot 99 procent. Vooralsnog lijkt dat iets te hoog gegrepen, want in de praktijk kun je uit de ondertitelingstekst soms geen wijs worden. Handig is dat je de tekstgrootte van Ava kunt schalen, zodat ook gebruikers die slechthorend én slechtziend zijn er wat aan hebben. En net als bij een schrijftolk, kan Ava alle ondertitelingsteksten van een persoonlijk of groepsgesprek opslaan. Dan kun je alles later nog eens rustig nalezen. Het verschil met een schrijftolk is echter dat je daarvoor niemand om toestemming hoeft te vragen ;-).
Ava is een gratis app en tot 5 uur per maand is ook het gebruik gratis. Voor intensiever gebruik kun je via een in-app aankoop voor € 32,99 per maand een abonnement afsluiten.
Earfy (iOS & Android)
Earfy is net zo'n app als Ava, maar terwijl Ava continu op zoek is naar verbetering, lijkt Earfy minder aan de weg te timmeren. De iOS-app is namelijk al sinds 2017 niet meer bijgewerkt en de Android-versie heeft in augustus 2018 zijn laatste wijziging gehad. Aanvankelijk werkte Earfy ook met een abonnement en was alleen de eerste maand gratis, maar om het wereldwijde gebruik te bevorderen, werd het gebruik van de app na een crowdfunding-actie geheel gratis gemaakt!
Earfy gebruikt de interne microfoon en claimt net als Ava dat als je gesprekspartner duidelijk spreekt, 95 procent van het gezegde correct wordt ondertiteld. Of dat juist is, blijft nog even de vraag. In elk geval rept Earfy nergens over het gebruik van een externe microfoon voor een betere spraakkwaliteit – en daarmee dus ook een betere ondertiteling.
Maar Earfy heeft wel iets leuks aan boord. Om de spraakkwaliteit van je gesprekspartner te controleren, wordt deze op het scherm met een emoji gevisualiseerd. Aan de emoji kun je dan zien of je gesprekspartner duidelijk genoeg spreekt. Bovendien wordt de ondertitelstekst op basis van de context direct verbeterd. Die mogelijkheden hebben we natuurlijk wel even getest. Helaas, wanneer Earfy aangeeft dat de spraakkwaliteit goed is, blijkt de ondertiteling soms allesbehalve te kloppen. Daarom heeft ook Earfy een optie om foutieve ondertiteling te corrigeren, maar wat heeft dat voor zin als je aan de tekst geen touw kunt vastknopen?
Een pluspunt van Earfy is dat je ook kunt kiezen voor een ‘gespiegelde lay-out’, waarbij een spreker tegenover je de ondertiteling direct kan meelezen. Heel fijn is verder dat je net als bij Ava de transcripts van je gesprekken kunt opslaan en via e-mail kunt delen.
De app is gratis, maar gek genoeg noemt de App Store nog steeds in-app aankopen: € 4,99 voor een basisabonnement en € 49,99 voor een jaarabonnement. De Google Play Store daarentegen vermeldt duidelijk dat de app toch echt geheel gratis is.
Text Hear (iOS & Android)
TextHear is een Amerikaanse app die ook de Nederlandse taal ondersteunt. De app is heel simpel. Je downloadt en opent hem. Vervolgens tik je bovenaan op de taalaanduiding (standaard is dat Engels) en selecteer je Dutch (Nederlands). Klaar. Nu klik je op Start om met de microfoon spraak op te nemen en die direct in tekst te laten omzetten.
Nadeel van TextHear is dat je de app slechts één minuut gratis mag testen. Daarna betaal je voor omzetting van spraak naar tekst ongeveer 33 eurocent per minuut. Dat wil zeggen voor het verdere gebruik van de app dien je als in-app aankoop voor 9,99 euro een ‘transcription credits pack’ van 30 minuten aan te schaffen. Dat maakt het gebruik van de app nogal prijzig, zelfs vergeleken met bijvoorbeeld AVA, dat wel 5 uur (!) per maand aan gratis tegoed aanbiedt.
De vraag is nu: krijg je voor die 33 cent per minuut een betere kwaliteit spraakomzetting? Dat hebben we in die ene gratis minuut niet goed kunnen testen. Maar de makers stellen dat ze gebruikmaken van 'hoogwaardige tekst-naar-spraak engines'. Dat zal best, want TextHear wordt in de Google Play Store door gebruikers heel goed beoordeeld vergeleken Ava of Earfy, maar dat zijn wel voornamelijk Engelse gebruikers…
TextHear is gratis. Na de eerste gratis minuut kost het gebruik € 9,99 per 30 minuten.
Google Live Transcribe (Android)
De onlangs door Google gelanceerde app Live Transcribe is ontwikkeld in samenwerking met Gallaudet University, de Amerikaanse universiteit voor doven. We hebben de app nog niet getest, maar Villamedia, de website over journalistiek, heeft de prestaties van de app vergeleken met die van journalistieke dicteerapps en geconcludeerd dat Live Transcribe veruit de beste spraak-naar-tekstomzetting uitvoert. Met andere woorden, als ondertitelingsapp voor doven lijkt Live Transcribe hoge ogen te gaan gooien.
Helaas, Live Transcribe is er alleen voor Android. Over een eventuele iOS-versie is nog niets bekend. In de App Store vind je overigens wel apps als Transcribe en Transcribe Live die hetzelfde doen, maar die zijn van andere ontwikkelaars en ondersteunen alleen de Engelse taal. Live Transcribe zelf is net als TextHear in het gebruik een simpele app. Na het installeren tik je op een knop en kun je direct aan de slag. De app ondersteunt 70 talen. Voor de kwaliteit van de ondertitelstekst is goede spraakopname van belang, daarom worden ook externe microfoons volop ondersteund.
Live Transcribe bevat een paar leuke opties die de andere apps niet hebben. Zo plaatst de app een extra pictogramknop naast de Home-knop, zodat je de app altijd snel kunt starten als je hem nodig hebt. Nog een optie is dat de app een trilsignaal kan produceren om je erop te attenderen dat iemand begint te praten of na een kort pauzemoment verdergaat. Verder heeft de app een luidheidsindicator waaraan je ziet hoe luid de spreker praat ten opzichte van het omgevingsgeluid. Jammer is wel dat de app geen mogelijkheid heeft om ondertitelteksten op te slaan of te delen. Hopelijk komt dat nog.
Live Transcribe is gratis, zowel de app zelf als het gebruik ervan.
Nog meer apps
Behalve de bovengenoemde apps zijn er nog wel meer apps die ongeveer dezelfde werkwijze volgen: spraak naar een server sturen, in tekst laten omzeten en het resultaat terugsturen naar je smartphone. De ene app doet dat iets beter dan de andere, maar het kan nog wel een paar jaar duren voordat omzzetting van spraak naar tekst echt goed werkt. Dit artikel is dus niet bedoeld om de beste app aan te wijzen, maar om je een idee te geven van een aantal apps die er al zijn.
Behalve apps voor je smartphone zijn er ook nog andere oplossingen om spraak in tekst om te zetten. Het al veelbesproken SpeakSee is daar één van. In een volgend artikel zetten we een aantal alternatieve oplossingen op een rijtje.
Ben je op zoek naar een (nieuwe) baan?
Bij Ctalents zijn we altijd op zoek naar blinde of slechtziende talenten die aan de slag willen gaan bij inclusieve organisaties. Wil je weten wat Ctalents voor jou kan betekenen? Doe de One Minute Check en kom er binnen 1 minuut achter wat wij voor jou kunnen betekenen.