Met de groeiende hoeveelheid video- en audiomateriaal stijgt ook de behoefte aan ondertitelings- en transcriptiediensten. Daarvoor kan heel goed kunstmatige intelligentie toegepast worden, weet de ondernemer in deze aflevering. Hoewel de onderliggende modellen steeds accurater spraak naar tekst omzetten, zijn er nog altijd mensen nodig voor de puntjes op de i.
Het internet staat bol van video en audio. De steamingdiensten laten dagelijks nieuwe series en films aanrukken en de ook de podcast maakt een snelle opmars. Maar liefst 91% van de bedrijven gebruikt Amberscript speelt in op die behoefte.
De technologie van Amberscript heeft de geluidsopname van de aflevering omgezet in een transcript.
Het bedrijf maakt gebruik van ‘speech-to-text’-technologie, die spraak herkent en deze omzet naar geschreven tekst. Het eerste voorbeeld van spraakherkenning stamt al uit 1952, toen het Amerikaanse telefoonbedrijf AT&T in zijn laboratorium ‘AUDREY’ ontwikkelde. De machine kon de cijfers 0 tot en met 9, wanneer uitgesproken door de uitvinder, met 90 procent accuratesse herkennen. Het vocabulaire van soortgelijke machines groeiden in de jaren erna exponentieel.
Volgens Peter-Paul de Leeuw, oprichter en CEO van Amberscript, is de beschikbare technologie de laatste jaren steeds beter geworden. Voor veel casussen, zoals de transcriptie van hoorcolleges en gemeenteraadsvergaderingen, moet de output echter foutloos zijn. Om dat te garanderen, ontwikkelt het bedrijf AI-modellen voor specifieke sectoren en toepassingen, en werkt het samen met menselijke ondertitelaars en transcribenten. Het bedrijf spreekt dan ook liever van ‘assisted intelligence’ dan ‘artificial intelligence’.
In deze aflevering vertelt De Leeuw over de veelheid aan AI-modellen die Amberscript gebruikt. Zo volstaat het bij ondertiteling niet om een letterlijke vertaling te geven van alles wat wordt gezegd, maar moet het kort zijn en de tekst steeds op een logisch punt worden afgebroken. Verder bespreekt het gezelschap ‘bias’ in spraakherkenningsalgoritmes en gaan zij in op de beweegredenen van grote technologiebedrijven om hun modellen vrij beschikbaar te stellen.
Peter-Paul de Leeuw is CEO van Amberscript, dat hij oprichtte na zijn MBA aan businessschool INSEAD. Hij was indertijd onder de indruk van de prestaties van speech-to-text, maar zag nog volop kansen voor de Nederlandse markt. Inmiddels ondersteunt Amberscript meer dan 29 talen en is het na een tweetal overnames marktleider van Nederland en Duitsland. Het bedrijf hoopt met zijn diensten een bijdrage te leveren aan de toegankelijkheid van audio- en videocontent.
We zien AI als een hulpmiddel voor de mens en niet als vervanging.
Nederland is een tech- en ondernemersland. In de podcast ‘De Innovatiegolf’ komen ondernemers aan het woord die op een specifieke innovatiegolf zijn gesprongen. Waar leidt deze golf naartoe en wat betekenen de onderliggende technologische ontwikkelingen voor mens, maatschappij en planeet? En wat kunnen andere ondernemers doen om op diezelfde innovatiegolf mee te surfen? Ontdek het in de podcast ‘De Innovatiegolf’.
Blijf op de hoogte van onze inzichten, tips en trends