Spraaksegmentatie

Gepubliceerd: 4 juli 2024 | 12:13

Update: 14 oktober 2024 | 16:02

MirrorBall B.V. wil een systeem ontwikkelen waarin gesproken teksten benaderd kunnen worden als vectoren. Hierdoor is het mogelijk om audiosegmentatie te verwezenlijken en grote stappen te maken in de Nederlands AI kennis. Het doel is een ‘smart radio’ te ontwikkelen waarbij het mogelijk is ‘on demand’ bepaalde gesproken onderwerpen op te vragen. Hiervoor is het noodzakelijk dat automatisch bepaalde audiofragmenten gesegmenteerd kunnen worden. Er zijn verschillende technieken mogelijk: Spraakherkenning, semantische netwerken en woordvectoren. Er is wereldwijd veel aandacht voor spraakherkenning omdat het een belangrijk onderdeel is van smartphones. Daarnaast kunnen semantische netwerken worden gebruikt voor het afleiden van betekenis van woorden en woordgroepen. Dit zal dan via ‘machine learning’ gecombineerd worden met woordvectoren. Hierdoor zal het mogelijk zijn om in een korte tijd gesproken onderwerpen op te vragen uit grote taalbestanden via woorden en woordcombinaties. Uiteindelijk zal dit een applicatie opleveren die consumenten in staat stelt om snel verschillende audiofragmenten te beluisteren over een specifiek onderwerp.

Projectsamenvatting

Projectnummer MIT-2017-0076

Rijksbijdrage € 25.000,00

Locatie Nederland

Jaar 2017

Subsidieregeling Mkb-innovatiestimulering Topsectoren

Sectoren Creatieve industrie

Aanvrager Mirrorball B.V.