Regio Zuid-Holland | Inzet synthetische data voor het trainen van een objectherkenningsalgoritme
Een grote uitdaging bij het trainen van AI-modellen in het algemeen, is het vergaren van kwalitatief hoogstaande datasets en het op juiste wijze labelen van die data om een object detectie-algoritme te trainen. Dit kost nu heel veel tijd, maar is wel nodig om afvalsoorten goed te gaan herkennen. Daar kunnen we het verschil gaan maken ten opzichte van de huidige methodes en laten zien dat techniek gaat zorgen voor efficiëntie en doeltreffendheid. Hoe groter de variëteit aan data, hoe beter en robuuster het getrainde model, en hoe effectiever het detectie-algoritme zal functioneren. ..Voor onze use case, Project.BB, is een uitgebreider getraind detectie-algoritme nodig, omdat het niet alleen sigarettenpeuken zijn die voor plastic vervuiling op het strand zorgen. Uiteindelijk dient de BeachBot het hele scala aan zwerfafval te detecteren, waaronder bijvoorbeeld patatvorkjes, plastic zakjes, blikjes, rietjes etc., en deze items onder alle mogelijke omstandigheden (regen, licht, hoek etc.) te herkennen. Het plastic in de natuur ziet er heel anders uit dan in de winkel, dit afbraakproces zouden we graag simuleren, omdat de herkenning steeds lastiger wordt...Het beoogde innovatieproject richt zich op het ontwikkelen van een nieuw functioneel model op basis van supervised learning. Een methode van aanleren door het voeden van vele voorbeelden in de vorm van gelabelde data, waarmee het object detection algoritme wordt getraind, echter nu dan ook op basis van (of met zoveel mogelijk) kunstmatig gegenereerde beelden van zwerfafval. Daarbij wordt rekening gehouden met een zo breed mogel