Artificial Intelligence (AI) gebruiken we steeds vaker om automatiseringsvraagstukken op te lossen. Door zelflerende algoritmes wordt het steeds eenvoudiger om specifieke, maar eentonige werkzaamheden uit handen te nemen. Ondanks dat je AI-technologieën voor allerlei problemen kan toepassen, zoals spraakherkenning en tekstherkenning, is het niet altijd dé oplossing voor ieder vraagstuk. Zo hebben we bij Pegamento meerdere cases behandeld waar dat voorkwam. We gingen met Computer Vision & AI Lead Thomas de Wolf in gesprek waarom kunstmatige intelligentie niet altijd de best werkende oplossing is voor ieder vraagstuk.
Voor dit verhaal pakken we de print industrie. Bijvoorbeeld een organisatie die gepersonaliseerde verpakkingen bedrukt, zoals Tony’s Chocolonely waar je je eigen wikkel kunt ontwerpen. Er worden honderden, misschien wel duizenden verschillende soorten chocoladewikkels gemaakt die ieder in dozen naar het juiste adres vervoerd moeten worden. Dit komt voor bij vele organisaties binnen de print industrie. Tijdens het klaarmaken van de orders controleren organisaties in de print industrie vaak handmatig de producten in en het plaatje (afbeeldingsetiket) op een doos op een lopende band om vervolgens de juiste order informatie erop te plakken. In een doos zitten bijvoorbeeld chocoladerepen met gepersonaliseerde wikkels voor een specifieke klant en daarvan plakken ze de sticker erop. En dat voor duizenden stuks per dag.
Computer vision en Artificial Intelligence achter de schermen
'Het is net een baby, die leert op een gegeven moment dat hij iets kan vastpakken met zijn handen. Hij komt erachter dat het handig is en leert ervan.'
Een automatiseringsvraagstuk hiervoor kan zijn dat organisaties in de print industrie zoeken naar een manier om het handmatige controleren te automatiseren. Een toepassing is een camerasysteem die de doos op de lopende band ziet en het plaatje op de doos herkent. Het systeem vergelijkt dat plaatje met de database om vervolgens te bevestigen: 'dit zijn de melk chocoladerepen van Tony's Chocolonely en niet de puur of de hazelnoot'. ''Dit is een vraagstuk waarbij je van tevoren niet weet wat er voor de camera langskomt, maar die je wel wilt gaan herkennen'', vertelt Thomas. ''Voor dit soort problemen laten we de computer 500 voorbeelden zien van de melk, 500 van de puur en 500 van de hazelnootwikkels. Dan hebben we drie type chocoladerepen waarvan we van ieder wikkelsoort 500 plaatjes op een witte doos in de database hebben.''
Met al die voorbeelden gaat de technologie een lerend algoritme trainen. ''De software probeert het melketiket op de doos te herkennen, waarna hij kijkt of hij hier goed in is geworden'', legt Thomas uit. ''Als dat niet het geval is, verandert hij allemaal kleine getallen en probeert hij het opnieuw. Het is net een baby, die leert op een gegeven moment dat hij iets kan vastpakken met zijn handen. Hij komt erachter dat het handig is en leert ervan. Zo werkt een lerend algoritme ook.''
Praktisch gezien geef je de computer veel voorbeelden en geef je de software de opdracht om aan de hand van die voorbeelden te trainen. Na een tijdje heeft het netwerk zich aangeleerd om het melkchocolade-etiket van Tony's op de witte doos te herkennen. Als je dan vervolgens een nieuwe foto laat zien van een doos met een etiket erop, herkent het systeem dat het de melkchocolade is en plakt hij de juiste order informatie erop.
In de afbeelding hiernaast zie je een voorbeeld van beeldherkenning i.c.m. AI. De camera heeft geleerd een auto te herkennen.
Terug naar klassieke beeldherkenning: feature matching
'Als er constant nieuwe soorten etiketten langskomen, hoe kan een computer dan zien dat het een etiket is en niet de doos?’
Toch is AI niet altijd de beste oplossing voor dit automatiseringsvraagstuk. Dat komt doordat organisaties in de print industrie niet maar drie categorieën etiketten hebben, maar juist heel veel soorten in verschillende maten, figuren, kleuren en grote. Vooral als je een soortgelijke business hebt als Tony's Chocolonely, namelijk het zelf kunnen ontwerpen van wikkels, etiketten of verpakkingen. Zoals een gepersonaliseerde Pegamento chocoladereepwikkel. Dit betekent dat je misschien wel duizend categorieën zal krijgen. ''Een typisch probleem waarbij je niet wil grijpen naar een lerend netwerk, maar dat je specifiek moet kijken wat al die etiketten nou anders maakt'', geeft Thomas aan. ''Een netwerk trainen die weet wat een etiket is, maar niet weet wat de melkchocolade is, werkt ook niet. Want als er weer nieuwe soorten etiketten langskomen kan de computer het etiket gaan zien als de doos. Voor zo'n vraagstuk moet je terugvallen op klassieke beeldherkenning: feature matching.''
Feature matching
''Allereerst schrijven we de software zo dat hij herkent dat alles wat niet achtergrond is de witte doos moet zijn. En alles wat niet wit is, is dan het etiket. We halen vervolgens de outline van een etiket eruit. Dat stukje snijden we uit en dan kom je bij het feature matching gedeelte.''
Kort gezegd betekent feature matching dat een algoritme kijkt naar specifieke pixels van een afbeelding om deze te gaan vergelijken met andere plaatjes in de database. Hij pakt bijvoorbeeld een klein stukje van de wikkel van de Pegamento chocoladereep uit het etiket en vergelijkt dat pixelgroepje met alle andere plaatjes in de database. ''Stel je hebt een ontwerp van een Pegamento wikkel, Nike wikkel en IKEA wikkel, dan gaat hij kijken of dat pixelgroepje ergens voorkomt. Dat doet hij ongeveer voor zo'n 1000 pixelgroepen'', vertelt Thomas terwijl hij via een afbeelding laat zien hoe het er visueel uitziet. ''Hij kijkt welke afbeelding het beste matcht. Op die manier kan hij zeggen, zonder dat hij ooit van tevoren iets gezien heeft, dat iets op elkaar lijkt. En dat is de truc achter feature matching. Zo weet de computer welke order informatie op de doos moet.''
En zo hoeven organisaties in de print industrie niet meer handmatig te checken wat er in en op de doos zit om de juiste order informatie erop te plakken. Een organisatie kan hierdoor een hoger productieproces creëren met hetzelfde aantal mankracht.
Voor alle bedrijven die iets doen met maatwerk drukken en bedrukken
Een ander voorbeeld wat Thomas noemt tijdens het gesprek is fotogeschenken waarop je een foto kan laten drukken. Zo'n soort organisatie drukt foto's op producten waarna ze per 400 de oven in gaan. Vaak is het daarna lastig te herleiden welk product bij welke order hoort. Je ziet slechts een afbeelding van een gezin op het product staan. Aan de hand van die afbeelding moeten ze handmatig de order terugzoeken die erbij hoort. ''Bij zoiets zou je ook een camera kunnen inzetten met feature matching'', geeft Thomas aan. ''Je zet het product met de afbeelding voor de camera en de computer zoekt aan de hand van al die pixelgroepen naar een match. Easy as that! Met deze techniek kan je op basis van beeld zo specifiek uitsluiten wat het is, dat het eigenlijk net zo simpel wordt als het scannen van een barcode.''
AI is ook in dit geval niet de beste oplossing, omdat feature matching bij dit vraagstuk beter werkt doordat elke foto anders is. Zo zie je maar dat niet voor alle automatiseringsvraagstukken kunstmatige intelligentie de juiste oplossing is. Gelukkig zijn er genoeg andere technieken die wel dé oplossing kunnen zijn. En die zoeken wij samen met jou, de techniek die bij jouw vraagstuk past.
Gratis: beeldherkenning voor beginners
Helemaal up to date zijn van de mogelijkheden van beeldherkenning anno 2022? Download hier jouw gratis whitepaper. Wij vertellen jou ook vrijblijvend of beeldherkenning toepasbaar is binnen jouw organisatie.