We gebruiken bij GlobeScope Active Learning om onze modellen voor Artificiële Intelligentie (AI) beter te maken. Hoe gaat dat actief leren nu in zijn werk, waarom is de mens essentieel in dit proces en hoe zorgen we er met Active Learning voor dat de informatiekwaliteit van onze klanten verbetert? Erik de Jong, onze development manager geeft antwoord.
In de tweewekelijkse AI-sessies werk ik met de GlobeScope ontwikkelaars Ben Jacobs, Jeroen Janssen en onze adviseur AI Freddy Snijder aan nieuwe features op de roadmap. Op één dag doen we een korte SCRUM sprint met snelle, korte iteraties. Ons doel is om aan het eind van zo’n dag de nieuwe features te kunnen presenteren. Afgelopen AI-sessie hebben we de Active Training loop van onze AI-modellen verbeterd voor het herkennen van documenttypes.
Document analyseren en voorspellen
Het model dat we gebruiken in onze software voor de Smart Document Analyzer kan tot een bepaalde mate het document analyseren en voorspellen om welk documenttype het gaat. Hiervoor moet het model in eerste instantie weten welke documenttypes er zijn. In een initiële training leren we het model welke set van woorden bij een bepaald type document hoort. Hoe vaker het model een set woorden kan koppelen aan een type, hoe sterker die verbinding wordt. Dit proces is vergelijkbaar met het leerproces in de hersenen van een mens. Als het aantal documenten waarmee getraind wordt voldoende groot is, kan het model al met een vrij hoge nauwkeurigheid voorspellen welk type document het is.
AI-training
Maar ondanks de AI-training kan het model niet altijd achterhalen om welk type document het gaat. In zo’n geval zal een mens handmatig het juiste type moeten toekennen. Ook bij nieuwe documenttypes of documenten die qua inhoud erg op elkaar lijken zal de input van de mens nodig zijn. Deze input is heel belangrijk; die gebruiken we weer om het model verder te trainen en de voorspelling beter te maken. Zo verbeteren we de precision (welk percentage van de gevonden types is relevant?) en de recall (welk percentage van de relevante types is gevonden?) van het model. Het resultaat? Het model kan na zo’n trainingsronde een nog betere voorspelling doen.
Van analyseren naar valideren
Ook de klant speelt een rol bij het doortrainen van de Smart Document Analyzer of Smart Privacy Analyzer. Deze kent immers zijn eigen documenten het beste en weet welk van welk type een document is. Ook die kennis kan worden gebruikt om het model beter maken. Naarmate het model beter wordt, verandert de rol van de gebruiker van analyseren naar valideren. Het gaat zelfs zo ver dat de applicatie de medewerker kan wijzen op welke documenten nog aandacht behoeven. "Als documenten met voldoende betrouwbaarheid geanalyseerd zijn, hoeft de medewerker er helemaal niet meer naar om te kijken", aldus Freddy. “Het AI-model kan dankzij onze gezamenlijke Active Learning-sessie steeds beter voorspellen welk documenttype hij voor zich heeft. Vaak beter dan de mens!” Zo verbeteren en versnellen wij bij elke Active Learning-sessie als developmentteam en GlobeScope de informatiekwaliteit van onze klanten.
Interesse in onze Smart Analyzers? Een vraag over Active Learning? Vraag een demo of kennismaking aan via het contactformulier.