Honderden pagina’s met handleidingen voor machines of een uitgebreide juridische tekst, het vinden van cruciale informatie kost vaak veel tijd. En heb je dan echt alle relevante gegevens gevonden? Maar het Fraunhofer IWU schiet te hulp. Als het goed is, hoeft straks niemand de Machineverordening nog te lezen.

Het Fraunhoferteam voedt een AI-oplossing momenteel met uitgebreide technische en juridische teksten. En het bereidt de externe invoer zo voor dat zoekopdrachten (prompts)moeten leiden tot nauwkeurige en volledige informatie. Dit wordt mogelijk gemaakt door Retrieval Augmented Generation (RAG).
De kwaliteit van antwoorden die chatbots geven op basis van grote taalmodellen hangt af van de trainingsdata, vaak een overvloed aan openbaar beschikbare documenten. Gebruikers moeten echter kritisch blijven over de betrouwbaarheid van de antwoorden.
Grote taalmodellen (LLM’s) leveren doorgaans goede resultaten op voor alledaagse vragen in chatbots. Voor een eerste oriëntatie zijn de antwoorden vaak voldoende. Maar deze modellen hebben beperkingen: trainingsdatasets kunnen onvolledig of verouderd zijn, en sommige informatie kan vaag of incorrect zijn. Daarom is het verstandig om ontvangen informatie te verifiëren. Bij juridische kwesties is het onverstandig om blindelings op een chatbot te vertrouwen.
Wat te doen als de veiligheid afhangt van de verkregen informatie? Moeten we dan toch weer dikke documenten doorploegen?
‘RAG garandeert betrouwbare informatie over de EU-Machinerichtlijn’
Dat hoeft niet langer, zo stelt Fraunhofer, want RAG voorziet het taalmodel van extra richtlijnen. Hierdoor scant het model primair essentiële teksten of tekstgedeelten. Het model wordt hiervoor niet opnieuw getraind, maar doelgericht uitgebreid. Fraunhofer IWU integreert nu de EU-Machinerichtlijn (2023/1230) in een LLM ter demonstratie.
Het team koos voor LLaMA (Large Language Model Meta AI) als geschikt model, omdat het krachtig genoeg is maar tegelijkertijd niet te zwaar voor de rekenkracht van een hoogwaardige standaard PC. Een lokaal draaiend model betekent dat bedrijven controle houden over hun gegevens. Voor minder kritische data kan cloudgebruik een goede optie zijn.
Hoe het werkt
Eerst wordt de geïmporteerde data omgezet naar platte tekst (Cleaning). Vervolgens wordt de tekst opgedeeld in kleinere segmenten (chunks; doorzoekbare eenheden). Daarna wordt een zoekmechanisme (Retrieval System) gebouwd om efficiënt door deze chunks te navigeren. De chunks worden gestructureerd op basis van relevante passages en opgeslagen in een vector-database, waarin ze als wiskundige vectoren worden weergegeven. Ook zoekopdrachten (prompts) worden omgezet in vectoren. Hierdoor kan het model niet alleen zoeken op woorden in de zoekopdracht, maar ook de betekenis ervan begrijpen (semantisch zoeken). Het model kan nu informatie samenvatten, herschikken, de meest relevante gegevens extraheren en deze in een begrijpelijke context plaatsen. Wanneer een gebruiker een specifieke zoekopdracht invoert, worden geselecteerde chunks gebruikt om complete, feitelijke antwoorden te genereren. Dit alles zonder hertraining van het model.
De juiste structuur
Bij IWU ligt de focus op werktuigbouwkunde. Het team van de afdeling ‘Machine Learning in Productie’ weet welke filters en structuren nodig zijn om de belangrijkste passages uit de Machinerichtlijn te vinden. Een van de belangrijkste doelen voor de toekomst is de integratie van verschillende gegevensbronnen, inclusief tabellen en afbeeldingen, zodat deze eenvoudig doorzoekbaar worden.
AI-tool op maat
De Machinerichtlijn diende als demonstratietoepassinge. Het expertteam biedt zijn methodologische expertise aan om geïnteresseerde bedrijven te helpen bij het ontwikkelen van op maat gemaakte toepassingen. Dit kan gaan om handleidingen, offertevoorbereiding, geautomatiseerde programmeertaken in de productie of het vereenvoudigen van rapportageverplichtingen. Het handmatig doorzoeken van interne documenten, regelgeving, bedrijfsafspraken of operationele gegevens behoort binnenkort tot het verleden.