De hype voorbij: hoe helpt generative AI de IT-professional?

insights Data & Ai

Gepubliceerd op 2023-08-12 door Stef Gyssels

Nu de storm rond generative AI en boegbeelden zoals ChatGPT en Dall-E gaan liggen is, wordt het tijd om te kijken wat deze technologie echt kan betekenen voor IT-professionals. In welke aspecten van jouw job kun je hiermee je voordeel doen? Heel wat, zo blijkt. Maar er schuilen ook nieuwe obstakels en gevaren.

Dit artikel verscheen oorspronkelijk in SAI Update 14, het digitaal magazine van SAI. Leden van SAI kunnen het magazine integraal lezen.

“Generative AI is niet nieuw”, zegt Christophe Robyns, managing partner van Agilytic. “Wij gebruiken al verschillende jaren LLM’s (large language models, de specifieke vorm van generatieve AI om natuurlijke taal te begrijpen en genereren, n.v.d.r.), maar de leercurve van deze modellen is met een indrukwekkende snelheid verbeterd. Zelfs zonder of met weinig training krijg je al verbijsterende resultaten.” Het zorgt er vooral voor dat vele op generative AI gebaseerde tools nu al concreet inzetbaar zijn, ook ter ondersteuning van diversie IT-activiteiten. We overlopen even de belangrijkste domeinen.

1. Code genereren/checken/vertalen

Er bestaan verscheidene generative AI-modellen die IT-professionals bijstaan door het coderingsproces te automatiseren. Met behulp van de opgelegde specificaties en voorbeelden kunnen herhaalde of routinematige programmeertaken door de machine worden overgenomen. Of je kunt een modelcode laten nakijken of zelfs van de ene taal naar de andere laten herschrijven. Zulke modellen vind je bij AWS en (weldra) bij Google. Ook Copilot van OpenAI staat hoog aangeschreven.

2. Documenteren van applicaties

Het voor vele programmeurs ‘noodzakelijke kwaad’ van software documenteren en handleidingen schrijven, kan met de juiste modellen snel en accuraat worden geautomatiseerd. Alle nodige documentatie wordt uitgeschreven en vertaald, en bij aanpassingen vlot mee geactualiseerd.

3. Synthetische data

Met generative AI kun je kunstmatige data creëren die functioneel vergelijkbaar zijn met echte data, zonder specifiek naar de echte wereld te verwijzen. Dit is vooral nuttig wanneer er weinig echte data beschikbaar zijn of wanneer men weg wil blijven van privacygevoelige data. Zo kan men zonder massa’s reële data toch waardevolle testen uitvoeren, machine learning-modellen trainen en scenario’s simuleren.

4. Netwerk- en systeemconfiguratie

Met generatieve modellen kun je heel wat systeem- en netwerkconfiguratie automatiseren. Je kunt bijvoorbeeld de gewenste netwerkarchitectuur ingeven en het AI-model maakt zelf de nodige configuratiebestanden aan, meestal sneller en met minder fouten. Je kunt modellen ook aanleren wat normaal en gewenst gedrag is voor netwerken en systemen, zodat de modellen kunnen aangeven wanneer er vermeldenswaardige afwijkingen optreden.

5. IT-helpdesk ondersteund (of uitgevoerd) door een chatbot

Dit is de meest gekende en besproken toepassing van generative in een IT-context. De uitdaging vandaag bestaat er niet alleen in om een natuurlijke dialoog te bouwen tussen chatbot en eindgebruiker, maar ook om de juiste vervolgacties te genereren, zoals een wachtwoord resetten of toegang verlenen tot een systeem. Belangrijk is dat je hiervoor niet zomaar een standaardoplossing inzet, maar eender welke oplossing aanpast aan de eigen situatie en behoeften: toegang tot de eigen specifieke bedrijfsinformatie rond policy’s, duidelijke regels en beperkingen rond de inhoud en toon van de chats enzovoort.

Aandachtspunten

De eigen bedrijfssituatie is een van de belangrijkste aandachtspunten. Door de steeds omvattender beschikbare modellen, die vaak het resultaat zijn van jaren training met talloze data, kom je gemakkelijk in de verleiding om een standaardmodel als goed genoeg te beschouwen. “Maar als iedereen datzelfde AI-model gebruikt, is het ook geen differentiator meer en kun je nooit een resultaat voorleggen dat echt je bedrijf representeert”, waarschuwt Edle Everaert, business development unit coach bij ML6. Dat eigen data toevoegen geen kinderspel is, beseft ze maar al te goed: “De eigen data zitten bij veel bedrijven enorm verspreid,en zijn technisch moeilijk benaderbaar. Ik verwacht dan ook een nieuwe golf van datalake- en datamartinitiatieven.”

Christophe Robyns wijst op een ander sluipend gevaar voor de IT’ers, de overdreven verwachtingen door de schijnbare eenvoud van de oplossing: “Het is leuk dat er meer bewustzijn is rond wat AI allemaal kan realiseren. Maar de huidige hype heeft ook gezorgd voor valse verwachtingen. Ik heb onlangs nog een uur nodig gehad om een klant uit te leggen wat wel en niet mogelijk was. Zijn probleem oplossen in enkele dagen was niet werkbaar, terwijl ChatGPT de indruk wekt dat alle problemen in een handomdraai op te lossen zijn.”

Last but not least wijst Edle Everaert op het belang van dataprivacy en gegevensbescherming: “Wanneer data nog eenvoudiger toegankelijk en verspreidbaar worden, is GDPR-compliance des te belangrijker. En dat gaat verder dan de traditionele bekommernissen. Je moet bijvoorbeeld ook op je hoede zijn voor scraping door foundation model providers en – wanneer je een publieke LLM gebruikt – het onbewust vrijgeven van data door medewerkers.”

Kortom: generative AI wijst ook de IT-afdeling de weg naar een rooskleurige toekomst. Maar de putten en hobbels op de weg kunnen erg pijnlijk zijn als je niet voldoende oplet.

Hoe kies je de juiste tool?

Alle generative AI-tools voor de IT-omgeving opsommen, zou ons te ver leiden. Maar we delen wel graag de criteria die ML6 ons bezorgde om je te helpen bij jouw keuze:

Performantie van het model (juistheid en accuraatheid van de resultaten). Dit wordt bepaald door de omvang van de datasets die gebruikt zijn voor de training van het model en het aantal modelparameters. Voor GPT3 en 3.5 waren dit er bijvoorbeeld 175 miljard.
Modellatency of reactiesnelheid. Ook hier speelt het aantal parameters een rol: hoe meer parameters, hoe langer de reactietijd.
Tokenlimiet: hoeveel woorden kunnen uitgewisseld worden in vraag en antwoord?
Prijs voor gebruik. Bij commerciële modellen is dit doorgaans op basis van het aantal tokens en die prijs kan op dit moment aardig oplopen.
De manier van toegang. Kies je voor een API naar een commercieel model of host je zelf een opensourcemodel? In het laatste geval moet je dan wel nog die hostingkosten in de vergelijking meenemen.
Locatie en duur van opslag van data. Dit wordt vaak grotendeels bepaald door de dataprivacycompliancy. Zo heeft Microsoft Azure voor Europa een aparte GPT API en apart model met opslag gebouwd.
Mogelijke beperkingen op commercieel gebruik: te controleren bij gebruik van opensourcemodellen.

SAI-leden kunnen hier het webinar van Geertrui Mieke De Ketelaere over ‘Generative AI: hype, hope or hazard?’ herbekijken, alsook het webinar van Microsoft over ‘Conversational AI & ChatGPT at Microsoft’.