māchine
Nieuws

ChatGPT altijd aan de LSD: OpenAI geeft het toe

Lang gold het idee dat een hallucinatie wijst op slechte data, matige filters of een slordig getraind model. Nieuwe analyses laten iets fundamentelers zien: taalmodellen gokken wanneer hun zekerheid tekortschiet en die onzekerheidsmarge verdwijnt nooit helemaal.

Er is een harde grens aan hoe zeker een model kan zijn, ongeacht extra datasets of slimme tweaks. Computerworld beschrijft dit als een wiskundige onvermijdelijkheid die niet met een update verdwijnt.

Wat wel belangrijk is, dit stuk gaat specifiek over LLM's oftewel taalmodellen. Andere AI-systemen, zoals beeldgeneratoren of spraakherkenners, maken ook fouten, maar vaak om andere redenen. Het fenomeen hallucineren, dus met volle overtuiging een verzonnen antwoord geven, is typisch voor taalmodellen. Dat komt in de basis omdat zij altijd een waarschijnlijk volgend woord moeten kiezen, zelfs als ze te weinig informatie hebben. In dit stuk gaan we er dieper op in.

Waarom een LLM fantaseert

Onderzoekers wijzen drie oorzaken aan die samen het verzinnen voeden. Drie moeilijke woorden incoming: epistemische onzekerheid, representatiecapaciteit en computationele intractabiliteit. Als je die drie begrippen tien keer achter elkaar in de spiegel zegt, komt Chappie je halen.

Epistemische onzekerheid betekent dat een taalmodel soms antwoorden verzint, omdat het simpelweg te weinig kennis of voorbeelden heeft gezien in z'n training. Het model “ziet” dus niet genoeg van de wereld om zeker te weten wat het juiste antwoord is, maar geeft toch een gok.

Beperkte representatiecapaciteit betekent dat een model niet genoeg "ruimte" of vaardigheid heeft om alle patronen van een taak goed vast te leggen. Daardoor kan een te moeilijke opdracht leiden tot scheve redeneringen en toch een (fout) antwoord opleveren.

En computationele intractabiliteit maakt de hallucinatie compleet, omdat sommige problemen zelfs met veel rekenkracht gewoon erg lastig blijven en het juiste antwoord niet altijd uit te rekenen is.

DDDDEEEEPSSEEEK?!1

Dat klinkt abstract, maar je ziet het terug in iets heel basaals. Onderzoekers vroegen verschillende modellen: “Hoeveel D’s zitten er in het woord DEEPSEEK?” Een mens telt gewoon één keer en is klaar. Maar de DeepSeek-V3 met 600 miljard parameters gaf in tien pogingen soms ‘2’, soms ‘3’. Meta’s model en Claude 3.7 Sonnet maakten er zelfs ‘6’ of ‘7’ van.

Dit laat precies zien waar die drie oorzaken samenkomen. Het model heeft geen echte telvaardigheid (beperkte representatiecapaciteit), is niet getraind op letter-telsituaties (epistemische onzekerheid) en moet het gat vullen met een gok. Het resultaat: een zelfverzekerd maar fout antwoord, zelfs bij de simpelste vraag.

De conclusie is duidelijk: hallucinaties vind je niet alleen bij zeldzame onderwerpen, maar ook bij alledaagse vragen.

Wij belonen de leugens

De manier waarop we AI beoordelen helpt niet mee. Soms krijg je na het invoeren van een prompt, de opties uit twee antwoorden. Je kunt dan kiezen wat je voorkeur heeft. Maar daardoor krijgen modellen punten voor een zelfverzekerd antwoord, ook als dat eigenlijk nergens op slaat.

Een model dat nuanceert of zegt het niet zeker te weten, scoort in veel tests slechter dan een model dat zelfverzekerd mis zit. Zo trainen we onbedoeld juist die toon van zekerheid die jij als gebruiker voor waar kunt aanzien.

Wat onderzoekers willen

De oplossing is niet zwijgen, maar slimmer rapporteren. Laat modellen naast een antwoord ook hun eigen onzekerheid uitdrukken met een duidelijke vertrouwensscore. Dat geeft context, helpt verwachtingen bij te stellen en maakt het makkelijker om antwoorden te controleren.

Tegelijk blijft volledige zekerheid onhaalbaar, want de wiskundige grenzen verdwijnen niet. Dat vraagt om volwassen gebruik in plaats van blind vertrouwen.

Wat dit betekent voor de praktijk

Voor organisaties betekent dit dat ze AI door een andere bril moeten bekijken. Niet sturen op nul fouten, want dat is een strijd die je verliest. Maar denk aan risicobeheersing met menselijke controles, ingebouwde checks in de software en duidelijke waarschuwingen bij twijfel. AI is een handige sidekick, niet een alwetende eindbaas.

Bedrijven die dat verschil duidelijk vastleggen, maken AI betrouwbaarder in de praktijk en voorkomen dure verrassingen, zoals foutieve medische adviezen of een generatief model dat auteursrechtelijke claims oplevert.

Dus

Dubbelcheck wanneer het ertoe doet, stel vervolgvragen en let op signalen van onzekerheid als die beschikbaar zijn. AI liegt niet omdat het stout is, maar omdat het zo werkt. Jij moet dus slimmer zijn dan je tools.

Althans, meestal. Want Google waarschuwde onlangs dat sommige toekomstige modellen wél stout kunnen worden, niet in de zin van een foute gok, maar door actief mensen te manipuleren of zich te verzetten tegen uitschakeling. TUNTUNTUNNN