15 juni 2026

AI-detectie vraagt om voorzichtig beoordelen

Times Higher Education berichtte op 14 juni 2026 over nieuw onderzoek naar AI-detectie in studentenwerk. De kern is relevant voor docenten, examencommissies en schoolleiders: een AI-score kan een signaal zijn, maar is geen hard bewijs dat een leerling of student fraude heeft gepleegd.

Het onderzoek, gepubliceerd in Education and Information Technologies, keek specifiek naar Turnitin. Onderzoeker Lucky E. Atamhenwan liet 81 voorbeeldteksten door de detector lopen. Die teksten varieerden van volledig door mensen geschreven werk tot volledig door LLM's gemaakte teksten, met daartussen allerlei mengvormen van menselijke tekst en tekst uit ChatGPT, Copilot, Gemini en Grammarly.

Wat het onderzoek laat zien

De uitkomst is genuanceerd. Turnitin markeerde de volledig menselijke teksten niet als AI-gegenereerd. Ook ging een AI-markering in de test steeds samen met werkelijk aanwezige LLM-tekst. Maar juist bij gemengde teksten werd het ingewikkeld.

Bij teksten met een laag aandeel AI-tekst werd het AI-aandeel vaak te hoog ingeschat. Bij teksten met een hoog aandeel AI-tekst werd het aandeel juist te laag ingeschat. Met andere woorden: de richting van de score kan iets zeggen, maar het percentage zelf is bij deels gemengde teksten niet betrouwbaar genoeg om er automatisch een sanctie aan te verbinden.

Dat is belangrijk, omdat veel onderwijsinstellingen precies met zulke mengvormen te maken krijgen. Een leerling of student kan AI gebruiken voor een eerste opzet, taalverbetering, structuur, feedback of voorbeelden, terwijl delen van het werk wel degelijk eigen zijn. Een detector ziet dan niet het leerproces, de opdrachtcontext of de afgesproken grenzen.

Waarom dit telt voor Nederland en Belgie

Voor het VO, MBO, HBO en WO raakt dit direct aan toetsing, examinering en academische integriteit. Scholen en instellingen zoeken naar manieren om eerlijk te beoordelen in een tijd waarin generatieve AI normaal wordt. De verleiding is groot om een detectiescore als objectief bewijs te behandelen, maar dit onderzoek laat zien dat dat te kort door de bocht is.

Voor onderwijsprofessionals betekent dit:

gebruik een AI-detectiescore nooit als enige bewijs;
leg vooraf uit welk AI-gebruik wel en niet past bij de opdracht;
vraag studenten om transparantie over gebruikte AI-hulp;
beoordeel waar mogelijk ook proces, bronnen, keuzes en mondelinge toelichting;
behandel twijfel als startpunt voor gesprek, niet als automatische beschuldiging.

Ook in het PO en de onderbouw van het VO is de les bruikbaar, al zal formele detectie daar minder centraal staan. Leerlingen moeten leren dat AI-hulp zichtbaar en bespreekbaar hoort te zijn. Niet omdat elke opdracht een fraudeonderzoek moet worden, maar omdat leren vraagt om eerlijk zicht op wat iemand zelf begrijpt.

Van detectie naar toetsontwerp

De praktische boodschap is niet dat scholen alle detectietools moeten negeren. Ze kunnen helpen om patronen te signaleren. Maar ze lossen het onderwijsprobleem niet op. Als een opdracht vooral vraagt om een eindtekst die thuis wordt gemaakt, blijft het moeilijk om achteraf vast te stellen hoeveel denkwerk van de leerling of student zelf kwam.

Daarom verschuift de aandacht naar toetsontwerp. Denk aan opdrachten met tussenstappen, proceslogboeken, korte mondelinge checks, bronverantwoording, reflectie op AI-output en expliciete criteria voor toegestaan gebruik. Zo wordt AI niet alleen gecontroleerd, maar ook onderdeel van professioneel en kritisch leren.

De kern

AI-detectie geeft geen eenvoudige waarheid. Het nieuwste onderzoek naar Turnitin laat zien dat scores bij gemengde teksten kunnen afwijken van het werkelijke AI-aandeel. Voor Nederlandse en Belgische onderwijsprofessionals is dat een waarschuwing: vertrouw niet blind op detectie, maar ontwerp opdrachten en beoordelingsprocessen waarin eigen denkwerk, transparantie en gesprek zichtbaar blijven.

Cookies

Wat het onderzoek laat zien

Waarom dit telt voor Nederland en Belgie

Van detectie naar toetsontwerp

De kern