TNO en nieuwsbedrijven bundelen hun krachten voor de verdere ontwikkeling van GPT-NL. Dit is het eerste grootschalige Nederlandse AI-taalmodel dat volledig wordt getraind op legaal verkregen data. De samenwerking moet zorgen voor meer hoogwaardige Nederlandse trainingsdata.
Nieuwsarchieven als trainingsbron
Nieuwsuitgevers die zijn aangesloten bij branchevereniging NDP Nieuwsmedia, waaronder DPG Media, Mediahuis en De Groene Amsterdammer, stellen een groot deel van hun nieuwsarchieven beschikbaar. Het gaat om miljoenen artikelen van meer dan 30 landelijke en regionale titels. Ook persbureau ANP doet mee. Hierdoor verdubbelt in één klap de hoeveelheid hoogwaardige Nederlandstalige data waarmee GPT-NL wordt getraind.
Unieke samenwerking
Het is wereldwijd de eerste keer dat nieuwsorganisaties op deze schaal samenwerken met een partij die een AI-taalmodel ontwikkelt. Er zijn duidelijke afspraken gemaakt om te voorkomen dat artikelen technisch uit het model kunnen worden gehaald. Uitgevers ontvangen een vergoeding als het model commercieel wordt ingezet.
Verantwoord alternatief
GPT-NL is een initiatief van non-profitorganisaties TNO, NFI en SURF. Het model biedt een ethisch en transparant alternatief voor commerciële AI-modellen. In plaats van willekeurig online materiaal, wordt GPT-NL getraind op zorgvuldig geselecteerde, auteursrechtelijk beschermde data. Daarmee voldoet het model aan de Europese AI-wetgeving (AI-Act).
Waardevolle trainingsdata
Dankzij de samenwerking krijgt GPT-NL toegang tot meer dan 20 miljard tokens uit nieuwsartikelen. Die artikelen behandelen uiteenlopende thema’s zoals politiek, zorg, economie en wetenschap. Tokens zijn kleine stukjes tekst – zoals woorden of leestekens – waarmee AI leert hoe taal werkt.
Van start tot lancering
De ontwikkeling van GPT-NL begon in 2023. In juni 2025 is de daadwerkelijke training van het model gestart. In het laatste kwartaal van 2025 wordt het model verder geoptimaliseerd en klaargemaakt voor gebruik. Eerder leverden organisaties als De Nederlandsche Bank, ICTRecht en Het Utrechts Archief al data aan voor het project.
Bron: ANP
Plaats een Reactie
Meepraten?Draag gerust bij!