Matthijs de Jonge aan het woord

Matthijs de Jonge is docent bij de Master Applied Data Science. “ In een vakgebied dat zich razendsnel ontwikkelt, schuilt de ware uitdaging niet langer in automatisering, maar in het verantwoord nemen van beslissingen op basis van data,” vertelt hij en hij licht toe waarom ethiek bijvoorbeeld zo’n
De reis van docent Matthijs de Jonge naar het hart van Data Science begon met een praktisch tekort op de HAN University of Applied Sciences. "Ik ben in eerste instantie ingezet in vakken rondom Data Solutions Development in de bacheloropleiding ICT, omdat er toen te weinig docenten beschikbaar waren," vertelt hij. Wat begon met die toevallige stap, bleek de toegang tot het meest dynamische vakgebied in ICT van de afgelopen 25 jaar.
De verschuiving: van snelheid naar inzicht
“In de ICT is de focus verschoven; alle redelijkerwijs te automatiseren processen zijn inmiddels geautomatiseerd. De nieuwe uitdaging is Data Science, dat richt zich op het vinden van patronen in data en deze te gebruiken voor voorspellingen. Zo kun je bijvoorbeeld productieprocessen optimaliseren door voorspellingen te doen op basis van verkoopcijfers, of kun je logistieke processen van een intensive care optimaliseren op basis van medische data door te voorspellen wanneer patiënten de IC zullen kunnen verlaten.”
ChatGPT
Ook taalmodellen zoals ChatGPT werken op basis van data en voorspellingen. Feitelijk wordt er door een taalmodel taal geproduceerd door de meest waarschijnlijke antwoorden te voorspellen op de vragen die je stelt. Nu heel logisch, maar een paar jaar geleden onvoorstelbaar. Iedereen herkent vast wel dat je een tekst die je geschreven hebt even door ChatGPT haalt om zeker te weten of het goed Nederlands is of dat er een betere zin toe te voegen is. Als je dat vijf jaar geleden had gezegd werd dat gezien als science fiction, toch? Maar het is nu wel zo.” De echte innovatie zit volgens Matthijs de Jonge echter niet in de bekende taalmodellen, maar in nieuwere en minder zichtbare, impactvolle toepassingen zoals medische diagnostiek.
Gedeelde bagage wordt nieuwe expertise
De Master Applied Data Science is opgebouwd uit drie semesters, gevolgd door een afstudeerscriptie:
-
Semester 1 (Basis): Studenten leren wat er allemaal mogelijk is, maken kennis met verschillende soorten modellen en ontdekken de toepassingen.
-
Semester 2 (Data Exploratie): De focus ligt hier op de data zelf: de kwaliteit, geschiktheid voor modellen en het herkennen van vooroordelen (bias).
-
Semester 3 (Diepgang): Dit semester gaat over de 'cutting edge' van AI: geavanceerde ontwerpen zoals neurale netwerken en hun ingewikkelde modellen, bijvoorbeeld toegepast bij beeldherkenning.
De Masteropleiding trekt professionals aan die al werkervaring hebben en die werkervaring biedt een enorme verdieping. De masteropleiding wordt dan ook afgesloten met een afstudeerscriptie, bij voorkeur over een onderzoek met bestaande data bij de organisatie van de masterstudenten om een toepassing te bouwen. “Wij ontdekken samen met de studenten steeds nieuwe inzichten. Een groepje studenten moest bijvoorbeeld gegevens van grondboringen bekijken. Eén van de mensen in dat groepje deed zelf dat soort werk. Die nam natuurlijk allemaal kennis mee," vertelt Matthijs. Dit zorgt ervoor dat er door de gedeelde bagage samen nieuwe expertise wordt ontwikkeld.
Ethiek en Data Science
De ethische aspecten van Data Science zijn fundamenteel in de masteropleiding. Matthijs de Jonge benadrukt dat data nooit neutraal is en dat de grootste uitdaging is om de bias te herkennen. Hij illustreert dit met het voorbeeld van een rekruteringssysteem dat, getraind op historische aannamepatronen van een grote organisatie, uitsluitend blanke en rijke mannen bleek uit te nodigen voor gesprekken. Dat gebeurde omdat het systeem getraind was op data uit het verleden en in het verleden werden er nu eenmaal alleen blanke, rijke mannen uitgenodigd op gesprek. Op dit soort zaken moet je echt beducht zijn en die ethische aspecten zijn onlosmakelijk verbonden met het werken met data. De gegevens die je hebt, daar zit enorm veel bias in, en daar moet je je altijd bewust van zijn," aldus Matthijs. Dit inzicht is cruciaal voor de vraag of je data überhaupt voor een bepaald doel kunt gebruiken.
Tip voor startende studenten
Als deze docent één tip zou moeten geven aan toekomstige studenten, is deze heel concreet: "Zorg dat je werkgever erachter staat dat je deze masteropleiding gaat doen. De studiebelasting bedraagt ongeveer 20 uur per week (les en huiswerk), dat komt neer op een halve werkweek. Deze master is pittig, en daarom is steun van zowel de werkgever als de thuisomgeving essentieel om de studie vol te houden.”

