Module 5 · safety layer

Risico's — en hoe je ze inkadert

De techniek is krachtig en niet veilig per default. Hallucinaties, privacy-lekken, bias in het model én in jezelf: ze zijn allemaal voorspelbaar. In deze module: wat ze zijn, hoe je ze herkent, en de vier vuistregels waarmee jij de safety layer wordt.

Wat ga je leren: hallucinatie als feature, AVG en het verkeerslicht-model, twee soorten bias, vier vuistregels, en hoe je dit lokaal verankert (DPIA, governance, ESC AI Hub).

Les 5.1 — Hallucinaties: geen bug, een feature

Doel: nooit meer verbaasd zijn dat een goed-klinkend antwoord toch fout was.

Een hallucinatie is — vanuit de techniek — een statistisch waarschijnlijke afronding die toevallig niet waar is. Niet een bug, maar inherent aan het mechanisme dat we in module 1 en 2 hebben besproken.

Voorbeeld dat je vaker zult zien
Vraag: “Wat zegt de ESC 2023-richtlijn endocarditis over indicatie voor PET-CT bij prothetische kleppen?” Antwoord (LLM): “Volgens hoofdstuk 5.3, tabel 12 van de ESC 2023 endocarditis-richtlijn is PET-CT geïndiceerd >3 maanden post-implantatie (Class I aanbeveling, niveau B).” ⚠ Klinkt zelfverzekerd. ‘Hoofdstuk 5.3’, ‘tabel 12’ en het exacte class/level zijn verzonnen — passend bij wat zo'n citaat eruit kan zien.

Waarom dit gebeurt is geen mysterie: het model heeft tijdens training gezien dat richtlijn-citaten er zus of zo uitzien. Bij gebrek aan exacte herinnering vult het de vorm aan met plausibel klinkende inhoud. Het wéét niet dat het het niet weet.

Hoe je het beperkt (vier maatregelen)

  1. Lever zelf de bron aan in de prompt (module 4.2). Verreweg de meest effectieve maatregel.
  2. Gebruik tools met web-search ingebouwd (GPT-5 web search; Claude in 2025 met web mode; Gemini Deep Research) — die voegen verifieerbare citaten toe.
  3. Vraag expliciet om onzekerheid + bronnen. Voorbeeld: “Welke onderdelen van je antwoord ben je het minst zeker over, en waarom?”
  4. Verifieer elk kritisch detail handmatig. Dosering, percentage, jaartal, class/level, paragraafnummer.

Vragen bij les 5.1

1. Welke uitspraak over hallucinaties klopt het beste?

2. Wat is de effectiefste maatregel tegen hallucinerende richtlijn-citaten?

Les 5.2 — Privacy & AVG: het verkeerslicht

Doel: in 5 seconden weten of iets “groen”, “oranje” of “rood” is voor de publieke chat.

De juridische werkelijkheid is dat patiëntdata in een publieke LLM een datalek is. Punt. De praktische werkelijkheid is dat veel cardiologen toch elke dag in ChatGPT werken — vaak terecht, met geanonimiseerde casuïstiek of eigen ruwe punten. Het verkeerslicht-model helpt je in een paar seconden onderscheiden:

🟢 GROEN
Standaard veilig in publieke chat (met je gebruikelijke verstand).
  • Volledig fictieve casus
  • Eigen ruwe dictaat zonder identificeerbare gegevens
  • Patiëntfolder schrijven over een algemene aandoening
  • Wetenschappelijke vraagstelling over openbare richtlijn
  • Cursus, onderwijs, presentatie-tekst
🟠 ORANJE
Alleen na anonimiseren én bewust nadenken.
  • Geanonimiseerde casus met klinisch zeldzame combinatie (zeldzame diagnose + locatie + tijdstip = mogelijk herleidbaar)
  • Echo- of ECG-verslag van een echte patiënt (zonder PII, maar nog steeds met klinische unieke patroon-handtekening)
  • Lange stukken eigen-dossier-tekst — controleer of er geen unieke zinnen in zitten
  • Eigen onderzoeksdata van patiënten (publicatieklaar of niet)
🔴 ROOD
Niet doen — ook niet “een keertje”.
  • Volledige ontslagbrief, opnameverslag of dossiernotitie mét naam, BSN, adres of geboortedatum
  • DICOM, ECG-trace-bestanden, foto's waarop een patiënt herkenbaar is
  • Patiëntgegevens die uniek genoeg zijn om de patiënt re-identificeerbaar te maken
  • Diagnoses doorvragen alsof het over een specifieke patiënt gaat met PII erbij
  • “Alleen ik gebruik het, dus het mag” — onjuiste aanname

De “eigen-omgeving” uitzondering

Veel ziekenhuizen hebben in 2025–2026 Microsoft Copilot voor M365 (zakelijk), Azure OpenAI, of een specifieke Claude Enterprise-omgeving met DPIA en verwerkersovereenkomst. Daar zijn de regels vaak ruimer (met eigen lokale logging, geen training op jouw data, mogelijk binnen EU). Check bij je ICT/CIO of een Functionaris voor Gegevensbescherming wat er beschikbaar is en welke gegevens daar wél in mogen. De cursus kan dat niet voor jouw werkplek bepalen.

Vragen bij les 5.2

3. Welke van deze acties is “rood” in een publieke chat (ChatGPT.com / Claude.ai)?

4. Een casus zonder naam/BSN maar mét “67-jarige vrouw, woonachtig in [klein dorp], opgenomen op [exacte datum] met [zeldzame diagnose]” — wat kleur in het verkeerslicht?

Les 5.3 — Bias in het model

Doel: weten waar de data scheef zit, en dus waar het antwoord scheef zit.

De trainingsdata van LLMs weerspiegelt de samenleving die hem produceerde — inclusief de scheve verdelingen. Voor de cardioloog drie concrete gebieden om waakzaam op te zijn:

  • Witte mannen-overrepresentatie. Veel cardiologische literatuur tot de jaren 2010 is overwegend op witte mannen gebaseerd. Adviezen voor vrouwen en niet-Europese populaties kunnen minder kloppen.
  • AMI-symptomen bij vrouwen historisch onder-gerapporteerd. De “typische” presentatie die het model geeft, leunt sterk op de mannelijke presentatie. Atypische klachten — vermoeidheid, nausea, schouderpijn — krijgen minder aandacht in samenvattingen dan ze verdienen.
  • Engelstalige medische literatuur domineert. Zeldzame Nederlandse richtlijn-eigenheden (NVVC-specifieke werkafspraken, lokaal beleid) kent het model vaak niet.

Praktische gewoonte

Bij elk klinisch advies van een LLM voor een vrouw of een patiënt met niet-Europese achtergrond: vraag expliciet “hoe zou dit advies anders zijn bij een vrouwelijke patiënt” of “welke groepen zijn ondervertegenwoordigd in de bronnen waar dit advies op leunt?”. Niet als plichtmatig vinkje — maar als korrektie-vraag die soms échte aanpassingen oplevert.

Les 5.4 — Bias in de gebruiker: automation bias

Doel: jezelf herkennen in een goed gedocumenteerd patroon.

Automation bias is de neiging om antwoorden die gestructureerd, vloeiend en zelfverzekerd klinken sneller te accepteren dan antwoorden van een collega. Drie observaties uit het veld:

  • We accepteren AI-output sneller dan output van een collega — terwijl het tegenovergestelde zou moeten gelden.
  • Hoe drukker je bent, hoe minder je verifieert — precies wanneer fouten het meest kosten.
  • “De AI zei het” voelt als rugdekking — terwijl jij eindverantwoordelijk blijft.

De cardiologische context maakt dit acuut: in de SEH onder tijdsdruk een DD bevestigen lijkt dezelfde handeling als “raadpleeg collega”, maar is fundamenteel iets anders. Een LLM heeft geen klinische context, geen patiëntgevoel, en geen verantwoordelijkheid.

Drie zelf-checks

  1. Lees je het AI-antwoord echt, of scan je het op “voelt logisch”?
  2. Zou je het antwoord net zo snel accepteren als een AIOS dit had gezegd?
  3. Wat staat er niet in het antwoord dat er bij een collega wél in zou staan?

Vragen bij les 5.4

5. Wat is automation bias?

Les 5.5 — Vier vuistregels om het veilig in te zetten

1. Lever zelf de context aan

Plak de richtlijn, de paper of het dossierfragment in de prompt. Dan werkt het met jouw bron — niet met vage herinnering.

2. Geen patiëntdata in publieke tools

Gebruik alleen ziekenhuis-goedgekeurde omgevingen voor echte gegevens. Anders: anonimiseer of construeer.

3. Verifieer wat ertoe doet

Niet elk woord. Wél elk cijfer, elke dosering, elke richtlijn-uitspraak, elke literatuurreferentie. Geen uitzonderingen.

4. Jij blijft de eindverantwoordelijke

De AI is een goede co-assistent. Eindverantwoordelijkheid voor de patiënt is van jou. Geldt juridisch en moreel.

Vragen bij les 5.5

6. Wat is een werkbare formulering van “verifieer wat ertoe doet”?

Les 5.6 — Lokale governance en wat de beroepsverenigingen doen

Doel: weten waar je je ankert als afdeling AI breder wil inzetten.

Goed nieuws: je staat niet alleen. In 2025–2026 is er substantieel werk verricht door beroepsverenigingen en onderzoeksgroepen waar je op kunt leunen:

  • ESC Artificial Intelligence Hub — centrale plek voor AI-bronnen, masterclasses en de Focus on Digital Tools and AI in Cardiology-track.
  • ESC Digital Cardiology and AI Committee (DCAI) — bouwt aan een roadmap voor het veilig integreren van AI in cardiologie. Data-kwaliteit, evaluatie-frameworks, stakeholder-engagement.
  • EACVI 2025+ — eigen AI-track binnen multimodale beeldvorming (echo, CMR, CT, nucleair). Hands-on training in de Imaging Training Hub.
  • NVVC en eigen ziekenhuis-DPIA's — vraag actief naar wat er lokaal beschikbaar is voor “eigen omgeving”-LLMs.

Wat je als individuele cardioloog of AIOS kunt doen

  1. Zoek uit welke tools jouw werkgever al heeft goedgekeurd (vaak: Microsoft Copilot M365, soms Azure OpenAI, soms Claude Enterprise). Werk daar — niet in een privé-account.
  2. Vraag of er een DPIA is voor LLM-gebruik op de afdeling. Zo nee, begin er eentje of meld het bij de Functionaris voor Gegevensbescherming.
  3. Houd een persoonlijk register van use cases bij waarvoor je een LLM inzet. Helpt bij audits én bij collegiale discussies.
  4. Deel fouten en hallucinaties die je tegenkomt met de afdeling. Cultuur is preventief: een “dit ging mis”-moment voorkomt herhaling bij collega's.

Les 5.7 — Eindoefening: hallucinatie-jacht

Doel: in een echte chat een hallucinatie identificeren en bedenken hoe je de vraag had moeten stellen.

Live oefening — vind de hallucinatie

Stap 1. Stel deze vraag (verleidt het model bewust tot een richtlijn-citaat):

Wat zegt de ESC 2023 endocarditis-richtlijn precies over de indicatie voor PET-CT bij prothetische klependocarditis? Noem hoofdstuk, tabelnummer, class- en levelaanbeveling, en geef een directe quote uit de richtlijn.

Stap 2. Bekijk het antwoord kritisch. Hoofdstuknummer? Tabel? Class? “Directe quote”? Open zo mogelijk de echte ESC 2023 endocarditis-richtlijn (publiek beschikbaar op de ESC-site) en vergelijk. Stap 3. Stel daarna deze veiligere vervolgvraag in dezelfde chat:

Ik ga je nu een fragment uit de ESC 2023 endocarditis-richtlijn aanleveren. Citeer alléén uit dat fragment, en als iets niet expliciet vermeld is, schrijf “niet vermeld in dit fragment”. Heb je begrepen? [Plak hier dan het echte fragment uit de richtlijn en stel je vervolgvraag.]

Het verschil tussen stap 1 en stap 3 — vorm A “bron vragen” vs vorm B “bron leveren” — is de hele essentie van deze module.

Take-home van module 5 — en van de cursus

Drie dingen om mee de praktijk in te nemen — niet alleen voor deze module maar voor de hele cursus:

1. Eén regel, alles is daaruit logisch af te leiden

Een LLM voorspelt het meest waarschijnlijke volgende stukje tekst. Het denkt niet, weet niets, maar imiteert taal overtuigend goed. Daaruit volgt: bron leveren, vraag onderaan, en verifieer wat ertoe doet.

2. Minimaal een uitstekende co-assistent

Brieven, samenvattingen, code, eerste DD, folders, onderwijs — daar levert het vandaag al meerwaarde. Tempo van vooruitgang is hoog: probeer regelmatig opnieuw, ook use cases die vorig jaar niet werkten.

3. Jij bent de safety layer

Lever context. Geen patiëntdata in publieke tools. Verifieer wat ertoe doet. Jij draagt de eindverantwoordelijkheid — altijd. Geen AI-disclaimer beschermt jou; je eigen klinische oordeel wel.

Veel succes met het toepassen. Vragen? Reflectie-momenten met collega's rond een “ai-fout van de week” doen vaak meer dan een nieuwe cursus.