Module 3 · tools

De drie spelers — kansen voor de cardioloog

Welke tool pak je wanneer? Per ChatGPT (OpenAI), Claude (Anthropic) en Gemini (Google) wat ze sterk maakt en waar het knelt. Plus DeepSeek en de soevereiniteitsvraag — en waarom het tempo niet lineair maar exponentieel is.

Wat ga je leren: sterkten en valkuilen per tool, een keuze-matrix per cardio-taak, en hoe je niet vastzit aan één leverancier.

Les 3.1 — ChatGPT: de generalist

OpenAI · sinds nov 2022 · 700M+ wekelijkse gebruikers · GPT-5 sinds aug 2025.

Sterke punten
  • GPT-5: één model, twee snelheden. Router tussen Instant (snel) en Thinking (diep redeneren). Significant minder hallucinaties dan GPT-4o.
  • Native image generation. gpt-image-2 (2026) — sterke tekst-in-afbeelding voor onderwijsmateriaal en infographics.
  • Advanced Voice mode. Real-time gesprek; onderweg een case bespreken zonder typen (let op: geen patiëntdata).
  • Code Interpreter. Python in de chat. Upload geanonimiseerde CSV → laat analyseren en visualiseren.
  • Agent / Operator. Voert opdrachten uit in een browser — boekt, vult formulieren in, scrape't data.

Kanttekeningen

  • Snelle release-cyclus: kwaliteit varieert per feature en datum.
  • Image-gen weigert vaak medisch herkenbare content (auteursrecht / persoon-bescherming).
  • Stem en agent draaien (nog) niet binnen ziekenhuis-perimeter — geen patiëntdata.
  • De “memory”-feature onthoudt info tussen chats. Handig óf zorgwekkend — afhankelijk van wat je deelt.

Vragen bij les 3.1

1. Waarvoor is ChatGPT (GPT-5 + image-gen) onder de huidige drie meestal eerste keuze?

Les 3.2 — Claude: de tekstwerker

Anthropic · sinds maart 2023 · Claude 4-serie · Opus 4.7 en Sonnet 4.6 (begin 2026).

Sterke punten
  • Excel, PowerPoint & Word add-ins (M365, sinds eind 2025): bewerkt sheets, formules, slides en documenten direct in het bestand; markeert elke wijziging.
  • Artifacts. Interactieve HTML/React/SVG live naast de chat — bouw een widget, dashboard of poster terwijl je praat.
  • Lange context. 200K standaard, 1M op Sonnet 4.6. Een complete ESC-richtlijn past erin zonder knippen.
  • Coding-leider. Opus 4.7 op kop bij SWE-bench (87,6 %). Sterk voor scripts, data-pipelines, refactoring.
  • MCP-integraties. 6 000+ koppelingen: Drive, Slack, GitHub, Jira.

De ethische positionering — wat dat wél en níét betekent

Anthropic presenteert zich publiekelijk uitgesproken rond AI-safety en verantwoord gebruik (onder meer thema's als Constitutional AI: het model krijgt expliciete principes mee om te volgen). Praktisch: Claude is vaak voorzichtiger dan ChatGPT met direct medisch advies. Dat is bewust ontworpen. Het betekent dat de kwaliteit van veiligheidsdiscussies vaak iets hoger is — maar het is géén vrijbrief om patiëntdata te delen. Ook Claude hallucineert, ook Claude is VS-gevestigd, en jij blijft verantwoordelijk.

Kanttekeningen

  • Géén native image generation, géén video — tekst (en image) in, tekst uit.
  • Geen stem-modus zoals ChatGPT.
  • Webinterface is rustiger, maar feature-armer dan ChatGPT voor consumenten.

Vragen bij les 3.2

2. Wat is een typische sweet-spot voor Claude (Sonnet 4.6)?

3. “Constitutional AI” — Anthropic's veelgenoemde label — is in essentie:

Les 3.3 — Gemini: de Workspace-bewoner

Google DeepMind · sinds dec 2023 (eerder Bard) · Gemini 3 (eind 2025) → 3.1 Pro (feb 2026).

Sterke punten
  • Workspace-integratie. Leeft in Gmail, Docs, Sheets, Slides, Drive, Meet — vraagt geen context, hééft al toegang.
  • Personal Intelligence. Kent (met toestemming) je mail, agenda, Drive; bereidt vergaderingen voor, vat threads samen.
  • Deep Research (Max). Autonome onderzoeksagent. Doorzoekt web + Workspace, levert rapport met citaties.
  • Native video & multimodal. Verwerkt video direct, niet alleen frames — geschikt voor echo-clips of zaal-opnames (mits veilig kader).
  • Veo / Nano Banana / Lyria. Geïntegreerde beeld-, video- en muziek-generatie. Voor onderwijs- of presentatiemateriaal.

Kanttekeningen

  • Workspace-koppeling = jouw Google-data wordt door Gemini gelezen. Check je organisatie-instellingen.
  • Standalone chat: door velen ervaren als minder sterk in proza dan ChatGPT / Claude.
  • Productlijn met veel namen: Gemini app, Google AI Pro, Ultra, Workspace, NotebookLM — verwarrend.
  • EU-rollout van Personal Intelligence loopt achter door data-residency wetgeving.

Les 3.4 — DeepSeek en de soevereiniteitsvraag

DeepSeek (深度求索) · China, Hangzhou (Zhejiang).

DeepSeek-V3 en R1 hebben in 2025 veel aandacht gekregen omdat de modellen open weights bevatten en op benchmarks vergelijkbaar zijn met westerse top-modellen — tegen een fractie van de gerapporteerde trainingskosten. Voor de cardioloog is de discussie minder “is het goed?” en meer “wat is de juridische en organisatorische context?”

Wat je weet (basis)
  • Chinese vennootschap, hoofdkwartier in Hangzhou (provincie Zhejiang).
  • Verwerking via de officiële chat/API loopt over Chinese servers, met Chinese juridische context.
  • De modellen zijn deels open weights: er bestaan lokale en EU-gehoste deployments via derden — daar gelden andere voorwaarden.
  • Zelfde technische risico's als andere LLMs: hallucinatie, bias, “te zelfverzekerde” tekst.

De praktische regel

Voor zorginstellingen in Europa: typisch geen patiëntdata in de publieke DeepSeek-chat. Voor onderzoek of vergelijking met geanonimiseerde casuïstiek kan het interessant zijn — maar dan eerst checken bij ICT/CIO of er een vorm van EU-gehoste of zelf-gehoste DeepSeek beschikbaar is.

Vragen bij les 3.4

4. Wat is voor een Europese cardioloog praktisch het belangrijkste bij DeepSeek?

Les 3.5 — Welke tool wanneer? Cardio-keuzematrix

Vuistregels. Voor specifieke taken kunnen verschillen anders uitvallen — test zelf met jouw use cases.

Taak Eerste keuze Waarom
Ontslagbrief of verslag redigeren Alle drie Alle drie leveren goede eerste concepten. Verifieer altijd zelf.
Hele richtlijn / dossier in één keer analyseren Claude 200K–1M tokens context: lange documenten zonder knippen.
Werken IN Excel, PowerPoint, Word Claude M365 add-in (sinds eind 2025): bewerkt sheets, formules en slides direct in het bestand.
Werken IN Gmail, Docs, Sheets (Google Workspace) Gemini Enige met diepe Workspace-integratie.
Python / R-script of data-analyse Claude of ChatGPT Claude leider op SWE-bench; ChatGPT heeft Code Interpreter (Python in de chat, sandbox).
Literatuur doorzoeken & samenvatten met citaties Gemini Deep Research doet autonoom 50+ bronnen met citaties.
Afbeelding of poster maken (onderwijs) ChatGPT gpt-image-2 (2026): beste tekst-rendering in beeld.
Interactieve HTML-tool of dashboard prototype Claude Artifacts: live preview en deelbaar als app.
Voicechat oefenen / case bespreken zonder typen ChatGPT Advanced Voice Mode (geen patiëntdata).

Cardio-specifiek: een vergelijkende studie (Hearts, 2025, Di Eusanio et al.) liet ChatGPT iets hoger scoren dan Claude/Gemini op klinische prompts — verschillen klein. Belangrijker dan tool-keuze: of jij verifieert.

Vragen bij les 3.5

5. Je wilt een MDO-PowerPoint-bestand opschonen, één slide herschrijven en de gedaante onthouden in track-changes. Welke tool kies je vandaag?

6. Wat is een verstandige selectie-houding voor een cardiologische afdeling die in 2026 met LLMs wil werken?

Live oefening — vergelijk twee tools op dezelfde vraag

Stel exact dezelfde vraag aan ChatGPT én aan Claude en vergelijk de antwoorden zorgvuldig (geen patiëntdata gebruiken).

Een 58-jarige man met BMI 31, hypertensie, type-2 diabetes en gisteren nieuw-ontdekt persistent atriumfibrilleren. Functioneel weinig beperkingen. CHA2DS2-VASc berekenen, kort de orale anticoagulantia-opties beschouwen, en aangeven welke aanvullende onderzoeken volgens de huidige ESC-richtlijn AFib (2024-versie) je standaard zou aanvragen. Houd het bondig: 1 kolom CHA2DS2-VASc met punten, 1 kolom afwegingen DOAC, en een korte bulletlist aanvullend onderzoek. Geen disclaimers.

Let op: (1) komt de CHA2DS2-VASc-score in beide tools op hetzelfde uit? (2) welke geeft een richtlijn-citaat dat je niet kunt verifiëren? (3) welke voelt klinisch meer “mainstream”? Geen patiëntdata; bovenstaand is een fictieve casus.

Les 3.6 — Het tempo: niet lineair, exponentieel

Doel: snappen waarom je je verwachtingen elke 6–12 maanden moet bijstellen.

Capaciteiten die in 2022 sciencefiction waren, zijn vandaag werkbalk. Eén indicatieve grafiek uit medische evaluaties:

JaarModelUSMLE / MedQA-achtige benchmark
2020GPT-3Onder slagingspercentage
2023GPT-4Boven slagingspercentage USMLE
2025–2026GPT-5 / Claude Opus 4.795 %+ op academische examens

Bron: illustratief, op basis van openbare evaluaties (Singhal et al. 2023; Kung et al. 2023; meer recent vergelijkende studies 2025–2026). Benchmarks ≠ klinische prestatie. Veelzeggend over de richting; weinig zeggend over of het in jouw specifieke afdeling werkt.

Wat je hieruit meeneemt

Verwacht dat wat vandaag “net niet bruikbaar” is, over 12 maanden vaak wél kan. Tegelijk: nieuwere modellen worden ook subtieler in hun fouten — een “net niet”-fout in een richtlijn-citaat valt soms minder op dan een grove. Verifieer wat ertoe doet blijft, ook bij betere modellen, de centrale werkhouding.

Take-home van module 3

Drie spelers

ChatGPT = generalist + beeld + voice. Claude = lange context + M365 + ethische framing. Gemini = Workspace + Deep Research + native video.

Tool ≠ doel

Kies per taak. Organisatiebeleid en DPIA gaan voor benchmark. DeepSeek niet als publieke chat voor patiëntdata.

Test elke 6 maanden

Wat vorig jaar niet werkte, werkt vaak nu wel. Wat nu “helemaal goed” lijkt, kan binnenkort beter via een ander model.