Verslaglegging duidt op mogelijk gemiste registratie van consult (N6404)

Uit normenkaderzorg.nl
Naar navigatie springen Naar zoeken springen

Referentienummer: N6404
Behoort tot Normenkader ValueCare

Zorgprestatiemodel

  1. GGZ Volledigheid - Consulten
  2. Lastenverlichting - Ondersteuning Digitale Transformatie - GGZ
Samenvatting

Deze norm signaleert acties wanneer met behulp van AI wordt aangetoond dat er sprake is van een gemist feitelijk geleverd consult.

Regelgeving / beleid
2023
Consult

Direct, ononderbroken en zorginhoudelijke contact tussen zorgverlener en (forensische) patiënt en/of naaste van de patiënt. Met ononderbroken wordt bedoeld dat het niet is toegestaan om zonder zorginhoudelijke reden consulten op te delen.

2023: Regeling geestelijke gezondheidszorg en forensische zorg - NR/REG-2313a art. 1.1

2024
Consult

Direct, ononderbroken en zorginhoudelijke contact tussen zorgverlener en (forensische) patiënt en/of naaste van de patiënt. Met ononderbroken wordt bedoeld dat het niet is toegestaan om zonder zorginhoudelijke reden consulten op te delen. Contact: Een zorginhoudelijk en ononderbroken interactie. Een contact kan zowel 'face–to-face', telefonisch, 'screen-to-screen' als 'bit-to-bit' plaatsvinden.

2024: Regeling geestelijke gezondheidszorg en forensische zorg - NR/REG-2418 art. 1.1

Interpretaties

De volgende interpretatiekeuzes zijn gemaakt:

  • Er is een verslaglegging nodig om meegenomen te worden in de controlemassa van deze controle.
  • Als er géén consult is geregistreerd, maar wel verslaglegging is vastgelegd, dan wordt dit niet meegenomen in de N6404, maar op de N2819.
  • Als er een consult is geregistreerd, maar er is géén verslaglegging vastgelegd, dan wordt dit niet meegenomen in de N6404, maar op de N2781.
  • Prestaties die op de blokkadelijst staan of validatiefouten hebben worden niet meegenomen
Achtergrond bij AI techniek

De AI-analyse van de verslaglegging werkt als volgt:

  1. Er wordt een AI-taalmodel beschikbaar gemaakt op de klant ValueCare server.
    • ValueCare beoordeelt medische verslagen door gebruik te maken van een fine-tuned RoBERTa model (een specifiek soort AI-Large Language Model). RoBERTa staat voor: a Robustly Optimized BERT (Bidirectional Encoder Representations from Transformers) pretraining Approach.
    • ValueCare gebruikt als basis een open-source RoBERTa model dat specifiek is getraind voor Nederlandstalige medische data. Het model heeft al kennis over taalstructuren en woordrelaties.
    • Er wordt gebruik gemaakt van RoBERT. RoBERT is een Nederlands vooraf getraind RoBERTa model.
  2. Er wordt een training set gemaakt in afstemming met de klant.
    • De training set bevat een reeks van verslaglegging records voor gerealiseerde consulten. Voor elke verslaglegging is aangegeven of het bijbehorende consult rechtmatig bevonden kan worden of niet. Kortom: de verslagen zijn dus geïnterpreteerd en gecategoriseerd.
    • De training set moet voldoende groot zijn. Een te kleine training set leidt tot onvoldoende nauwkeurigheid van het AI-model.
    • De training set kan óf automatisch worden opgesteld óf handmatig worden opgesteld. Veelal worden handmatige beoordelingen uit het verleden gebruikt uit zelfonderzoeken of Horizontaal Toezicht audits. Daarnaast wordt deze set in de regel aangevuld met een groot aantal handmatig beoordeelde verslagleggingen.
  3. Het AI-taalmodel wordt getraind met de verslaglegging en classificatie uit de training set. Hierdoor is een getraind AI-taalmodel beschikbaar op de ValueCare server. Het AI-model kan dus verslaglegging categoriseren naar rechtmatig of onrechtmatig.
  4. Vervolgens wordt de gehele controlemassa van verslagleggingen voorgelegd aan het AI-model. Het AI-model categoriseert de verslaglegging en geeft de zekerheid van het model aan.
  5. De resultaten worden in een actielijst getoond.

Controle op de AI-technologie vindt als volgt plaats:

  1. Elke actielijst wordt na oplevering door ValueCare getest door de klant in samenwerking met ValueCare. Bij akkoord wordt de actielijst in productie geplaatst.
    • Met het testen van de actielijst wordt ook het AI-algoritme getest.
    • Er wordt gecontroleerd of de resultaten in de actielijst correct zijn aan de hand van een menselijke beoordeling.
  2. Jaarlijks wordt de werking van de actielijst door een steekproef getest door de klant in samenwerking met ValueCare.
    • Er wordt gecontroleerd of de resultaten in de actielijst correct zijn aan de hand van een menselijke beoordeling.

Beheer AI: modelversies toelichting waarden

Precisie: hoe vaak klopt het als het model iets als 'positief' aanduidt ten opzichte van alle voorspellingen. Oftewel: het aandeel positieven onder de voorspelde positieven.

Recall (volledigheid): hoeveel van de echte positieve gevallen heeft het model gevonden. Oftewel: het aandeel echte positieven dat is gevonden door het model onder de werkelijke positieven. Dit is belangrijk als je er zeker van wilt zijn dat je niets belangrijks mist.

F1 score: de F1 score is een metriek die wordt gebruikt bij binaire classificatie en informatieopslag om de voorspellende prestaties te beoordelen. Het combineert precisie en recall tot een gemiddelde, waarbij beide even belangrijk worden geacht. De waarde varieert van 0 (slechtst) tot 1 (best), waarbij een score van 1 perfecte precisie en recall aangeeft.

Accuratesse: het percentage van alle gevallen (zowel positief als negatief) dat een model correct voorspelt. Het kijkt naar de totale prestaties van het model dus hoeveel van alle voorspellingen juist zijn.

Specificiteit: een waarde die de kans op een negatief resultaat weergeeft, ook wel true negative rate. Deze waarde geeft aan hoe vaak de afwezigheid van een bepaalde factor correct wordt geïdentificeerd.

Aantal prediction categoriën: hoeveel klassen er zijn die voorspeld worden, bij de controles nu; behandelinhoudelijk correct of incorrect = 2.

Werkinstructie

Stel vast dat het geregistreerde consult ook daadwerkelijk feitelijk geleverd is door onderstaande vragen te beantwoorden:

  1. Is het contactsoort juist?
  2. Is het contact doorgegaan?
  3. Is van het contact een behandelinhoudelijk verslag aanwezig?
  4. Is het contactsoort juist gekozen? Het antwoord bevat een oordeel over soort contact (bijv. behandeling of diagnostiek)

Door het beantwoorden van de vragen kan worden aangetoond dat de gerealiseerde consulten niet alleen hebben plaatsgevonden, maar ook behandelinhoudelijk verantwoord zijn. De strengheid van de controle hangt in samenhang met de strengheid van het beoordelen van de instelling. Hoe strenger er wordt beoordeeld, hoe strenger AI zal beoordelen in de controle.

Het kan voorkomen dat er wel een zorginhoudelijk gesprek heeft plaatsgevonden. In dat geval kan de actie in ValueCare genegeerd worden met de tekst: 'AI onjuist'. Deze data wordt gebruikt om het model bij te trainen. Voor het negeren van acties geldt over het algemeen dat als de kolom 'Opmerking' niet gevuld is, de actie automatisch wordt teruggezet. Als de actie genegeerd dient te worden moet de opmerking dus gevuld worden.

Programmeerbare norm

Er is sprake van “Verslaglegging duidt op mogelijk gemiste registratie van consult (N6404)” als aan de volgende selectie is voldaan:

1) Alle niet-declarabele consulten


2) Consult betreft een NO SHOW


3) AI-analyse toont aan dat client wel aanwezig was bij het consult


Logica: 1 en 2 en 3

Berekening financiële impact

De financiële impact is de waarde van het onrechtmatige consult.