Multi-bestand aanlevering

Via xlsx

Een registratie welke middels een multi-bestand wordt aangeleverd bevat meerdere datasets. In een xlsx bestand dient u deze verschillende datasets op verschillende tabbladen aan te leveren. In afbeelding 1 ziet u een voorbeeld van een registratie met de datasets ‘patient’, ‘episode’ en ‘followup’. Elke dataset staat op een apart tabblad. 

Afbeelding 1: Voorbeeld aanlevering in xlsx

Via csv

Wanneer de datasets in csv worden aangeleverd dient u per dataset een bestand aan te leveren. Hiervoor dient elk bestand de naam van de betreffende dataset te hebben (zie afbeelding 2).  De verschillende bestanden worden in een .zip bestand aangeleverd zodat voor ons duidelijk is welke aangeleverde bestanden bij elkaar horen en samen verwerkt dienen te worden.

Hoe maak ik een zip-bestand?
Er zijn verschillende tools beschikbaar om bestanden te zippen. Microsoft Windows en macOS van Apple bieden bijvoorbeeld de mogelijkheid om vanuit de documenten-folder meerdere bestanden te selecteren, vervolgens klikt men op de rechtermuisknop en wordt er gekozen voor ‘comprimeer onderdelen’.

Afbeelding 2: Voorbeeld aanlevering in csv

De hiërarchische relatie tussen verschillende datasets

Voor het succesvolle opstellen van een multi-bestand aanlevering is het belangrijk dat de relatie tussen de verschillende datasets in een registratie duidelijk is. 

Voor de dataset-structuur van de registratie waarvoor u data wilt aanleveren kunt u het tabblad ‘Relatie datasets’ in de datadictionary raadplegen.

In het voorbeeld in afbeelding 3 ziet u dat de registratie uit de datasets ‘patient’, ‘episode’, ‘followup’ en ‘verrichting’ bestaat. 

  • De ‘patient’ dataset ligt hiërarchisch boven de datasets ‘episode’ en ‘followup’ (‘patient’ is parent van ‘episode’ en ‘follow-up’).
  • De ‘episode’ dataset ligt hiërarchisch boven de dataset ‘verrichting’ (‘episode’ is parent van ‘verrichting’). 
Afbeelding 3: Voorbeeld hiërarchie datasets

Aangezien de datasets in een multi-bestand aanlevering apart van elkaar (in verschillende tabbladen of bestanden) worden aangeleverd, dient de hiërarchische relatie tussen de rijen of records uit de datasets middels een aantal extra variabelen te worden vastgelegd. Deze extra variabelen zijn ‘org_id’ en ‘nr’.

Uitleg inzake het ‘org_id’ veld. 

Om de data uit een multi-bestand aanlevering technisch te kunnen verwerken dient de variabele ‘org_id’ te worden toegevoegd in de aanlevering. In een xlsx dient elk tabblad deze variabele te bevatten en in een csv dient deze variabele in elk bestand te worden opgenomen. De variabele ‘org_id’ wordt gevuld met het ziekenhuisnummer (CIC).

Uitleg ‘nr’ veld binnen de patiënt dataset.

Om de hiërarchie van de datasets te kunnen weergeven in een multi-bestand aanlevering dient ook de variabele ‘nr’ aangeleverd te worden. In de kolom ‘nr’ van een dataset vult u voor ieder record een unieke waarde in. 

Afbeelding 4: Voorbeeld dataset ‘patiënt’ met toevoeging ‘org_id’ en ‘nr’

In bovenstaand voorbeeld (Afbeelding 4) van de dataset ‘patient’ is gekozen om het unieke patiëntnummer in te vullen (UPN) in de kolom ‘nr’. Dit nummer is binnen het ziekenhuis uniek per patiënt en kan zodoende ook maar eenmaal voorkomen.

Uitleg ‘patient_nr’ veld binnen de onderliggende datasets

In het voorbeeld in afbeelding 5 ziet u de onderliggende datasets ‘episode’ en ‘followup’. Deze vallen beide hiërarchisch onder de dataset ‘patient’.

Afbeelding 5: Voorbeeld hiërarchie tussen twee datasets (‘patiënt’ en ‘episode’)
  • De variabele ‘nr’ is in iedere dataset gevuld met een uniek nummer per regel. 
  • De datasets ‘patient’ en ‘episode’ zijn aan elkaar gekoppeld middels de variabelen ‘nr’ (in ‘patient’ dataset) en ‘patient_nr’ (in ‘episode’ dataset).
  • De variabele ‘patient_nr’ in de dataset ‘episode’ verwijst naar een record/regel in de bovenliggende dataset ‘patient’ met hetzelfde nummer.
  • Een patiënt kan meerdere episodes hebben, de variabele ‘patient_nr’ in de dataset ‘episode’ kan dan ook vaker hetzelfde nummer bevatten. 
  • Voor de nummering in onderliggende datasets adviseren we om een simpele cijferreeks te hanteren. De variabele ‘nr’ krijgt in regel 1 de waarde ‘1’, in regel 2 de waarde ‘2’, enzovoorts.

In het voorbeeld in afbeelding 6 is er bovendien sprake van een derde hiërarchisch niveau. 

Afbeelding 6: Voorbeeld hiërarchie tussen meerdere datasets (‘patiënt’, ‘episode’ en ‘verrichting’)
  • In dit voorbeeld heeft de dataset ‘verrichting’ als bovenliggende dataset ‘episode’ en ‘episode’ heeft als bovenliggende dataset weer ‘patient’ (zie ook afbeelding 3). 
  • De variabele ‘nr’ is in iedere dataset gevuld met een uniek nummer per regel. 
  • De dataset ‘verrichting’ verwijst aan de hand van de variabele ‘episode_nr’ naar de bovenliggende dataset ‘episode’.
  • Een episode kan meerdere verrichtingen bevatten, de variabele ‘episode_nr’ kan dan ook vaker hetzelfde nummer bevatten. 

Datum laatste aanpassing 23 december 2019

We helpen je graag verder

Als u vragen heeft staan wij voor u klaar. Bel of mail ons op onderstaand telefoonnummer of e-mailadres.

Stuur bericht Sluit formulier
Stuur ons een bericht

Heeft u een vraag? Laat dan een bericht achter. Wij antwoorden altijd persoonlijk en snel.