Multi-bestand aanlevering
Via xlsx
Een registratie welke middels een multi-bestand wordt aangeleverd bevat meerdere datasets. In een xlsx bestand dient u deze verschillende datasets op verschillende tabbladen aan te leveren. In afbeelding 1 ziet u een voorbeeld van een registratie met de datasets ‘patient’, ‘episode’ en ‘followup’. Elke dataset staat op een apart tabblad.

Via csv
Wanneer de datasets in csv worden aangeleverd dient u per dataset een bestand aan te leveren. Hiervoor dient elk bestand de naam van de betreffende dataset te hebben (zie afbeelding 2). De verschillende bestanden worden in een .zip bestand aangeleverd zodat voor ons duidelijk is welke aangeleverde bestanden bij elkaar horen en samen verwerkt dienen te worden.
Hoe maak ik een zip-bestand?
Er zijn verschillende tools beschikbaar om bestanden te zippen. Microsoft Windows en macOS van Apple bieden bijvoorbeeld de mogelijkheid om vanuit de documenten-folder meerdere bestanden te selecteren, vervolgens klikt men op de rechtermuisknop en wordt er gekozen voor ‘comprimeer onderdelen’.

De hiërarchische relatie tussen verschillende datasets
Voor het succesvolle opstellen van een multi-bestand aanlevering is het belangrijk dat de relatie tussen de verschillende datasets in een registratie duidelijk is.
Voor de dataset-structuur van de registratie waarvoor u data wilt aanleveren kunt u het tabblad ‘Relatie datasets’ in de datadictionary raadplegen.
In het voorbeeld in afbeelding 3 ziet u dat de registratie uit de datasets ‘patient’, ‘episode’, ‘followup’ en ‘verrichting’ bestaat.
- De ‘patient’ dataset ligt hiërarchisch boven de datasets ‘episode’ en ‘followup’ (‘patient’ is parent van ‘episode’ en ‘follow-up’).
- De ‘episode’ dataset ligt hiërarchisch boven de dataset ‘verrichting’ (‘episode’ is parent van ‘verrichting’).

Aangezien de datasets in een multi-bestand aanlevering apart van elkaar (in verschillende tabbladen of bestanden) worden aangeleverd, dient de hiërarchische relatie tussen de rijen of records uit de datasets middels een aantal extra variabelen te worden vastgelegd. Deze extra variabelen zijn ‘org_id’ en ‘nr’.
Uitleg inzake het ‘org_id’ veld.
Om de data uit een multi-bestand aanlevering technisch te kunnen verwerken dient de variabele ‘org_id’ te worden toegevoegd in de aanlevering. In een xlsx dient elk tabblad deze variabele te bevatten en in een csv dient deze variabele in elk bestand te worden opgenomen. De variabele ‘org_id’ wordt gevuld met het ziekenhuisnummer (CIC).
Uitleg ‘nr’ veld binnen de patiënt dataset.
Om de hiërarchie van de datasets te kunnen weergeven in een multi-bestand aanlevering dient ook de variabele ‘nr’ aangeleverd te worden. In de kolom ‘nr’ van een dataset vult u voor ieder record een unieke waarde in.

In bovenstaand voorbeeld (Afbeelding 4) van de dataset ‘patient’ is gekozen om het unieke patiëntnummer in te vullen (UPN) in de kolom ‘nr’. Dit nummer is binnen het ziekenhuis uniek per patiënt en kan zodoende ook maar eenmaal voorkomen.
Uitleg ‘patient_nr’ veld binnen de onderliggende datasets
In het voorbeeld in afbeelding 5 ziet u de onderliggende datasets ‘episode’ en ‘followup’. Deze vallen beide hiërarchisch onder de dataset ‘patient’.

- De variabele ‘nr’ is in iedere dataset gevuld met een uniek nummer per regel.
- De datasets ‘patient’ en ‘episode’ zijn aan elkaar gekoppeld middels de variabelen ‘nr’ (in ‘patient’ dataset) en ‘patient_nr’ (in ‘episode’ dataset).
- De variabele ‘patient_nr’ in de dataset ‘episode’ verwijst naar een record/regel in de bovenliggende dataset ‘patient’ met hetzelfde nummer.
- Een patiënt kan meerdere episodes hebben, de variabele ‘patient_nr’ in de dataset ‘episode’ kan dan ook vaker hetzelfde nummer bevatten.
- Voor de nummering in onderliggende datasets adviseren we om een simpele cijferreeks te hanteren. De variabele ‘nr’ krijgt in regel 1 de waarde ‘1’, in regel 2 de waarde ‘2’, enzovoorts.
In het voorbeeld in afbeelding 6 is er bovendien sprake van een derde hiërarchisch niveau.

- In dit voorbeeld heeft de dataset ‘verrichting’ als bovenliggende dataset ‘episode’ en ‘episode’ heeft als bovenliggende dataset weer ‘patient’ (zie ook afbeelding 3).
- De variabele ‘nr’ is in iedere dataset gevuld met een uniek nummer per regel.
- De dataset ‘verrichting’ verwijst aan de hand van de variabele ‘episode_nr’ naar de bovenliggende dataset ‘episode’.
- Een episode kan meerdere verrichtingen bevatten, de variabele ‘episode_nr’ kan dan ook vaker hetzelfde nummer bevatten.
Datum laatste aanpassing 21 december 2020