CSV

Een csv is een komma gescheiden bestand. Bij het opstellen van een batch in .csv heeft u de datadictionary nodig.

In het kort

De extensie van het aangeleverd bestand is “.csv”. In de eerste regel van het csv-bestand noteert u de variabele-namen waarvoor u gegevens aan gaat leveren. De variabele namen worden door een komma van elkaar gescheiden. De gegevens worden in de rijen daaronder ingevuld op basis van de dezelfde volgorde van de eerste regel.

De regels

Bij aanlevering in csv gelden de volgende regels voor de samenstelling van het bestand:

  • Het eerste record (regel) in het csv-bestand bevat de namen van de aan te leveren variabelen. Een variabele wordt in dit verband ook wel een ‘header’ genoemd. De schrijfwijze van een header dient gelijk te zijn met de schrijfwijze van de variabele uit de datadictionary. Let op! headers zijn hoofdlettergevoelig. 
  • De velden worden gescheiden door komma’s. Er kunnen ook andere scheidingstekens dan de komma gebruikt worden. In de klantafspraken maakt u een afspraak over het te gebruiken scheidingsteken.

Voorbeeld op basis van komma’s als scheidingsteken

  1. in de eerste regel ziet u het record met headers
  2. in de tweede regel ziet u de eerste regel met waarden
  3. in de derde regel ziet u de tweede regel met waarden. Op variabele 3 is geen waarde aangeleverd.
  1. var1,var2,var3,var4,var5
  2. antwoord_variabele_1,antwoord_variabele2,antwoord_variabele3,antwoord_variabele4,antwoord_variabele5
  3. antwoord_variabele_1,antwoord_variabele2,,antwoord_variabele4,antwoord_variabele5
  • Spaties and tabs voorafgaand en volgend op het scheidingsteken worden genegeerd.
  • Velden die beginnen of eindigen met spaties moeten worden voorafgegaan en afgesloten met een dubbel citaat teken. De citaat tekens zullen geen onderdeel zijn van de ingelezen data.
  • Velden die een dubbel citaat teken bevatten moeten worden voorafgegaan en worden afgesloten met een dubbel citaat teken. Ook ieder dubbel citaat teken in het veld zelf moet worden voorafgegaan en afgesloten met een dubbel citaat teken.

Gebruik van dubbel citaat teken

  • in de eerste regel ziet u het record met headers
  • in de tweede regel ziet u de eerste regel met waarden. De spatie achter ‘Utrecht’ wordt geïmporteerd. 
  • in de derde regel ziet u de tweede regel met waarden. De spatie achter de waarde ‘v’ wordt genegeerd.
  • in de vierde regel ziet u hoe een waarde met dubbele citaat tekens moet worden aangeleverd. 
  1. geslacht,gebplaats,leeftijd
  2. m,”Utrecht ”,48
  3. v ,Amsterdam,56
  4. m, “Eindhoven ““de gekste”””, 43
  • Ieder record is één regel. Een record regeleinde mag bestaan uit een “line feed” (ASCII/LF=0x0A), of een “carriage return en line feed” (ASCII/CRLF=0x0D 0x0A). 
  • Een waarde kan en mag bestaan uit meerdere regels. Denk hierbij bijvoorbeeld aan een antwoord dat u invult in een vrij-tekst-veld. Wanneer een waarde uit meerdere regels bestaat moet de waarde worden voorafgegaan en worden afgesloten met een dubbel citaat teken
  • Als u voor een record op een variabele geen waarde aan kunt leveren dan levert u simpelweg niets aan.
  • Het bestand mag geen lege rijen en kolommen bevatten. 

Records en regeleinden 

  • in de eerste regel ziet u het record met headers. 
  • Op de eerste regel, achter de variabele ‘land’, staat een ‘lege kolom’ genoteerd. Dit is niet toegestaan.
  • in de tweede regel ziet u de eerste regel met waarden.
  • in de derde regel ziet u de tweede regel met waarden. De waarde op de variabele opinie bestaat
    uit meerdere regels. De regel voor deze persoon wordt afgesloten op regel 5. 
  • in regel  6 ziet u hoe u een variabele ‘leeg’ kunt laten. Er staat niets ingevuld op de variabele opinie.
  • in regel 7 lijkt een lege regel genoteerd te staan. Dit zorgt voor een error en moet voorkomen worden. 
  1. geslacht,gebplaats,leeftijd,opinie,land,,
  2. v ,Amsterdam,56,”geen mening”,Nederland
  3. v,Alkmaar,30,”Hallo,
  4. ik vind het een goed idee.
  5. groeten”,Nederland
  6. m,Leiden,45,,Nederland
  7. ,,,,
  • Numerieke waarden hebben de punt “.” als decimaal scheidingsteken en bevatten verder geen duizendtal scheidingstekens.
  • Om uw gegevens goed te kunnen verwerken moet bekend zijn welke character encoding gebruikt wordt. Standaard wordt uitgegaan van UTF-8. Indien gebruik wil worden gemaakt van een andere character encoding format dient u dit kenbaar te maken. 

Datum laatste aanpassing 12 november 2019

We helpen je graag verder

Als u vragen heeft staan wij voor u klaar. Bel of mail ons op onderstaand telefoonnummer of e-mailadres.

Stuur bericht Sluit formulier
Stuur ons een bericht

Heeft u een vraag? Laat dan een bericht achter. Wij antwoorden altijd persoonlijk en snel.