Data bij toetsen en bij betrouwbaarheidsintervallen: van Excel naar R

Author

Prof. Herman Callaert, UHasselt

Published

10/03/2026



De programma’s die je gebruikt bij toetsen van hypothesen en bij betrouwbaarheidsintervallen werken ofwel met “ruwe” data ofwel met “samengevatte” data.

“Samengevatte” data (zoals een gemiddelde of een standaardafwijking) kan je eenvoudig zelf intikken.

“Ruwe” data zijn data die (zonder verandering of na een codering) tot jou gekomen zijn bij het trekken van een steekproef. Al die data tik je niet in met de hand maar je zorgt ervoor dat het R-programma die data kan inlezen vanuit een Excel bestand. Om dat goed te laten verlopen werk je in 2 stappen:

  1. Data in een Excel bestand vooraf klaarmaken

    Bij een toets of bij een betrouwbaarheidsinterval werk je met 1 steekproef. De data van die steekproef moeten als volgt in 1 kolom (A of B of C of…) van een Excel bestand staan.
    Als voorbeeld neem je een studie van geboortegewichten waarbij je 10 gewichten in kolom B zet.

    Eerst tik je in cel B1 een hoofding (zoals gew voor gewicht). Als hoofding mag je een woord (of afkorting) naar keuze gebruiken, maar een hoofding in de eerste cel is ALTIJD NODIG.

    Dit betekent dat de data pas beginnen vanaf de tweede cel (in dit voorbeeld vanaf cel B2). Daaronder staan (zonder lege cellen ertussen en zonder cellen ertussen die letters bevatten) alle data van de steekproef (dat zijn dus allemaal getallen, zonder onderbreking).
    In dit voorbeeld staan de 10 gewichten als 10 getallen in kolom B, opeenvolgend vanaf cel B2 tot cel B11. Daaronder staat niets meer in kolom B.

    Wanneer in een programma gevraagd wordt in welke kolom de steekproefdata staan, dan moet je naar die kolom verwijzen met de letter-verwijzing (dus kolom B) en niet met de hoofding (gew) die je in B1 hebt getikt .


    Als de data op de juiste manier in een kolom staan, dan plaats je het Excel bestand op je laptop in de subfolder xcl waarbij de structuur op je laptop eruitziet als:
    ….. ((sub)folder) stat_met_r ➝ (subfolder) qmd ➝ (subfolder) xcl.

  2. Data uit een klaargemaakt Excel bestand gebruiken in R

    Bij de oefeningen gaat de R-code ervanuit dat de data staan in het Excel bestand met naam mijndata.xlsx. Als je dus wil werken met je eigen data die je in een eigen bestand hebt gezet, dan ga je als volgt te werk:

    • ga op je laptop naar de subfolder xcl en dubbelklik daar op je eigen bestand om het te openen

    • klik op Bestand -> Kopie opslaan -> Bladeren -> Bestandsnaam: vul in mijndata.xlsx en klik op Opslaan

    • bij de melding “mijndata.xlsx bestaat al. Wilt u het vervangen?” klik je op Ja

    • SLUIT nu mijndata.xlsx.

Op dit ogenblik staat op je laptop een ongewijzigd eigen bestand (met data die je ook later nog kan gebruiken). In het bestand mijndata.xlsx staan dezelfde data, klaar om met R te worden ingelezen.