Via het menu (in de rode linkerkolom) kan je navigeren naar de verschillende onderdelen.

 

Statistiek met Ris lesmateriaal statistiek en data-analyse voor het secundair onderwijs waarbij, op een eenvoudige manier, de programmeertaal R gebruikt wordt bij berekeningen, tabellen en grafieken.

  • Het is de bedoeling dat de leerling bestaande R-programma's gebruikt en zo vertrouwd geraakt met de “look and feel” van R, een moderne programmeeromgeving voor statistiek en data-analyse.
  • Het lesmateriaal vereist niet dat de leerling autonoom in R programmeert. Wat je moet gebruiken in R wordt telkens stapsgewijs duidelijk uitgelegd. 
  • De tekst is zo opgesteld dat de leerling zelfstandig op eigen laptop de leerstof kan verwerken. 
    Dat vereist vooraf, voor iedereen die met dit lesmateriaal wil werken , een configuratie op eigen laptop (klik hier).

Voor opmerkingen over inhoud, taal- of tik- of programmeerfouten… contacteer Herman Callaert 

 

 

BIVARIATE DATA EN SPREIDINGSDIAGRAM
CORRELATIE

In een dataset heb je “elementen” of “objecten” (= grootheden waarvan je eigenschappen opmeet) en “veranderlijken” (= de eigenschappen die je bij die objecten opmeet). Als je per object twee eigenschappen bestudeert, dan werk je met “bivariate data”. Bij continue gegevens (zoals lengte en gewicht bij een baby) kan je de data in het vlak voorstellen met een spreidingsdiagram. Je kan daarbij op zoek gaan naar patronen en samenhang en naar de betekenis van de correlatiecoëfficiënt.

  • Ga op je laptop naar “Spreidingsdiagram en correlatie.html”. (of klik hier)

LINEAIRE REGRESSIE

Regressie bouwt een model om de samenhang tussen continue veranderlijken weer te geven. Het meest eenvoudige model ziet eruit als een rechte. Om een regressierechte goed te begrijpen heb je inzicht nodig in de rolverdeling van de bestudeerde veranderlijken. Het lesmateriaal werkt met voorbeelden om stapsgewijs de ideeën achter regressie te ontdekken. De tekst eindigt met herhalingsopgaven die als aanzet kunnen dienen voor een statistisch onderzoek.

  • Ga op je laptop naar “Lineaire regressie.html”. (of klik hier)

KANSMODELLEN EN DE NORMALE VERDELING

In statistiek beschrijf je populaties, steekproeven, steekproefgrootheden… met kansmodellen (binomiale, Poisson, t, chi-kwadraat…). Een model dat je zeker ontmoet, is “de normale”. Om het normale kansmodel in een juist kader te plaatsen, bekijk je eerst algemene kansmodellen.

  • Je start met definitie en eigenschappen en je leert hoe je over kansmodellen moet nadenken.
    • Ga op je laptop naar “Kansmodellen.html”. (of klik hier)
  • Nadat je vertrouwd bent met de algemene terminologie en notatie, kan je het normale kansmodel bestuderen.
    • Ga op je laptop naar “De normale verdeling.html”. (of klik hier)

VARIABILITEIT VAN STEEKPROEVEN
STEEKPROEFGEMIDDELDE EN STEEKPROEFPROPORTIE

In de verklarende statistiek doe je op basis van steekproeven uitspraken over populaties. Vanuit het steekproefgemiddelde zeg je iets over het populatiegemiddelde en de steekproefproportie gebruik je voor beweringen over de populatieproportie. Zo’n uitspraken, waarbij je bovendien aangeeft hoe betrouwbaar die zijn, doe je vanuit inzicht in de variabiliteit van steekproeven.

  • Ga op je laptop naar “Steekproef, gemiddelde en proportie.html”. (of klik hier)

TOETSEN VAN HYPOTHESEN

Toetsen van hypothesen is een basismethode in de verklarende statistiek. Je start met een hypothese over een populatie en je onderzoekt of correct verzamelde data die hypothese “voldoende” tegenspreken om de overstap naar een alternatieve hypothese te rechtvaardigen. Wat je bedoelt met “voldoende” geef je aan met een significantieniveau.

  • Ga op je laptop naar “Toetsen van hypothesen.html”. (of klik hier)

BETROUWBAARHEIDSINTERVALLEN

Betrouwbaarheidsintervallen horen bij de basismethoden van de verklarende statistiek. Voor een kenmerk van de populatie (zoals het gemiddelde of de proportie) zoek je een interval met “aannemelijke waarden”. Je werkt met een model waarbij je vooraf het betrouwbaarheidsniveau bepaalt. Of correct verzamelde data je daarna een interval opleveren dat het gezochte kenmerk te pakken heeft, weet je niet.

  • Ga op je laptop naar “Betrouwbaarheidsintervallen.html”. (of klik hier)

 

DATABANK GEBOORTEN

De databank geboorten bevat informatie over meer dan een half miljoen kinderen die in Vlaanderen geboren zijn tussen 2000 en 2008. De data zijn gebaseerd op gegevens die bereidwillig ter beschikking werden gesteld door het "Studiecentrum voor Perinatale Epidemiologie" te Brussel.

  • Hoe je, met R, uit deze databank een steekproef trekt, lees je in “Een steekproef trekken uit de databank geboorten" (klik hier).