Statistiek met R

“Statistiek met R” is een project met lesmateriaal statistiek voor het secundair onderwijs.

Op een eenvoudige manier wordt de programmeertaal R gebruikt bij berekeningen, tabellen en grafieken.
Het is de bedoeling dat de leerling bestaande R-programma's leert gebruiken en zo vertrouwd geraakt met de “look and feel” van R, een moderne programmeeromgeving voor statistiek en data-analyse.
Het lesmateriaal vereist niet dat de leerling zelf in R programmeert.
De tekst is zo opgesteld dat de leerling autonoom op eigen laptop de leerstof kan verwerken.
Dat vereist vooraf, voor iedereen die met dit lesmateriaal wil werken , een configuratie op eigen laptop (klik hier).
Voor opmerkingen over inhoud, taal- of tik- of programmeerfouten… contacteer Herman Callaert

DATABANK GEBOORTEN

De databank bevat de kinderen die in Vlaanderen geboren zijn tussen 2000 en 2008. De data zijn gebaseerd op gegevens die bereidwillig ter beschikking werden gesteld door het "Studiecentrum voor Perinatale Epidemiologie" te Brussel.

Lees de handleiding “Een steekproef trekken uit de databank geboorten" (klik hier).

SPREIDINGSDIAGRAM EN CORRELATIE

In een dataset heb je “elementen” of “objecten” (= grootheden waarvan je eigenschappen opmeet) en “veranderlijken” (= de eigenschappen die je bij die objecten opmeet). Als je per object twee eigenschappen bestudeert, dan werk je met “bivariate data”. Bij continue gegevens (zoals lengte en gewicht bij een baby) kan je de data in het vlak voorstellen met een spreidingsdiagram. Je kan daarbij op zoek gaan naar patronen en samenhang en naar de betekenis van de correlatiecoëfficiënt.

Ga op je laptop naar “Spreidingsdiagram en correlatie.html”. (of klik hier)

LINEAIRE REGRESSIE

Regressie bouwt een model om de samenhang tussen continue veranderlijken weer te geven. Het meest eenvoudige model ziet eruit als een rechte. Om een regressierechte goed te begrijpen heb je inzicht nodig in de rolverdeling van de bestudeerde veranderlijken. Het lesmateriaal werkt met voorbeelden om stapsgewijs de ideeën achter regressie te ontdekken. De tekst eindigt met herhalingsopgaven die als aanzet kunnen dienen voor een statistisch onderzoek.

Ga op je laptop naar “Lineaire regressie.html”. (of klik hier)

KANSMODELLEN EN DE NORMALE VERDELING

In statistiek beschrijf je populaties, steekproeven, steekproefgrootheden… met kansmodellen (binomiale, Poisson, t, chi-kwadraat…). Een model dat je zeker ontmoet, is “de normale”. Om het normale kansmodel in een juist kader te plaatsen, bekijk je eerst algemene kansmodellen.

Je start met definitie en eigenschappen en je leert hoe je over kansmodellen moet nadenken.
- Ga op je laptop naar “Kansmodellen.html”. (of klik hier)
Nadat je vertrouwd bent met de algemene terminologie en notatie, kan je het normale kansmodel bestuderen.
- Ga op je laptop naar “De normale verdeling.html”. (of klik hier)

STEEKPROEF, GEMIDDELDE EN PROPORTIE

In de verklarende statistiek doe je op basis van steekproeven uitspraken over populaties. Vanuit het steekproefgemiddelde zeg je iets over het populatiegemiddelde en de steekproefproportie gebruik je voor beweringen over de populatieproportie. Zo’n uitspraken, waarbij je bovendien aangeeft hoe betrouwbaar die zijn, doe je vanuit inzicht in de variabiliteit van steekproeven.

Ga op je laptop naar “Steekproef, gemiddelde en proportie.html”. (of klik hier)

TOETSEN VAN HYPOTHESEN

Toetsen van hypothesen is een basismethode in de verklarende statistiek. Je start met een hypothese over een populatie en je onderzoekt of correct verzamelde data die hypothese “voldoende” tegenspreken om de overstap naar een alternatieve hypothese te rechtvaardigen. Wat je bedoelt met “voldoende” geef je aan met een significantieniveau.

Ga op je laptop naar “Toetsen van hypothesen.html”. (of klik hier)

BETROUWBAARHEIDSINTERVALLEN

Betrouwbaarheidsintervallen horen bij de basismethoden van de verklarende statistiek. Voor een kenmerk van de populatie (zoals het gemiddelde of de proportie) zoek je een interval met “aannemelijke waarden”. Je werkt met een model waarbij je vooraf het betrouwbaarheidsniveau bepaalt. Of correct verzamelde data je daarna een interval opleveren dat het gezochte kenmerk te pakken heeft, weet je niet.

Ga op je laptop naar “Betrouwbaarheidsintervallen.html”. (of klik hier)

Statistiek met R

Info voor

Opleidingen

universiteit Hasselt

Snel naar

Statistiek met R

Info voor

Opleidingen

universiteit Hasselt

Snel naar

Social Media