Analiza danych statystycznych
R + RStudio; estymatory c.d.
Wiedza jest drugim słońcem dla ludzi.
– Platon
R + RStudio
Część praktyczna najbliższych wykładów poświęcona będzie niezbędnikowi analityka, czyli podstawowym funkcjom przekształcającym tabele zdefiniowanymi w pakiecie tidyverse
. Ściągawka cheatsheet-dplyr z pewnością się przyda.
Dane wykorzystane w nagraniu: bat.bbb.
Potrafię wczytać tabelę zapisaną w formacie
csv
stosując odpowiednie funkcje tj.read_csv
,read_delim
,read.table
,read.csv
i inne.
Znam i potrafię zastosować funkcje:
head
,tail
,nrow
,n
,ncol
,row_number
,case_when
,mutate
.
Potrafię zapisać formuły i wyrażenia matematyczne.
Potrafię zdefiniować prostą funkcję.
Zadania praktyczne
Tabela do zadań: tabela.cos – opis kolumn:
inicjał – pierwsza litera imienia;
płeć – płeć;
wiek – wiek;
waga – waga;
wzrost – wzrost.
Stworzyć projekt. Utworzyć podkatalog
data
.Zapisać tabelę
tabela.cos
w katalogudata
.Utworzyć skrypt wczytujący tabelę
tabela.cos
. Pamiętać o niezbędnych pakietach.Utworzyć dodatkowy skrypt, w którym zawarte będą rozwiązania odpowiednio podzielone na sekcje. Tytuły sekcji to treść kolejnych zadań.
Dodać kolumnę
nr
, która zawierać będzie numery kolejnych wektorów.Ile rekordów jest w tabeli?
Do tabeli dodać kolumnę zawierającą współczynnik BMI.
Dodać kolumnę w której będzie określenie wskaźnika BMI. Kategorie przyjąć takie jak na stronie: badanie-bmi.html.
Zamienić inicjały na imiona. Imiona samemu określić. Należy zwrócić uwagę na płeć.
Utworzyć tabelę, która zawierać będzie 13 pierwszych rekordów tabeli źródłowej.
Teoria
Tym razem chciałbym by poznali Państwo analogię rozkładów zmiennych losowych i ich wybranych parametrów w innych dziedzinach - przynajmniej namiastkę tego. Sięgniemy nawet do zasad Newtona, a jestem przekonany, że i u Einsteina znajdziecie powiązania z pojęciami czy metodami w statystyce. Książki autorstwa Hewitta (Hewitt 2000) czy Feynmana (Feynman 2014) to dobry początek zrozumienia fizykalności statystyki.
- Potrafię wskazać i wyjaśnić analogię pojęć, funkcji i parametrów występujących w statystyce.