Analiza danych statystycznych

R + RStudio; estymatory c.d.

Autor

Jacek Bojarski

Zmodyfikowano

March 15, 2023

Wiedza jest drugim słońcem dla ludzi.
– Platon

R + RStudio

Część praktyczna najbliższych wykładów poświęcona będzie niezbędnikowi analityka, czyli podstawowym funkcjom przekształcającym tabele zdefiniowanymi w pakiecie tidyverse. Ściągawka cheatsheet-dplyr z pewnością się przyda.

Dane wykorzystane w nagraniu: bat.bbb.

  1. Potrafię wczytać tabelę zapisaną w formacie csv stosując odpowiednie funkcje tj.

    1. read_csv, read_delim, read.table, read.csv i inne.
  2. Znam i potrafię zastosować funkcje:

    1. head, tail,

    2. nrow, n, ncol, row_number,

    3. case_when,

    4. mutate.

  3. Potrafię zapisać formuły i wyrażenia matematyczne.

  4. Potrafię zdefiniować prostą funkcję.

Zadania praktyczne

Tabela do zadań: tabela.cos – opis kolumn:

  1. inicjał – pierwsza litera imienia;

  2. płeć – płeć;

  3. wiek – wiek;

  4. waga – waga;

  5. wzrost – wzrost.

  1. Stworzyć projekt. Utworzyć podkatalog data.

  2. Zapisać tabelę tabela.cos w katalogu data.

  3. Utworzyć skrypt wczytujący tabelę tabela.cos. Pamiętać o niezbędnych pakietach.

  4. Utworzyć dodatkowy skrypt, w którym zawarte będą rozwiązania odpowiednio podzielone na sekcje. Tytuły sekcji to treść kolejnych zadań.

  5. Dodać kolumnę nr, która zawierać będzie numery kolejnych wektorów.

  6. Ile rekordów jest w tabeli?

  7. Do tabeli dodać kolumnę zawierającą współczynnik BMI.

  8. Dodać kolumnę w której będzie określenie wskaźnika BMI. Kategorie przyjąć takie jak na stronie: badanie-bmi.html.

  9. Zamienić inicjały na imiona. Imiona samemu określić. Należy zwrócić uwagę na płeć.

  10. Utworzyć tabelę, która zawierać będzie 13 pierwszych rekordów tabeli źródłowej.

Teoria

Tym razem chciałbym by poznali Państwo analogię rozkładów zmiennych losowych i ich wybranych parametrów w innych dziedzinach - przynajmniej namiastkę tego. Sięgniemy nawet do zasad Newtona, a jestem przekonany, że i u Einsteina znajdziecie powiązania z pojęciami czy metodami w statystyce. Książki autorstwa Hewitta (Hewitt 2000) czy Feynmana (Feynman 2014) to dobry początek zrozumienia fizykalności statystyki.

  1. Potrafię wskazać i wyjaśnić analogię pojęć, funkcji i parametrów występujących w statystyce.

Bibliografia

Feynman, Richard. 2014. Feynmana Wykłady z Fizyki. Warszawa: Wydawnictwo Naukowe PWN.
Hewitt, Paul. 2000. Fizyka Wokół Nas. Warszawa: Wydawnictwo Naukowe PWN.