Analiza danych statystycznych
R + RStudio; estymatory c.d.
Głównym celem szkoły jest tworzenie ludzi zdolnych do robienia nowych rzeczy, a nie tylko powtarzanie tego, co zrobiły inne pokolenia.
– Mandell Creighton
R + RStudio
W tej części zamkniemy podstawy przekształcania tabel. Praktycznie prawie wszystkie inne można stworzyć przy ich użyciu, wspomagając się funkcjonalnością R. Ale oczywiście nie przestajemy poznawać R i RStudio - jest jeszcze ogrom ciekawych rozwiązań ułatwiających pracę analityka.
- Znam i potrafię zastosować funkcje:
select
,filter
,arrange
,summary
,group_by
,across
,pivot_longer
,pivot_wider
,all_of
,any_of
.
- Potrafię utworzyć tabelę losową, dopasowaną do założeń odnoszących się do analizowanej populacji.
Zadania praktyczne
Tabela do zadań: tabela.cos – opis kolumn:
inicjał – pierwsza litera imienia;
płeć – płeć;
wiek – wiek;
waga – waga;
wzrost – wzrost.
Jest to kontynuacja zadań utrwalających z poprzedniego wykładu.
Dla kobiet i mężczyzna oblicz parametry: średnia, wariancja, liczba rekordów.
Wybrać rekordy z kobietami o inicjałach ‘A’ i ‘J’ oraz mężczyzn o wzroście większym niż 180 cm.
Uporządkuj rekordy względem płci oraz wzrostu.
Przedstaw na jednym wykresie zależność wagi od wieku w grupie kobiet i mężczyzn.
Teoria
Wracamy do estymatorów. Tym razem omawiane będą ich podstawowe własności. Gdy pierwszy raz kupujemy samochód, to zwracamy uwagę na jego ekonomiczność, czy mało pali, czy jest nieawaryjny, łatwy w prowadzeniu, czy jest lepszy od innych, itp. Ale już po roku, czasami szybciej, zapominamy o tym wszystkim i po prostu korzystamy z niego. Bardzo często analitycy podobnie postępują z estymacją. W pierwszych tygodniach stosowalności przyglądają się, badają, sprawdzają, a potem popadają w rutynę i po prostu korzystają z nich bez refleksji. Rutyna to jeden z grzechów ciężkich analityków - niestety poznałem jego konsekwencje. Unikajcie go.
- Wiem, że aby mówić o ‘lepszym’ czy ‘gorszym’ estymatorze należy podać kryterium porównawcze.
- Wiem co to jest błąd średniokwadratowy.
- Wiem co to jest obciążenie estymatora.
- Wiem co musi być spełnione aby estymator był nieobciążony.
- Wiem kiedy estymator jest asymptotycznie nieobciążony.
- Potrafię wskazać przykłady estymatorów: nieobciążonych, obciążonych, asymptotycznie nieobciążonych oraz wykazać te własności.