Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- # Pakiety
- #install.packages("PogromcyDanych")
- #install.packages("dplyr")
- library("PogromcyDanych")
- library("dplyr")
- head(auta2012)
- # Zadanie 1
- # Ile cech w zbiorze danych jest cechami jakościowymi?
- auta2012 %>%
- sapply(class) %>% # działa funkcją class na każdą kolumnę; pokazuje jaka jest klasa danych kolumn
- table() # podsumowuje i pokazuje ile kolumn jest danej klasy
- #odp.chyba 14
- # Zadanie 2
- # Sortowanie marek wg popularności
- auta2012 %>%
- count(Marka) %>%
- arrange(desc(n))
- #odp. Volkswagen
- # Zadanie 3
- # Jaki procent samochodów jest napędzany benzyną
- auta2012 %>%
- count(Rodzaj.paliwa) %>%
- mutate(percent = n*100 / sum(n))
- # Zadanie 4
- # Ile samochodów jest tańszych od 2000 PLN
- auta2012 %>%
- filter(Cena.w.PLN < 2000) %>%
- count()
- # Zadanie 5
- # Ile procent samochodów ma pojemność silnika >= 1500
- nrow(auta2012 %>% filter(Pojemnosc.skokowa >= 1500)) * 100 / nrow(auta2012 %>% filter(!is.na(Pojemnosc.skokowa)))
- # auta2012 %>% filter(Pojemnosc.skokowa >= 1500) %>%
- # count() %>%
- # mutate(percent = n*100/dim(auta2012)[1])
- # Zadanie 6
- # Ile samochodów jest zarejestrowanych w Polsce i tańszych od 2000
- auta2012 %>%
- filter(Kraj.aktualnej.rejestracji == 'Polska' & Cena.w.PLN < 2000 ) %>% nrow()
- #lub
- auta2012 %>%
- filter(Kraj.aktualnej.rejestracji == 'Polska' & Cena.w.PLN < 2000 ) %>%
- summarise(n=n())
- # Zadanie 7
- # Procent samochodów z dieselem i pojemnością > 1500
- nrow(auta2012 %>%
- filter(Rodzaj.paliwa == 'olej napedowy (diesel)' & Pojemnosc.skokowa > 1500 )) * 100 / nrow(auta2012)
- # Zadanie 8
- #Utworzyć nową ramkę z samochodami małymi i sportowymi; ilu ich jest
- library(MASS)
- filtered.frame <- Cars93 %>%
- filter(Type == 'Small' | Type == 'Sporty')
- nrow(filtered.frame)
- # Zadanie 9
- # Wybrać zwierzęta dłuższe od 1m
- koty_ptaki %>%
- filter(dlugosc > 1)
- # Zadanie 10
- # Posortować rosnąco wg prędkości
- koty_ptaki %>%
- arrange(predkosc)
- # Zadanie 11
- # Wybrać tylko Volkswageny; utworzyć talbicę kntyngnencji dla typu paliwa
- volks <- auta2012 %>% filter(Marka == 'Volkswagen')
- table(volks$Rodzaj.paliwa)
- # Zadanie 12
- # Wybrać tylko Volkswageny; policzyć średnią ceną i średni przebieg
- mean(volks$Cena.w.PLN)
- mean(na.omit(volks$Przebieg.w.km))
- # Zadanie 13
- # Średnia cena dla każdej marki
- auta2012 %>%
- group_by(Marka) %>%
- summarise(sr.cena = mean(Cena.w.PLN))
- # Zadanie 14
- # Ze zbioru auta2012 wybierz jedynie auta Toyota Corolla. Dla tak wybranych danych wyznacz
- # pierwszy i trzeci kwartyl ceny.
- auta2012%>%
- filter(Marka == 'Toyota' & Model == 'Corolla') %>% summarise(Q1 = quantile(Cena.w.PLN,1/4), Q2 = quantile(Cena.w.PLN,3/4))
- # Zadanie 15
- # Ze zbioru auta2012 wybierz jedynie auta marki Toyota. Dla tak wybranych danych,
- # dla każdego modelu wyznacz średnią cenę. Wyniki przedstaw posortowane w kolejności malejącej.
- auta2012%>%
- filter(Marka == 'Toyota') %>%
- group_by(Model) %>%
- summarise(sr.cena = mean(Cena.w.PLN)) %>%
- arrange(desc(sr.cena))
- # Zadanie 16
- # Dla danych auta2012 wybierz auta Volkswagen Passat z roku 2006. Dla tak wybranych danych
- # wyznacz średnią cenę. Ile spośród wybranych aut jest tańsze od 35 000 PLN?
- auta2012%>%
- filter(Marka == 'Volkswagen' & Model == 'Passat' & Rok.produkcji == 2006) %>%
- summarise(mean.price = mean(Cena.w.PLN))
- auta <- (auta2012 %>% filter(Marka == 'Volkswagen' & Model == 'Passat' & Rok.produkcji == 2006))
- nrow(auta %>% filter(Cena.w.PLN < 35000)) * 100 / nrow(auta) #procent, w sumie niepotrzebny
- # Zadanie 17
- # Dla danych auta2012 wybierze jedynie auta z roku 2007. Dla tak wybranych danych ile mamy aut
- # każdej marki? Przedstaw wyniki w postaci posortowanej (kolejność rosnąca) po wielkości każdej
- # grupy.
- auta2012 %>%
- filter (Rok.produkcji == 2007) %>%
- group_by(Marka) %>%
- summarise(n = n()) %>%
- arrange(n)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement