Advertisement
Guest User

Untitled

a guest
Jan 19th, 2019
97
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 3.95 KB | None | 0 0
  1. # Pakiety
  2.  
  3. #install.packages("PogromcyDanych")
  4. #install.packages("dplyr")
  5.  
  6. library("PogromcyDanych")
  7. library("dplyr")
  8.  
  9. head(auta2012)
  10.  
  11. # Zadanie 1
  12. # Ile cech w zbiorze danych jest cechami jakościowymi?
  13.  
  14. auta2012 %>%
  15. sapply(class) %>% # działa funkcją class na każdą kolumnę; pokazuje jaka jest klasa danych kolumn
  16. table() # podsumowuje i pokazuje ile kolumn jest danej klasy
  17. #odp.chyba 14
  18.  
  19. # Zadanie 2
  20. # Sortowanie marek wg popularności
  21.  
  22. auta2012 %>%
  23. count(Marka) %>%
  24. arrange(desc(n))
  25. #odp. Volkswagen
  26.  
  27. # Zadanie 3
  28. # Jaki procent samochodów jest napędzany benzyną
  29.  
  30. auta2012 %>%
  31. count(Rodzaj.paliwa) %>%
  32. mutate(percent = n*100 / sum(n))
  33.  
  34.  
  35. # Zadanie 4
  36. # Ile samochodów jest tańszych od 2000 PLN
  37. auta2012 %>%
  38. filter(Cena.w.PLN < 2000) %>%
  39. count()
  40.  
  41. # Zadanie 5
  42. # Ile procent samochodów ma pojemność silnika >= 1500
  43.  
  44. nrow(auta2012 %>% filter(Pojemnosc.skokowa >= 1500)) * 100 / nrow(auta2012 %>% filter(!is.na(Pojemnosc.skokowa)))
  45.  
  46. # auta2012 %>% filter(Pojemnosc.skokowa >= 1500) %>%
  47. # count() %>%
  48. # mutate(percent = n*100/dim(auta2012)[1])
  49.  
  50.  
  51. # Zadanie 6
  52. # Ile samochodów jest zarejestrowanych w Polsce i tańszych od 2000
  53.  
  54. auta2012 %>%
  55. filter(Kraj.aktualnej.rejestracji == 'Polska' & Cena.w.PLN < 2000 ) %>% nrow()
  56.  
  57. #lub
  58.  
  59. auta2012 %>%
  60. filter(Kraj.aktualnej.rejestracji == 'Polska' & Cena.w.PLN < 2000 ) %>%
  61. summarise(n=n())
  62.  
  63.  
  64. # Zadanie 7
  65. # Procent samochodów z dieselem i pojemnością > 1500
  66.  
  67. nrow(auta2012 %>%
  68. filter(Rodzaj.paliwa == 'olej napedowy (diesel)' & Pojemnosc.skokowa > 1500 )) * 100 / nrow(auta2012)
  69.  
  70.  
  71. # Zadanie 8
  72. #Utworzyć nową ramkę z samochodami małymi i sportowymi; ilu ich jest
  73.  
  74. library(MASS)
  75.  
  76. filtered.frame <- Cars93 %>%
  77. filter(Type == 'Small' | Type == 'Sporty')
  78. nrow(filtered.frame)
  79.  
  80. # Zadanie 9
  81. # Wybrać zwierzęta dłuższe od 1m
  82.  
  83. koty_ptaki %>%
  84. filter(dlugosc > 1)
  85.  
  86.  
  87. # Zadanie 10
  88. # Posortować rosnąco wg prędkości
  89.  
  90. koty_ptaki %>%
  91. arrange(predkosc)
  92.  
  93.  
  94. # Zadanie 11
  95. # Wybrać tylko Volkswageny; utworzyć talbicę kntyngnencji dla typu paliwa
  96.  
  97. volks <- auta2012 %>% filter(Marka == 'Volkswagen')
  98. table(volks$Rodzaj.paliwa)
  99.  
  100.  
  101. # Zadanie 12
  102. # Wybrać tylko Volkswageny; policzyć średnią ceną i średni przebieg
  103.  
  104. mean(volks$Cena.w.PLN)
  105. mean(na.omit(volks$Przebieg.w.km))
  106.  
  107.  
  108. # Zadanie 13
  109. # Średnia cena dla każdej marki
  110.  
  111. auta2012 %>%
  112. group_by(Marka) %>%
  113. summarise(sr.cena = mean(Cena.w.PLN))
  114.  
  115. # Zadanie 14
  116. # Ze zbioru auta2012 wybierz jedynie auta Toyota Corolla. Dla tak wybranych danych wyznacz
  117. # pierwszy i trzeci kwartyl ceny.
  118.  
  119. auta2012%>%
  120. filter(Marka == 'Toyota' & Model == 'Corolla') %>% summarise(Q1 = quantile(Cena.w.PLN,1/4), Q2 = quantile(Cena.w.PLN,3/4))
  121.  
  122.  
  123. # Zadanie 15
  124. # Ze zbioru auta2012 wybierz jedynie auta marki Toyota. Dla tak wybranych danych,
  125. # dla każdego modelu wyznacz średnią cenę. Wyniki przedstaw posortowane w kolejności malejącej.
  126.  
  127. auta2012%>%
  128. filter(Marka == 'Toyota') %>%
  129. group_by(Model) %>%
  130. summarise(sr.cena = mean(Cena.w.PLN)) %>%
  131. arrange(desc(sr.cena))
  132.  
  133.  
  134. # Zadanie 16
  135. # Dla danych auta2012 wybierz auta Volkswagen Passat z roku 2006. Dla tak wybranych danych
  136. # wyznacz średnią cenę. Ile spośród wybranych aut jest tańsze od 35 000 PLN?
  137.  
  138. auta2012%>%
  139. filter(Marka == 'Volkswagen' & Model == 'Passat' & Rok.produkcji == 2006) %>%
  140. summarise(mean.price = mean(Cena.w.PLN))
  141.  
  142. auta <- (auta2012 %>% filter(Marka == 'Volkswagen' & Model == 'Passat' & Rok.produkcji == 2006))
  143. nrow(auta %>% filter(Cena.w.PLN < 35000)) * 100 / nrow(auta) #procent, w sumie niepotrzebny
  144.  
  145.  
  146.  
  147. # Zadanie 17
  148. # Dla danych auta2012 wybierze jedynie auta z roku 2007. Dla tak wybranych danych ile mamy aut
  149. # każdej marki? Przedstaw wyniki w postaci posortowanej (kolejność rosnąca) po wielkości każdej
  150. # grupy.
  151.  
  152. auta2012 %>%
  153. filter (Rok.produkcji == 2007) %>%
  154. group_by(Marka) %>%
  155. summarise(n = n()) %>%
  156. arrange(n)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement