Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- ### Zadanie 5
- library(UsingR)
- library(dplyr)
- # Wyniki wyborów prezydenckich
- data.set <- florida
- View(data.set)
- # Wykres przedstawiający wyniki Busha i Buchanana + nazwy okręgów, w których osiągnięto te wyniki
- data.set %>%
- ggplot(aes(x = BUSH, y = BUCHANAN)) +
- geom_point() +
- geom_text(aes(label = County))
- # Identyfikacja dwóch najbardziej odstających wyników na podstawie wykresu: Palm Beach i Dade
- # Usunięcie wierszy z odstającymi wynikami
- data.filtered <- data.set[(data.set$County != "PALM BEACH" & data.set$County != "DADE"),]
- # Dopasowanie modelu do danych z usuniętymi obserwacjami odstającymi
- pres.model <- lm(BUCHANAN ~ BUSH, data = data.filtered)
- # Prognoza wyników dla Buchanana bazująca na liczbie głosów na Busha w okręgu Dade
- bush.result <- data.set[(data.set$County == "DADE"), "BUSH"] # wyniki Busha w Dade
- predict(pres.model, data.frame(BUSH = bush.result)) # prognoza
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement