Advertisement
Guest User

Untitled

a guest
Jan 25th, 2020
92
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
R 2.17 KB | None | 0 0
  1. mieszk <- read.table("dane/mieszkania.txt", header = TRUE, sep = ";", dec = ",")
  2. mieszk
  3. str(mieszk)
  4.  
  5. library(dplyr)
  6. library(tidyverse)
  7.  
  8. #zadanie2
  9. #podpunkt a
  10. sred <- mean(mieszk$cena)
  11.  
  12. dfOpcje <- mieszk %>%
  13.   group_by(miasto) %>%
  14.   filter(miasto == "Warszawa" & cena > sred)
  15. dfOpcje
  16.  
  17. dfDzielnia <- dfOpcje %>%
  18.   group_by(dzielnica) %>%
  19.   summarise(ilosc=n()) %>%
  20.   mutate(odsetek=round((ilosc/sum(ilosc)),2)) %>%
  21.   arrange(ilosc)
  22. dfDzielnia        
  23.  
  24. #podpunkt b
  25. library(e1071)
  26. podb <- mieszk %>%
  27.   group_by(miasto) %>%
  28.   filter(rok == 2010 & miesiac == 12) %>%
  29.   summarise(sred = mean(cena),
  30.             mediana = median(cena),
  31.             kurtoza = kurtosis(cena),
  32.             wspasy = skewness(cena),
  33.             odchylenie = sd(cena))
  34. podb
  35.  
  36. ggplot(podb, aes(x = miasto, y = mediana)) +
  37.   geom_col() +
  38.   labs(x="Miasto", y = "Mediana ceny")
  39.  
  40. #podpunkt c
  41. head(mieszk)
  42.  
  43. podc <- mieszk %>%
  44.   group_by(dzielnica) %>%
  45.   filter(dzielnica == "Wola"| dzielnica =="Zoliborz")  
  46.   #summarise(srednia = mean(cena)) %>%
  47.  # mutate(cena)
  48. podc
  49.  
  50. #H0: Cena w tych dzielnicach sie nie rózni
  51. #H1: Cena w tych dzielnicach sie różni
  52.  
  53. ggplot(podc, aes(x=dzielnica, y = cena))+
  54.   geom_boxplot()
  55.  
  56. podcc <- mieszk %>%
  57.   group_by(dzielnica) %>%
  58.   filter(dzielnica == "Wola"| dzielnica =="Zoliborz") %>%  
  59.   summarise(srednia = mean(cena))  
  60.  
  61. podcc
  62.  
  63. t.test(podcc$srednia, mu=0 ,conf.level = 0.95)
  64. #Wnioski: Nie ma podstaw do odrzucenia hipotezy H0.
  65.  
  66. #podpunkt d
  67. bank <- read.table("dane/bankFull.csv", header = TRUE, sep = ";", dec=",")
  68. str(bank)
  69.  
  70. podd <- bank %>%
  71.   group_by(marital, default) %>%
  72.   summarise(ilosc=n(),
  73.             kur = kurtosis(age))
  74. prop.test(815,n = 815+44396,conf.level = 0.95,correct=TRUE)
  75.  
  76. podd
  77. table(bank$default)
  78.  
  79. #zadanie3
  80. sok <- c("kubus", "pysio", "leon", "bobo frut")
  81. cena <- c(1.2, 1.35, 1.65, 1.99)
  82. cukier <- c(11.5, 12, 10, 9.6)
  83. dfSok <- data.frame(sok, cena, cukier)
  84. dfSok
  85.  
  86. kas <- c("bla", "hahaha", "max", "lololo")
  87. man <- c(6, 5, 4, 3)
  88. kij <- c(1, 2, 3, 4)
  89. dfBla <- data.frame(kas, man, kij)
  90. dfBla
  91.  
  92. dfSok$SRA <- c()
  93. dfSok$DRA <- c()
  94. dfSok[,c("SRA", "DRA")] <- dfBla[,c("kas", "man")]
  95. dfSok
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement