SHARE
TWEET

Untitled

a guest May 27th, 2019 66 Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
 1. #Zadatak1
 2. knjiga <- read.csv2("knjiga.csv")
 3. #X - čita li osoba redovito
 4. #Y - stručna sprema osoba
 5. #Jesu li X i Y nezavisne slučajne varijable
 6. #uočimo da nijedna margina nije fiksirana
 7. attach(knjiga)
 8. tf <- table(citanje,obrazovanje)
 9. prop.table(tf)
 10. #procjene marginalnih distribucija
 11. addmargins(prop.table(tf))
 12. #procjene uvjetnih distribucija
 13. prop.table(tf,1) #procjena za obrazovanje (Y uz uvjet X)
 14. prop.table(tf,2) #procjena za čitanje (X uz uvjet Y)
 15. prop.table(margin.table(tf,2)) #distribucija Y
 16. prop.table(margin.table(tf,1)) #distribucija X
 17.  
 18. #Hipoteze:
 19. #H0: X i Y su nezavisne
 20. #H1: X i Y su zavisne
 21. chisq.test(tf)
 22. #p-vrijednost je 0.001817<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
 23. #obilježja X i Y su zavisne
 24. #možemo tvrditi da su navike čitanja i obrazovanje međusobno zavisne
 25. #u tom smislu nema homogenosti uvjetnih distribucija
 26.  
 27. #X - čita li osoba redovito
 28. #Y - spol osobe
 29. #Hipoteze:
 30. #H0: X i Y su nezavisne
 31. #H1: X i Y su zavisne
 32. tf <- table(citanje,spol)
 33. chisq.test(tf)
 34.  
 35. #Zadatak2
 36. #Hipoteze:
 37. #H0: Odabir smjera ne ovisi o spolu
 38. #H1: Odabir smjera ovisi o spolu
 39. #chi^2 test o nezavisnosti
 40. tf <- matrix(c(100,80,70,50,50,50,50,50),2,4,byrow=TRUE)
 41. tf
 42. chisq.test(tf)
 43. #p-vrijednost je 0.6545>0.05 pa na razini značajnosti 0.05 ne odbacujemo H0
 44. #tj. nemamo razloga sumnjati u nezavisnost obilježja
 45. #ne možemo tvrditi da odabir smjera ovisi o spolu
 46.  
 47. #Zadatak3
 48. #Hipoteze:
 49. #H0: obilježja su nezavisna
 50. #H1: postoji zavisnost
 51. tf <- matrix(c(48,26,19,21,36,30),2,3,byrow=TRUE)
 52. tf
 53. chisq.test(tf)
 54. #p-vrijednost je 0.0007232<0.05 pa na razini značajnosti od 0.05 odbacujemo H0 i prihvaćamo H1
 55. #postoji povezanost između pušenja i povišenog krvnog tlaka
 56.  
 57. #procjene za uvjetne distribucije
 58. #za tlak
 59. prop.table(tf,2)
 60. prop.table(margin.table(tf,1))
 61. #0.4833333 predstavlja postotak osoba s povišenim tlakom u cijeloj populaciji
 62. #0.6122449 predstavlja postotak teških pušača s povišenim tlakom
 63. #kod teških pušača veći je udio povišenog tlaka nego kod nepušača ili kod cijele populacije
 64. #za pušenje
 65. prop.table(tf,1)
 66. prop.table(margin.table(tf,2))
 67. #kod normalnog tlaka je veći udio nepušača nego kod osoba s povišenim tlakom
 68.  
 69. tf
 70. chisq.test(tf)$expected
 71.  
 72. #Zadatak4
 73. library(BSDA)
 74. tf <- table(Politic)
 75. tf
 76. #Hipoteze:
 77. #H0: odabir političke stranke ne ovisi o spolu
 78. #H1: odabir političke stranke ovisi o spolu
 79. chisq.test(tf)
 80. #warning: postoje očekivane frekvencije koje nisu barem pet
 81. chisq.test(tf)$expected
 82. #p-vrijednost je 0.5055>0.05 pa na razini značajnosti 0.05 ne odbacujemo H0
 83. #nema dokaza da odabir stranke ovisi o spolu
 84.  
 85. #MJERE ASOCIJACIJE I KORELACIJE
 86.  
 87. #Primjer1
 88. x <- rnorm(100,0,1)
 89. y <- rnorm(100,5,1)
 90. cor(x,y) #po defaultu je Pearson
 91. cor(x,y,method="spearman")
 92. cor(x,y,method="kendall")
 93. #dobili smo jako mali broj (blizak nuli) što sugerira da su x i y nezavisni (što je za očekivati jer su uzorci nezavisno generirani)
 94. plot(x,y)
 95.  
 96. #Primjer2:
 97. x <- rnorm(100)
 98. y <- 2*x+1
 99. cor(x,y)
 100. cor(x,y,method="spearman")
 101. cor(x,y,method="kendall")
 102. plot(x,y)
 103. #radi se o determinističkoj monotonoj vezi i to linerna
 104.  
 105. #Primjer3: linearna veza s aditivnom greškom
 106. x <- 1:100
 107. y <- -5*x+rnorm(100,0,50)
 108. plot(x,y)
 109. cor(x,y)
 110. cor(x,y,method="spearman")
 111. cor(x,y,method="kendall")
 112. #veza je monotona i padajuća
 113.  
 114. #Primjer4:
 115. x <- rnorm(100)
 116. y <- x^2
 117. plot(x,y)
 118. cor(x,y)
 119. cor(x,y,method="spearman")
 120. cor(x,y,method="kendall")
 121. #nisko i blisko nuli
 122. #iako su x i y deterministički vezani, niti jedna mjera to nije u mogućnosti prepoznati
 123.  
 124. #Primjer5:
 125. x <- rnorm(100)
 126. y <- x^3
 127. plot(x,y)
 128. cor(x,y)
 129. cor(x,y,method="spearman")
 130. cor(x,y,method="kendall")
 131. #uočimo razliku između korelacije i postojanja monotone veze
 132.  
 133. #Zadatak1
 134. pozar <- read.csv2("pozar.csv")
 135. #x - udaljenost do vatrogasnog centra
 136. #y - iznos štete od požara
 137. attach(pozar)
 138. x <- udaljenost
 139. y <- steta
 140. plot(x,y)
 141. cor(x,y) #ukazuje na postojanje korelacije (blizak 1 => pozitivne korelacije)
 142. cor(x,y,method="spearman")
 143. cor(x,y,method="kendall")
 144. #spearman i kendall ukazuju na postojanje rastuće monotone veze
 145.  
 146. #a)
 147. #Hipoteze:
 148. #H0: rho=0
 149. #H1: rho!=0
 150. cor.test(x,y)
 151. #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
 152. #tj. možemo tvrditi da postoji korelacija
 153.  
 154. #b)
 155. #Hipoteze:
 156. #H0: rho=0
 157. #H1: rho>0
 158. cor.test(x,y,alternative = "greater")
 159. #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
 160. #tj. možemo tvrditi da postoji pozitivna korelacija
 161.  
 162. #c)
 163. #Hipoteze:
 164. #H0: rhoS=0
 165. #H1: rhoS!=0
 166. cor.test(x,y,method = "spearman") #zbog jednakih vrijednosti koristi se asimptotska
 167. #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
 168. #tj. možemo tvrditi da postoji monotona veza
 169.  
 170. #Hipoteze:
 171. #H0: tau=0
 172. #H1: tau!=0
 173. cor.test(x,y,method = "kendall")
 174. #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
 175. #tj. možemo tvrditi da postoji monotona veza
 176.  
 177. #d) Da, zbog zaključaka u a,b,c
 178.  
 179. #Zadatak2
 180. library(MASS)
 181. str(Animals)
 182. attach(Animals)
 183. plot(body,brain)
 184. text(body,brain,labels=row.names(Animals),pos=4)
 185.  
 186. #testiramo postojanje pozitivne korelacije:
 187. #Hipoteze:
 188. #H0: rho=0
 189. #H1: rho>0
 190. cor.test(body,brain,alternative = "greater")
 191. #p-vrijednost je 0.5108>0.05 pa na razini značajnosti 0.05 ne odbacujemo H0
 192. #nema dokaza za postojanje pozitivne korelacije
 193.  
 194. #testiramo postojanje rastuće veze
 195. #Spearman
 196. #Hipoteze:
 197. #H0: rhoS=0
 198. #H1: rhoS!=0
 199. cor.test(body,brain,alternative = "greater",method="spearman")
 200. #p-vrijednost je 9.064e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
 201. #možemo tvrditi da postoji rastuća veza
 202.  
 203. #Kendall
 204. #Hipoteze:
 205. #H0: tau=0
 206. #H1: tau!=0
 207. cor.test(body,brain,alternative = "greater",method="kendall")
 208. #p-vrijednost je 2.071e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
 209. #možemo tvrditi da postoji rastuća veza
 210.  
 211. #za logaritmirane podatke
 212. plot(log(body),log(brain))
 213. text(log(body),log(brain),labels=row.names(Animals),pos=4)
 214.  
 215. #testiramo postojanje pozitivne korelacije:
 216. #Hipoteze:
 217. #H0: rho=0
 218. #H1: rho>0
 219. cor.test(log(body),log(brain),alternative = "greater")
 220. #p-vrijednost je 5.084e-07<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
 221. #možemo tvrditi da postoji pozitivna korelacija nad logaritmiranim podatcima
 222.  
 223. #testiramo postojanje rastuće veze
 224. #Spearman
 225. #Hipoteze:
 226. #H0: rhoS=0
 227. #H1: rhoS!=0
 228. cor.test(log(body),log(brain),alternative = "greater",method="spearman")
 229. #p-vrijednost je 9.064e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
 230. #možemo tvrditi da postoji rastuća veza
 231.  
 232. #Kendall
 233. #Hipoteze:
 234. #H0: tau=0
 235. #H1: tau!=0
 236. cor.test(log(body),log(brain),alternative = "greater",method="kendall")
 237. #p-vrijednost je 2.071e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
 238. #možemo tvrditi da postoji rastuća veza
 239.  
 240. #Zadatak3
 241. str(mtcars)
 242. attach(mtcars)
 243. plot(mpg,hp)
 244.  
 245. #Testiramo postojanje korelacije
 246. #H0: rho=0
 247. #H1: rho!=0
 248. cor.test(mpg,hp)
 249. #možemo tvrditi da postoji korelacija
 250.  
 251. #Testiramo postojanje monotone veze
 252. #Sperman
 253. #H0: rhoS=0
 254. #H1: rhoS!=0
 255. cor.test(mpg,hp,method="spearman")
 256. #možemo tvrditi da postoji monotona veza
 257.  
 258. #Kendall
 259. #H0: tau=0
 260. #H1: tau!=0
 261. cor.test(mpg,hp,method="kendall")
 262. #možemo tvrditi da postoji monotona veza
 263.  
 264. #po vrijednostima koeficijenata se radi o padajućoj vezi
RAW Paste Data
We use cookies for various purposes including analytics. By continuing to use Pastebin, you agree to our use of cookies as described in the Cookies Policy. OK, I Understand
 
Top