SHARE
TWEET

Untitled

a guest May 27th, 2019 66 Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. #Zadatak1
  2. knjiga <- read.csv2("knjiga.csv")
  3. #X - čita li osoba redovito
  4. #Y - stručna sprema osoba
  5. #Jesu li X i Y nezavisne slučajne varijable
  6. #uočimo da nijedna margina nije fiksirana
  7. attach(knjiga)
  8. tf <- table(citanje,obrazovanje)
  9. prop.table(tf)
  10. #procjene marginalnih distribucija
  11. addmargins(prop.table(tf))
  12. #procjene uvjetnih distribucija
  13. prop.table(tf,1) #procjena za obrazovanje (Y uz uvjet X)
  14. prop.table(tf,2) #procjena za čitanje (X uz uvjet Y)
  15. prop.table(margin.table(tf,2)) #distribucija Y
  16. prop.table(margin.table(tf,1)) #distribucija X
  17.  
  18. #Hipoteze:
  19. #H0: X i Y su nezavisne
  20. #H1: X i Y su zavisne
  21. chisq.test(tf)
  22. #p-vrijednost je 0.001817<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  23. #obilježja X i Y su zavisne
  24. #možemo tvrditi da su navike čitanja i obrazovanje međusobno zavisne
  25. #u tom smislu nema homogenosti uvjetnih distribucija
  26.  
  27. #X - čita li osoba redovito
  28. #Y - spol osobe
  29. #Hipoteze:
  30. #H0: X i Y su nezavisne
  31. #H1: X i Y su zavisne
  32. tf <- table(citanje,spol)
  33. chisq.test(tf)
  34.  
  35. #Zadatak2
  36. #Hipoteze:
  37. #H0: Odabir smjera ne ovisi o spolu
  38. #H1: Odabir smjera ovisi o spolu
  39. #chi^2 test o nezavisnosti
  40. tf <- matrix(c(100,80,70,50,50,50,50,50),2,4,byrow=TRUE)
  41. tf
  42. chisq.test(tf)
  43. #p-vrijednost je 0.6545>0.05 pa na razini značajnosti 0.05 ne odbacujemo H0
  44. #tj. nemamo razloga sumnjati u nezavisnost obilježja
  45. #ne možemo tvrditi da odabir smjera ovisi o spolu
  46.  
  47. #Zadatak3
  48. #Hipoteze:
  49. #H0: obilježja su nezavisna
  50. #H1: postoji zavisnost
  51. tf <- matrix(c(48,26,19,21,36,30),2,3,byrow=TRUE)
  52. tf
  53. chisq.test(tf)
  54. #p-vrijednost je 0.0007232<0.05 pa na razini značajnosti od 0.05 odbacujemo H0 i prihvaćamo H1
  55. #postoji povezanost između pušenja i povišenog krvnog tlaka
  56.  
  57. #procjene za uvjetne distribucije
  58. #za tlak
  59. prop.table(tf,2)
  60. prop.table(margin.table(tf,1))
  61. #0.4833333 predstavlja postotak osoba s povišenim tlakom u cijeloj populaciji
  62. #0.6122449 predstavlja postotak teških pušača s povišenim tlakom
  63. #kod teških pušača veći je udio povišenog tlaka nego kod nepušača ili kod cijele populacije
  64. #za pušenje
  65. prop.table(tf,1)
  66. prop.table(margin.table(tf,2))
  67. #kod normalnog tlaka je veći udio nepušača nego kod osoba s povišenim tlakom
  68.  
  69. tf
  70. chisq.test(tf)$expected
  71.  
  72. #Zadatak4
  73. library(BSDA)
  74. tf <- table(Politic)
  75. tf
  76. #Hipoteze:
  77. #H0: odabir političke stranke ne ovisi o spolu
  78. #H1: odabir političke stranke ovisi o spolu
  79. chisq.test(tf)
  80. #warning: postoje očekivane frekvencije koje nisu barem pet
  81. chisq.test(tf)$expected
  82. #p-vrijednost je 0.5055>0.05 pa na razini značajnosti 0.05 ne odbacujemo H0
  83. #nema dokaza da odabir stranke ovisi o spolu
  84.  
  85. #MJERE ASOCIJACIJE I KORELACIJE
  86.  
  87. #Primjer1
  88. x <- rnorm(100,0,1)
  89. y <- rnorm(100,5,1)
  90. cor(x,y) #po defaultu je Pearson
  91. cor(x,y,method="spearman")
  92. cor(x,y,method="kendall")
  93. #dobili smo jako mali broj (blizak nuli) što sugerira da su x i y nezavisni (što je za očekivati jer su uzorci nezavisno generirani)
  94. plot(x,y)
  95.  
  96. #Primjer2:
  97. x <- rnorm(100)
  98. y <- 2*x+1
  99. cor(x,y)
  100. cor(x,y,method="spearman")
  101. cor(x,y,method="kendall")
  102. plot(x,y)
  103. #radi se o determinističkoj monotonoj vezi i to linerna
  104.  
  105. #Primjer3: linearna veza s aditivnom greškom
  106. x <- 1:100
  107. y <- -5*x+rnorm(100,0,50)
  108. plot(x,y)
  109. cor(x,y)
  110. cor(x,y,method="spearman")
  111. cor(x,y,method="kendall")
  112. #veza je monotona i padajuća
  113.  
  114. #Primjer4:
  115. x <- rnorm(100)
  116. y <- x^2
  117. plot(x,y)
  118. cor(x,y)
  119. cor(x,y,method="spearman")
  120. cor(x,y,method="kendall")
  121. #nisko i blisko nuli
  122. #iako su x i y deterministički vezani, niti jedna mjera to nije u mogućnosti prepoznati
  123.  
  124. #Primjer5:
  125. x <- rnorm(100)
  126. y <- x^3
  127. plot(x,y)
  128. cor(x,y)
  129. cor(x,y,method="spearman")
  130. cor(x,y,method="kendall")
  131. #uočimo razliku između korelacije i postojanja monotone veze
  132.  
  133. #Zadatak1
  134. pozar <- read.csv2("pozar.csv")
  135. #x - udaljenost do vatrogasnog centra
  136. #y - iznos štete od požara
  137. attach(pozar)
  138. x <- udaljenost
  139. y <- steta
  140. plot(x,y)
  141. cor(x,y) #ukazuje na postojanje korelacije (blizak 1 => pozitivne korelacije)
  142. cor(x,y,method="spearman")
  143. cor(x,y,method="kendall")
  144. #spearman i kendall ukazuju na postojanje rastuće monotone veze
  145.  
  146. #a)
  147. #Hipoteze:
  148. #H0: rho=0
  149. #H1: rho!=0
  150. cor.test(x,y)
  151. #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  152. #tj. možemo tvrditi da postoji korelacija
  153.  
  154. #b)
  155. #Hipoteze:
  156. #H0: rho=0
  157. #H1: rho>0
  158. cor.test(x,y,alternative = "greater")
  159. #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  160. #tj. možemo tvrditi da postoji pozitivna korelacija
  161.  
  162. #c)
  163. #Hipoteze:
  164. #H0: rhoS=0
  165. #H1: rhoS!=0
  166. cor.test(x,y,method = "spearman") #zbog jednakih vrijednosti koristi se asimptotska
  167. #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  168. #tj. možemo tvrditi da postoji monotona veza
  169.  
  170. #Hipoteze:
  171. #H0: tau=0
  172. #H1: tau!=0
  173. cor.test(x,y,method = "kendall")
  174. #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  175. #tj. možemo tvrditi da postoji monotona veza
  176.  
  177. #d) Da, zbog zaključaka u a,b,c
  178.  
  179. #Zadatak2
  180. library(MASS)
  181. str(Animals)
  182. attach(Animals)
  183. plot(body,brain)
  184. text(body,brain,labels=row.names(Animals),pos=4)
  185.  
  186. #testiramo postojanje pozitivne korelacije:
  187. #Hipoteze:
  188. #H0: rho=0
  189. #H1: rho>0
  190. cor.test(body,brain,alternative = "greater")
  191. #p-vrijednost je 0.5108>0.05 pa na razini značajnosti 0.05 ne odbacujemo H0
  192. #nema dokaza za postojanje pozitivne korelacije
  193.  
  194. #testiramo postojanje rastuće veze
  195. #Spearman
  196. #Hipoteze:
  197. #H0: rhoS=0
  198. #H1: rhoS!=0
  199. cor.test(body,brain,alternative = "greater",method="spearman")
  200. #p-vrijednost je 9.064e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  201. #možemo tvrditi da postoji rastuća veza
  202.  
  203. #Kendall
  204. #Hipoteze:
  205. #H0: tau=0
  206. #H1: tau!=0
  207. cor.test(body,brain,alternative = "greater",method="kendall")
  208. #p-vrijednost je 2.071e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  209. #možemo tvrditi da postoji rastuća veza
  210.  
  211. #za logaritmirane podatke
  212. plot(log(body),log(brain))
  213. text(log(body),log(brain),labels=row.names(Animals),pos=4)
  214.  
  215. #testiramo postojanje pozitivne korelacije:
  216. #Hipoteze:
  217. #H0: rho=0
  218. #H1: rho>0
  219. cor.test(log(body),log(brain),alternative = "greater")
  220. #p-vrijednost je 5.084e-07<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  221. #možemo tvrditi da postoji pozitivna korelacija nad logaritmiranim podatcima
  222.  
  223. #testiramo postojanje rastuće veze
  224. #Spearman
  225. #Hipoteze:
  226. #H0: rhoS=0
  227. #H1: rhoS!=0
  228. cor.test(log(body),log(brain),alternative = "greater",method="spearman")
  229. #p-vrijednost je 9.064e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  230. #možemo tvrditi da postoji rastuća veza
  231.  
  232. #Kendall
  233. #Hipoteze:
  234. #H0: tau=0
  235. #H1: tau!=0
  236. cor.test(log(body),log(brain),alternative = "greater",method="kendall")
  237. #p-vrijednost je 2.071e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  238. #možemo tvrditi da postoji rastuća veza
  239.  
  240. #Zadatak3
  241. str(mtcars)
  242. attach(mtcars)
  243. plot(mpg,hp)
  244.  
  245. #Testiramo postojanje korelacije
  246. #H0: rho=0
  247. #H1: rho!=0
  248. cor.test(mpg,hp)
  249. #možemo tvrditi da postoji korelacija
  250.  
  251. #Testiramo postojanje monotone veze
  252. #Sperman
  253. #H0: rhoS=0
  254. #H1: rhoS!=0
  255. cor.test(mpg,hp,method="spearman")
  256. #možemo tvrditi da postoji monotona veza
  257.  
  258. #Kendall
  259. #H0: tau=0
  260. #H1: tau!=0
  261. cor.test(mpg,hp,method="kendall")
  262. #možemo tvrditi da postoji monotona veza
  263.  
  264. #po vrijednostima koeficijenata se radi o padajućoj vezi
RAW Paste Data
We use cookies for various purposes including analytics. By continuing to use Pastebin, you agree to our use of cookies as described in the Cookies Policy. OK, I Understand
 
Top