Advertisement
Guest User

Untitled

a guest
May 27th, 2019
83
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 7.37 KB | None | 0 0
  1. #Zadatak1
  2. knjiga <- read.csv2("knjiga.csv")
  3. #X - čita li osoba redovito
  4. #Y - stručna sprema osoba
  5. #Jesu li X i Y nezavisne slučajne varijable
  6. #uočimo da nijedna margina nije fiksirana
  7. attach(knjiga)
  8. tf <- table(citanje,obrazovanje)
  9. prop.table(tf)
  10. #procjene marginalnih distribucija
  11. addmargins(prop.table(tf))
  12. #procjene uvjetnih distribucija
  13. prop.table(tf,1) #procjena za obrazovanje (Y uz uvjet X)
  14. prop.table(tf,2) #procjena za čitanje (X uz uvjet Y)
  15. prop.table(margin.table(tf,2)) #distribucija Y
  16. prop.table(margin.table(tf,1)) #distribucija X
  17.  
  18. #Hipoteze:
  19. #H0: X i Y su nezavisne
  20. #H1: X i Y su zavisne
  21. chisq.test(tf)
  22. #p-vrijednost je 0.001817<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  23. #obilježja X i Y su zavisne
  24. #možemo tvrditi da su navike čitanja i obrazovanje međusobno zavisne
  25. #u tom smislu nema homogenosti uvjetnih distribucija
  26.  
  27. #X - čita li osoba redovito
  28. #Y - spol osobe
  29. #Hipoteze:
  30. #H0: X i Y su nezavisne
  31. #H1: X i Y su zavisne
  32. tf <- table(citanje,spol)
  33. chisq.test(tf)
  34.  
  35. #Zadatak2
  36. #Hipoteze:
  37. #H0: Odabir smjera ne ovisi o spolu
  38. #H1: Odabir smjera ovisi o spolu
  39. #chi^2 test o nezavisnosti
  40. tf <- matrix(c(100,80,70,50,50,50,50,50),2,4,byrow=TRUE)
  41. tf
  42. chisq.test(tf)
  43. #p-vrijednost je 0.6545>0.05 pa na razini značajnosti 0.05 ne odbacujemo H0
  44. #tj. nemamo razloga sumnjati u nezavisnost obilježja
  45. #ne možemo tvrditi da odabir smjera ovisi o spolu
  46.  
  47. #Zadatak3
  48. #Hipoteze:
  49. #H0: obilježja su nezavisna
  50. #H1: postoji zavisnost
  51. tf <- matrix(c(48,26,19,21,36,30),2,3,byrow=TRUE)
  52. tf
  53. chisq.test(tf)
  54. #p-vrijednost je 0.0007232<0.05 pa na razini značajnosti od 0.05 odbacujemo H0 i prihvaćamo H1
  55. #postoji povezanost između pušenja i povišenog krvnog tlaka
  56.  
  57. #procjene za uvjetne distribucije
  58. #za tlak
  59. prop.table(tf,2)
  60. prop.table(margin.table(tf,1))
  61. #0.4833333 predstavlja postotak osoba s povišenim tlakom u cijeloj populaciji
  62. #0.6122449 predstavlja postotak teških pušača s povišenim tlakom
  63. #kod teških pušača veći je udio povišenog tlaka nego kod nepušača ili kod cijele populacije
  64. #za pušenje
  65. prop.table(tf,1)
  66. prop.table(margin.table(tf,2))
  67. #kod normalnog tlaka je veći udio nepušača nego kod osoba s povišenim tlakom
  68.  
  69. tf
  70. chisq.test(tf)$expected
  71.  
  72. #Zadatak4
  73. library(BSDA)
  74. tf <- table(Politic)
  75. tf
  76. #Hipoteze:
  77. #H0: odabir političke stranke ne ovisi o spolu
  78. #H1: odabir političke stranke ovisi o spolu
  79. chisq.test(tf)
  80. #warning: postoje očekivane frekvencije koje nisu barem pet
  81. chisq.test(tf)$expected
  82. #p-vrijednost je 0.5055>0.05 pa na razini značajnosti 0.05 ne odbacujemo H0
  83. #nema dokaza da odabir stranke ovisi o spolu
  84.  
  85. #MJERE ASOCIJACIJE I KORELACIJE
  86.  
  87. #Primjer1
  88. x <- rnorm(100,0,1)
  89. y <- rnorm(100,5,1)
  90. cor(x,y) #po defaultu je Pearson
  91. cor(x,y,method="spearman")
  92. cor(x,y,method="kendall")
  93. #dobili smo jako mali broj (blizak nuli) što sugerira da su x i y nezavisni (što je za očekivati jer su uzorci nezavisno generirani)
  94. plot(x,y)
  95.  
  96. #Primjer2:
  97. x <- rnorm(100)
  98. y <- 2*x+1
  99. cor(x,y)
  100. cor(x,y,method="spearman")
  101. cor(x,y,method="kendall")
  102. plot(x,y)
  103. #radi se o determinističkoj monotonoj vezi i to linerna
  104.  
  105. #Primjer3: linearna veza s aditivnom greškom
  106. x <- 1:100
  107. y <- -5*x+rnorm(100,0,50)
  108. plot(x,y)
  109. cor(x,y)
  110. cor(x,y,method="spearman")
  111. cor(x,y,method="kendall")
  112. #veza je monotona i padajuća
  113.  
  114. #Primjer4:
  115. x <- rnorm(100)
  116. y <- x^2
  117. plot(x,y)
  118. cor(x,y)
  119. cor(x,y,method="spearman")
  120. cor(x,y,method="kendall")
  121. #nisko i blisko nuli
  122. #iako su x i y deterministički vezani, niti jedna mjera to nije u mogućnosti prepoznati
  123.  
  124. #Primjer5:
  125. x <- rnorm(100)
  126. y <- x^3
  127. plot(x,y)
  128. cor(x,y)
  129. cor(x,y,method="spearman")
  130. cor(x,y,method="kendall")
  131. #uočimo razliku između korelacije i postojanja monotone veze
  132.  
  133. #Zadatak1
  134. pozar <- read.csv2("pozar.csv")
  135. #x - udaljenost do vatrogasnog centra
  136. #y - iznos štete od požara
  137. attach(pozar)
  138. x <- udaljenost
  139. y <- steta
  140. plot(x,y)
  141. cor(x,y) #ukazuje na postojanje korelacije (blizak 1 => pozitivne korelacije)
  142. cor(x,y,method="spearman")
  143. cor(x,y,method="kendall")
  144. #spearman i kendall ukazuju na postojanje rastuće monotone veze
  145.  
  146. #a)
  147. #Hipoteze:
  148. #H0: rho=0
  149. #H1: rho!=0
  150. cor.test(x,y)
  151. #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  152. #tj. možemo tvrditi da postoji korelacija
  153.  
  154. #b)
  155. #Hipoteze:
  156. #H0: rho=0
  157. #H1: rho>0
  158. cor.test(x,y,alternative = "greater")
  159. #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  160. #tj. možemo tvrditi da postoji pozitivna korelacija
  161.  
  162. #c)
  163. #Hipoteze:
  164. #H0: rhoS=0
  165. #H1: rhoS!=0
  166. cor.test(x,y,method = "spearman") #zbog jednakih vrijednosti koristi se asimptotska
  167. #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  168. #tj. možemo tvrditi da postoji monotona veza
  169.  
  170. #Hipoteze:
  171. #H0: tau=0
  172. #H1: tau!=0
  173. cor.test(x,y,method = "kendall")
  174. #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  175. #tj. možemo tvrditi da postoji monotona veza
  176.  
  177. #d) Da, zbog zaključaka u a,b,c
  178.  
  179. #Zadatak2
  180. library(MASS)
  181. str(Animals)
  182. attach(Animals)
  183. plot(body,brain)
  184. text(body,brain,labels=row.names(Animals),pos=4)
  185.  
  186. #testiramo postojanje pozitivne korelacije:
  187. #Hipoteze:
  188. #H0: rho=0
  189. #H1: rho>0
  190. cor.test(body,brain,alternative = "greater")
  191. #p-vrijednost je 0.5108>0.05 pa na razini značajnosti 0.05 ne odbacujemo H0
  192. #nema dokaza za postojanje pozitivne korelacije
  193.  
  194. #testiramo postojanje rastuće veze
  195. #Spearman
  196. #Hipoteze:
  197. #H0: rhoS=0
  198. #H1: rhoS!=0
  199. cor.test(body,brain,alternative = "greater",method="spearman")
  200. #p-vrijednost je 9.064e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  201. #možemo tvrditi da postoji rastuća veza
  202.  
  203. #Kendall
  204. #Hipoteze:
  205. #H0: tau=0
  206. #H1: tau!=0
  207. cor.test(body,brain,alternative = "greater",method="kendall")
  208. #p-vrijednost je 2.071e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  209. #možemo tvrditi da postoji rastuća veza
  210.  
  211. #za logaritmirane podatke
  212. plot(log(body),log(brain))
  213. text(log(body),log(brain),labels=row.names(Animals),pos=4)
  214.  
  215. #testiramo postojanje pozitivne korelacije:
  216. #Hipoteze:
  217. #H0: rho=0
  218. #H1: rho>0
  219. cor.test(log(body),log(brain),alternative = "greater")
  220. #p-vrijednost je 5.084e-07<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  221. #možemo tvrditi da postoji pozitivna korelacija nad logaritmiranim podatcima
  222.  
  223. #testiramo postojanje rastuće veze
  224. #Spearman
  225. #Hipoteze:
  226. #H0: rhoS=0
  227. #H1: rhoS!=0
  228. cor.test(log(body),log(brain),alternative = "greater",method="spearman")
  229. #p-vrijednost je 9.064e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  230. #možemo tvrditi da postoji rastuća veza
  231.  
  232. #Kendall
  233. #Hipoteze:
  234. #H0: tau=0
  235. #H1: tau!=0
  236. cor.test(log(body),log(brain),alternative = "greater",method="kendall")
  237. #p-vrijednost je 2.071e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
  238. #možemo tvrditi da postoji rastuća veza
  239.  
  240. #Zadatak3
  241. str(mtcars)
  242. attach(mtcars)
  243. plot(mpg,hp)
  244.  
  245. #Testiramo postojanje korelacije
  246. #H0: rho=0
  247. #H1: rho!=0
  248. cor.test(mpg,hp)
  249. #možemo tvrditi da postoji korelacija
  250.  
  251. #Testiramo postojanje monotone veze
  252. #Sperman
  253. #H0: rhoS=0
  254. #H1: rhoS!=0
  255. cor.test(mpg,hp,method="spearman")
  256. #možemo tvrditi da postoji monotona veza
  257.  
  258. #Kendall
  259. #H0: tau=0
  260. #H1: tau!=0
  261. cor.test(mpg,hp,method="kendall")
  262. #možemo tvrditi da postoji monotona veza
  263.  
  264. #po vrijednostima koeficijenata se radi o padajućoj vezi
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement