Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- #Zadatak1
- knjiga <- read.csv2("knjiga.csv")
- #X - čita li osoba redovito
- #Y - stručna sprema osoba
- #Jesu li X i Y nezavisne slučajne varijable
- #uočimo da nijedna margina nije fiksirana
- attach(knjiga)
- tf <- table(citanje,obrazovanje)
- prop.table(tf)
- #procjene marginalnih distribucija
- addmargins(prop.table(tf))
- #procjene uvjetnih distribucija
- prop.table(tf,1) #procjena za obrazovanje (Y uz uvjet X)
- prop.table(tf,2) #procjena za čitanje (X uz uvjet Y)
- prop.table(margin.table(tf,2)) #distribucija Y
- prop.table(margin.table(tf,1)) #distribucija X
- #Hipoteze:
- #H0: X i Y su nezavisne
- #H1: X i Y su zavisne
- chisq.test(tf)
- #p-vrijednost je 0.001817<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
- #obilježja X i Y su zavisne
- #možemo tvrditi da su navike čitanja i obrazovanje međusobno zavisne
- #u tom smislu nema homogenosti uvjetnih distribucija
- #X - čita li osoba redovito
- #Y - spol osobe
- #Hipoteze:
- #H0: X i Y su nezavisne
- #H1: X i Y su zavisne
- tf <- table(citanje,spol)
- chisq.test(tf)
- #Zadatak2
- #Hipoteze:
- #H0: Odabir smjera ne ovisi o spolu
- #H1: Odabir smjera ovisi o spolu
- #chi^2 test o nezavisnosti
- tf <- matrix(c(100,80,70,50,50,50,50,50),2,4,byrow=TRUE)
- tf
- chisq.test(tf)
- #p-vrijednost je 0.6545>0.05 pa na razini značajnosti 0.05 ne odbacujemo H0
- #tj. nemamo razloga sumnjati u nezavisnost obilježja
- #ne možemo tvrditi da odabir smjera ovisi o spolu
- #Zadatak3
- #Hipoteze:
- #H0: obilježja su nezavisna
- #H1: postoji zavisnost
- tf <- matrix(c(48,26,19,21,36,30),2,3,byrow=TRUE)
- tf
- chisq.test(tf)
- #p-vrijednost je 0.0007232<0.05 pa na razini značajnosti od 0.05 odbacujemo H0 i prihvaćamo H1
- #postoji povezanost između pušenja i povišenog krvnog tlaka
- #procjene za uvjetne distribucije
- #za tlak
- prop.table(tf,2)
- prop.table(margin.table(tf,1))
- #0.4833333 predstavlja postotak osoba s povišenim tlakom u cijeloj populaciji
- #0.6122449 predstavlja postotak teških pušača s povišenim tlakom
- #kod teških pušača veći je udio povišenog tlaka nego kod nepušača ili kod cijele populacije
- #za pušenje
- prop.table(tf,1)
- prop.table(margin.table(tf,2))
- #kod normalnog tlaka je veći udio nepušača nego kod osoba s povišenim tlakom
- tf
- chisq.test(tf)$expected
- #Zadatak4
- library(BSDA)
- tf <- table(Politic)
- tf
- #Hipoteze:
- #H0: odabir političke stranke ne ovisi o spolu
- #H1: odabir političke stranke ovisi o spolu
- chisq.test(tf)
- #warning: postoje očekivane frekvencije koje nisu barem pet
- chisq.test(tf)$expected
- #p-vrijednost je 0.5055>0.05 pa na razini značajnosti 0.05 ne odbacujemo H0
- #nema dokaza da odabir stranke ovisi o spolu
- #MJERE ASOCIJACIJE I KORELACIJE
- #Primjer1
- x <- rnorm(100,0,1)
- y <- rnorm(100,5,1)
- cor(x,y) #po defaultu je Pearson
- cor(x,y,method="spearman")
- cor(x,y,method="kendall")
- #dobili smo jako mali broj (blizak nuli) što sugerira da su x i y nezavisni (što je za očekivati jer su uzorci nezavisno generirani)
- plot(x,y)
- #Primjer2:
- x <- rnorm(100)
- y <- 2*x+1
- cor(x,y)
- cor(x,y,method="spearman")
- cor(x,y,method="kendall")
- plot(x,y)
- #radi se o determinističkoj monotonoj vezi i to linerna
- #Primjer3: linearna veza s aditivnom greškom
- x <- 1:100
- y <- -5*x+rnorm(100,0,50)
- plot(x,y)
- cor(x,y)
- cor(x,y,method="spearman")
- cor(x,y,method="kendall")
- #veza je monotona i padajuća
- #Primjer4:
- x <- rnorm(100)
- y <- x^2
- plot(x,y)
- cor(x,y)
- cor(x,y,method="spearman")
- cor(x,y,method="kendall")
- #nisko i blisko nuli
- #iako su x i y deterministički vezani, niti jedna mjera to nije u mogućnosti prepoznati
- #Primjer5:
- x <- rnorm(100)
- y <- x^3
- plot(x,y)
- cor(x,y)
- cor(x,y,method="spearman")
- cor(x,y,method="kendall")
- #uočimo razliku između korelacije i postojanja monotone veze
- #Zadatak1
- pozar <- read.csv2("pozar.csv")
- #x - udaljenost do vatrogasnog centra
- #y - iznos štete od požara
- attach(pozar)
- x <- udaljenost
- y <- steta
- plot(x,y)
- cor(x,y) #ukazuje na postojanje korelacije (blizak 1 => pozitivne korelacije)
- cor(x,y,method="spearman")
- cor(x,y,method="kendall")
- #spearman i kendall ukazuju na postojanje rastuće monotone veze
- #a)
- #Hipoteze:
- #H0: rho=0
- #H1: rho!=0
- cor.test(x,y)
- #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
- #tj. možemo tvrditi da postoji korelacija
- #b)
- #Hipoteze:
- #H0: rho=0
- #H1: rho>0
- cor.test(x,y,alternative = "greater")
- #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
- #tj. možemo tvrditi da postoji pozitivna korelacija
- #c)
- #Hipoteze:
- #H0: rhoS=0
- #H1: rhoS!=0
- cor.test(x,y,method = "spearman") #zbog jednakih vrijednosti koristi se asimptotska
- #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
- #tj. možemo tvrditi da postoji monotona veza
- #Hipoteze:
- #H0: tau=0
- #H1: tau!=0
- cor.test(x,y,method = "kendall")
- #p-vrijednost je manja od 2.2e-16<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
- #tj. možemo tvrditi da postoji monotona veza
- #d) Da, zbog zaključaka u a,b,c
- #Zadatak2
- library(MASS)
- str(Animals)
- attach(Animals)
- plot(body,brain)
- text(body,brain,labels=row.names(Animals),pos=4)
- #testiramo postojanje pozitivne korelacije:
- #Hipoteze:
- #H0: rho=0
- #H1: rho>0
- cor.test(body,brain,alternative = "greater")
- #p-vrijednost je 0.5108>0.05 pa na razini značajnosti 0.05 ne odbacujemo H0
- #nema dokaza za postojanje pozitivne korelacije
- #testiramo postojanje rastuće veze
- #Spearman
- #Hipoteze:
- #H0: rhoS=0
- #H1: rhoS!=0
- cor.test(body,brain,alternative = "greater",method="spearman")
- #p-vrijednost je 9.064e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
- #možemo tvrditi da postoji rastuća veza
- #Kendall
- #Hipoteze:
- #H0: tau=0
- #H1: tau!=0
- cor.test(body,brain,alternative = "greater",method="kendall")
- #p-vrijednost je 2.071e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
- #možemo tvrditi da postoji rastuća veza
- #za logaritmirane podatke
- plot(log(body),log(brain))
- text(log(body),log(brain),labels=row.names(Animals),pos=4)
- #testiramo postojanje pozitivne korelacije:
- #Hipoteze:
- #H0: rho=0
- #H1: rho>0
- cor.test(log(body),log(brain),alternative = "greater")
- #p-vrijednost je 5.084e-07<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
- #možemo tvrditi da postoji pozitivna korelacija nad logaritmiranim podatcima
- #testiramo postojanje rastuće veze
- #Spearman
- #Hipoteze:
- #H0: rhoS=0
- #H1: rhoS!=0
- cor.test(log(body),log(brain),alternative = "greater",method="spearman")
- #p-vrijednost je 9.064e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
- #možemo tvrditi da postoji rastuća veza
- #Kendall
- #Hipoteze:
- #H0: tau=0
- #H1: tau!=0
- cor.test(log(body),log(brain),alternative = "greater",method="kendall")
- #p-vrijednost je 2.071e-06<<0.05 pa na razini značajnosti 0.05 odbacujemo H0 i prihvaćamo H1
- #možemo tvrditi da postoji rastuća veza
- #Zadatak3
- str(mtcars)
- attach(mtcars)
- plot(mpg,hp)
- #Testiramo postojanje korelacije
- #H0: rho=0
- #H1: rho!=0
- cor.test(mpg,hp)
- #možemo tvrditi da postoji korelacija
- #Testiramo postojanje monotone veze
- #Sperman
- #H0: rhoS=0
- #H1: rhoS!=0
- cor.test(mpg,hp,method="spearman")
- #možemo tvrditi da postoji monotona veza
- #Kendall
- #H0: tau=0
- #H1: tau!=0
- cor.test(mpg,hp,method="kendall")
- #možemo tvrditi da postoji monotona veza
- #po vrijednostima koeficijenata se radi o padajućoj vezi
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement