Advertisement
Guest User

Untitled

a guest
Mar 25th, 2019
69
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 4.06 KB | None | 0 0
  1. djelatnici <- read.csv2("djelatnici.csv")
  2. attach(djelatnici )
  3. #zad 1
  4. #a
  5. mean(placa_prije)#procjena ocekivanja
  6. var(placa_prije)#procjena varijance
  7. median(placa_prije)#procjena medijana
  8. #b
  9. prop.table(table(obrazovanje))
  10. #trazena procjena vjerojatnosti je 0.06
  11. prop.table(table(dob>35))
  12. #procjena te vjerojatnosti je 0.26
  13.  
  14. #procjena distribucije
  15. #empirijska distrubucija
  16. #ecdf()
  17. x <- rnorm(10)
  18. ecdf(x)
  19. plot(ecdf(x))
  20.  
  21. x <- rnorm(1000)
  22. Fn <- ecdf(x)
  23. Fn(1)#procjena ya F(1)-rel frekvencija vrijednosti manjih ili jednakih 1
  24. prop.table(table(x<=1))
  25. pnorm(1)
  26. #diskretne slucajne varijable
  27. #empirijska tablica distribucije
  28. (tab <- prop.table(table(rukovodstvo)))
  29. #ocekivanje empirijske distribucije
  30. sum(as.numeric(names(tab))*tab)
  31. #ili
  32. mean(rukovodstvo)
  33. #varijanca empirijske distribucije
  34. sum(((as.numeric(names(tab))-mean(rukovodstvo))^2)*tab)
  35. #ili
  36. (length(rukovodstvo)-1)/length(rukovodstvo)*var(rukovodstvo)
  37. #zadatak 2
  38.  
  39. hormon <- read.csv2("hormon.csv")
  40. str(hormon)
  41. hormon2 <- na.omit(hormon)#izbacuje sve NA retke iz hormon
  42. str(hormon2)
  43. #a
  44. Fn <- ecdf(gastrS.bezNA)
  45. plot(ecdf(gastrS.bezNA))
  46. #b
  47. 1-Fn(50)#procjena da gastrS bude vece od 50
  48. #ili
  49. prop.table(table(gastrS.bezNA>50))
  50. #c
  51. Fn(75)-Fn(50)
  52. #ili
  53. prop.table(table(gastrS.bezNA>50 & gastrS.bezNA<=75))
  54. #d
  55. prop.table(table(gastrS.bezNA<55.1))
  56. #e
  57. prop.table(table(gastrS.bezNA<=55.1))
  58. #ili
  59. Fn(55.1)
  60. #f
  61. prop.table(table(dijagnoza))
  62. #3
  63. #ECDF je konzistentan procjenitelj i kovnergirat ce prema teoretskoj funkciji distribucije
  64. n <- c(10,50,100,1000)
  65. par(mfrow=c(2,2))
  66. for(i in n)
  67. {
  68. x <- rnorm(i)
  69. plot(ecdf(x),col="red",lwd=2,xlim=c(-4,4), main=paste("n=",i))
  70. curve(pnorm(x),col="blue",lwd=3,add=TRUE, lty=3)
  71. }
  72. #analiza distribucije uzorka
  73. #pr:histogram 1000 slucajnih brojeva iz standardne normalne distribucije
  74. uzorak <- rnorm(1000,0,1)
  75. hist(uzorak)
  76. hist(uzorak, probability = TRUE)
  77. hist(uzorak, probability = TRUE, breaks = 30)
  78. curve(dnorm(x,mean(uzorak),sd(uzorak)),-3,3,add = TRUE)
  79. #histogram uz pretpostavljenu teorijsku gustocu s procjenjenim parametrima
  80.  
  81. x <- rnorm(1000,0,1)
  82. y <- rnorm(1000,0,5)
  83. par(mfrow=c(1,2))
  84. hist(x, probability = TRUE, breaks=20, xlim=c(-20,20))
  85. hist(y, probability = TRUE, breaks=20, xlim=c(-20,20))
  86. #procjenjivanja funkcije gustoce
  87. #density()
  88. x <- rnorm(1000)
  89. hist(x)
  90. density(x)
  91. plot(density(x))
  92. plot(density(x),col="red")
  93. curve(dnorm(t,mean(x),sd(x)),xname="t", add=TRUE)
  94. #procjenjena fun gustoce poklapa se sa teorijskom fun gustoce, sto je i ocekivano jer smo generirali uzorak iz normalne distribucije
  95. #QQplot
  96. #pr
  97. x <- rnorm(1000,0,1)
  98. qqnorm(x)
  99. qqline(x)
  100. #tocke leze priblizno na pravcu y=x
  101. #distribucije bi trebale biti jednake
  102. #pr
  103. x <- rnorm(1000,5,1)
  104. qqnorm(x)
  105. qqline(x)
  106. #tocke su opet na pravcu, ali sada to nije y=x
  107. #distribucije su povezane linearnom transformacijom
  108.  
  109. x <- rnorm(1000,0,1)
  110. qqplot(qt(ppoints(x),4),x)
  111. qqline(x)
  112. #ukazuje na razlike u distribuciji repova
  113. #ukazuje da uzorak vjerojatno nije iz t-distribucije
  114. #primjer
  115. x <- rexp(1000,1)
  116. qqnorm(x)
  117. qqline(x)
  118. #zakrivljenost ukazuje da je distibucija asimetricna
  119.  
  120.  
  121. #zad 4
  122. #visina
  123. hist(visina, probability = TRUE)
  124. curve(dnorm(x,mean(visina),sd(visina)),add = TRUE)
  125. plot(density(visina))
  126. qqnorm(visina)
  127. qqline(visina)
  128. #analogno za drugu varijablu
  129. #zad 5
  130.  
  131. theta1 <- function(x) max(x)
  132. theta2 <- function(x)((length(x)+1)/length(x))*max(x)
  133. theta3 <- function(x)2*mean(x)
  134. n <- 1000
  135. vrtheta1 <- c()
  136. vrtheta2 <- c()
  137. vrtheta3 <- c()
  138. for(i in 1:n)
  139. {
  140. uzorak <- sample(1:100,10,replace = TRUE)
  141. vrtheta1 <- c(vrtheta1, theta1(uzorak))
  142. vrtheta2 <- c(vrtheta2, theta2(uzorak))
  143. vrtheta3 <- c(vrtheta3, theta3(uzorak))
  144. }
  145. par(mfrow=c(1,3))
  146. plot(density(vrtheta1),main=expression(hat(theta[1])))
  147. abline(v=100)
  148. #par(mfrow=c(1,3))
  149. plot(density(vrtheta2),main=expression(hat(theta[2])))
  150. abline(v=100)
  151. #par(mfrow=c(1,3))
  152. plot(density(vrtheta3),main=expression(hat(theta[3])))
  153. abline(v=100)
  154. #theta3 ocigledno ima najvecu varijanu
  155. #theta2 je najblize stvarnoj vrijednosti
  156. mean(vrtheta1)
  157. mean(vrtheta2)
  158. mean(vrtheta3)
  159. var(vrtheta1)
  160. var(vrtheta2)
  161. var(vrtheta3)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement