Advertisement
Guest User

Como Controlar Dados

a guest
Aug 23rd, 2016
74
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 7.87 KB | None | 0 0
  1. 24/08 atv
  2. 14/09 prov
  3. 26/09 atv
  4. 19/10 prov
  5. 19/11 atv
  6. 07/12 prov
  7. http://lite.acad.univali.br/rcurso
  8.  
  9. ###Funções
  10. 2+2
  11. a <- 2
  12. b <- 90
  13. c <- 2*a
  14. d <- 2*sqrt(b)
  15. e <- d*a*b*c
  16. runif <- c("a, b, c, d")
  17. a
  18. b
  19. c
  20. d
  21. e
  22. runif
  23. g <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
  24. g
  25. log(a)
  26. log(x = 10, base = 10)
  27. log(x =10)
  28. log(x = 3, base = 10)
  29. exp(2.3025854)
  30. factorial(10)
  31.  
  32. ###Entrada de base de dados
  33.  
  34. dados <- read.table(file = "insira aqui nome da sua base de dados corretamente",
  35. header = TRUE,
  36. sep = ";",
  37. dec = ",")
  38. ----------
  39. ### Importando dados
  40.  
  41. dados <- read.table(file = "DADOS.csv",
  42. header = TRUE,
  43. sep = ";",
  44. dec = ",")
  45.  
  46.  
  47. ### Vizualizar as primeiras linhas de base de dados
  48.  
  49. head(dados)
  50.  
  51.  
  52. ### Visualizar a estrutura das variáveis...
  53. str(dados)
  54.  
  55. dados$ANO
  56. dados$FROTA
  57. dados$MES
  58. dados$LAT
  59. dados$LON
  60. dados$AREA
  61.  
  62. ### Resumo estatístico de dados
  63. summary(dados)
  64.  
  65. ### 1 quartil 25% e 75%
  66. ### 2 quartil 50% e 50% (mediana)
  67. ### 3 quartil 75% e 25%
  68. ### mediana: 50% de todos os dados separados
  69. ### media: soma de todos os dados dividido pelo número de vezes que ele está representado
  70. ### assimetria positiva a média está para os maiores valores mediana está antes (menor)
  71. ### addimetria negativa a média está para os menores valores mediana está depois(maior)
  72.  
  73. ### Resumo estatístico dos dados
  74. describe(dados)
  75. ### Resumo gráficos - Histograma...
  76. hist(dados$EFF)
  77. ### HISTOGRAMA
  78. x <- hist(dados$EFF, col = "green",
  79. main = "Isto é um histograma",
  80. xlab = "Número de anzóis",
  81. ylab = "Frequência",
  82. ylim = c(0,500))
  83. x
  84. ### DIAGRAMA
  85. plot(x = dados$EFF, y = dados$LAGE, col = "brown",
  86. main = "Isto é um diagrama de disperção",
  87. xlab = "Número de anzóis",
  88. ylab = "Captura (kg)",
  89. pch = 25)
  90.  
  91. plot(x = dados$FROTA, y = dados$EFF, col = "blue")
  92. ### barra preta = mediana do dados de esforço do plot acima (2 quartil)
  93. ### caixinha azul parte de baixo (1 quartil), parte de cima azul (3 quartil)
  94. ### bigodinho pra baixo e pra cima = intervalo interquartil (diferença entre primeiro quartil e o terceiro quartil multiplicado por 1,54)
  95. ### bolinhas = outlier, dados fora do padrão, ou erro de digitação(deport)
  96. ### distribuição simétrica nesse plot seria tudo equilibrado se todos estivesse equilibrados no centro
  97.  
  98.  
  99. ### BAR PLOT (grafico de barras á seguir)
  100.  
  101. x <- table(dados$FROTA)
  102. x
  103. barplot(x, col = "red")
  104.  
  105. x <- table(dados$FROTA, dados$ANO)
  106. x
  107. barplot(x)
  108. barplot(x, beside = TRUE)
  109.  
  110. barplot(x, beside = TRUE,
  111. legend.text = c("BRA", "BRA-ESP"),
  112. col = c("red", "green"))
  113. --------
  114. Semana que vem prova de "analise exploratória"
  115.  
  116. ###analise de variância###
  117.  
  118. trata-se de um métodos estatístico que permite realiazar comparações simultâneas entre 3 ou mais médias, ou seja, testes hipóteses sobre médias de diferentes populações.
  119.  
  120. SPIN-OFF ->(TESTE-T : comparações de duas populações, testa hipoteses simples (hipotese nula(medias iguais m1=m2=m3....mnº) e altenativa(uma media distinta das demais)))
  121. --------------------------------------------------------------------------------------------------------------------------------------------------------------------------
  122. ANOVA | TESTE-T
  123. |
  124. |
  125. um único teste com 95% de confiança, ou seja, nível de significância é | Três testes, cada um com 95% de confiança, ou seja, cada teste com um erro alpha = 0,05
  126. alpha= 0,05 |
  127. |
  128. Ex: M1=M2=M3 | Ex: M1=M2 , M1=M3, M2=M3
  129. --------------------------------------------------------------------------------------------------------------------------------------------------------------------------
  130.  
  131. ->Erro do tipo 1: quanto mais testes são feitos em séries encadeadas cada um com seu erro respectivo ou nível de significância a probabilidade de termos um erro
  132. é aumentada exponencialmente (alpha)
  133. ->Erro do tipo 2: Rejeitar H0 quando na verdade teria que falhar em rejeitar H0
  134.  
  135. Nunca podemos considerar o H1 ou H0 totalmente verdadeiros, mas precisamos analisar todas as possibilidades.
  136.  
  137. Média de idade da turma: 22.5
  138.  
  139. Amostra 1 = 20,21,21,32,22 M = 23,2
  140. Amostra 2 = 22,18,29,19,26 M = 22,8 + ( PS: não foi retirado todos os integrantes da populção (turma) para fazer estas amostras)
  141. Amostra 3 = 23,20,19,20,24 M = 21,2
  142. -----------
  143. MT = 22,4
  144.  
  145. ->Erro não amostral: erro do estatístico(digitação), indução da pergunta, indução da resposta, medições não aleatórias (destintas por opção).
  146.  
  147.  
  148.  
  149. Variabilidade atribuida e outros fatores (ou seja dentro de cada grupos)
  150. /
  151. Variabilidade total
  152. \
  153. Variabilidade aribuida a classe (ou seja variabilidade entre os grupos)
  154.  
  155.  
  156.  
  157. -> Pressupostos do ANOVA
  158.  
  159. 1) Independência das observações (consiste em pressupor que os erros são variáveis aleatórias independentes) Ex: votos para determinação da superioridade.
  160. -Independência analise de residuos = não ter um padrão entre os residuos
  161. -Dependência analise de residuos = tem um padrão entre os residuos
  162.  
  163. 2) Igualdade das variâncias (consiste em que a variança entre as amostras tem que ser similar, estar dentro de padrões) declara sua homogenidade das varianças
  164.  
  165. 3) Normalidade ( consiste em ter uma amostra normal e com variâncias distintas)
  166.  
  167.  
  168. I | Yij |(Yij-y¯)² | ni(y¯i-y¯)²
  169. ------------------------------------ -> Yij = µi + eij
  170. Praia | M.O.| |
  171. A | 30 | 156,25 | 264,5 y¯= Média = 17,25
  172. A | 28 | 110,25 | SQT = 511,5
  173. B | 18 | 0,25 | 0,5 SQEnt= 507
  174. B | 16 | 2,25 | y¯a = 29
  175. C | 6 | 132,25 | 242 y¯b = 17
  176. C | 7 | 110,25 | y¯c = 6,5
  177. SQDen = SQT - SQEnt = 4,5
  178. G.L.t = amostra - 1 = 5
  179. G.L.e = 2
  180. G.L.d = 3
  181. MQE = 253,5
  182. MQD = 1,5
  183. F = 169
  184.  
  185. TABELAS -> http://lite.acad.univali.br/rcurso/anova/index.html
  186.  
  187. ID Área I Área II Área III Área IV
  188. 1 3,2 4,2 5,4 4,5
  189. 2 3,5 3,7 4,6 3,8
  190. 3 2,7 3,4 4 4,1
  191. 4 4,1 4,3 5,3 3,1
  192. 5 3,1 3,9 4,7 4,2
  193. 6 3,7 4,1 4,2 3,4
  194. 7 4,2 3,1 4,9 4,2
  195. 8 3,6 4,5 4,7 4,5
  196.  
  197. (yij-yg)^2 (yij-yg)^2 (yij-yg)^2 (yij-yg)^2
  198.  
  199. 0,685791016 0,029541016 1,882041016 0,222666016
  200. 0,278916016 0,107666016 0,327041016 0,052041016
  201. 1,763916016 0,394541016 0,000791016 0,005166016
  202. 0,005166016 0,073916016 1,617666016 0,861416016
  203. 0,861416016 0,016416016 0,451416016 0,029541016
  204. 0,107666016 0,005166016 0,029541016 0,394541016
  205. 0,029541016 0,861416016 0,760166016 0,029541016
  206. 0,183291016 0,222666016 0,451416016 0,222666016
  207.  
  208.  
  209.  
  210. Média T= 4,028125
  211. Média A1 3,5125
  212. Média A2 3,9
  213. Média A3 4,725
  214. Média A4 3,975
  215. SQT 12,9646875
  216. SQEnt1 2,126953125
  217. SQEnt2 0,131328125
  218. SQEnt3 3,885078125
  219. SQEnt4 0,022578125
  220. SQEtnT 6,1659375
  221. SQDen 6,79875
  222. n 32
  223. k 4
  224. G.L.Total 31
  225. G.L.Ent 3
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement