jorandradefig

clase5.R

Feb 8th, 2019
141
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
R 1.97 KB | None | 0 0
  1. # clase 5
  2.  
  3. # ruta de la base de datos
  4.  
  5. ruta <- "/Users/jorandradefig/Downloads/carpetas-de-investigacion-pgj-cdmx.csv"
  6.  
  7. # leer base de datos y guardar en variable
  8. # UTF-8 es la codificación unicode o universal
  9.  
  10. pgj.cdmx <- read.csv(ruta, sep=";", encoding="UTF-8")
  11.  
  12. # mostrar base de datos
  13.  
  14. pgj.cdmx
  15.  
  16. # resumen de la base de datos
  17.  
  18. summary(pgj.cdmx)
  19.  
  20. # instalar biblioteca tidyverse
  21.  
  22. install.packages("tidyverse", dependencies=TRUE)
  23.  
  24. # importar o activar biblioteca tidyverse
  25.  
  26. library(tidyverse)
  27.  
  28. # seleccionar columnas
  29. # selección vertical de la tabla
  30.  
  31. select(pgj.cdmx, "Alcaldía")
  32.  
  33. # filtrar o seleccionar los renglones
  34. # donde la columna de Alcaldía es igual a CUAUHTEMOC
  35. # selección horizontal de la tabla
  36.  
  37. filter(pgj.cdmx, "Alcaldía" == "CUAUHTEMOC")
  38.  
  39. # incrementar imprimir como máximo 1000000 de filas
  40.  
  41. options(max.print=1000)
  42.  
  43. # seleccionar la columna Alcaldía de la base de datos (pgj.cdmx)
  44.  
  45. select(pgj.cdmx, "Alcaldía")
  46.  
  47. # nombrar la selección de la columna Alcaldía de la base de datos (pgj.cdmx)
  48.  
  49. columna.alcaldia <- select(pgj.cdmx, "Alcaldía")
  50.  
  51. # Agrupamos la selección de la columna Alcaldía de la base de datos
  52.  
  53. group_by(columna.alcaldia, `Alcaldía`)
  54.  
  55. # nombramos la agrupación de la selección de la columna Alcaldía de la base de datos
  56.  
  57. group.alcaldia <- group_by(columna.alcaldia, `Alcaldía`)
  58.  
  59. # sumamos la agrupación de la selección de la columna de la base
  60.  
  61. summarise(group.alcaldia, count = n())
  62.  
  63. # nombramos la suma de la agrupación de la selección de la columna de la base
  64.  
  65. summarise.alcaldia <- summarise(group.alcaldia, count = n())
  66.  
  67. # mostramos todo de la suma de la agrupación de la selección de la columna de la base
  68.  
  69. data <- as.data.frame(summarise.alcaldia)
  70.  
  71. summary(data)
  72.  
  73. # graficamos la muestra completa de la suma de la agrupación de la selección de la columna de la base
  74.  
  75. ggplot(data = data, mapping = aes(x = data$Alcaldía, y = data$count)) +
  76.   geom_point(aes(size = data$count))
Add Comment
Please, Sign In to add comment