Advertisement
Guest User

Untitled

a guest
May 29th, 2015
263
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 3.68 KB | None | 0 0
  1. ### Прочетете данните и ги запишете в data frame в R;
  2. myData = read.csv("C:/Users/ymihaylov/internet.csv", header = TRUE)
  3.  
  4. data_frame = data.frame(myData)
  5.  
  6. ### Изкарайте на екрана първите няколко (5-6) наблюдения;
  7. data_frame[1:6,]
  8.  
  9. ### Използвайте функция, за да извлечете имената на променливите;
  10. colnames(data_frame)
  11.  
  12. ### Какъв вид данни (качествени/количествени) са записани във всяка от
  13. променливите Internet_users, One_yr_growth, One_yr_population_change,
  14. Penetration?
  15. # Качествени - One_yr_population_change
  16. # Количествени - Internet_users, One_yr_growth, Penetration
  17.  
  18. ### Изведете дескриптивни статистики за всяка една от посочените по-
  19. ### горе четири променливи;
  20. summary(data_frame$One_yr_growth)
  21. summary(data_frame$Internet_users)
  22. summary(data_frame$Penetration)
  23. summary(data_frame$One_yr_population_change)
  24.  
  25. ### Изведете редовете на държавите с най-голям и най-малък процент
  26. ### интернет потребители в населението;
  27. row.names(subset(data_frame,Penetration==max(data_frame$Penetration))) # 17
  28. row.names(subset(data_frame,Penetration==min(data_frame$Penetration))) # 30
  29.  
  30. ### Изведете редовете на държавите с процентно нарастване на интернет
  31. ### потребителите под 0.05;
  32. row.names(subset(data_frame,One_yr_growth < 0.05))
  33.  
  34. ### Направете хистограма на процентното нарастване на интернет потре-
  35. ### бителите само за държавите с отрицателен прираст на населението и
  36. ### нанесете графика на плътността върху нея. Симетрично ли са разпо- ложени
  37. ### данните?
  38. growth_with_negative_population = subset(data_frame$One_yr_growth, data_frame$One_yr_population_change == "negative")
  39. hist(growth_with_negative_population)
  40. lines(density(growth_with_negative_population), col="blue", lwd=2)
  41. lines(density(growth_with_negative_population, adjust=2), col="darkgreen", lwd=2)
  42.  
  43. # Данните не са разположени симетрично
  44.  
  45. ### Изследвайте съвместно променливите One_yr_growth и One_yr_population_change
  46. ### с подходящ графичен метод. В коя група може да се каже, че има по-
  47. ### голямо процентно нарастване на интернет потребителите? Сравнете
  48. ### извадковите средни и медианите в двете групи;
  49. # Медиани
  50. # negative - 0.02 и positive - 0.08
  51.  
  52. # negative
  53. mean(subset(data_frame$One_yr_growth,data_frame$One_yr_population_change == "negative"))
  54. # [1] 0.04866667
  55.  
  56. # positive
  57. mean(subset(data_frame$One_yr_growth,data_frame$One_yr_population_change == "positive"))
  58. # [1] 0.08133333
  59.  
  60. # Изследвайте съвместно променливите Internet_users и Penetration
  61. # с подходящ графичен метод. Бихте ли казали, че съшествува линейна
  62. # връзка между тях? Намерете корелацията между величините и ко-
  63. # ментирайте стойността й.
  64. plot(data_frame$Internet_users, data_frame$Penetration)
  65. abline(lm(data_frame$Penetration~ data_frame$Internet_users))
  66. cor(data_frame$Internet_users, data_frame$Penetration) # -0.01236333
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement