Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- ### Прочетете данните и ги запишете в data frame в R;
- myData = read.csv("C:/Users/ymihaylov/internet.csv", header = TRUE)
- data_frame = data.frame(myData)
- ### Изкарайте на екрана първите няколко (5-6) наблюдения;
- data_frame[1:6,]
- ### Използвайте функция, за да извлечете имената на променливите;
- colnames(data_frame)
- ### Какъв вид данни (качествени/количествени) са записани във всяка от
- променливите Internet_users, One_yr_growth, One_yr_population_change,
- Penetration?
- # Качествени - One_yr_population_change
- # Количествени - Internet_users, One_yr_growth, Penetration
- ### Изведете дескриптивни статистики за всяка една от посочените по-
- ### горе четири променливи;
- summary(data_frame$One_yr_growth)
- summary(data_frame$Internet_users)
- summary(data_frame$Penetration)
- summary(data_frame$One_yr_population_change)
- ### Изведете редовете на държавите с най-голям и най-малък процент
- ### интернет потребители в населението;
- row.names(subset(data_frame,Penetration==max(data_frame$Penetration))) # 17
- row.names(subset(data_frame,Penetration==min(data_frame$Penetration))) # 30
- ### Изведете редовете на държавите с процентно нарастване на интернет
- ### потребителите под 0.05;
- row.names(subset(data_frame,One_yr_growth < 0.05))
- ### Направете хистограма на процентното нарастване на интернет потре-
- ### бителите само за държавите с отрицателен прираст на населението и
- ### нанесете графика на плътността върху нея. Симетрично ли са разпо- ложени
- ### данните?
- growth_with_negative_population = subset(data_frame$One_yr_growth, data_frame$One_yr_population_change == "negative")
- hist(growth_with_negative_population)
- lines(density(growth_with_negative_population), col="blue", lwd=2)
- lines(density(growth_with_negative_population, adjust=2), col="darkgreen", lwd=2)
- # Данните не са разположени симетрично
- ### Изследвайте съвместно променливите One_yr_growth и One_yr_population_change
- ### с подходящ графичен метод. В коя група може да се каже, че има по-
- ### голямо процентно нарастване на интернет потребителите? Сравнете
- ### извадковите средни и медианите в двете групи;
- # Медиани
- # negative - 0.02 и positive - 0.08
- # negative
- mean(subset(data_frame$One_yr_growth,data_frame$One_yr_population_change == "negative"))
- # [1] 0.04866667
- # positive
- mean(subset(data_frame$One_yr_growth,data_frame$One_yr_population_change == "positive"))
- # [1] 0.08133333
- # Изследвайте съвместно променливите Internet_users и Penetration
- # с подходящ графичен метод. Бихте ли казали, че съшествува линейна
- # връзка между тях? Намерете корелацията между величините и ко-
- # ментирайте стойността й.
- plot(data_frame$Internet_users, data_frame$Penetration)
- abline(lm(data_frame$Penetration~ data_frame$Internet_users))
- cor(data_frame$Internet_users, data_frame$Penetration) # -0.01236333
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement