Advertisement
Guest User

Untitled

a guest
May 23rd, 2019
86
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 4.28 KB | None | 0 0
  1. ---
  2. title: "Flights"
  3. author: "Tomasz Lech"
  4. date: "5/21/2019"
  5. output: html_document
  6. ---
  7. ```{r, echo=FALSE}
  8. library(RODBC)
  9. library(formattable)
  10. polacz <- odbcConnect("FlightProject", uid = "dbad_s444483", pwd = "dXKeqA6K25")
  11. ```
  12.  
  13. **Dany raport przedstawia zapytania do bazy amerykańskich lini lotniczych związanych z opóźnieniami lotów**
  14.  
  15. **zad.1 Jakie było średnie opóźnienie przylotu?**
  16. ```{r}
  17. sqlQuery(polacz, "select avg(arr_delay_new)
  18. from Flight_delays")
  19. ```
  20.  
  21. **zad.2 Jakie było maksymalne opóźnienie przylotu?**
  22. ```{r}
  23. sqlQuery(polacz, "select max(arr_delay)
  24. from Flight_delays")
  25. ```
  26.  
  27. **zad.3 Który lot miał największe opóźnienie przylotu?**
  28. ```{r}
  29. sqlQuery(polacz, "select carrier,fl_num,origin_city_name,dest_city_name, fl_date
  30. from Flight_delays
  31. where arr_delay_new = (select max(arr_delay_new) from Flight_delays)")
  32. ```
  33.  
  34. **zad.4 Które dni tygodnia są najgorsze do podróżowania?**
  35. ```{r}
  36. sqlQuery(polacz, "select W.weekday_name, AVG(F.arr_delay_new) as 'delay'
  37. from Flight_delays F join Weekdays W on W.weekday_id = F.day_of_week
  38. group by W.weekday_name")
  39. ```
  40.  
  41. **zad.5 Które linie lotnicze latające z San Francisco (SFO) mają najmniejsze opóźnienia przylotu?**
  42. ```{r}
  43. sqlQuery(polacz, "select distinct airline_name, avg_delay
  44. from (select A.airline_name, F.airline_id, avg(F.arr_delay_new) as 'avg_delay'
  45. from Flight_delays F join Airlines A on F.airline_id = A.airline_id
  46. group by A.airline_name, F.airline_id) as T join Flight_delays F on T.airline_id = F.airline_id
  47. where F.origin like'SFO'
  48. order by avg_delay desc")
  49.  
  50. ```
  51.  
  52. **zad.6 Jaka część linii lotniczych ma regularne opóźnienia, tj. jej lot ma średnio co najmniej 10 min. opóźnienia?**
  53. ```{r}
  54. x <- sqlQuery(polacz, "select count(distinct unique_carrier)
  55. from Flight_delays
  56. where unique_carrier
  57. in(select unique_carrier
  58. from Flight_delays
  59. group by unique_carrier
  60. having avg( arr_delay_new) > 10)")
  61.  
  62. y <- sqlQuery(polacz, "select COUNT(distinct unique_carrier)
  63. from Flight_delays")
  64. z <- (x/y)
  65. print(z)
  66.  
  67. ```
  68.  
  69. **zad.7 Jak opóźnienia wylotów wpływają na opóźnienia przylotów?**
  70. ```{r}
  71. x <- sqlQuery(polacz,"select dep_delay_new from Flight_delays")
  72. y <- sqlQuery(polacz,"select arr_delay_new from Flight_delays")
  73. wspPear <- cor( x,y , use= "complete.obs",method= "pearson")
  74. print(wspPear)
  75. ```
  76.  
  77. **zad..8 Która linia lotnicza miała największy wzrost (w wartościach bezwzględnych) średniego opóźnienia przylotów w ostatnim tygodniu miesiąca, tj. między 1-23 a 24-31 lipca?**
  78. ```{r}
  79. x <- sqlQuery(polacz, "
  80. with srednia_1
  81. as
  82. (select airline_name,
  83. avg_delay_1
  84. from (select A.airline_name, AVG(arr_delay_new) as 'avg_delay_1'
  85. from (select airline_id, arr_delay_new from Flight_delays
  86. where day_of_month between 1 and 23 and month like'7') as T join Airlines A on A.airline_id = T.airline_id
  87. group by A.airline_name) as K
  88. ),
  89.  
  90. srednia_2
  91. as
  92. (select airline_name, avg_delay_2
  93. from (select A.airline_name, AVG(arr_delay_new) as 'avg_delay_2'
  94. from (select airline_id, arr_delay_new
  95. from Flight_delays
  96. where day_of_month between 24 and 31 and month like'7') as P join Airlines A on A.airline_id = P.airline_id
  97. group by A.airline_name) as R
  98. )
  99.  
  100. select top 1 srednia_1.airline_name,
  101. (srednia_2.avg_delay_2 - srednia_1.avg_delay_1) as 'increase'
  102. from srednia_1 join srednia_2 on srednia_1.airline_name = srednia_2.airline_name
  103. where srednia_2.avg_delay_2 > srednia_1.avg_delay_1
  104. order by increase desc;
  105. ")
  106. ```
  107.  
  108. **zad.9 Które linie lotnicze latają zarówno na trasie SFO → PDX (Portland), jak i SFO → EUG (Eugene)?**
  109. ```{r}
  110. sqlQuery(polacz, "select distinct airline_name
  111. from (select distinct A.airline_name, F.airline_id
  112. from Flight_delays F join Airlines A on F.airline_id = A.airline_id
  113. where F.origin like'SFO' and F.dest like'PDX') as T join Flight_delays F1 on F1.airline_id = T.airline_id
  114. where F1.origin like'SFO' and F1.dest like'EUG';")
  115. ```
  116.  
  117. **zad.10 Jak najszybciej dostać się z Chicago do Stanfordu, zakładając wylot po 14:00 czasu lokalnego?**
  118. ```{r}
  119. sqlQuery(polacz, "select origin,dest,
  120. avg(arr_delay_new) as 'avg_delay'
  121. from Flight_delays
  122. where crs_dep_time between 1401 and 2359
  123. group by origin, dest
  124. having origin in ('MDW', 'ORD') and dest in ('SFO', 'SJC', 'OAK')
  125. order by avg_delay desc")
  126. ```
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement