Advertisement
Guest User

interim tasks

a guest
Mar 26th, 2019
83
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 6.55 KB | None | 0 0
  1. Задача t1 - t15 это задачи на построение прототипов и агрегацию данных разными способами.
  2.  
  3. Задача 1
  4. Построение разницы результата текущими предсказаниями
  5. с предыдущими предсказаниями которые были достигнуты на прошлой итерации.
  6. Отрисованы как png графики разниц, так и анимированные нормализированные gif-файлы, где визуально видно изменения бронирований начиная с самого дальнего дня бронирования до заезда и заканчивая самим днем заезда.
  7.  
  8. Задача 2
  9. Построения графиков где осью X теперь будет количество дней до заезда, а не дата. Соответственно название файла отражаем день заезда потому создается по png-файлу для каждого дня.
  10.  
  11. Задача 3
  12. Построение графика разницы между соседними днями заезда, такой график строится для каждого количества дней бронирования до заезда.
  13. А также построение графика суммы соседних дней заездов аналогично разницы выше.
  14.  
  15. Задача 4
  16. Построение графиков скользящих средних для нескольких дней N, где N брался для каждого значения из [7, 14, 21, 28, 30, 31, 59, 60, 90, 120, 151, 191, 212, 243, 273, 304, 334, 365, 730, 1095, 1461]
  17. Отрисованы были как png-файлы так и gif-анимация
  18.  
  19. Задача 5
  20. Построение графиков отношения разницы к целому. Это разница между соседними днями поделить на значение.
  21. Построение графиков разницы дня заезда с каждым днем до заезда.
  22. Построение графиков разницы окна. Когда берется разница значений двух дней до заезда которые друг от друга находятся на заданное количество дней N. К примеру для N=5 это разница между датами 09.01 и 04.01, потом 10.01 и 05.01 и так далее.
  23. Построение графиков скользящего среднего для окна N. Аналогично предыдущему но теперь берется среднее значение всех значение в окне.
  24.  
  25. Задача 8
  26. Скрипт переноса данных из БД PostregSQL в БД MySQL. Только тех данных которые нужны для построени модели предсказания.
  27.  
  28. Задача 9
  29. Построение графиков разниц между значениями с типом комнаты GENERAL и суммой всех остальных типов. Для проверки целостности общих данных и расписанных уже по типам комнат.
  30.  
  31. Задача 10
  32. Построение графиков предсказания где разные года выводятся вместе но разными линиями и разным цветом. Ось x это день года от 1-го января до 31-го декабря.
  33.  
  34. Задача 11
  35. Построение графиков где на каждый день по оси x отображаются сумма каждого параметра по всем броням в будущее существующие на данный день. Выводятся предсказания и реальные данные по сегодня.
  36.  
  37. Задача 12
  38. Оптимизация импорта данных из основной PostgreSQL в дополнительную PostgreSQL.
  39. Потому что выполнять все предыдущие задачи с основной базой либо очень долго либо вообще не возможно.
  40. В связи с очень большими размерами БД основная проблема это время выполнения запроса, когда выборка происходит из нескольких таблиц сразу или когда приходится группировать по каким либо полям.
  41. К примеру стандартный запрос к БД PostreqSQL для импорта данных в MySQL во время выполнения начинал потреблять до 60 Гб оперативной памяти и все равно не удалось дождатся результата его выполнения.
  42.  
  43. Задача 13
  44. Построение графика отображающей ситуацию на каждый день.
  45. Построение анмированных gif и avi файлов, проигрывающих изменения по дням.
  46.  
  47. Задача 14
  48. Построение графиков состояния броней за N дней до дня проживания. Где N есть параметр и рисуется по рисунки для какждого такого N. Графики рисуются как для каждого отеля, так и в целом по всем отелям.
  49.  
  50. Задача 15
  51. Построение графиков поступления новых броней. Двумя способами.
  52. Первый - разницa между множеством броней существующих на определенный день и с множеством броней на прошлый день.
  53. Второй способ как первое появление брони в БД.
  54. А также третий график который является разницей между этими двумя способами.
  55.  
  56. Здесь также была сложность из запросом к БД. Когда разница каждого среза с предыдущим срезом для определения поступившых броней выполнялась от 3-х до 7-ми часов.
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement