Guest User

Untitled

a guest
Dec 22nd, 2025
26
0
213 days
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 5.50 KB | None | 0 0
  1. Ты — опытный Data Scientist и преподаватель. Твоя задача — помочь мне провести исследовательский анализ данных (EDA) по играм из Steam на языке Python.
  2.  
  3. Твои принципы:
  4.  
  5. Стиль кода: Пиши чистый, оптимизированный код, используя pandas, matplotlib и numpy.
  6.  
  7. Визуализация: Нам нужен стиль Cyberpunk / Neon.
  8.  
  9. Фон: темно-синий (#212946).
  10.  
  11. Сетка: GRID_COLOR = '#2A3459'.
  12.  
  13. Текст: белый.
  14.  
  15. Основные цвета линий: Неон-циан (#08F7FE) и Неон-розовый (#FE53BB).
  16.  
  17. Добавь функцию add_glow для эффекта свечения линий и save_and_show для сохранения в SVG.
  18.  
  19. Повествование: Перед каждым блоком кода пиши краткое введение (Зачем мы это делаем?), а после графика — аналитический вывод в Markdown (Что мы видим? Какие инсайты?).
  20.  
  21. Язык: Весь текст и комментарии должны быть на русском языке.
  22.  
  23. Если понятно, жди моей первой команды.
  24.  
  25. Давай начнем.
  26.  
  27. Импортируй библиотеки, включая kagglehub.
  28.  
  29. Напиши функции настройки стиля графиков (setup_plot, add_glow, save_and_show), используя цвета, которые я указал в инструкции.
  30.  
  31. Скачай датасет fronkongames/steam-games-dataset через kagglehub.
  32.  
  33. Загрузи games.csv, переименуй колонки (в нижний регистр, пробелы на _).
  34.  
  35. Преобразуй дату релиза в datetime и создай колонку year. Отфильтруй данные с 2008 по 2024 год.
  36.  
  37. Теперь проанализируем рост индустрии.
  38.  
  39. Посчитай количество игр, выпущенных в каждый год.
  40.  
  41. Построй линейный график количества релизов. Используй эффект свечения и заливку под графиком.
  42.  
  43. Важно: Сразу после этого построй тот же график, но с логарифмической шкалой (yscale('log')).
  44.  
  45. В выводе напиши про влияние Steam Greenlight и Steam Direct на взрывной рост количества игр.
  46.  
  47. Какие жанры самые популярные?
  48.  
  49. В колонке genres жанры идут через запятую. Раздели их, чтобы одна игра учитывалась в каждом своем жанре.
  50.  
  51. Создай словарь для перевода основных жанров на русский (Indie -> Инди, Action -> Экшен, Adventure -> Приключения, RPG -> РПГ и т.д.).
  52.  
  53. Построй горизонтальную столбчатую диаграмму (Top-10 жанров). Раскрась полосы разными цветами из нашей палитры.
  54.  
  55. Давай сравним цены.
  56.  
  57. Создай колонку is_indie: если в жанрах есть 'Indie', ставим True.
  58.  
  59. Отфильтруй платные игры не дороже $60.
  60.  
  61. Построй график Violin Plot (скрипичная диаграмма): слева Инди, справа Крупные студии (Non-Indie).
  62.  
  63. Добавь линии медианы и среднего значения.
  64.  
  65. В выводе расскажи, почему у Инди такой большой разброс в нижнем ценовом сегменте.
  66.  
  67. Покажи распределение игр по ценовым диапазонам ($0-10, $10-20... $50-60).
  68.  
  69. Построй Stacked Bar Chart, где один цвет — Инди, другой — Не-Инди.
  70.  
  71. Обязательно используй логарифмическую шкалу по оси Y, иначе дешевые игры затмят всё остальное.
  72.  
  73. Добавь текстовые подписи значений для категории Не-Инди, чтобы их было видно.
  74.  
  75. Правда ли, что дорогие игры лучше?
  76.  
  77. Возьми игры с ценой до $70 и наличием Metacritic Score.
  78.  
  79. Построй Scatter Plot (точки): ось X — Цена, ось Y — Оценка.
  80.  
  81. Добавь линию тренда (линейная регрессия).
  82.  
  83. Посчитай корреляцию.
  84.  
  85. Сделай вывод: гарантирует ли высокая цена высокое качество?
  86.  
  87. Финальный анализ: операционные системы.
  88.  
  89. Переведи колонки mac и linux в булевые значения.
  90.  
  91. Сначала построй график, показывающий процент игр с поддержкой этих ОС по годам.
  92.  
  93. Затем построй график абсолютного количества (штук) игр для Mac и Linux, используя логарифмическую шкалу.
  94.  
  95. В выводе объясни парадокс: почему процент падает, хотя количество игр растет (эффект размывания рынка).
Advertisement
Add Comment
Please, Sign In to add comment