Advertisement
Sanlover

Untitled

Jul 14th, 2021
728
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 1.21 KB | None | 0 0
  1. import pandas as pd
  2. import numpy as np
  3. import seaborn as sns
  4. from matplotlib import pyplot as plt
  5.  
  6. df = pd.read_csv('./vgsales.csv', encoding='latin-1')
  7. # В целом я написал костьль
  8.  
  9. # Выводим ДО
  10. print(df['Publisher'].value_counts())
  11.  
  12. # Присваиваем var = Pandas.Series, который сформирован по столбику 'Publisher' с условием, что количество повторений < 831
  13. var = df['Publisher'].value_counts().loc[lambda x: x < 831]
  14.  
  15. for index, row in df.iterrows(): # бежим по нашему датасету по рядам
  16.     if row["Publisher"] in var.index: # var.index содержит содержит названия компаний, можешь проверить выведя print(var.index).
  17.         # Если мы находим среди индексов (названий) того, который сейчат рассматриваем в качестве итератора, то заменяем на в датасете
  18.         # данные на позиции Index, в столбце Publisher на прочее
  19.         df.at[index, "Publisher"] = "прочее"
  20.  
  21. print(df['Publisher'].value_counts())
  22.  
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement