Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- import pandas as pd
- import numpy as np
- import seaborn as sns
- from matplotlib import pyplot as plt
- df = pd.read_csv('./vgsales.csv', encoding='latin-1')
- # В целом я написал костьль
- # Выводим ДО
- print(df['Publisher'].value_counts())
- # Присваиваем var = Pandas.Series, который сформирован по столбику 'Publisher' с условием, что количество повторений < 831
- var = df['Publisher'].value_counts().loc[lambda x: x < 831]
- for index, row in df.iterrows(): # бежим по нашему датасету по рядам
- if row["Publisher"] in var.index: # var.index содержит содержит названия компаний, можешь проверить выведя print(var.index).
- # Если мы находим среди индексов (названий) того, который сейчат рассматриваем в качестве итератора, то заменяем на в датасете
- # данные на позиции Index, в столбце Publisher на прочее
- df.at[index, "Publisher"] = "прочее"
- print(df['Publisher'].value_counts())
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement