Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- # импортируйте библиотеку pandas
- import pandas as pd
- # считайте csv-файл 'music_log.csv' в переменную df
- df = pd.read_csv('music_log.csv')
- # переименуйте названия столбцов df
- df = df.rename(columns={' used_id':'user_id', 'total play':'total_play', 'Artist':'artist'})
- # объявите список columns_to_replace с названиями столбцов track, artist, genre
- columns_to_replace = ['track', 'artist', 'genre']
- # заполните отсутствующие значения столбцов из списка columns_to_replace значением 'unknown' в цикле
- for c in columns_to_replace:
- df[c] = df[c].fillna('unknown')
- # удалите строки-дубликаты из датафрейма df
- df = df.drop_duplicates().reset_index(drop=True)
- print(df.head(20))
- # выведите на экран первые 20 строчек обновлённого набора данных df
Advertisement
Add Comment
Please, Sign In to add comment