Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- usernames = [] #membuat list kosong untuk diisikan dengan username nantinya
- with open('d:/python2.json') as file: #membaca file python2.json
- for x in file :
- data = json.loads(x) #membaca json dari variabel x dan menyimpannya kedalam variabel data
- usernames.append(data['user']['screen_name'])
- usernames = list(dict.fromkeys(usernames)) #menghapus username yang kembar dari list username
- usernames = usernames[:5] #mengambil 5 username saja dari list username yang ada
- dtx = [] #membuat list kosong untuk diisi nantinya
- for username in usernames:
- a = api.user_timeline(username, count=5) #mengambil 5 tweet terakhir
- for tweet in a:
- hashtags = tweet.entities['hashtags'] #mengambil hashtags untuk setiap tweet
- created_at = str(tweet.created_at) #mengambil tanggal dibuatnya tweet
- ht = []
- for hashtag in hashtags:
- ht.append(hashtag['text']) #menambahkan hashtag kedalam variabel hashtags
- ht = ', '.join(ht) #mengubah list hashtags menjadi string / kalimat berisi hashtag
- if ht=='' : ht = None #mengatur nilai '' menjadi None / NaN agar bisa dideteksi :D
- dtx.append([created_at, tweet.text, ht]) #menambahkan tanggal tweet, tweet serta hashtag kedalam list dtx
- df = pd.DataFrame(dtx, columns = ['Tanggal', 'Tweet', 'Hashtags']) #mengkonversi list dtx menjadi dataframe milik pandas
- print(df.isnull().sum()) #hitung jumlah data yang null
- df['Hashtags'].fillna('kosong', inplace=True) #mengganti nilai null / none menjadi kosong
- print(df) #menampilkan isi dataframe
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement