Advertisement
Guest User

Untitled

a guest
Jul 19th, 2019
110
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 1.94 KB | None | 0 0
  1. usernames = [] #membuat list kosong untuk diisikan dengan username nantinya
  2. with open('d:/python2.json') as file: #membaca file python2.json
  3. for x in file :
  4. data = json.loads(x) #membaca json dari variabel x dan menyimpannya kedalam variabel data
  5. usernames.append(data['user']['screen_name'])
  6. usernames = list(dict.fromkeys(usernames)) #menghapus username yang kembar dari list username
  7. usernames = usernames[:5] #mengambil 5 username saja dari list username yang ada
  8. dtx = [] #membuat list kosong untuk diisi nantinya
  9. for username in usernames:
  10. a = api.user_timeline(username, count=5) #mengambil 5 tweet terakhir
  11. for tweet in a:
  12. hashtags = tweet.entities['hashtags'] #mengambil hashtags untuk setiap tweet
  13. created_at = str(tweet.created_at) #mengambil tanggal dibuatnya tweet
  14. ht = []
  15. for hashtag in hashtags:
  16. ht.append(hashtag['text']) #menambahkan hashtag kedalam variabel hashtags
  17. ht = ', '.join(ht) #mengubah list hashtags menjadi string / kalimat berisi hashtag
  18. if ht=='' : ht = None #mengatur nilai '' menjadi None / NaN agar bisa dideteksi :D
  19. dtx.append([created_at, tweet.text, ht]) #menambahkan tanggal tweet, tweet serta hashtag kedalam list dtx
  20.  
  21. df = pd.DataFrame(dtx, columns = ['Tanggal', 'Tweet', 'Hashtags']) #mengkonversi list dtx menjadi dataframe milik pandas
  22.  
  23. print(df.isnull().sum()) #hitung jumlah data yang null
  24. df['Hashtags'].fillna('kosong', inplace=True) #mengganti nilai null / none menjadi kosong
  25.  
  26. print(df) #menampilkan isi dataframe
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement