Advertisement
Guest User

Untitled

a guest
Oct 23rd, 2016
66
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 1.31 KB | None | 0 0
  1. class flu_tweets:
  2.  
  3.     def __init__(self):
  4.         self.tweets = []
  5.         self.labels = []
  6.  
  7.  
  8.     def load(self, tweets_filename, labels_filename = ""):
  9.         f = open(tweets_filename, 'r')
  10.         for tweet in f:
  11.             if tweet != "\n":
  12.                 self.tweets.append(tweet)
  13.         f = open(labels_filename, 'r')
  14.         for label in f.readlines():
  15.             b = label.strip("\n"):
  16.                 self.labels.append(b)
  17.  
  18.  
  19.     def label_tweets(self):
  20.         for tweets in self.tweets:
  21.             print json.loads(tweet)['text']
  22.         while True:
  23.             l = raw_input("Label as pos or neg")
  24.             if l == "pos" or l == "neg":
  25.                 self.labels.append(l)
  26.             break
  27.        
  28.  
  29.     def count(self, label):
  30.         count = 0
  31.         for i in self.labels:
  32.             if i == label:
  33.                 count += 1
  34.         return count
  35.  
  36.  
  37.     def trim(self):
  38.         for i in range(len(self.tweets)):
  39.             if json.loads(self.tweets[i])['lang'] != 'en':
  40.                 del self.labels[i]
  41.                 del self.tweets[i]
  42.        
  43.         cnt_pos = 0
  44.         cnt_neg = 0
  45.         for i,j in enumerate(self.labels):
  46.             if j == "pos":
  47.                 if cnt_pos < 10:
  48.                     cnt_pos += 1
  49.                 else:
  50.                     del self.tweets[i]
  51.                     del j
  52.            
  53.             if j == "neg":
  54.                 if cnt_neg < 90:
  55.                     cnt_neg += 1
  56.                 else:
  57.                     del self.tweets[i]
  58.                     del j
  59.  
  60.  
  61.     def merge(self, another_flu_tweets):
  62.         self.tweets = self.tweets + another_flu_tweets.tweets
  63.         self.labels = self.labels + another_flu_tweets.labels
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement