Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- contadorPalavras = {
- 'notícias' : {},
- 'esportes' : {},
- 'celebridades' : {},
- 'finanças': {},
- 'música': {}
- }
- aux = 'notícias'
- with open('./yahoo16.txt', 'r') as f:
- for linha in f:
- lista_palavras = linha.replace('\n','').replace('\t','').lower().split()
- if len(lista_palavras) == 1 and lista_palavras[0] == 'notícias':
- aux = 'notícias'
- # print (contadorPalavras[aux])
- if len(lista_palavras) == 1 and lista_palavras[0] == 'esportes':
- aux = 'esportes'
- # print (contadorPalavras[aux])
- if len(lista_palavras) == 1 and lista_palavras[0] == 'celebridades':
- aux = 'celebridades'
- # print (contadorPalavras[aux])
- if len(lista_palavras) == 1 and lista_palavras[0] == 'finanças':
- aux = 'finanças'
- # print (contadorPalavras[aux])
- if len(lista_palavras) == 1 and lista_palavras[0] == 'música':
- aux = 'música'
- # print (contadorPalavras[aux])
- for palavra in lista_palavras:
- if palavra not in contadorPalavras[aux]:
- contadorPalavras[aux][palavra] = 1
- else:
- contadorPalavras[aux][palavra] = contadorPalavras[aux][palavra] + 1
- with open('./lista_ocorrencias_tags.txt', 'w') as f:
- for key, value in contadorPalavras.items():
- f.write('TAG: {}\n\nPALAVRAS: {}\n\n\n\n\n\n\n\n'.format(str(key), str(value)))
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement