Advertisement
fabianelima

EditOCR 0.0.3

Nov 19th, 2014
401
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 1.46 KB | None | 0 0
  1. # -*- coding: utf-8 -*-
  2. # -*- python -*-
  3.  
  4. # Programa funcional. Tira quebras de linha bizarras
  5. # pelos caracteres corretos (letras, pontuação, alguns
  6. # diacríticos e meia dúzia de palavras comuns). Funciona
  7. # apenas com texto em português — para outros idiomas
  8. # é preciso acrescentar outras "terminações" de palavras.
  9.  
  10. texto = raw_input('Qual é o arquivo, chefe?: ')
  11. try:
  12.     textooriginal = open(texto, 'r')
  13. except:
  14.     print 'Dá pra ler isso não, tenta outra coisa.'
  15.     exit()
  16.  
  17. nome = raw_input('Que nome você quer dar pro arquivo, chefe?: ')
  18. textoeditado = open('/Users/infografia03/Dropbox/firestone/EDICAO/' + nome + '.txt', 'w')
  19.  
  20. for line in textooriginal:
  21.     textoeditado.write(line.replace('-\n','').replace(',\n',', ').replace(' _ ',' — ').replace(' -- ',' — ').replace(';\n','; ').replace('`','').replace('a\n','a ').replace('e\n','e ').replace('i\n','i ').replace('o\n','o ').replace('u\n','u ').replace('l\n','l ').replace('m\n','m ').replace('n\n','n ').replace('r\n','r ').replace('s\n','s ').replace('k\n','k ').replace('w\n','w ').replace('y\n','y ').replace(\n','á ').replace(\n','é ').replace(\n','í ').replace(\n','ó ').replace(\n','ú ').replace(\n','à ').replace(\n','ã ').replace(\n','õ ').replace(\n','â ').replace(\n','ô ').replace(' nao ','não').replace(' tambem ','também').replace('oes','ões').replace('”','"').replace('“','"').replace(' 0 ',' o '))
  22.  
  23. textooriginal.close()
  24. textoeditado.close()
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement