Guest User

Untitled

a guest
Nov 15th, 2018
88
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 0.79 KB | None | 0 0
  1. 3kshjfsdhf9834r
  2. Henry11
  3. 34r9jsadfsdf
  4. Jackson33
  5. 3d2d32ddffjkj
  6. Alex
  7.  
  8. Henry11
  9. Jackson33
  10. Alex
  11.  
  12. import re
  13. PATTERN = re.compile('[bcdfghjklmnpqrstvwxz]{4,}', flags=re.I)
  14.  
  15. words = ['3kshjfsdhf9834r', 'Henry11', '34r9jsadfsdf', 'Jackson33', '3d2d32ddffjkj', 'Alex']
  16. print(words)
  17.  
  18. new_words = [word for word in words if not PATTERN.search(word)]
  19. print(new_words) # ['Henry11', 'Jackson33', 'Alex']
  20.  
  21. Для каждой строки в файле:
  22. Для каждой подряд идущей комбинации букв в строке:
  23. #(word) -> (w, wo, wor, word, o, or, ord, rd, r, rd, d)
  24. Чекаем являться ли эта комбинция именем(через списки имен или либой https://pypi.org/project/nameparser/ например)
Add Comment
Please, Sign In to add comment